文章主题:ChatGPT, Siri, 国产手机语音助手, 人工智能
原标题:ChatGPT “取代” Siri,国产手机语音助手忙变革
在经历了权力争夺的风波之后,OpenAI正在逐步恢复正常运行。近期,这个人工智能公司面向所有用户开放了ChatGPT Voice服务,允许用户进行语音聊天。OpenAI的前总裁Greg Brockman在接受采访时表示,这次开放是一个“尝试”,旨在彻底改变ChatGPT的使用体验。在此之前,OpenAI于九月份推出了基于ChatGPT的文本转语音功能,利用神经网络模型从文本中生成类似于人类的声音。值得一提的是,这项功能现在对所有免费用户开放,而不再是只有ChatGPT Plus订阅用户才能使用。
尽管Siri作为苹果公司的智能语音助手曾一度引领潮流,展示了通过语音控制设备的可能性,但随着时间流逝,其影响力和地位均有所下降,目前甚至处于落后状态。这主要是因为在竞争者的崛起和技术进步的影响下,Siri的不足之处日益暴露。
在大型模型的助力下,更加智能且自然的人机交互体验逐渐浮现,这引起了我国国产手机品牌的注意。这些品牌纷纷投入大模型技术的应用,旨在优化产品用户体验,以此提升竞争力,进一步扩大市场份额。
天下苦 Siri 久矣
Siri,作为苹果公司的智能语音助手,虽然在某些领域有所建树,但在某些方面仍有待加强。首先,在语音识别方面,Siri仍有提升空间。在某些情况下,Siri有可能无法精准地识别用户的语音指令,从而使用户无法获取所需的信息或服务。其次,Siri的理解能力有待提高。尽管Siri能回答部分日常问题,但对于复杂问题或生僻词汇,它可能无法理解,这可能导致用户感到困惑和无助。
Siri作为苹果设备的重要语音助手,其用户体验仍有待进一步提升。在某些情况下,Siri的响应速度可能较慢,甚至当用户迫切需要帮助时也无法提供及时的支持,这无疑给用户带来了诸多不便与烦躁。尽管Siri能够根据用户的偏好与习惯进行自我学习与优化,但在某些方面仍无法实现高度个性化的服务,亦无法满足部分用户对于更高级别智能助手的高期待。
在 OpenAI 的 ChatGPT 语音功能向所有免费用户开放的消息宣布后,许多用户开始考虑是否要更换他们的 iPhone 语音助手——尤其是那些配备新操作按钮的 iPhone 15 Pro 系列用户。这些新操作按钮替代了自 iPhone 首次亮相以来一直存在的静音按钮,这无疑将对用户的 iPhone 使用体验产生重大影响。
用户可以通过新的设置菜单将按钮用于除静音以外的其他功能,如打开相机、手电筒、录制语音备忘录等。此外,该功能还可作为ChatGPT的触发器。考虑到人工智能聊天机器人在许多日常查询中的实用性和Siri所不具备的能力,为ChatGPT添加语音支持已经成为许多海外用户默认可做的行为。
国产手机品牌齐发力
GPT等大型模型的发展不仅风靡了AI领域,也为硬件智能化开辟了新的途径。其中,大型模型技术在提升手机语音识别能力方面表现尤为突出。相较于传统的语音识别技术,它们能够显著增强语音识别的准确性和稳定性,这一优势对于需要频繁使用语音输入的用户而言尤为重要。
另一方面,大模型还可以提升手机的理解能力。通过应用大模型技术,手机可以更好地理解用户的意图和需求,从而提供更加个性化和高效的服务。这对于用户体验的提升也是非常重要的。
华为终端BG AI与智能全场景业务部总裁贾永利指出,大语言模型具备泛化能力,能够帮助手机智能助手提升理解能力。另外,大模型Plug-in的插件能力,可以在手机内部打通各应用之间的壁垒,借助工具拓展能力。
在华为盘古L0基座大模型的基础上,华为针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了语音助手“小艺”中。全新的小艺在今年夏天的华为开发者大会上正式亮相。
基于大模型,小艺的智慧体验迎来升级,实现了基于自然语言理解的设备控制、本机数字内容搜索、对话识别屏幕内容;帮助用户快速摘要、文案内容辅助、图片二次创作;实现了随口说随时记、贴心的组合服务建议提醒等。随着更长时间的使用,小艺也会通过不断学习,成为熟悉用户个性、偏好、习惯的日常助手。而这些新体验,今后也将进一步扩展至华为的产品生态中。
11月16日,在2023 OPPO开发者大会上,OPPO正式推出安第斯大模型(AndesGPT),并接入最新发布的操作系统ColorOS 14上。OPPO方面介绍称,在AndesGPT加持下,OPPO手机助手“小布”能实现更加自然流畅的对话,以及提供对话式内容创作、日程管理与通话摘要等服务。
OPPO还表示,2022 年发布的潘塔纳尔系统全面商用,此次将在ColorOS 14上与AndesGPT深度协作。这一系统有望提供更多元化的泛在服务,即根据地点、时间、事件、习惯,在通勤、打车、外卖、差旅等高频场景中提供服务。以国内游为例,当识别到用户购买旅游地机票、火车票后,ColorOS会在用户授权情况下,通过主动感知位置,主动智能推送城市游玩榜单卡片,以及推荐相关酒店住宿。
11月1日,2023 vivo开发者大会期间,vivo正式发布自研蓝心大模型Blue LM。该大模型通过大参数AI算力的端侧部署与云端服务,将全面覆盖核心应用场景。其蓝心小V智慧助理功能,将提供超能语义搜索、超能问答、超能写作、超能创图和超感智慧交互五大体验。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围表示,希望端侧大模型能成为用户的贴身助理。
荣耀 CEO 赵明则很早就强调了大模型端侧部署的趋势和重要性,在6月上海举行的MWC 2023上他指出,手机端侧的个人大模型是未来探索方向。
天风证券也指出,C端AI应用落地阶段场景重要性凸显,聊天机器人、AI伴侣和内容生产工具场景最先落地,这些场景中的AI应用开发速度和商业化进展或超预期。
机遇与挑战并存
DeepMind联合创始人Mustafa Suleyman此前受访时表示,现阶段的生成式AI只是一个过渡性的技术阶段,接下来将进入交互式AI时代,AI将根据用户的不同任务需求,安排其他软件和或联系真人来完成工作。
他认为,第一波AI浪潮主要聚焦于分类。深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未来的交互界面”,用户不仅仅是点击按钮和键入文字,而是与AI直接对话,届时交互式AI将能自主采取行动。
毋庸置疑,未来的手机语音助手将更加智能化和个性化,通过与用户的对话和交互,提供更加更精准的建议和服务。但是,由于生成式 AI 和交互式AI需要处理大量的对话数据和实时数据,因此需要更高效的数据处理和存储能力来支持这种交互。这对于手机语音助手的性能和技术要求将是一个巨大的挑战。
另外,生成式 AI 和交互式AI“呼唤”更强大的安全性和隐私保护能力。由于二者需要大量收集和处理用户的对话数据,因此需要手机厂商和技术提供商加强数据安全和隐私保护的措施,以确保用户的数据安全和隐私不受侵犯。
总之,随着AI技术的进一步发展,手机语音助手将面临新的变革。为了迎接这些利好,手机厂商需要不断提升技术水平和创新能力,以应对技术巨变带来的相关问题,并满足用户的需求和期望。返回搜狐,查看更多
责任编辑:
ChatGPT, Siri, 国产手机语音助手, 人工智能
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!