语音助手十年前曾是人工智能的巅峰,但随着生成式人工智能的崛起,它们已经有些显得过时。语音助手迫切需要升级,但谷歌一直忽略了它的语音助手,而是专注于更具雄心的项目,比如Bard聊天机器人。
此次谷歌在周三的Made by Google活动上为其Google Assistant提供了一些急需的TLC,为用户增加了新的人工智能功能,扩大了其能力。
这次活动的最大亮点是Google Assistant将与Bard相结合,成为一个更加个性化的数字助手。
通过这次升级,Google Assistant将不再局限于语音命令,而是能够通过更强大的上下文意识帮助用户完成任务,包括理解屏幕上的文本和图像,处理音频剪辑等等。
例如,谷歌表示升级后的助手将能够帮助计划下一次旅行,帮助整理电子邮件收件箱,完成Google文档中的任务,或者根据图像写标题。
演示展示了用户询问朋友聚会地点的情况,助手与Bard通过从用户的电子邮件中获取相关信息迅速在地图上填写了地址。
与Bard相结合的助手在安卓设备上的集成性将更强,为用户提供更多有上下文意识的体验。带有Bard的助手对话叠加功能将能够使用视觉线索为用户提供所需的答案,可以适用于各种场景。
带有Bard的助手将在未来几个月内在iOS和安卓用户中推出,并且因为它还处于初期阶段,将很快面向早期测试者进行公开测试,以获取他们的反馈。如何加入早期测试的详细信息尚不可用,但谷歌表示请“继续关注”以获取相关信息。
接下来,谷歌解决了语音助手最令人讨厌的问题之一——无法理解用户说的话。这个问题通常迫使用户在听写文本时使用经过精心计算的、几乎是机器人的语音,以确保它们可以理解。
现在,Google Assistant能够理解更自然的对话方式,甚至可以捕捉到“呃”等自然停顿,而不会将其包含在最终的转写结果中。
此外,在听写信息时,写信息的速度将提高一倍,消除你说话和助手处理你所说的内容之间的典型滞后。
Google Assistant还通过Pixel呼叫辅助功能来优化您的电话通话体验,甚至可以为您接听电话。
通过新的电话筛查功能,当电话最初进行筛查时,Google Assistant可以听取对话者的对话,并根据通话内容为您提供建议。然后,当您选择回答时,Google Assistant会使用自然、逼真的声音与您的来电者对话。
例如,如果你的医生办公室打来电话确认预约,助手可能会生成一个选项,允许它在你未接听电话的情况下替你说“是的,我会去”。
最后,为了帮助您浏览互联网,Google Assistant可以将网页概述为关键要点,朗读出来并为您翻译。
尽管有些网页朗读功能可能听起来并不是很突破性,但谷歌人工智能使助手能够理解网页的哪些元素是标志和哪些是广告,因此在朗读或概述时可以省略它们。