谷歌助手首席工程师Huffman:5项必须遵守的语音计算规则
2018年08月23日 由 浅浅 发表
928321
0
在机器学习的推动下,像Alexa,谷歌助手这样的会话式AI只会越来越多,因为世界上最大的科技公司竞相将他们的助手放在你的家中,工作场所和汽车中。
人们更倾向于使用助手来检查他们的日历或天气,还可以控制家庭设备,更换电视遥控器,以及进行语音搜索和购物。智能音箱的采用率预计将在未来几年增长六倍,但没有迹象表明这种势头正在放缓。
经过多年的发展,谷歌助手首席工程师Scott Huffman表示,他的团队已经学到了一些经验教训,包括在语音计算时代应遵循的五条基本规则。
霍夫曼对此事的看法值得关注。早在5月份,Huffman宣布智能助手现已面向5亿台设备上市,上周发布的Canalys数据显示,在2018年上半年,Google Home在全球范围内超过市场领先的Echo。
1.声音是为了完成任务
一个全能的,聪明的助手,同时扮演着伙伴和健谈的角色,这一愿景还没有实现。Huffman说,与谷歌助手的互动比典型的谷歌搜索的可能性要高出40倍。
“人们多年来一直在问谷歌你可以想象的一切,但是当我们转向声音时,我们注意到了一个真正的根本的转变。人们开始要求我们做事情,而不仅仅是为了得到答案。”
人们最有可能要求谷歌智能助手执行诸如拨打电话,设置提醒,找到智能手机或将手机设置为飞行模式等操作。用户在与助手交互时通常很忙,而免提接口是对此的补充。
Huffman认为,我们正处于重大的计算转变的开始,随着时间的推移,你可以期待助手帮助你的各种事情。
Huffman说,“我有点觉得我们的声音让我想起了25年前我们在网络上的位置。这些工具的交互有点笨拙,并不总是完全清楚要构建什么,但它显然是建立在很大的基础上,所以我鼓励深入研究并建立一些对话。”
在谷歌继续努力帮助人们完成工作的过程中,Huffman在I / O开发者大会上推出了一系列功能,包括能够用一句话做出多个动作,并能够提出后续问题,而无需说“OK Google”。
从今天开始,Google智能助手用户也可以说“Tell me something good”,来听一些好消息。
2.声音并不意味要取代屏幕
早在2016年,Siri cocreator Babak Hodjat就认为越来越受欢迎的Amazon Echo音箱会在没有屏幕的情况下达到上限。
最初和仍然最流行的Echo和Home音箱系列可能缺少屏幕,但Huffman说屏幕会改变一切。例如,谷歌智能助手已经能够通过分步指导来帮助用户做饭,但Huffman承认单独使用音箱有点困难。
“音箱没有被过度索引的观点实际上是我一直对我的团队强调的。”他说。
购物,查看列表或获取发送到智能手机的路线时,视觉效果也非常明显。
它们还可以帮助人们与本地企业建立联系,包括车载信息娱乐显示和其他具有屏幕和谷歌智能助手访问权限的设备。“我认为,当我们超越设备级别的命令和控制时,我们真正看到的下一个是更多的本地服务,”他说。
谷歌智能助手在视觉表面上的运作方式变得更加智能。除了制作免提电视控制外,使用Google on Google第三方平台的开发人员还可以创建可视语音应用。
作为近几个月为谷歌智能助手推出的一系列变化的一部分,除了用于安排预约和六种新声音的Duplex AI试验开始之外,谷歌在安卓智能手机上的Lens计算机视觉已获得计算机视觉实时分析能力和风格与时尚情报等新的功能。
最近几周有关于谷歌智能助手在视觉领域的主要潜在后续步骤的谣言已经出现。据报道,谷歌正在研发自己的智能音箱,屏幕,与索尼,LG和JBL的亚马逊Echo Show和第三方音箱竞争。带有谷歌智能助手的8英寸和10英寸联想智能显示器于7月26日上架。
据报道,谷歌还计划在今年秋季发布Pixel 3,其中包含一个充电中使用的案例,允许用户在手机充电时与谷歌智能助手进行互动。
3.日常工作推动采用
根据语音应用程序开发人员提供的数据,最常见的Alexa表明,成为用户生活中常规固定装置的最有效方法之一就是成为他们日常生活中的一部分。
例如,谷歌智能助手用户可能会在早上询问新闻和天气,在下午向朋友发送消息,并在晚上播放音乐或投放视频。
谷歌于3月推出了Routines功能,供人们创建自定义命令,因此您可以说“OK Google,我在家”,打开灯,更改温度以及执行其他常用操作。亚马逊于2017年10月为Alexa发布了类似的功能。
4.语音不需要用户手册
自然语言界面意味着虚拟助手无需训练或用户手册即可了解如何使用它们。“谷歌助手真的无视早期采用者的刻板印象。因此,女性是我们增长最快的用户群;老年人和家庭正在大量采用这项技术;真正违背早期采用者的刻板印象,”Huffman表示。
同时也展示了当你不需要学习如何使用操作系统时会发生什么,在印度,与2017年相比,谷歌智能助手的使用量今年增加了3倍。
“随着全新用户的加入,我们看到的是他们绕过了一些传统的应用和基于竖井的访问服务的方式,实际上是直接跳到语音助手,”Huffman说。
5.会话AI当然是进行会话的
虽然人们更倾向于通过语音助手完成工作,但这并不意味着他们不会说话。
与谷歌搜索相比,使用谷歌智能助手将人们相互关联的多个命令或问题链接在一起的可能性要高出200倍,因为用户对助手可以执行的操作的期望越来越高。
Huffman表示,“人们期待真正的对话,所以当你开始使用任何技术时,人们可能他们的期望很低,但随着它开始起作用,人们的期望很快就会上升。因此,我们今天看到的是人们与语音技术的对话越来越复杂。即使只是设置一个警报这样简单的事情,人们每天都会询问如何单独设置警报的不同方式。”
随着时间的推移,Huffman希望谷歌智能助手能够更好地了解与之对话的人。