Facebook的语音助手Aloha疑曝光
2018年08月22日 由 浅浅 发表
570166
0
Facebook语音计算革命的速度有点慢。它没有语音助手,它的智能扬声器仍在开发中,而像Instagram这样的一些应用程序并没有完全配备音频通信。但根据在Facebook代码中发现的实验,再加上新的专利申请,情况可能有所改变。
据报道,它即将推出的Portal智能音箱专为与家庭远程视频聊天而设计,包括老年人和可能遇到手机问题的孩子。改进的转录和语音到文本到语音转换功能可以将Messenger用户连接到输入媒体上,并将它们保留在聊天应用程序上,而不是偏向于短信。
鉴于Facebook已经迟了一步,它需要通过强大的实用程序来解决实际问题。以下是Facebook在语音领域的最新发展,以及它过去的实验如何为其下一次重大推动奠定基础。
Aloha
Facebook正在以Aloha为名开发自己的语音识别功能,用于Facebook和Messenger应用程序,以及外部硬件,可能是它正在开发的视频聊天智能扬声器。在Facebook和Messenger的Android应用中,移动研究人员Jane Manchun Wong第一次看到了Aloha用户界面的原型。
[video width="358" height="360" mp4="https://www.atyun.com/uploadfile/2018/08/Facebook-Aloha-Voice-Testing-TechCrunch-Jane-Manchun-Wong.mp4"][/video]
Aloha语音测试中,当用户在消息线程中说话时,水平蓝条会扩展和收缩,以便在识别和转录到文本时可视化语音量。该代码将该功能描述为与外部Wi-Fi或蓝牙设备建立连接。该软件可能会在Facebook的硬件和软件上运行,类似于在手机和Google Home扬声器上运行的谷歌智能助理。
多年前,Facebook有兴趣开发自己的语音识别软件,专门用于准确转录朋友之间的互动方式。与我们正式处理亚马逊Alexa或Google Home等计算机助理的方式相比,这些语音模式通常更随意,口语化,快速且充满俚语。
Wong还在Facebook的代码中发现了Aloha徽标,其中包含火山图像。有人在Facebook员工的手机上看到了一个Facebook Aloha Setup聊天机器人,上面有类似的标志。
如果Facebook可以解决这个问题,它可以在Messenger和网站的其他地方提供自己的转录功能,这样用户就可以跨媒体进行通信。它可能会让你无法查看屏幕时向朋友发出评论或消息。然后,接收者可以阅读文本而不必像语音消息那样收听它。该功能还可用于为Facebook应用程序的语音导航提供动力,以实现更好的免提使用。
智能音箱Portal
Facebook的视频聊天智能音箱最初代号为Aloha,但后来更名为Portal,Business Insider的Alex Heath和现在Cheddar于2017年8月首次报道。由于担心会加剧剑桥分析公司引发的隐私丑闻,它被推迟了。
一项新的专利申请显示,Facebook正在考虑建立一个智能音箱,早在2016年12月26日,它就为立方体形状的设备申请了专利。该专利描绘了由Baback Elmieh,Alexandre Jais和John Proksch-Whaley 发明的“音箱的装饰设计”。Facebook于当年9月收购了Elmieh的创业公司Nascent Objects,现在他是Facebook秘密的Building 8硬件实验室的技术项目负责人。
通往Voicebook的漫长道路
Facebook长期在语音领域进行修整。2015年,它收购了自然语言处理初创公司Wit.ai,该公司运行了一个用于构建语音界面的开发者平台,但后来将Wit.ai推入Messenger的平台团队,专注于聊天机器人。Facebook也开始测试在2015年自动将Messenger语音片段转录成文本,这可能是上面看到的Aloha的基础功能。
第二年,Facebook负责人David Marcus声称“这不是我们现在正在积极开展工作的事情”,但他补充道,“在某种程度上,很明显,随着我们在Messenger中开发越来越多的功能和交互,我们将开始处理语音交换和接口。”然而,一位消息人士称Facebook的秘密语言技术小组已经在探索语音机会。Facebook也开始为想要播放声音而不是视频的用户测试其实时音频功能。
到2017年,Facebook为Pages的视频提供自动字幕,并正在开发语音搜索功能。今年,Facebook开始尝试将语音片段作为状态更新和故事,这些用户可能难以用母语打字。但高管们并未谈及语音举措。
最详细的评论来自Facebook的设计负责人Luke Woods,他在TechCrunch Disrupt 2017描述了语音搜索,说它“非常有前途”。
目前还不清楚Facebook的Aloha究竟会怎样。对于Facebook的智能扬声器和应用程序,它可以是操作系统或语音界面和转录功能。它也可能会像M一样成为一个更加成熟的语音助手。或许它可能成为Facebook与其他语音生态系统的桥梁。
更多语音识别数据集点击“这里”下载