亚马逊Alexa是如何学习新语言的?
2019年10月12日 由 TGS 发表
113568
0
亚马逊的Alexa助手最近学会了新的语言——印地语、美国西班牙语和巴西葡萄牙语。对此,亚马逊研究科学高级经理Janet Slifka今天上午在Alexa博客上发表的一篇文章中解释说:
合成数据在Alexa学习新语言时起到了很大的作用,但它不是最终的万能解决方案,新的语言学习依然需要新的引导工具。
亚马逊Alexa AI应用建模和数据科学小组利用“语法归纳”技术分析“黄金话语”,开发了新的语法系统工具,它能生成一系列可以生成句子的表达式。此外,他们还利用“引导重采样”技术,开发了一种可以通过从现有数据中的例子中重组单词和短语来创造新句子的工具,该工具的重点任务是优化句子类型的数量和分布。
Slifka指出,当Alexa的新语言版本处于积极开发阶段时,团队会为系统编译培训数据,以便了解客户的意图。数据有一部分来自人工智能模型翻译的现有语言,其余剩下部分则通常来自crowd workers和Cleo——向客户提供提示答案的Alexa语音应用。
语法系统可以使用一种名为贝叶斯模型合并的技术,来生成一个具有代表性的语法,或者使用一组重写规则,通过单词插入、删除和替换来改变基本的模板句形成语法。通常情况下,一个计算语言学家一天可以处理50个“金句”,但该工具通过识别话语列表中的模式,并利用该模式,可以为数千个模板生成100多个候选规则,将处理过程缩短到几秒钟,两者的差距,是非常显而易见的。
引导重采样工具同样也使用了目录和现有示例来增加自然语言理解训练数据。具体来说,它可以通过交换话语中的元素来生成额外的训练样本,并使用Jaccard索引来评估内容之间的成对相似性。
这两种新开发的工具,会帮助Alexa变得越来越聪明,成为用户最好的生活帮手,带给用户最好的体验。Slifka最终表示,技术总是不断进步的,他们正在努力克服研发中的难题。
从“人工智障”到人工智能,这是一个漫长而又艰辛的过程,但幸运的是总在进步,或许和人们理想中的有差距,可终究是在慢慢进步的,量变总有一天会引发质变的,不是么?