Alexa利用自然语言理解系统识别对话中与问题不相关的部分
2018年09月05日 由 浅浅 发表
904971
0
区分对话的相关和不相关的部分通常是一种良好的生活技能,但对于像亚马逊的Alexa这样的语音助手来说,它是不可或缺的。为了适当地回应所说的内容,从天气到附近的餐馆或运输中的包裹,它们需要知道正在处理的主题是否超出了知识范围。
亚马逊的研究人员使用自然语言理解(NLU)系统解决了这个问题,该系统同时识别域内(已知)和域外(未知)主题。结果将于9月初在印度海得拉巴举行的Interspeech会议上公布。
“有时Alexa的客户可能会说一些不适用于任何领域的东西,”亚马逊Alexa团队的科学家,该论文的第一作者,Yong-Bum Kim在一篇博文中写道,“这可能是对尚未存在的服务的要求,或者可能是客户大声说出思考的情况:'等等,这不是我想要的。' 如果自然语言理解(NLU)系统试图将域分配给域外话语,结果可能是无意义的响应。”
该团队首先汇编了两个包含话语(即语音命令)的数据集:一个覆盖21个不同的域,另一个从1500个常用的Alexa技能中采样。
在选择模型时,团队确定了双向长短期记忆(Bi-LSTM)架构,其中(1)按照接收话语的顺序考虑因素,(2)考虑前向和后向的数据序列。团队提供“词级”和“字符级”信息(特别是嵌入,或代表单词的100维空间中的点),以及组成字符。
神经网络产生了有用的个体特征的矢量摘要,该团队在将它们传递给第二个 Bi-LSTM 之前与上述嵌入相结合。它学会了识别整个输入的摘要。
平均而言,研究人员的系统将给定目标的分类准确度提高了6%。当他们在21域数据集上训练系统时,他们明显取得了更好的结果:与现有系统的83.7%相比,准确率达到90.4%。
Kim写道,“通过使用迭代尝试优化这两个目标之间权衡的训练机制,我们显着改善了具有单独训练的域分类器和域外分类器的系统的性能,域分类通过缩小可能的解释范围,使确定客户想要执行的行动更有效率。”