研究人员测试AI是否可以在词的层面上理解幽默感
2019年02月27日 由 bie管我叫啥 发表
222822
0
AI能够理解多种语言并与人类交流,然而,AI系统仍然在某些方面遇到了困难,其中之一就是幽默。
牛津大学,微软研究院和TRASH的一组研究人员最近开展了一项研究,关于词嵌入中幽默。词嵌入是一种流行的AI工具,可以将单词与Euclidean向量相关联。
“我们有兴趣研究计算机如何理解幽默,”开展这项研究的微软研究员Adam Kalai表示,“虽然AI非常强大,甚至可以从一种语言翻译成另一种语言,但啊它却无法理解幽默。我们决定测试AI是否可以在一个词的层面上理解幽默,因为很多人都会觉得像‘nincompoop(傻瓜)’这样的词有些好笑。”
团队考虑了幽默的六个主要特征,从现有理论和幽默的学术讨论中汲取灵感。这些特征包括:幽默的声音(无论意义如何),并置/意外的不协调,性内涵,晦涩的内涵,侮辱性的话语和口语词。
研究人员调查了这些特征与幽默相关的程度,在一个名为GNEWS的谷歌新闻语料库中嵌入一个预先训练好的word2vec,看能在多大程度上捕捉到这些特征。在他们的研究中使用的一个数据集是Engelthaler-Hill 数据集,该数据集包含4997个单词的平均幽默评分,每个单词的评分范围从1到5(约35个人类评估者)。
为了更好地理解人们对有趣的词的看法差异,研究人员还收集了一个较小的原始数据集,其中包含高度幽默的单词,通过亚马逊的Mechanical Turk平台招募讲英语的人来标记这些单词。他们进行了一系列幽默评级研究,要求参与者选择他们发现更幽默的单词,并用相关的幽默理论为每个单词注释。
描述词嵌入中与词理论相关的特征与其各自幽默等级之间的关系
“我们要求多个人对他们在英语单词中发现最幽默的单词进行评分,我们设计了一项研究,人们通过最小的努力(点击次数最少)确定了他们发现的最有趣的单词。”
随后,研究人员调查了他们最初发现的幽默特征如何与他们的数据集中的幽默评级相关联,以确定理论结构在捕获人类评级中的有效性。此外,他们使用词嵌入测试了这些评级的可预测性,探索了AI可以理解幽默的程度。
“我们发现AI可以理解为什么有些词比其他词更有趣,甚至可以理解幽默感之间的差异。但AI仍然不理解句子或较长文本中的幽默,我们希望这个研究是一个起点。”
Kalai和他的同事发现,嵌入词有效地捕获了EH数据集中评价的幽默词的各个方面,以及幽默等级与其新数据集的差异。研究结果进一步表明,人们的幽默感可以通过一些评级来嵌入,并且最终的嵌入可以用来预测未被评级的单词的幽默级数。
结论显示了一个有趣的词汇嵌入应用,并为利用那些做更多AI幽默研究方式铺平了道路,例如生成或预测与个人幽默感相匹配的幽默词汇,与此同时,还提供了对幽默的直观概念的进一步验证,以及在心理学或哲学等其他领域收集的知识。
由Kalai,Gultchin及其同事进行的研究表明,嵌入词可以通过各种方式增强我们对幽默的理解。首先,他们发现已建立的幽默理论(例如优势理论,不协调理论等)在不同程度上都表现为嵌入词,因此可以用来识别或预测幽默,并被人类的评价所捕捉。
“女性幽默感”与“男性幽默感”之间的差异
通过对词汇的向量表示,研究人员还能够将个人的幽默感定义为一个平均向量,利用这些向量来预测不同人的幽默感,即他们对某些词汇的幽默感评级。最后,聚类幽默感使他们能够识别出幽默的聚类,如“女性幽默”、“男性幽默”、“老年幽默”等。这是一个重要的发现,因为它证实了不同群体的人有不同的幽默感。
Gultchin说,“在AI应用广泛的时代,例如推荐系统或助手,幽默可能会在促进用户和自动化系统之间更顺畅,更无缝的交互方面发挥重要作用,我们希望这项工作有助于作为概念证明,表明现有的NLP工具已经可以帮助我们实现这一目标。”
Kalain,Gultchin及其同事将公开提供他们研究中使用的新数据集,以便其他研究人员可以在他们的研究中使用它们。他们认为增强AI系统对单词幽默的理解可以开辟一些有趣的可能性。
Gultchin表示,"我们仍在观察这项工作如何被接受,但未来有多个方向。看看这些概念是否真的可以用在互动系统中,这将是非常有趣的。互动系统会根据个人的幽默感对句子进行‘有趣’的修改,就像嵌入单词一样。另一个有趣的方向是,最终是否能学会预测和生成完整的幽默句子,或者随着最近的发展,是否能写出完整的幽默的段落。”
论文:
arxiv.org/abs/1902.02783