英文

模型描述

摘要

构建开放领域的聊天机器人是机器学习研究的一个具有挑战性的领域。以往的研究表明,通过增加神经模型的参数数量和训练数据的规模,可以获得更好的结果。然而,我们表明,要实现一个高性能的聊天机器人,还需要其他的要素。良好的对话需要一些技能,这些技能是一位专业的对话者以一种无缝的方式结合起来的: 提供引人入胜的话题并倾听对方,既提问也回答问题,并根据情况适当地展示知识、同理心和个性。我们展示了当给出适当的训练数据和生成策略选择时,大规模模型可以学习这些技巧。我们构建了90M、2.7B和9.4B参数的神经模型的变体,并公开了我们的模型和代码。人工评估结果显示,我们的最佳模型在多轮对话中的引人入胜度和人性度方面优于现有方法。然后,我们通过分析模型的失败案例来讨论本研究的局限性。