模型:
facebook/blenderbot-1B-distill
构建开放领域聊天机器人是机器学习研究中具有挑战性的领域。尽管先前的研究表明,将神经模型在参数数量和训练数据规模上进行扩展可以获得改进的结果,但我们表明还有其他因素对于高性能聊天机器人非常重要。良好的对话需要许多技能,一个专业的对话者可以巧妙地融合在一起:提供有趣的话题和倾听对方的意见,既提问又回答问题,并根据情况适当显示知识、同理心和个性。我们表明,当给予适当的训练数据和生成策略选择时,大规模模型可以学习这些技能。我们构建了包含90M、2.7B和9.4B个参数神经模型的不同版本,并公开提供我们的模型和代码。人工评估显示,我们最好的模型在多轮对话的吸引力和人性化度量方面优于现有方法。然后,我们通过分析模型的错误案例来讨论这项工作的局限性。