模型:
hyunwoongko/blenderbot-9B
构建开放领域的聊天机器人是机器学习研究的一个具有挑战性的领域。以往的研究表明,在参数数量和训练数据规模上扩展神经模型可以取得改善的结果,但我们表明,在构建高性能聊天机器人时还有其他要素很重要。良好的对话需要一个有多种技能的专业对话者能够无缝地交织在一起:提供引人入胜的话题并倾听对方,既能够提问又能够回答问题,并根据情况适当地展示知识、移情和个性。我们表明,当给予适当的训练数据和生成策略选择时,大规模模型可以学习这些技能。我们构建了包含9000万、27亿和94亿参数的神经模型的变体,并公开提供我们的模型和代码。人工评估结果显示,我们最好的模型在多轮对话的吸引力和人性度测量方面优于现有方法。然后,我们通过分析模型失败案例讨论了这项工作的局限性。