模型:
hyunwoongko/reddit-3B
构建开放领域的聊天机器人是机器学习研究中的一个具有挑战性的领域。先前的研究表明,通过在模型参数数量和训练数据规模上进行扩展可以获得更好的结果,我们显示其他因素对于高性能聊天机器人也是至关重要的。良好的对话需要一些技能,一个专业的对话者可以无缝地融合这些技能:提供有趣的话题并倾听他们的伙伴,既提问又回答问题,并根据情况恰当地展示知识、同理心和个性。我们发现,当给定适当的训练数据和生成策略选择时,大规模模型可以学习并掌握这些技能。我们构建了90M、2.7B和9.4B参数的神经模型的变体,并公开提供我们的模型和代码。人类评估显示,我们最好的模型在多轮对话中的引人入胜程度和人性化程度方面优于现有方法。然后我们通过分析模型失效案例来讨论这项工作的局限性。