大型语言模型(LLM)是先进的深度学习技术,可以实时与人类互动,并回答范围广泛的话题。在OpenAI发布ChatGPT后,这些模型因其生成类似人类答案的能力而受到广泛关注。
尽管LLM越来越普及,但大多数LLM都是通用的,而不是针对特定主题提供答案的。另一方面,一些机场、商场和公共场所引入的聊天机器人往往基于其他类型的自然语言处理(NLP)模型。
Heriot-Watt大学和Alana AI的研究人员最近创建了FurChat,这是一个基于特定领域LLM的具象对话Agent,可以提供特定环境中的信息。这篇论文在arXiv预发布,介绍了这个Agent通过人型机器人Furhat与用户进行有趣的对话。
研究人员Oliver Lemon说:“我们想要研究与人类进行自然互动的具象化人工智能的几个方面。特别是,我们对将可以与ChatGPT等LLM进行的广泛的‘开放领域’会话与更有用和特定的信息来源相结合感兴趣,例如关于建筑和组织(即英国国家机器人馆)的信息。我们还使用ARI机器人在巴黎的Broca医院为SPRING项目构建了类似的系统,并且是用法语进行的。”
该团队最近工作的主要目标是将LLM应用于上下文特定的对话中。此外,Lemon和他的同事们希望测试这些模型生成与机器人或虚拟形象在特定时间进行交流或回应相一致的面部表情的能力。
Lemon表示:“FurChat将大型语言模型(LLM)(如ChatGPT或其他许多开源替代品,例如LLAMA)与具有动画语音功能的机器人结合起来。这是我们所知道的第一个同时将LLM用于一般对话和特定信息来源(如有关组织的文档)与自动表情机器人动画相结合的系统。”
团队的具象对话Agent和面部表情的回应是由GPT 3.5模型生成的。然后通过Furhat机器人以口头和实体的方式传达出来。
为了评估FurChat的性能,研究人员向用户进行了测试,并在用户与该Agent互动后请他们提供反馈。他们特别将机器人安装在苏格兰的英国国家机器人馆,它与访客进行互动,并为他们提供有关设施、研究事务、即将举行的活动等的信息。
Lemon解释道:“我们正在研究如何利用和进一步发展LLM的最新人工智能进展,以创建更有用、可用和引人入胜的人与机器人和人工智能系统之间的协作系统。此类系统需要事实准确,例如解释所呈现的信息如何在特定文档或图像中提供。我们正在努力开发这些功能,以确保更值得信赖和可解释的人工智能和机器人系统。同时,我们正在开发结合视觉和语言的具象化Agent系统,这样它们就可以与人类一起工作。随着人机协作系统的不断发展,这将越来越重要。”
在团队的初步现实世界实验中,FurChat系统似乎能够以流畅而信息丰富的方式与用户进行交流。将来,这项研究可能会促使在公共空间、博物馆、节日和其他场所引入类似基于LLM的具象化人工智能Agent。
Lemon补充说:“我们现在正在将具象对话Agent扩展到所谓的‘多方’对话,即涉及多个人的交互,例如在陪同亲属参观医院时。然后我们计划将它们的使用扩展到机器人和人类团队合作解决现实世界问题的场景。”