谷歌DeepMind推出Talker-Reasoner代理框架,融合人类思维双系统

2024年10月25日 由 neo 发表 218 0

AI代理在执行任务时,常需应对不同速度、推理及规划能力的要求。理想状态下,代理应能灵活选择直接记忆或复杂推理策略。然而,设计能根据任务需求自适应的代理系统仍是一大挑战。

QQ截图20241025161609

近期,谷歌DeepMind的研究团队在一篇新论文中介绍了Talker-Reasoner框架,这是一个受人类认知“两个系统”模型启发的代理架构。此框架旨在帮助AI代理在不同类型的推理间找到平衡,从而提升用户体验的流畅度。

人类与AI中的系统1与系统2思维

诺贝尔奖得主丹尼尔·卡尼曼提出的两系统理论指出,人类思维由两个不同系统驱动。系统1快速、直观且自动,负责即时判断,如快速反应或识别熟悉模式。相反,系统2缓慢、深思熟虑并具分析性,擅长复杂问题解决、规划及推理。

尽管常被视为独立系统,两者却持续相互作用。系统1生成印象、直觉及意图,而系统2评估这些建议,并在认可时将其融入明确信念和深思熟虑的选择中。这种互动让我们能在从日常琐事到复杂问题的各种情境中自如应对。

当前AI代理主要依赖系统1模式

当前AI代理主要展现系统1特性,擅长模式识别、快速反应及重复性任务。但在需多步规划、复杂推理及战略决策的场景中,它们常表现欠佳,而这些正是系统2思维的强项。

Talker-Reasoner框架介绍

Talker-Reasoner-framework

DeepMind提出的Talker-Reasoner框架旨在赋予AI代理系统1与系统2的能力。该框架将代理分为两个模块:Talker(言说者)和Reasoner(推理者)。

  • · Talker:快速且直观,类似于系统1,负责实时与用户及环境交互。它感知观察结果、解释语言、从记忆中检索信息并生成对话响应,通常借助大型语言模型(LLM)的上下文学习能力实现。
  • · Reasoner:体现系统2的缓慢与深思熟虑特性,负责复杂推理和规划。它准备执行任务,与工具和外部数据源交互以增进知识并做出明智决策。随着新信息的收集,它还更新代理的信念,这些信念驱动未来决策,并作为Talker在对话中使用的记忆。

研究人员指出:“Talker专注于自然连贯的对话及环境交互,而Reasoner则专注于多步规划、推理及信念形成,这些信念以Talker提供的环境信息为基础。”

两模块主要通过共享内存系统交互。Reasoner通过最新信念和推理结果更新内存,而Talker检索这些信息以指导交互。这种异步通信使Talker能维持连续对话流程,即使Reasoner在后台进行耗时计算。

Talker-Reasoner-detailed

应用测试与未来研究方向

研究人员在睡眠辅导应用中测试了该框架。AI辅导员通过自然语言与用户交互,提供个性化睡眠习惯改善指导。此应用结合了快速共情对话与深思熟虑的知识推理。

睡眠教练的Talker组件处理对话,提供共情回应并引导用户经历不同辅导过程。Reasoner维护用户睡眠问题、目标、习惯及环境的信念状态,利用这些信息生成个性化建议和多步计划。此框架同样适用于客户服务、个性化教育等应用。

DeepMind研究人员还提出了未来研究方向,包括优化Talker与Reasoner的交互,以及扩展框架以包含多个Reasoners,每个专长于不同类型推理或知识领域,从而使代理能处理更复杂任务并提供更全面支持。

文章来源:https://venturebeat.com/ai/deepminds-talker-reasoner-framework-brings-system-2-thinking-to-ai-agents/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消