Meta研发系统2蒸馏技术提升LLM推理力

2024年07月15日 由 daydream 发表 217 0

在探讨大型语言模型(LLM)的能力时,我们不难发现,它们在解答日常简单问题时游刃有余,但一旦面对需要深度逻辑推理和复杂规划的任务,便显得力不从心。为此,科研界引入了一种被称为“系统2”的特殊提示策略,这种策略通过要求LLMs逐步展示解题的中间步骤,显著增强了其推理能力。然而,这一方法虽有效,却也带来了处理速度放缓和计算成本激增的问题。


微信截图_20240715102650


有趣的是,认知科学中的“双系统”理论为我们提供了灵感:系统1代表快速、直觉性的思考,而系统2则负责缓慢但深入分析的任务。LLMs常被看作是系统1的延伸,擅长即时响应但短于深思。于是,AI研究者们开发了多种系统2提示技术,如“思维链”,旨在通过分步推理提升LLMs的逻辑准确性。


而今,Meta FAIR的研究团队创新性地提出了“系统2蒸馏”技术,它巧妙地绕过了依赖中间步骤的局限,让LLMs在不失精准度的前提下,直接掌握处理复杂任务的能力。这一技术灵感源自人类学习:通过反复练习,原本需要刻意努力的系统2任务最终能转化为系统1的自然反应,如驾驶技能的习得。


微信截图_20240715103109


系统2蒸馏的核心在于,它利用LLM自身通过系统2推理获得的知识,通过一种类似“知识提纯”的过程,将这些复杂推理能力直接融入其高效的系统1生成机制中。具体而言,就是先通过系统2提示让LLM解答问题,并通过自洽性验证确保答案的准确性;随后,舍去冗长的推理过程,仅保留最终结果,并对模型进行微调,使其能够直接、快速地给出答案。


实验证明,系统2蒸馏技术不仅显著提升了LLM在复杂推理任务上的表现,有时甚至超越了原始的系统2方法,且响应速度更快,计算成本更低。无论是应对偏见观点、优化回答质量,还是进行精细评估,该技术都展现出了非凡的效能。研究团队指出,这一发现为LLMs在复杂场景下的应用开辟了新的可能,让模型能够更高效地处理各类难题。


当然,系统2蒸馏并非万能。研究也发现,并非所有类型的推理技能都能被LLM无缝提炼至其快速推理机制中,尤其是那些高度依赖思维链提示的复杂数学推理任务。这提示我们,某些任务可能始终需要更为细致的推理过程。


此外,关于系统2蒸馏的进一步研究还需深入探索其在小型模型上的表现,以及蒸馏过程对模型在未知任务上泛化能力的影响。同时,还需警惕LLM基准测试的潜在偏见问题,确保评估结果的公正与准确。


尽管如此,系统2蒸馏无疑为LLM的优化与应用开辟了一条充满希望的新路径。展望未来,这项技术有望让LLMs在擅长领域更加高效运作,同时腾出更多资源去攻克那些尚显棘手的难题,正如人类不断突破自我极限的过程一样。

文章来源:https://venturebeat.com/ai/meta-researchers-distill-system-2-thinking-into-llms-improving-performance-on-complex-reasoning/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消