Meta研发系统2蒸馏技术提升LLM推理力

2024年07月15日由 daydream 发表 419 0

在探讨大型语言模型（LLM）的能力时，我们不难发现，它们在解答日常简单问题时游刃有余，但一旦面对需要深度逻辑推理和复杂规划的任务，便显得力不从心。为此，科研界引入了一种被称为“系统2”的特殊提示策略，这种策略通过要求LLMs逐步展示解题的中间步骤，显著增强了其推理能力。然而，这一方法虽有效，却也带来了处理速度放缓和计算成本激增的问题。

微信截图_20240715102650

有趣的是，认知科学中的“双系统”理论为我们提供了灵感：系统1代表快速、直觉性的思考，而系统2则负责缓慢但深入分析的任务。LLMs常被看作是系统1的延伸，擅长即时响应但短于深思。于是，AI研究者们开发了多种系统2提示技术，如“思维链”，旨在通过分步推理提升LLMs的逻辑准确性。

而今，Meta FAIR的研究团队创新性地提出了“系统2蒸馏”技术，它巧妙地绕过了依赖中间步骤的局限，让LLMs在不失精准度的前提下，直接掌握处理复杂任务的能力。这一技术灵感源自人类学习：通过反复练习，原本需要刻意努力的系统2任务最终能转化为系统1的自然反应，如驾驶技能的习得。

微信截图_20240715103109

系统2蒸馏的核心在于，它利用LLM自身通过系统2推理获得的知识，通过一种类似“知识提纯”的过程，将这些复杂推理能力直接融入其高效的系统1生成机制中。具体而言，就是先通过系统2提示让LLM解答问题，并通过自洽性验证确保答案的准确性；随后，舍去冗长的推理过程，仅保留最终结果，并对模型进行微调，使其能够直接、快速地给出答案。

实验证明，系统2蒸馏技术不仅显著提升了LLM在复杂推理任务上的表现，有时甚至超越了原始的系统2方法，且响应速度更快，计算成本更低。无论是应对偏见观点、优化回答质量，还是进行精细评估，该技术都展现出了非凡的效能。研究团队指出，这一发现为LLMs在复杂场景下的应用开辟了新的可能，让模型能够更高效地处理各类难题。

当然，系统2蒸馏并非万能。研究也发现，并非所有类型的推理技能都能被LLM无缝提炼至其快速推理机制中，尤其是那些高度依赖思维链提示的复杂数学推理任务。这提示我们，某些任务可能始终需要更为细致的推理过程。

此外，关于系统2蒸馏的进一步研究还需深入探索其在小型模型上的表现，以及蒸馏过程对模型在未知任务上泛化能力的影响。同时，还需警惕LLM基准测试的潜在偏见问题，确保评估结果的公正与准确。

尽管如此，系统2蒸馏无疑为LLM的优化与应用开辟了一条充满希望的新路径。展望未来，这项技术有望让LLMs在擅长领域更加高效运作，同时腾出更多资源去攻克那些尚显棘手的难题，正如人类不断突破自我极限的过程一样。

文章来源：https://venturebeat.com/ai/meta-researchers-distill-system-2-thinking-into-llms-improving-performance-on-complex-reasoning/

标签：

Meta LLM

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇微软OneNote Copilot功能开启智能手写笔记新时代

下一篇 Meta计划发布超大规模开源AI模型Llama 3-405B

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来