OpenAI公开o3-mini思维链引发真实性争议

2025年02月07日 由 daydream 发表 3997 0

近日,OpenAI宣布公开其o3-mini模型的思维链(Chain of Thought,简称CoT)。然而,这一举动却迅速引发了广泛争议,因为公开的思维链被质疑并非原生,而是经过处理的版本。


微信截图_20250207143333


据悉,o3-mini的思维链原本旨在展示模型如何一步步推理得出答案。例如,在回答“怎么今天不是星期五啊?”的问题时,展示的思维链显示模型理解了用户的幽默,并通过Zeller公式计算出当天确实是星期四。然而,这一展示很快被专业人士发现存在问题。


OpenAI研究员Noam Brown首先指出,此次公开的思维链并非模型原始的CoT。随后,其他研究者也发现,所谓的CoT更像是一个“总结器”,而非真实的推理过程。


针对这一质疑,OpenAI首席执行官奥特曼进行了解释。他表示,OpenAI正在努力整理原始的CoT以提高可读性,并在必要时提供翻译,同时尽量保持原始内容的忠实度。然而,这一解释并未平息争议。


有观点认为,OpenAI此次公开的思维链处理过度,失去了作为prompt调试器的真实价值,反而可能引入错误,增加调试难度。同时,与竞争对手DeepSeek相比,OpenAI的处理方式显得不够自然和直接。DeepSeek已经公开了其模型的完整原始CoT,而OpenAI则选择了一个更为谨慎和保守的路径。


此外,还有研究者指出,OpenAI此次公开的思维链显示速度较慢,如果采用原始的o3-mini模型,推理过程中的生成速度应该会更快。这也进一步加剧了人们对OpenAI处理方式的质疑。


对于这一争议,OpenAI发言人表示,为了提高清晰度和安全性,他们在公开的思维链中增加了一个额外的后处理步骤。在这一步骤中,模型会审查原始的思维链,移除任何不安全的内容,并简化复杂的推理过程。同时,这一步骤也使得非英语用户能够以他们的母语接收思维链,从而创造一个更易于访问和友好的体验。


尽管OpenAI给出了官方解释,但争议仍在继续。此次事件再次凸显了人工智能领域在透明度和开放性方面所面临的挑战。如何在保护模型安全性的同时,向公众展示模型的真实推理过程,成为了业界亟待解决的问题。

文章来源:https://www.atyun.com/65322.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消