OpenAI发布了一款名为o1的新模型,这是该公司计划中的一系列“推理”模型之一。这款模型旨在更快速地解答复杂问题。o1将与一个较小且成本较低的版本o1-mini一同推出。尽管OpenAI将此次发布标记为“预览版”,以表明其仍处于早期阶段,但这一模型因其高度期待而备受关注。
对于OpenAI而言,o1是实现类人人工智能目标的重要一步。在实用性上,它在编写代码和解决多步骤问题方面比之前的模型表现得更好。然而,相比GPT-4o,o1使用成本更高且速度较慢。OpenAI表示,ChatGPT Plus和Team用户可以访问o1-preview和o1-mini;而Enterprise和Edu用户将在下周获得访问权限。至于免费用户,他们将能够在未来的某个时间点获得o1-mini的使用权。
o1的训练方法与其前身有显著不同。OpenAI的研究负责人Jerry Tworek透露,o1采用了一种全新的优化算法,并且使用了专门为该模型定制的训练数据集。不同于通过模仿训练数据中的模式来学习的GPT模型,o1采用了强化学习技术进行自我问题解决,并通过奖励和惩罚的方式进行训练。此外,它还运用了“思维链”来处理查询,类似于人类逐步解决问题的过程。
据称,这种新的训练方法使模型更为精确,减少了错误生成的情况,但完全消除错误生成仍然是个挑战。新模型在解决AP数学测试和国际数学奥林匹克竞赛题目的能力上表现出色,甚至在Codeforces编程比赛中达到了参赛者的第89百分位。不过,o1在世界事实知识方面不如GPT-4o,并且不具备浏览网络或处理文件和图像的能力。
尽管如此,OpenAI认为o1代表了一个全新的功能类别。该模型被命名为o1,意味着“将计数器重置回1”。OpenAI希望通过这个名称传达出一种新的命名逻辑。
虽然o1在处理复杂问题时展现出更强的能力,但它并不等同于真正的人类思考过程。OpenAI强调,设计模型时并未将其与人类思维等同起来,而是希望通过界面展示模型如何更深入地处理和解决问题。然而,即使在模拟人类思维过程中,o1也并不是真正的思考实体。