如果你认为最近的GPT-4o和GPT-4o mini发布已经足够让OpenAI忙碌了,那你可就想错了。在GPT-4o发布仅四个月后,OpenAI终于发布了传闻中的“草莓”大型语言模型(LLM),官方名称为o1和o1-mini。
周四,OpenAI发布了o1系列模型,这些模型擅长推理,能够解决复杂的数学、科学和编码问题。此次发布是在有关OpenAI将发布一款擅长推理的大型语言模型(代号“草莓计划”)的传言流传一年多之后。
OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)甚至也加入了传言的行列,于8月在X上发布了一张草莓园的照片,并附上了一段神秘的文字:“我喜欢夏天的花园”,如下所示。
我喜欢夏天的花园 pic.twitter.com/Ter5Z5nFMc
——萨姆·阿尔特曼(@sama)2024年8月7日
现在,“草莓计划”即o1-preview和o1-mini已经面世,以下是我们所知的关于这些模型的一切、如何访问它们以及你可以期待什么。
“草莓计划”到底是什么?
今年5月,路透社获得了一份OpenAI内部文件,该文件显示OpenAI正在研发一个代号为“草莓”的项目。在这份内部文件中,“草莓”被描述为一个具有先进推理能力的模型,可以自主且可靠地在互联网上导航,用于深入研究。
这个项目与Q模型相同,关于Q的传言始于2023年11月。当时,路透社报道称,一些OpenAI员工认为Q*是通用人工智能(AGI)领域的一个突破。
对于这些传言的正式回应是OpenAI于9月12日发布的o1-preview和o1-mini模型。与上述传言不同,这些模型并非AGI或完全自主,但它们确实具备研究人员和学者可以利用的高级推理能力。这些模型已向ChatGPT Plus和Team订阅用户开放。
o1-preview和o1-mini可以用于哪些方面?
这两款模型的主要卖点在于它们擅长推理,即像人类一样思考并解答问题。OpenAI表示,它们训练这些模型在回答之前先思考,这改进了它们的思考过程,使它们能够尝试不同的策略并识别自己的错误。
由于这两款模型能够推理出提示,它们在解决复杂或困难的数学、科学和编程问题方面表现更佳。因此,在选择使用哪款模型时,如果需要帮助解决更复杂的问题,最好选择o1-preview。OpenAI还指出,o1-mini在编程方面尤其有效。
o1模型与GPT-4o相比如何?
o1模型的优势在于其出色的推理能力。这得益于其训练方式,即要求模型在回答之前先思考,从而能够尝试不同的策略并最终得出答案。
因此,o1模型在数学、科学和编程方面表现出色。例如,它在国际数学奥林匹克竞赛(IMO)资格考试中获得了83%的分数。相比之下,GPT-4o仅正确解决了13%的问题。因此,在解决复杂或困难的STEM(科学、技术、工程和数学)问题时,o1模型是最佳选择。
然而,尽管这种表现可能让你认为o1模型在所有情况下都是更好的选择,但事实并非如此。由于o1是一个早期模型,它缺乏ChatGPT的一些关键功能,如浏览互联网和接受媒体上传。因此,目前对于大多数请求来说,GPT-4o仍然是更好的选择。
ChatGPT Plus和Teams用户可以根据提示在不同模型之间切换,因此无需局限于使用其中一个。为了更便于用户选择,OpenAI正在开发一项功能,使ChatGPT能够根据用户提示自动选择最佳模型。
Project Strawberry/o1-preview和o1-mini可以在哪里访问?
ChatGPT Plus和Teams用户可以通过ChatGPT页面左上角的模型选择器切换按钮访问o1-preview和o1-mini模型。对于o1-preview,每周限制为30条消息,而o1-mini的周限制为50条消息。
Altman确认这一更新已对所有ChatGPT Plus/Teams用户开放。最终,OpenAI也计划将这些功能带给所有ChatGPT免费用户,但并未明确说明这一变化何时会发生。
当然,开发者也有机会访问这些模型,特别是那些符合API使用层级5的开发者,他们在API中的限制为每分钟20次请求(RPM)。ChatGPT Enterprise和Edu用户将在下周初获得访问权限。
o1-preview和o1-mini是免费的吗?
这些模型目前还不是免费的,但OpenAI计划将它们向所有人开放。在此之前,唯一可以访问o1-preview和o1-mini的方式是通过付费订阅,包括ChatGPT Plus、Teams、Enterprise和Edu。开发者也可以通过API访问。
对于个人用户来说,ChatGPT Plus是访问这些模型的最佳方式,它每月费用为20美元,并附带其他福利,如优先访问最新模型和创建GPT的能力。