在《与比尔·盖茨同行:消除困惑》最新一集中,OpenAI首席执行官Sam Altman指出,OpenAI正在“这条漫长而连续的曲线”上创建更新更好的模型。他强调了多模态性作为GPT-5的关键特性,使其能够处理视频输入并生成新视频。
Altman认为,不久的将来,AI将能够处理更复杂的任务,从而提高生产力。“你可以想象对一个小助手说,‘去为我编写这整个程序’。它可能会向你提一些问题,但它不仅仅是写几个函数——它将开启很多新的东西,”Altman表示。
他打趣说:“也许有一天,会有一个AI,你可以对它说,‘为我启动并运行这个公司’。然后有一天,可能还会有一个AI,你可以对它说,‘为我发现新的物理[定律]’。”
目前,已有几个基础模型实现了GPT-4的能力。谷歌随时可能会推出Gemini Ultra。与此同时,Mistral公司首席执行官Arthur Mensch在法国国家广播电台宣布,该公司将在2024年推出一个开源的GPT-4水平模型。
“Gemini Ultra会在GPT-5之前发布吗?我怀疑Gemini Ultra在推理上超过了GPT-4,”Abacus AI首席执行官Bindu Reddy在X上的帖子写道。
值得注意的是,Mistral Medium获得了6000多票并且表现出色,达到了Claude的水平。“Mixtral将在今年超越GPT-4。今天,在聊天机器人竞技场中,它是唯一一个位于顶尖的开源模型(跟随GPT-4、Claude和Mistral Medium),也是最小的一个,拥有70亿指令。它甚至比谷歌的Gemini Pro还要好,”AI专家Santiago欣喜地说。
诸如此类的事实和声明让OpenAI必须保持警惕。
接下来是什么——GPT-5?
在与盖茨的对话中,Altman详细讨论了GPT-5,强调了定制化和个性化。“了解你、你的电子邮件、你的日程表、你喜欢如何预订预约,以及连接到其他外部数据源。这些将是改善的最重要的领域,”Altman说。
此外,他声称GPT-5将比GPT-4具有更好的推理能力。“GPT-4只能在极其有限的方式上推理。此外,可靠性也是一个问题。如果你让GPT-4回答大多数问题1万次,其中1次可能是相当不错的,但它并不总是知道哪一个。但你希望每次都能得到1万次中的最佳回应,”Altman说。
除了新模型,OpenAI或许很快将开始专注于特定垂直领域以服务其客户。“编程可能是我们现在最明显的生产力提升领域,人工智能已经在这一领域得到了大规模部署和使用。医疗保健和教育也在走上这样的曲线,我们也对它们很兴奋,”Altman说。
与此同时,OpenAI最近推出了GPT商店。这可能有助于OpenAI开发GPT-5,因为他们将从客户创建的使用个人数据的GPT中获取大规模标记的数据。有趣的是,博客中没有提到OpenAI不会使用GPT商店数据来训练其模型。
OpenAI是关于行动的
OpenAI团队在X上非常活跃,请求客户反馈以改进其模型。最近,OpenAI总裁Greg Brockman在X上提了一个问题:“ChatGPT如何改变了你的生活?”一个名为Aaron Stormerr的用户分享了ChatGPT对其作为盲人计算机科学学生的学术旅程产生的深远影响。
同样,OpenAI开发者关系负责人Logan Kilpatrick问道:“谁正在用OpenAI API构建最有用/最酷的产品?我想在2024年花更多时间听来自建设者的反馈,关于我们可以如何支持他们/你。”
显然,OpenAI的宗旨就是发布一个不完美的产品或功能,然后通过持续的消费者反馈在旁边进行改进,并尽可能快速地推出产品。因此,公司的好坏取决于下一个模型,类似Walt Disney曾对他的团队说的:“我们的好坏取决于我们的下一张图片。”