近期,多个备受瞩目的AI旗舰模型未能如期发布,这一趋势正在持续扩大。
据悉,去年夏季,AI公司xAI的创始人兼首席执行官、亿万富翁埃隆·马斯克表示,该公司下一代主要AI模型Grok 3将于2024年底前问世。Grok 3被视作是对抗OpenAI的GPT-4o和谷歌的Gemini等模型的回应,它能够分析图像、回答问题,并为马斯克的社交网络X提供多项功能支持。
马斯克曾在去年7月在X上发布的一条帖子中提到,经过10万台H100 GPU集群训练后的Grok 3“年末应该会有非常特别的表现”。去年12月中旬,他又在另一条帖子中称,“Grok 3将是一个重大的飞跃”。
然而,如今已是1月2日,Grok 3却仍未发布,且没有迹象表明其即将推出。
实际上,有AI消息人士蒂博·布拉霍发现,xAI网站上的一些代码暗示,一个中间版本“Grok 2.5”可能会率先亮相。
这并非马斯克首次设定高远目标却未能达成。马斯克关于产品发布时间的声明往往被认为至少是不切实际的,这一点早已为人所知。
去年8月,马斯克在接受播客主持人莱克斯·弗里德曼采访时曾表示,如果“运气好”的话,Grok 3“希望能在2024年推出”。
但Grok 3的缺席状态值得关注,因为它反映了当前的一个趋势。
去年,AI初创公司Anthropic未能如期推出其顶级模型Claude 3 Opus的升级版。在宣布下一代模型Claude 3.5 Opus将于2024年底前发布数月后,Anthropic从其开发者文档中删除了所有关于该模型的提及。(有报道称,Anthropic去年确实完成了Claude 3.5 Opus的训练,但认为发布该模型在经济上并不划算。)
据报道,谷歌和OpenAI的旗舰模型也在近几个月遭遇了挫折。
这可能表明,当前AI扩展定律——即公司用来提升模型能力的方法——存在局限性。在不久之前,通过利用大量计算能力和越来越大的数据集来训练模型,仍有可能实现显著的性能提升。但每代模型的增益已开始缩小,迫使公司寻求替代技术。
马斯克在弗里德曼的采访中也暗示了这一点。当被问及是否希望Grok 3能成为最先进的模型时,他回答说:“希望如此。我的意思是,这是目标。我们可能会失败。这只是期望。”
Grok 3延期的背后可能有其他原因。例如,xAI的团队规模远小于其许多竞争对手。尽管如此,发布时间的推迟仍进一步证明了传统AI训练方法正面临挑战。