消息称OpenAI已放弃GPT-4级模型“Arrakis”的开发

2023年10月19日 由 daydream 发表 270 0

OpenAI曾在研发一款名为Arrakis的新型AI模型,旨在降低AI推理成本。然而,由于质量问题,该公司已停止了该项目的开发。


微信截图_20231019113700

Arrakis本应具备与GPT-4相当的能力,但部署成本更低,原因是该模型部分采用了所谓的“稀疏原则”。这意味着只有神经网络的部分被用于处理输入,而在传统的"密集模型"中,整个神经网络是活动的。例如,谷歌在其Pathways AI项目中使用了稀疏原则。


Arrakis的开发始于去年秋季,训练工作于春季开始。然而,OpenAI的开发团队很快意识到性能不足,据引述两位熟悉该项目的人的说法。


有消息称,团队在一个月的时间里进行了一些调整,然后领导团队终止了该项目。目前尚不清楚为什么稀疏原则在早期测试中表现良好,但对于更大规模的模型则不适用。


转而开发“GPT-4 Turbo”


尽管遇到了挫折,但OpenAI可能会将Arrakis的工作应用于其他模型,比如计划中的Gobi多模态模型。据报道,Arrakis训练失败后,OpenAI的研究人员开始致力于开发能够更快生成响应的GPT-4版本。


这可能就是今年夏季推出的“0613”版GPT-4,其速度要比OpenAI今年3月起初使用的“0314”版本快得多。一些用户已经抱怨在某些领域质量有所下降,虽然OpenAI对此进行了反驳,但这导致该公司通过API提供“0314”版本的时间比原计划的更长。


OpenAI将AI引入沙漠


Gobi、Sahara和Arrakis:这些新的AI模型原型以沙漠命名,向稀疏原则致敬,并希望这些模型能够更有效地工作并节省成本。特别是OpenAI合作伙伴微软希望Arrakis能够降低其产品中生成式AI的使用成本。


根据媒体的报道,微软自身已将资源转向开发更便宜的语言模型,因为生成式AI的高成本威胁到了新兴的商业模式。


有关Arrakis的消息泄漏


Arrakis的泄漏先前有过报道。据称,该模型除了生成文本外还可以生成图像和视频,幻觉比GPT-4少,并且适合作为自主代理。此外,Arrakis将部分使用合成数据进行训练。发布计划定于明年。据FeltSteam表示,Arrakis可能更像是一个生成更高效模型的系统,这可能有助于GPT-3.5 Turbo的开发。


回顾起来,多模态模型Arrakis的存在可能解释了微软德国首席技术官Andreas Braun曾在2023年3月初发表的一份声明。在GPT-4正式发布前一周,他谈到了“多模态模型”,这些模型也可以生成视频。当时,OpenAI很可能还在研发Arrakis。

文章来源:https://the-decoder.com/openai-reportedly-canceled-arrakis-its-more-efficient-gpt-4-level-ai-model/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消