埃隆·马斯克宣布,他公司下一代AI聊天机器人Grok可能在几周内发布,称其“聪明得吓人”,并声称在测试中已超越其他所有AI模型。
xAI的首席执行官在2月13日的迪拜世界政府峰会上发表了这些言论。
“有时,我觉得Grok-3有点聪明得吓人”马斯克说。“它能提出你意想不到的解决方案——你知道的,不是显而易见的解决方案。”
聊天机器人的开发者为Grok-3采用了独特的训练方法。与ChatGPT使用真实世界数据不同,Grok-3依赖于合成数据,并采用自我纠正机制以保持逻辑一致性。马斯克声称,它变得如此准确,即使遇到错误信息,系统也会反思数据并删除不符合现实的内容。
训练Grok-3的计算需求非常庞大。计算它需要2亿GPU小时,远远超过其中国竞争对手DeepSeek-V3的270万小时。它运行在xAI的Colossus超级集群上,10万块Nvidia H100 GPU——是其前身计算能力的十倍。即使没有微调,马斯克声称基础模型的表现也优于Grok-2。
Grok-3与X的整合,使其能够实时抓取社交媒体应用,而不是依赖于浏览网络。系统可以从X中提取实时数据,并具有公司称之为“无拘无束模式”的功能——根据xAI自己的常见问题解答,这是“旨在引起反感、不当和冒犯的。”
不过,系统还未完全准备好投入使用。马斯克将剩余的工作比作完成一栋房子:“最后的5%是做干墙、油漆和修剪——即使工作量不大,但它改变了房子的面貌。”
然而,它可能会比OpenAI的GPT-4.5更早发布,至少,Sam Altman表示可能在几周或几个月内发布。
“可能(Grok-3)将在一两周内发布”埃隆说。他没有明确说明新版本是否会公开发布或像Grok-2最初那样需要订阅。
AI领域的竞争加剧。虽然ChatGPT在2024年占据市场份额,但中国的开源模型DeepSeek-V3成为了一个强有力的竞争者,尽管使用的资源远少于GPT-4o和Meta的Llama 3.1,但表现更好。
Grok最初在X Premium上推出,这大大限制了其可用性。后来,它免费向马斯克社交媒体平台的所有用户开放,并推出了一个新的独立网站,现在对所有人开放。
xAI进入推理AI战场
我很高兴地宣布Reflection 70B,这是世界上最顶尖的开源模型。
使用Reflection-Tuning训练,这是一种开发的技术,旨在使LLM能够修正自己的错误。
405B下周推出——我们预计它将成为世界上最好的模型。
由@GlaiveAI构建。
继续阅读 ⬇️:pic.twitter.com/kZPW1plJuo
——Matt Shumer (@mattshumer_)2024年9月5日