埃隆·马斯克称他的新AI聊天机器人“聪明得吓人”——将在几周内推出

2025年02月14日 由 佚名 发表 127 0

埃隆·马斯克宣布,他公司下一代AI聊天机器人Grok可能在几周内发布,称其“聪明得吓人”,并声称在测试中已超越其他所有AI模型。

微信截图_20250214103334

xAI的首席执行官在2月13日的迪拜世界政府峰会上发表了这些言论。

“有时,我觉得Grok-3有点聪明得吓人”马斯克说。“它能提出你意想不到的解决方案——你知道的,不是显而易见的解决方案。”

聊天机器人的开发者为Grok-3采用了独特的训练方法。与ChatGPT使用真实世界数据不同,Grok-3依赖于合成数据,并采用自我纠正机制以保持逻辑一致性。马斯克声称,它变得如此准确,即使遇到错误信息,系统也会反思数据并删除不符合现实的内容。

训练Grok-3的计算需求非常庞大。计算它需要2亿GPU小时,远远超过其中国竞争对手DeepSeek-V3的270万小时。它运行在xAI的Colossus超级集群上,10万块Nvidia H100 GPU——是其前身计算能力的十倍。即使没有微调,马斯克声称基础模型的表现也优于Grok-2。

Grok-3与X的整合,使其能够实时抓取社交媒体应用,而不是依赖于浏览网络。系统可以从X中提取实时数据,并具有公司称之为“无拘无束模式”的功能——根据xAI自己的常见问题解答,这是“旨在引起反感、不当和冒犯的。”

不过,系统还未完全准备好投入使用。马斯克将剩余的工作比作完成一栋房子:“最后的5%是做干墙、油漆和修剪——即使工作量不大,但它改变了房子的面貌。”

然而,它可能会比OpenAI的GPT-4.5更早发布,至少,Sam Altman表示可能在几周或几个月内发布。

“可能(Grok-3)将在一两周内发布”埃隆说。他没有明确说明新版本是否会公开发布或像Grok-2最初那样需要订阅。

AI领域的竞争加剧。虽然ChatGPT在2024年占据市场份额,但中国的开源模型DeepSeek-V3成为了一个强有力的竞争者,尽管使用的资源远少于GPT-4o和Meta的Llama 3.1,但表现更好。

Grok最初在X Premium上推出,这大大限制了其可用性。后来,它免费向马斯克社交媒体平台的所有用户开放,并推出了一个新的独立网站,现在对所有人开放。

微信截图_20250214103917
图片:Grok.com

xAI进入推理AI战场

主要的AI参与者正在将重点转向推理模型,开发能够反思特定问题并在经过长时间和广泛的思维链推理后找到解决方法的AI模型。

这个想法最初由Matt Schumer探索,当时Reflection 70b宣布。该模型被训练以整合思维链推理,尽管只是Llama 70b的微调,但据说可以在复杂任务中击败Claude 3.5 Sonnet。

这没有奏效,但仅仅几周后,OpenAI宣布了其“OpenAI o1”推理模型,有效地应用了相同的概念。该模型标志着AI模型在逻辑能力方面的新标准,并被视为OpenAI在AI行业中占据主导地位的护城河。

但是DeepSeek的发布颠覆了世界。一个中国研究团队构建了一个比o1更好的模型,成本仅为其一小部分——而且还开源了。

从那时起,OpenAI宣布其未来的模型将合并为一个全能的AI,抛弃传统的GPT架构,首先专注于深度推理。

xAI似乎在跟随市场趋势。

“Grok-3具有非常强大的推理能力”埃隆·马斯克说。

他没有透露关于模型结构的更多信息。当前版本的Grok-2在LLM竞技场中排名第18位,远低于GPT、Claude、Gemini、Qwen或DeepSeek等竞争对手。

展望未来,xAI计划将其计算基础设施扩展到100万块GPU用于未来具有“数万亿参数”的模型。根据马斯克的说法,最终目标是通过越来越复杂的模型向通用人工智能迈进。

文章来源:https://decrypt.co/305821/elon-musk-grok-3-ai-chatbot-scary-smart
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消