最近,埃隆·马斯克创立的人工智能公司xAI宣布了一款名为Grok的大型语言模型。Grok通过xAI的X平台可以获取当前世界的知识,并在多个基准测试中击败了其他类似规模的模型,包括GPT-3.5。
xAI于今年初推出,训练了他们的第一个模型Grok-0,该模型包含了330亿个参数。关于最新版本Grok-1的参数和训练细节,公司没有透露太多,但表示该模型在数学基准GSM8k和MATH、问答基准MMLU以及编码基准HumanEval等方面表现优于GPT-3.5和Llama 2。该模型被称为具有"机智和反叛倾向",xAI声称它可以回答其他语言模型无法回答的问题。xAI团队表示:
“通过创建和改进Grok,我们的目标是收集反馈,并确保我们正在建立对所有人有最大效益的人工智能工具。我们认为设计人工智能工具对各种背景和政治观点的人都有用是很重要的。我们也希望在合法的前提下赋予用户使用我们人工智能工具的权力。我们希望Grok能成为任何人的强大研究助手,帮助他们快速获取相关信息、处理数据并产生新的思路。我们的最终目标是帮助人类追求理解。”
尽管“grok”一词最早出现在罗伯特·海因莱因(Robert Heinlein)的科幻小说《陌生世界》中,但xAI表示他们的模型的灵感来自道格拉斯·亚当斯(Douglas Adams)的科幻系列小说《银河系漫游指南》中的同名虚构指南书。xAI表示,它“旨在回答几乎所有问题......”。
虽然关于Grok的技术细节不多,但xAI提到他们使用JAX、Rust和Kubernetes构建了一个自定义的机器学习框架用于训练和推断。他们还表示该模型进行了为期两个月的训练。xAI的创始成员Toby Pohlen在X平台上发布了展示Grok用户界面的视频。此外,开源向量数据库Qdrant在其X平台帐户上发文称Grok的实时知识功能是基于Qdrant构建的,并鼓励用户“敬请期待”未来的博客文章和与xAI工程团队的技术交流。
大家对这一宣布的反应褒贬不一。在Reddit上,有一位用户对这一努力表示赞扬,称:
“用只有两个月的训练就击败了Meta,这真的很令人印象深刻。我们知道他们至少拥有1万个H100(计算资源),这比用于GPT-4的计算资源还多。看起来他们将继续不断发布新版本,所以它很可能会快速改进。而且,模型似乎受到审查要少得多,这将促使其他公司也采取同样的实践。”
Hacker News上的用户则持怀疑态度。有用户推测,Grok在基准测试中的得分可能是因为在测试集上进行了训练:
“许多现代的语言模型都使用了整个互联网的副本,其中包括许多基准测试的测试集。所以,如果有人声称击败了ChatGPT,而他们的模型是在测试集上训练的,那当然他们的表现会更好。甚至ChatGPT可能也是在测试集上进行了训练。”
xAI表示他们无法排除这种可能性。不过,该团队还对Grok的数学部分进行了手动评分,该部分是匈牙利国家高中毕业考试的一部分,并在他们收集数据后发布。在这个数学考试中,Grok的表现优于GPT-3.5和Claude 2。
其他用户质疑Grok所宣称的没有审查制度是否意味着xAI忽略了偏见和其他风险。xAI表示他们正在研究“防止灾难性的恶意使用”的保护措施。该公司的顾问中列出了AI安全中心主任丹·亨德里克斯(Dan Hendrycks)。Hendrycks最近接受了Future of Life Institute的播客采访,讨论了人工智能的风险。在播客中,Hendrycks提到了xAI:
“我认为需要注意的是[xAI]是非常认真努力的。我预计它可能会成为未来一两年的三大人工智能公司之一:OpenAI、Google DeepMind和xAI。”
Grok的早期测试版等待名单仅对经过验证的X用户开放。