英伟达于周二低调发布了一款新的人工智能模型,这款名为Llama-3.1-Nemotron-70B-Instruct的模型在多项基准测试中表现出色,超过了行业领头羊OpenAI和Anthropic的产品。该模型在Hugging Face平台上发布后迅速引起了关注。
根据英伟达提供的数据,Llama-3.1-Nemotron-70B-Instruct在Arena Hard、AlpacaEval 2 LC以及GPT-4-Turbo MT-Bench等关键评估中分别取得了85.0、57.6和8.98分的成绩。这些成绩超越了包括OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet在内的知名模型。
此次发布标志着英伟达战略的一个重要转变。一直以来以图形处理器(GPU)闻名的英伟达现在展示了其开发复杂人工智能软件的能力。这表明公司正扩展业务范围,涉足大型语言模型领域,可能对行业内传统的软件主导型企业构成挑战。
Llama-3.1-Nemotron-70B-Instruct基于Meta开源的Llama 3.1模型,并通过人类反馈强化学习(RLHF)等高级训练技术进行了改进。这种方法使得AI能够从人类偏好中学习,从而生成更加自然且符合上下文的回答。
对于寻求AI解决方案的企业来说,这款模型提供了一个性能更强且成本效益更高的选择。它无需额外提示或特殊标记即可处理复杂的查询。例如,在一次演示中,它正确地回答了“草莓中有多少个r?”这一问题,显示了其对语言细节的理解能力。
值得注意的是,模型的“一致性”——即输出与用户需求及偏好的匹配度——是评价中的一个重点。对企业而言,这意味着更少的错误、更有帮助的回应,以及最终更高的客户满意度。
此外,英伟达还提供了免费托管推理服务,可通过build.nvidia.com平台访问,支持OpenAI兼容的API接口,降低了企业采用先进AI技术的门槛。不过,该公司也提醒,该模型未针对如数学或法律推理等专业领域进行调优,因此使用时需要谨慎并采取适当的安全措施。
随着Llama-3.1-Nemotron-70B-Instruct的推出,AI领域的竞争进一步加剧。尽管该模型的长期影响尚不明确,但它的出现无疑为构建最先进AI系统的竞赛设立了一个新的转折点。英伟达正在从硬件供应商转变为全方位AI解决方案提供商,结合自身硬件优势推出了强大的软件工具。未来几个月内,业界将密切关注这款模型在实际应用中的表现及其潜在影响。