英伟达发布Llama-3.1 AI模型，性能超越OpenAI

2024年10月17日由 daydream 发表 334 0

英伟达于周二低调发布了一款新的人工智能模型，这款名为Llama-3.1-Nemotron-70B-Instruct的模型在多项基准测试中表现出色，超过了行业领头羊OpenAI和Anthropic的产品。该模型在Hugging Face平台上发布后迅速引起了关注。

微信截图_20241017113405

根据英伟达提供的数据，Llama-3.1-Nemotron-70B-Instruct在Arena Hard、AlpacaEval 2 LC以及GPT-4-Turbo MT-Bench等关键评估中分别取得了85.0、57.6和8.98分的成绩。这些成绩超越了包括OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet在内的知名模型。

此次发布标志着英伟达战略的一个重要转变。一直以来以图形处理器（GPU）闻名的英伟达现在展示了其开发复杂人工智能软件的能力。这表明公司正扩展业务范围，涉足大型语言模型领域，可能对行业内传统的软件主导型企业构成挑战。

Llama-3.1-Nemotron-70B-Instruct基于Meta开源的Llama 3.1模型，并通过人类反馈强化学习（RLHF）等高级训练技术进行了改进。这种方法使得AI能够从人类偏好中学习，从而生成更加自然且符合上下文的回答。

对于寻求AI解决方案的企业来说，这款模型提供了一个性能更强且成本效益更高的选择。它无需额外提示或特殊标记即可处理复杂的查询。例如，在一次演示中，它正确地回答了“草莓中有多少个r？”这一问题，显示了其对语言细节的理解能力。

值得注意的是，模型的“一致性”——即输出与用户需求及偏好的匹配度——是评价中的一个重点。对企业而言，这意味着更少的错误、更有帮助的回应，以及最终更高的客户满意度。

此外，英伟达还提供了免费托管推理服务，可通过build.nvidia.com平台访问，支持OpenAI兼容的API接口，降低了企业采用先进AI技术的门槛。不过，该公司也提醒，该模型未针对如数学或法律推理等专业领域进行调优，因此使用时需要谨慎并采取适当的安全措施。

随着Llama-3.1-Nemotron-70B-Instruct的推出，AI领域的竞争进一步加剧。尽管该模型的长期影响尚不明确，但它的出现无疑为构建最先进AI系统的竞赛设立了一个新的转折点。英伟达正在从硬件供应商转变为全方位AI解决方案提供商，结合自身硬件优势推出了强大的软件工具。未来几个月内，业界将密切关注这款模型在实际应用中的表现及其潜在影响。

文章来源：https://venturebeat.com/ai/nvidia-just-dropped-a-new-ai-model-that-crushes-openais-gpt-4-no-big-launch-just-big-results/

标签：

英伟达人工智能模型

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Diff Transformer：改进大型语言模型信息检索能力的新架构

下一篇 SearchGPT推广范围逐步扩大，免费用户或将迎来体验机会

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来