英伟达发布Llama-3.1 AI模型,性能超越OpenAI

2024年10月17日 由 daydream 发表 113 0

英伟达于周二低调发布了一款新的人工智能模型,这款名为Llama-3.1-Nemotron-70B-Instruct的模型在多项基准测试中表现出色,超过了行业领头羊OpenAI和Anthropic的产品。该模型在Hugging Face平台上发布后迅速引起了关注。


微信截图_20241017113405


根据英伟达提供的数据,Llama-3.1-Nemotron-70B-Instruct在Arena Hard、AlpacaEval 2 LC以及GPT-4-Turbo MT-Bench等关键评估中分别取得了85.0、57.6和8.98分的成绩。这些成绩超越了包括OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet在内的知名模型。


此次发布标志着英伟达战略的一个重要转变。一直以来以图形处理器(GPU)闻名的英伟达现在展示了其开发复杂人工智能软件的能力。这表明公司正扩展业务范围,涉足大型语言模型领域,可能对行业内传统的软件主导型企业构成挑战。


Llama-3.1-Nemotron-70B-Instruct基于Meta开源的Llama 3.1模型,并通过人类反馈强化学习(RLHF)等高级训练技术进行了改进。这种方法使得AI能够从人类偏好中学习,从而生成更加自然且符合上下文的回答。


对于寻求AI解决方案的企业来说,这款模型提供了一个性能更强且成本效益更高的选择。它无需额外提示或特殊标记即可处理复杂的查询。例如,在一次演示中,它正确地回答了“草莓中有多少个r?”这一问题,显示了其对语言细节的理解能力。


值得注意的是,模型的“一致性”——即输出与用户需求及偏好的匹配度——是评价中的一个重点。对企业而言,这意味着更少的错误、更有帮助的回应,以及最终更高的客户满意度。


此外,英伟达还提供了免费托管推理服务,可通过build.nvidia.com平台访问,支持OpenAI兼容的API接口,降低了企业采用先进AI技术的门槛。不过,该公司也提醒,该模型未针对如数学或法律推理等专业领域进行调优,因此使用时需要谨慎并采取适当的安全措施。


随着Llama-3.1-Nemotron-70B-Instruct的推出,AI领域的竞争进一步加剧。尽管该模型的长期影响尚不明确,但它的出现无疑为构建最先进AI系统的竞赛设立了一个新的转折点。英伟达正在从硬件供应商转变为全方位AI解决方案提供商,结合自身硬件优势推出了强大的软件工具。未来几个月内,业界将密切关注这款模型在实际应用中的表现及其潜在影响。

文章来源:https://venturebeat.com/ai/nvidia-just-dropped-a-new-ai-model-that-crushes-openais-gpt-4-no-big-launch-just-big-results/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消