Meta发布700亿参数Llama 3.3,支持多语言

2024年12月09日 由 daydream 发表 233 0

近日,Meta公司推出了其最新的大型语言模型Llama 3.3。该模型拥有700亿参数,尽管规模小于4050亿参数的Llama 3.1,但在关键性能指标上却达到了相当的水平。


微信截图_20241209103310


Meta强调,Llama 3.3在效率上有所提升,使得开发者能够在标准工作站上运行该模型,从而降低了运营成本。这一改进为寻求高质量文本AI解决方案的开发者提供了更多便利。


在功能方面,Llama 3.3优化了多语言支持,能够处理包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语在内的8种语言。此外,该模型采用了自回归(auto-regressive)语言模型架构,并使用了优化的Transformer架构。其微调版本还结合了监督式微调(SFT)和基于人类反馈的强化学习(RLHF),以更好地符合人类对有用性和安全性的偏好。


Llama 3.3的上下文长度达到了128K,并支持多种工具使用格式,能够与外部工具和服务集成,从而扩展模型的功能。在安全方面,Meta采取了数据过滤、模型微调和系统级安全防护等措施,以降低模型滥用的风险,并鼓励开发者在部署时采取必要的安全措施。


值得注意的是,Meta的Llama模型已成为开源AI领域的重要组成部分,累计下载量已超过6.5亿次。通过降低前沿AI的计算要求,Llama 3.3为开发者降低了入门门槛,并扩展了各类企业应用场景的可能性。


从更广泛的角度来看,Meta对成本效益和可访问性的推动与其民主化AI的愿景相契合。此次发布也是其更广泛战略的一部分,包括在先进基础设施方面的投资,如在美国路易斯安那州建设一个2吉瓦的数据中心,以支持未来的AI发展。


具体而言,Llama 3.3在编码任务、多语言处理和一般推理方面表现出色。例如,在IFEval评估中,它获得了92.1%的分数,超过了Llama 3.1(4050亿参数)。除了对话AI之外,该模型的能力还扩展到合成数据生成、改进其他AI系统以及研究应用等领域。


关于未来规划,Meta在Instagram上发布的一篇文章暗示,Llama 4有望在2025年推出,这体现了Meta对长期AI发展的承诺。目前,Llama 3.3为开源AI树立了新的标准,在功能和实用性之间取得了平衡。


对于有兴趣了解Llama 3.3的开发者,相关资源和许可详细信息可在Meta的GitHub和Hugging Face平台上找到。

文章来源:https://www.maginative.com/article/meta-wraps-2024-with-the-release-of-llama-3-3-2/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消