Meta发布700亿参数Llama 3.3，支持多语言

2024年12月09日由 daydream 发表 287 0

近日，Meta公司推出了其最新的大型语言模型Llama 3.3。该模型拥有700亿参数，尽管规模小于4050亿参数的Llama 3.1，但在关键性能指标上却达到了相当的水平。

微信截图_20241209103310

Meta强调，Llama 3.3在效率上有所提升，使得开发者能够在标准工作站上运行该模型，从而降低了运营成本。这一改进为寻求高质量文本AI解决方案的开发者提供了更多便利。

在功能方面，Llama 3.3优化了多语言支持，能够处理包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语在内的8种语言。此外，该模型采用了自回归（auto-regressive）语言模型架构，并使用了优化的Transformer架构。其微调版本还结合了监督式微调（SFT）和基于人类反馈的强化学习（RLHF），以更好地符合人类对有用性和安全性的偏好。

Llama 3.3的上下文长度达到了128K，并支持多种工具使用格式，能够与外部工具和服务集成，从而扩展模型的功能。在安全方面，Meta采取了数据过滤、模型微调和系统级安全防护等措施，以降低模型滥用的风险，并鼓励开发者在部署时采取必要的安全措施。

值得注意的是，Meta的Llama模型已成为开源AI领域的重要组成部分，累计下载量已超过6.5亿次。通过降低前沿AI的计算要求，Llama 3.3为开发者降低了入门门槛，并扩展了各类企业应用场景的可能性。

从更广泛的角度来看，Meta对成本效益和可访问性的推动与其民主化AI的愿景相契合。此次发布也是其更广泛战略的一部分，包括在先进基础设施方面的投资，如在美国路易斯安那州建设一个2吉瓦的数据中心，以支持未来的AI发展。

具体而言，Llama 3.3在编码任务、多语言处理和一般推理方面表现出色。例如，在IFEval评估中，它获得了92.1%的分数，超过了Llama 3.1（4050亿参数）。除了对话AI之外，该模型的能力还扩展到合成数据生成、改进其他AI系统以及研究应用等领域。

关于未来规划，Meta在Instagram上发布的一篇文章暗示，Llama 4有望在2025年推出，这体现了Meta对长期AI发展的承诺。目前，Llama 3.3为开源AI树立了新的标准，在功能和实用性之间取得了平衡。

对于有兴趣了解Llama 3.3的开发者，相关资源和许可详细信息可在Meta的GitHub和Hugging Face平台上找到。

文章来源：https://www.maginative.com/article/meta-wraps-2024-with-the-release-of-llama-3-3-2/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇微软Surface新品2025年更新，搭载AI芯片与新特性

下一篇 X公司推出新AI图像生成器Aurora，逼真度大幅提升

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来