Meta发布两款Llama 4人工智能模型

2025年04月07日由 daydream 发表 3817 0

Meta公司近日宣布推出Llama 4系列人工智能模型，这些新模型目前为Meta AI助手提供支持，包括网页版及WhatsApp、Messenger和Instagram等应用中的版本。两款新模型Llama 4 Scout和Llama 4 Maverick已可通过Meta或Hugging Face平台下载。

微信截图_20250407090712

其中，Llama 4 Scout是一款小型模型，能够运行于单块Nvidia H100 GPU上。另一款Llama 4 Maverick则与GPT-4o和Gemini 2.0 Flash等模型性能相当。Meta方面表示，公司仍在训练Llama 4 Behemoth模型，Meta首席执行官马克·扎克伯格称该模型为“全球性能最优的基础模型”。

据Meta披露，Llama 4 Scout拥有1000万token的上下文窗口，即AI模型的工作记忆容量，在多项广泛使用的基准测试中，其表现优于谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型以及开源的Mistral 3.1，且仍可运行于单块Nvidia H100 GPU。对于更大规模的Maverick模型，Meta也做出了类似声明，称其性能优于OpenAI的GPT-4o和谷歌的Gemini 2.0 Flash，并在编程和推理任务中，使用不到一半的活动参数即可达到与DeepSeek-V3相当的结果。

至于Llama 4 Behemoth，该模型拥有2880亿活动参数，总参数规模达2万亿。尽管尚未发布，但Meta表示，Behemoth在多项STEM（科学、技术、工程和数学）基准测试中的表现优于GPT-4.5和Claude Sonnet 3.7等竞争对手。

在Llama 4模型中，Meta采用了“混合专家”（MoE）架构，该架构通过仅使用模型中特定任务所需的部分来节省资源。Meta计划在4月29日举行的LlamaCon大会上讨论未来AI模型和产品的发展规划。

与以往模型相同，Meta将Llama 4系列称为“开源”，但Llama模型曾因许可限制受到批评。例如，Llama 4的许可要求拥有超过7亿月活跃用户的商业实体在使用其模型前需获得Meta的许可，这一规定在2023年被开源促进会认为“不属于‘开源’范畴”。

文章来源：https://www.theverge.com/news/644171/llama-4-released-ai-model-whatsapp-messenger-instagram-direct

标签：

Meta Llama 4 人工智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇腾讯混元多模态理解模型升级，元宝支持同时处理10张图片

下一篇微软推出基于AI技术生成的《Quake II》演示版本

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来