Meta发布两款Llama 4人工智能模型

2025年04月07日 由 daydream 发表 3817 0

Meta公司近日宣布推出Llama 4系列人工智能模型,这些新模型目前为Meta AI助手提供支持,包括网页版及WhatsApp、Messenger和Instagram等应用中的版本。两款新模型Llama 4 Scout和Llama 4 Maverick已可通过Meta或Hugging Face平台下载。


微信截图_20250407090712


其中,Llama 4 Scout是一款小型模型,能够运行于单块Nvidia H100 GPU上。另一款Llama 4 Maverick则与GPT-4o和Gemini 2.0 Flash等模型性能相当。Meta方面表示,公司仍在训练Llama 4 Behemoth模型,Meta首席执行官马克·扎克伯格称该模型为“全球性能最优的基础模型”。


据Meta披露,Llama 4 Scout拥有1000万token的上下文窗口,即AI模型的工作记忆容量,在多项广泛使用的基准测试中,其表现优于谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型以及开源的Mistral 3.1,且仍可运行于单块Nvidia H100 GPU。对于更大规模的Maverick模型,Meta也做出了类似声明,称其性能优于OpenAI的GPT-4o和谷歌的Gemini 2.0 Flash,并在编程和推理任务中,使用不到一半的活动参数即可达到与DeepSeek-V3相当的结果。


至于Llama 4 Behemoth,该模型拥有2880亿活动参数,总参数规模达2万亿。尽管尚未发布,但Meta表示,Behemoth在多项STEM(科学、技术、工程和数学)基准测试中的表现优于GPT-4.5和Claude Sonnet 3.7等竞争对手。


在Llama 4模型中,Meta采用了“混合专家”(MoE)架构,该架构通过仅使用模型中特定任务所需的部分来节省资源。Meta计划在4月29日举行的LlamaCon大会上讨论未来AI模型和产品的发展规划。


与以往模型相同,Meta将Llama 4系列称为“开源”,但Llama模型曾因许可限制受到批评。例如,Llama 4的许可要求拥有超过7亿月活跃用户的商业实体在使用其模型前需获得Meta的许可,这一规定在2023年被开源促进会认为“不属于‘开源’范畴”。

文章来源:https://www.theverge.com/news/644171/llama-4-released-ai-model-whatsapp-messenger-instagram-direct
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消