据TechCrunch报道,Meta全球事务总裁Nick Clegg在周二(3月10日)于伦敦举行的一次活动中表示:“我们希望在接下来的一个月内,实际上可能更短,在很短的一段时间内,我们开始推出我们的新一代基础模型套件,即Llama 3。”
“今年内,我们将发布一系列具有不同功能和不同用途的模型,很快就要开始了,”他补充说。
《The Information》最初声称,Llama 3的一个较小版本可能最早在下周发布,而完整的开源模型仍定于7月发布。这个版本将能够与Claude 3和GPT-4竞争。
Meta首席产品官Chris Cox补充说,计划利用Llama 3为Meta的各种产品提供动力。
此次发布正值Meta试图在竞争激烈的生成式AI领域迎头赶上。其前身Llama 2于2023年7月发布,因其局限性而遭到批评。
AI研究副总裁Joelle Pineau表示:“我们的目标是将Llama驱动的Meta AI发展成为世界上最有用的助手。然而,要实现这一目标,还需要做大量工作。”
Llama 3是什么?
Llama 3是一个大型语言模型,其大小范围广泛,从非常小的版本开始,旨在与Claude Haiku或Gemini Nano等模型竞争,到更大的版本,它们装备齐全,能够进行回应和推理,类似于GPT-4或Claude Opus。
然而,关于Llama 3的详细信息仍然很少,预计它将遵循前一版本的步伐,采取开源形式,并有望支持多模态,能够同时理解视觉和文本输入。
据推测,Llama 3将推出不同版本和大小,最小的版本有70亿个参数,而最大的版本大约有1400亿个参数。然而,这仍然远远少于用于训练GPT-4的万亿级参数。