Meta开源新人工智能模型Llama 2
2023年07月31日 由 Susan 发表
692344
0
Meta正在开源其大型语言模型Llama 2。该模型的代码和权重可以免费用于研究和商业用途。
Llama 2是Meta和微软扩展伙伴关系的结果,微软成为新模型的首选合作伙伴。该模型可在Azure人工智能模型目录中获得,让使用Microsoft Azure的开发人员可以将其集成到项目中,并利用云原生工具进行内容过滤和安全功能。Llama 2还经过优化,可以在Windows上本地运行,为开发人员带来更简化的工作流程。
根据Meta的说法,与之前的Llama版本相比,Llama 2的训练数据量增加了40%以上,并在推理和知识测试方面优于其他语言模型。斯坦福大学基础模型研究中心主任Percy Liang评论道:“Llama 2并非GPT-4,但对于许多用例,你并不需要GPT-4。”
Meta的首席人工智能科学家Yann Lecun表示,有兴趣利用Llama 2的开发人员可以通过微软的Azure平台、亚马逊网络服务(AWS)、Hugging Face和其他提供商访问该模型。
Meta表示,发布Llama 2伴随着一系列资源以确保负责任的使用。这些资源包括红队演练、透明度计划、负责任使用指南和可接受使用政策。
Nvidia的人工智能科学家Jim Fan指出,“在编码基准测试上存在明显差距。在大多数基准测试中,它与PaLM-540B水平相当或更好,但仍远落后于GPT-4和PaLM-2-L。”
《麻省理工科技评论》指出,Meta没有公布用于训练Llama 2的数据集的信息,该模型“与所有大型语言模型一样存在一些问题:易于产生虚假信息和冒犯语言。”
开发人员可以参考模型卡片获取更多信息或开始编写自己的代码。模型卡片指出该模型仅适用于英文。
此举是在两名美国参议员此前向Meta的首席执行官提出关于此类发布的问题后采取的,他们在信中写道,“该公司的首席人工智能科学家曾表示,开放模型对于其商业成功至关重要”,并断言先前的开放发布“放任和宽容的方式引发了重要而复杂的问题”。
Meta还启动了新的计划以收集有关模型性能和潜在改进的反馈意见。Meta表示:“我们认为开放的方式对于当今的人工智能模型开发是正确的选择,特别是在生成领域,这里的技术正在迅速发展。”
来源:https://www.infoq.com/news/2023/07/meta-new-ai-model/