Cohere发布多语言AI模型Aya 23,支持23种语言

2024年05月24日 由 daydream 发表 559 0

Cohere的非营利性研究实验室Cohere for AI正式推出了Aya 23,这是他们多语言大型语言模型(LLM)的升级版。这款尖端的LLM以8B和35B的开放权重形式发布,支持多达23种语言,并且在性能上超越了其前身Aya 101。


微信截图_20240524100553


Aya 23巧妙地结合了Command家族的高性能预训练模型与最新发布的Aya集合,形成了一款强大的多语言模型。这款模型不仅为近一半的世界人口提供了尖端能力,还在预训练过程中通过为更少的语言分配更多容量来强调深度。


微信截图_20240524100710


在多项判别和生成任务中,Aya 23均展现出了超越广泛使用的模型(如Gemma、Mistral和Mixtral)的卓越性能。尤其值得一提的是,8B版本在同类产品中达到了最佳的多语言性能,这一突破性的进步让使用消费级硬件的研究人员也能轻松触及。


在CC-BY-NC许可下,Cohere for AI发布了8B和35B模型的开放权重。这一举措是他们致力于推动多语言AI领域进步,并扩大访问权限的承诺的体现。


Aya 23支持的语言包括:阿拉伯语、中文(简体和繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。

文章来源:https://www.maginative.com/article/cohere-releases-aya-23/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消