“零一万物 01AI”官方公众号发布了重要消息,宣布其全新开源模型Yi-9B的推出。这款模型在Yi系列中被誉为“理科状元”,以其卓越的代码和数学能力,展现了强大的技术实力。Yi-9B的实际参数达到了8.8B,默认上下文长度更是达到了4K tokens,为用户提供了更为丰富的信息处理能力。
Yi-9B模型在Yi-6B的基础上进行了进一步的优化和升级,利用0.8T tokens的数据进行继续训练,数据截止至2023年6月,确保了模型的前沿性和准确性。
在综合能力评估中,Yi-9B的表现尤为出色。它在相近尺寸的开源模型中脱颖而出,超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等众多竞争对手。特别是在代码能力和数学能力方面,Yi-9B同样展现出了强大的竞争力,虽然在某些方面略逊于DeepSeek-Coder-7B和DeepSeek-Math-7B,但整体性能依然令人瞩目。
此外,Yi-9B还在常识和推理能力方面表现出色,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相伯仲。这一优势使得Yi-9B能够更好地理解并处理复杂的语言任务,为用户提供更为精准和智能的服务。
值得一提的是,Yi-9B模型不仅在性能上表现出色,还在易用性和成本效益方面具有显著优势。官方表示,无论是BF 16版本的Yi-9B还是其量化版Int8,都能在消费级显卡上轻松部署,大大降低了使用门槛和成本。这一特性使得更多的开发者能够轻松利用Yi-9B模型,推动AI技术的普及和应用。
此前,该公司已在创新工场董事长兼CEO李开复的带领下,推出了Yi-34B和Yi-6B两个开源大模型,为学术研究提供了丰富的资源和支持。如今,随着Yi-9B的推出,该公司进一步巩固了在AI领域的领先地位,为整个行业的发展注入了新的活力。