百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

2024年01月29日 由 neo 发表 641 0

1月29日,百川智能公布了其最新研发的大语言模型Baichuan3。这款模型拥有超千亿的参数,并采用了多项创新技术,如“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等,从而显著提升了性能。相较于业界的同类产品,Baichuan3的性能提升了超过30%。更令人瞩目的是,该模型在训练过程中表现得非常稳定,持续训练时间长达一个月以上,且在故障发生时,恢复时间不超过10分钟。

在多个能力测评中,如CMMLU、GAOKAO、AGI-Eval以及数学和代码专项评测MATH、HumanEval、MBPP等,Baichuan3均展现出优秀的表现。它不仅在自然语言处理领域有出色表现,还得到了医疗领域的权威评测MCMLE、MedExam、CMExam的认可,成为中文医疗任务最佳大模型。

640(1)

此外,Baichuan3通过采用“迭代式强化学习”技术,进一步提升了语义理解和生成能力。这一技术使得模型能够更好地理解和生成复杂的语言信息,为用户提供更准确、更有用的答案。

总的来说,百川智能的Baichuan3大语言模型凭借其强大的性能和出色的表现,为自然语言处理领域带来了新的突破。在未来的应用中,我们有理由期待Baichuan3将为人类提供更高效、更智能的服务。

文章来源:https://www.nbd.com.cn/articles/2024-01-29/3226091.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消