百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

2024年01月29日由 neo 发表 993 0

1月29日，百川智能公布了其最新研发的大语言模型Baichuan3。这款模型拥有超千亿的参数，并采用了多项创新技术，如“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等，从而显著提升了性能。相较于业界的同类产品，Baichuan3的性能提升了超过30%。更令人瞩目的是，该模型在训练过程中表现得非常稳定，持续训练时间长达一个月以上，且在故障发生时，恢复时间不超过10分钟。

在多个能力测评中，如CMMLU、GAOKAO、AGI-Eval以及数学和代码专项评测MATH、HumanEval、MBPP等，Baichuan3均展现出优秀的表现。它不仅在自然语言处理领域有出色表现，还得到了医疗领域的权威评测MCMLE、MedExam、CMExam的认可，成为中文医疗任务最佳大模型。

640(1)

此外，Baichuan3通过采用“迭代式强化学习”技术，进一步提升了语义理解和生成能力。这一技术使得模型能够更好地理解和生成复杂的语言信息，为用户提供更准确、更有用的答案。

总的来说，百川智能的Baichuan3大语言模型凭借其强大的性能和出色的表现，为自然语言处理领域带来了新的突破。在未来的应用中，我们有理由期待Baichuan3将为人类提供更高效、更智能的服务。

文章来源：https://www.nbd.com.cn/articles/2024-01-29/3226091.html

标签：

百川智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Moonshot Kimi Chat 更新：基础模型能力全面升级

下一篇 Meta推出新版Code Llama：更强大、更准确的代码生成AI

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消