百川智能发布新型AI模型，具备语言、视觉和搜索三大领域推理能力

2025年01月26日由 daydream 发表 2521 0

近日，百川智能两款新型AI模型正式发布，分别为Baichuan-M1-preview和Baichuan-M1-14B，两者均在医疗及深度思考领域有显著进展。

微信截图_20250126101326

Baichuan-M1-preview是国内首个全场景深度思考模型，具备语言、视觉和搜索三大领域的推理能力。在数学、代码等多个权威评测中，其表现超越了同类模型o1-preview。此外，该模型还解锁了“医疗循证模式”，能够从证据检索到深度推理提供完整端到端服务，快速且精准地回答医疗临床与科研问题。目前，Baichuan-M1-preview已正式上线至百小应平台，用户可登录体验其深度思考模式下的数学、代码、逻辑推理及医疗问题解答能力。

Baichuan-M1-preview在语言推理方面，于AIME、Math等数学基准测试以及LiveCodeBench代码任务上的成绩均优于o1-preview等模型；在视觉推理方面，于MMMU-val、MathVista等权威评测中的表现超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等模型。其医疗循证模式通过借鉴循证医学理念，结合自建的涵盖亿级条目的循证医学知识库，实现了对复杂医学问题的深度推理与最佳医疗决策建议。该知识库囊括了国内外海量医学论文、权威指南、专家共识等内容，并以天为单位进行动态更新。同时，模型还具备“证据分级”能力，能运用医学知识和评估标准对证据进行多层分级，确保问答结果的准确性。

另一方面，Baichuan-M1-14B是Baichuan-M1系列中的小尺寸版本，也是行业首个开源的医疗增强大模型。其医疗能力超越了更大参数量的Qwen2.5-72B，与o1-mini相近。该模型已在GitHub、Huggingface等平台开源，并支持BF16推理的NPU版本。

为了提升Baichuan-M1-14B的医疗能力，研发团队在数据收集、合成数据及模型训练阶段均进行了大量优化与创新。在数据收集方面，面向细分医疗场景，收集了万亿级token的严肃医疗数据，涵盖中/英文专业医疗论文、院内真实医疗病例、医疗问答等内容。在合成数据方面，生成了超100B token的多样化数据，进一步强化了模型的医学知识能力和医疗推理能力。在模型训练阶段，运用多阶段领域提升方案，并结合ELO强化学习法，优化了模型的生成质量与逻辑推理能力。

Baichuan-M1-14B在cmexam、clinicalbench_hos等权威医学知识和临床能力评测中的成绩超越了更大参数量的Qwen2.5-72B-Instruct，展现了其优异的医疗能力。此次开源旨在推动AI技术在医疗领域的创新发展，增强AI医疗技术的透明度和可信性，提高医疗服务的可及性，繁荣AI医疗生态。

两款Baichuan-M1系列模型的发布，标志着AI在医疗与全场景深度思考领域的又一重要进展。Baichuan-M1-preview的全场景深度思考与医疗循证模式，以及Baichuan-M1-14B的开源与医疗增强能力，将为AI医疗生态的持续进步与高质量医疗服务提供强大助力。

文章来源：https://mp.weixin.qq.com/s/hv8dYkKCimEadH9xFnGMtA

标签：

百川智能 AI 模型

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇微软AI推出SIGMA：专为AI基础设施优化而量身定制的高效大型语言模型

下一篇 GLM-PC：智谱推出的多模态大模型电脑智能体

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来