百川智能发布新型AI模型,具备语言、视觉和搜索三大领域推理能力

2025年01月26日 由 daydream 发表 2302 0

近日,百川智能两款新型AI模型正式发布,分别为Baichuan-M1-preview和Baichuan-M1-14B,两者均在医疗及深度思考领域有显著进展。


微信截图_20250126101326


Baichuan-M1-preview是国内首个全场景深度思考模型,具备语言、视觉和搜索三大领域的推理能力。在数学、代码等多个权威评测中,其表现超越了同类模型o1-preview。此外,该模型还解锁了“医疗循证模式”,能够从证据检索到深度推理提供完整端到端服务,快速且精准地回答医疗临床与科研问题。目前,Baichuan-M1-preview已正式上线至百小应平台,用户可登录体验其深度思考模式下的数学、代码、逻辑推理及医疗问题解答能力。


Baichuan-M1-preview在语言推理方面,于AIME、Math等数学基准测试以及LiveCodeBench代码任务上的成绩均优于o1-preview等模型;在视觉推理方面,于MMMU-val、MathVista等权威评测中的表现超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等模型。其医疗循证模式通过借鉴循证医学理念,结合自建的涵盖亿级条目的循证医学知识库,实现了对复杂医学问题的深度推理与最佳医疗决策建议。该知识库囊括了国内外海量医学论文、权威指南、专家共识等内容,并以天为单位进行动态更新。同时,模型还具备“证据分级”能力,能运用医学知识和评估标准对证据进行多层分级,确保问答结果的准确性。


另一方面,Baichuan-M1-14B是Baichuan-M1系列中的小尺寸版本,也是行业首个开源的医疗增强大模型。其医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相近。该模型已在GitHub、Huggingface等平台开源,并支持BF16推理的NPU版本。


为了提升Baichuan-M1-14B的医疗能力,研发团队在数据收集、合成数据及模型训练阶段均进行了大量优化与创新。在数据收集方面,面向细分医疗场景,收集了万亿级token的严肃医疗数据,涵盖中/英文专业医疗论文、院内真实医疗病例、医疗问答等内容。在合成数据方面,生成了超100B token的多样化数据,进一步强化了模型的医学知识能力和医疗推理能力。在模型训练阶段,运用多阶段领域提升方案,并结合ELO强化学习法,优化了模型的生成质量与逻辑推理能力。


Baichuan-M1-14B在cmexam、clinicalbench_hos等权威医学知识和临床能力评测中的成绩超越了更大参数量的Qwen2.5-72B-Instruct,展现了其优异的医疗能力。此次开源旨在推动AI技术在医疗领域的创新发展,增强AI医疗技术的透明度和可信性,提高医疗服务的可及性,繁荣AI医疗生态。


两款Baichuan-M1系列模型的发布,标志着AI在医疗与全场景深度思考领域的又一重要进展。Baichuan-M1-preview的全场景深度思考与医疗循证模式,以及Baichuan-M1-14B的开源与医疗增强能力,将为AI医疗生态的持续进步与高质量医疗服务提供强大助力。

文章来源:https://mp.weixin.qq.com/s/hv8dYkKCimEadH9xFnGMtA
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消