月之暗面国产大模型Kimi发布全新视觉思考模型k1

2024年12月16日 由 neo 发表 553 0

今日,国内知名人工智能企业月之暗面正式推出了其国产大模型Kimi的全新视觉思考模型k1。这款模型基于先进的强化学习技术精心打造,不仅原生支持端到端的图像理解功能,还融入了思维链技术,进一步拓宽了其应用领域,涵盖了数学以外的众多基础科学领域。


b64543a98226cffc5eb16abb714b529ff703eafe

随着k1模型的发布,最新版Kimi智能助手已同步在Android、iPhone APP以及官方网页版kimi.com上线。用户只需在最新版手机APP或网页版的Kimi+页面中,找到Kimi视觉思考版功能,即可轻松通过拍照或上传图片的方式,体验这一创新功能。

eaf81a4c510fd9f97e52a5beed67cc252934a47e

据悉,在针对数学、物理、化学等基础科学学科的基准能力测试中,k1模型的表现尤为亮眼,成功超越了全球知名的标杆模型,包括OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。这一成绩不仅彰显了k1模型在基础科学领域的强大实力,也为其在未来的广泛应用奠定了坚实基础。

月之暗面官方表示,k1模型在视觉思考和图像理解方面实现了真正的端到端能力。用户可以直接向模型输入图像信息,模型将自主处理并思考得出答案,无需依赖外部的OCR或其他视觉模型进行辅助信息处理。

从模型训练的角度来看,k1的训练过程经过了精心的设计和优化。首先,通过预训练得到基础模型,然后在基础模型的基础上进行强化学习后训练。在基础模型阶段,k1特别优化了字符识别能力,并在OCRBench上取得了903分的优异成绩,同时在MathVista-testmini、MMMU-val和DocVQA等基准测试集上也表现出色,分别获得了69.1、66.7和96.9的高分,位列全球前列。

a490de3763bb609e8c429664b7410d15

值得一提的是,k1在强化学习后训练阶段也取得了显著进展。在数据质量和学习效率方面进行了进一步优化,并在强化学习的规模化上取得了新的突破。这正是k1视觉推理模型在基准测试中能够取得行业领先成绩的最关键因素。

然而,月之暗面也坦诚地表示,在内部测试过程中,他们发现k1视觉思考模型仍存在一些局限性。例如,在分布外(out-of-distribution)的泛化能力、处理更复杂问题的成功率、在更多噪声场景下的准确率以及多轮问答效果等方面,k1仍有很大的提升空间。此外,在一些场景和泛化能力上,k1模型与OpenAI的o1系列模型相比仍存在一定的差距。

文章来源:https://www.ithome.com/0/817/854.htm
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消