月之暗面国产大模型Kimi发布全新视觉思考模型k1

2024年12月16日由 neo 发表 635 0

今日，国内知名人工智能企业月之暗面正式推出了其国产大模型Kimi的全新视觉思考模型k1。这款模型基于先进的强化学习技术精心打造，不仅原生支持端到端的图像理解功能，还融入了思维链技术，进一步拓宽了其应用领域，涵盖了数学以外的众多基础科学领域。

b64543a98226cffc5eb16abb714b529ff703eafe

随着k1模型的发布，最新版Kimi智能助手已同步在Android、iPhone APP以及官方网页版kimi.com上线。用户只需在最新版手机APP或网页版的Kimi+页面中，找到Kimi视觉思考版功能，即可轻松通过拍照或上传图片的方式，体验这一创新功能。

eaf81a4c510fd9f97e52a5beed67cc252934a47e

据悉，在针对数学、物理、化学等基础科学学科的基准能力测试中，k1模型的表现尤为亮眼，成功超越了全球知名的标杆模型，包括OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。这一成绩不仅彰显了k1模型在基础科学领域的强大实力，也为其在未来的广泛应用奠定了坚实基础。

月之暗面官方表示，k1模型在视觉思考和图像理解方面实现了真正的端到端能力。用户可以直接向模型输入图像信息，模型将自主处理并思考得出答案，无需依赖外部的OCR或其他视觉模型进行辅助信息处理。

从模型训练的角度来看，k1的训练过程经过了精心的设计和优化。首先，通过预训练得到基础模型，然后在基础模型的基础上进行强化学习后训练。在基础模型阶段，k1特别优化了字符识别能力，并在OCRBench上取得了903分的优异成绩，同时在MathVista-testmini、MMMU-val和DocVQA等基准测试集上也表现出色，分别获得了69.1、66.7和96.9的高分，位列全球前列。

a490de3763bb609e8c429664b7410d15

值得一提的是，k1在强化学习后训练阶段也取得了显著进展。在数据质量和学习效率方面进行了进一步优化，并在强化学习的规模化上取得了新的突破。这正是k1视觉推理模型在基准测试中能够取得行业领先成绩的最关键因素。

然而，月之暗面也坦诚地表示，在内部测试过程中，他们发现k1视觉思考模型仍存在一些局限性。例如，在分布外（out-of-distribution）的泛化能力、处理更复杂问题的成功率、在更多噪声场景下的准确率以及多轮问答效果等方面，k1仍有很大的提升空间。此外，在一些场景和泛化能力上，k1模型与OpenAI的o1系列模型相比仍存在一定的差距。

文章来源：https://www.ithome.com/0/817/854.htm

标签：

月之暗面 Kimi

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Meta AI提出大型概念模型 (LCM)：超越基于标记的语言建模的语义飞跃

下一篇 LLMs推理策略新突破：小模型在受限计算预算下超越大模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来