DeepSeek V3推出了新版本V3-0324,尽管官方称之为“小版本升级”,但实际测试显示,其性能提升幅度相当可观,甚至与V3.5版本相媲美。
在新版本的测试中,DeepSeek V3-0324展现出了强大的能力。在复杂的小球弹跳测试中,该模型成功应对了4维空间超立方体的挑战,显示了其在高维度空间处理问题的实力。
编程方面,DeepSeek V3-0324也表现出色。仅需一句提示词,便能开发出一个完整的、带有自适应布局和动效的产品着陆页。这一功能与Claude 3.7 Sonnet的水平相当,体现了新版本在生成内容方面的强大能力。
在开发者Xeophon的个人Benchmark测试中,DeepSeek V3-0324在所有指标上均取得了显著提升,成为该测试下表现最好的非推理模型。
值得注意的是,DeepSeek V3-0324并非推理模型,但在处理问题时仍表现出一定的思维分解能力。在遇到难题时,该模型能够自主回到上一步重新思考,并展现出“顿悟”的能力,注意到题目中未直接提到的隐藏条件。
此外,DeepSeek V3-0324继续保持免费开源的特性,权重文件已上线HuggingFace,使用最宽松的MIT协议。所有权重文件占硬盘空间约688GB,与初代V3保持一致,说明其仍是671B参数的MoE模型。
目前,用户可以在官网、官方App(关闭深度思考功能)以及HuggingFace等渠道体验到DeepSeek V3-0324。同时,该模型也已加入大模型竞技场,与其他模型进行比拼,投票结果将在未来一段时间内公布。