DeepSeek V3发布新版本V3-0324,性能显著提升

2025年03月25日 由 daydream 发表 3790 0

DeepSeek V3推出了新版本V3-0324,尽管官方称之为“小版本升级”,但实际测试显示,其性能提升幅度相当可观,甚至与V3.5版本相媲美。


微信截图_20250325141409


在新版本的测试中,DeepSeek V3-0324展现出了强大的能力。在复杂的小球弹跳测试中,该模型成功应对了4维空间超立方体的挑战,显示了其在高维度空间处理问题的实力。


编程方面,DeepSeek V3-0324也表现出色。仅需一句提示词,便能开发出一个完整的、带有自适应布局和动效的产品着陆页。这一功能与Claude 3.7 Sonnet的水平相当,体现了新版本在生成内容方面的强大能力。


在开发者Xeophon的个人Benchmark测试中,DeepSeek V3-0324在所有指标上均取得了显著提升,成为该测试下表现最好的非推理模型。


值得注意的是,DeepSeek V3-0324并非推理模型,但在处理问题时仍表现出一定的思维分解能力。在遇到难题时,该模型能够自主回到上一步重新思考,并展现出“顿悟”的能力,注意到题目中未直接提到的隐藏条件。


此外,DeepSeek V3-0324继续保持免费开源的特性,权重文件已上线HuggingFace,使用最宽松的MIT协议。所有权重文件占硬盘空间约688GB,与初代V3保持一致,说明其仍是671B参数的MoE模型。


目前,用户可以在官网、官方App(关闭深度思考功能)以及HuggingFace等渠道体验到DeepSeek V3-0324。同时,该模型也已加入大模型竞技场,与其他模型进行比拼,投票结果将在未来一段时间内公布。

文章来源:https://www.atyun.com/66467.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消