阿里开源代码大模型CodeQwen1.5，支持92种编程语言

2024年04月17日由 neo 发表 586 0

在人工智能领域取得重大突破后，通义千问昨晚宣布开源了其基于Qwen1.5的代码模型——CodeQwen1.5。这一开源举措标志着代码智能领域的一大进步，为开发者们提供了更强大、更智能的代码生成与修改工具。

CodeQwen1.5是一个基于Qwen语言模型的代码专家模型，拥有高达7B的参数规模。它采用了先进的GQA架构，并通过预训练处理了约3T tokens的代码数据。这款模型不仅支持92种编程语言，更能处理最长达64K的上下文输入，为开发者提供了前所未有的便利。

6384896555714173661318814

在性能表现上，CodeQwen1.5在代码生成、长序列建模、代码修改和SQL能力等多个方面展现出了卓越的能力。据相关评估数据显示，CodeQwen1.5在代码生成方面的表现已经超越了众多大尺寸模型，缩小了与GPT-4等顶尖模型在编码能力上的差距。

值得一提的是，CodeQwen1.5在多个竞赛平台的问题上也展现出了强大的泛化能力。在LiveCodeBench的评估中，CodeQwen1.5在LeetCode、AtCoder和CodeForces等平台的问题解决上均取得了显著成绩，尽管其预训练语料中包含了LeetCode的数据。

livecode

此外，CodeQwen1.5不仅精通Python，还支持多种主流编程语言。在MultiPL-E的评估中，CodeQwen1.5在8种主流语言上的表现均令人瞩目，证明了其多语言编程的卓越能力。

在实际应用方面，CodeQwen1.5同样表现出色。在SWE Bench上的测试中，它能够理解代码仓库并生成可通过单测的代码，为解决真实软件开发中的问题提供了有力支持。同时，CodeQwen1.5在代码修改方面也展现出了最佳效果，尤其在Debug、Translate、Switch、Polish等四个方面。

作为一个智能的SQL专家，CodeQwen1.5还具备通过自然语言查询数据库的能力，为非编程专业人士提供了与高效数据交互的便捷途径。在Spider和Bird等基准测试中，CodeQwen1.5的性能接近GPT-4，充分显示了其在SQL领域的实力。

此次开源的CodeQwen1.5模型已支持多种平台和工具，如Transformers、vLLM、llama.cpp、Ollama等，为开源社区提供了更广泛的应用选择。开源社区对CodeQwen1.5的发布充满期待，期待它在代码助手、Code Agent等方面为社区做出更多贡献，并在未来的代码智能建设中发挥更加重要的作用，实现真正的AI程序员梦想。

通义千问通过开源CodeQwen1.5模型，不仅提升了开发者的工作效率，简化了软件开发流程，也为整个开源社区注入了新的活力。随着这一技术的不断发展和完善，相信未来代码智能领域将迎来更多的创新和突破。

文章来源：https://qwenlm.github.io/zh/blog/codeqwen1.5/

标签：

通义千问

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 PyTorch发布torchtune alpha版，简化大型语言模型微调流程

下一篇 AI2更新OLMo模型，采用Dolma 1.7数据集

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术