阿里云发布了Qwen2.5,这是其通义千问系列中的最新一代人工智能模型。该模型提供多种参数规模选项,从0.5亿到720亿不等,以适应不同的应用需求。在训练过程中,Qwen2.5利用了一个包含约18万亿个token的大规模数据集,相较于前代版本,性能提升了至少18%。
Qwen2.5能够处理更长的文本输入和输出,上下文长度支持达128,000个tokens,并能生成最多8,000个tokens的内容。此外,该模型覆盖了超过29种语言,强化了对不同语种的支持能力。
对于特定领域的需求,Qwen2.5提供了专门优化的版本:针对编程任务的Qwen2.5-Coder以及专注于数学问题解决的Qwen2.5-Math。前者基于5.5万亿个token的数据进行训练,涵盖了92种编程语言;后者则整合了多种推理方法,能够在中文和英文的数学题目上表现出良好的解题能力。
根据公开信息,在多个基准测试中,Qwen2.5展现了较为出色的表现。例如,在评估通用知识的MMLU-rudex、代码编写能力的MBPP以及数学能力的MATH测试中,Qwen2.5分别取得了86.8分、88.2分及83.1分的成绩。这些改进使得Qwen2.5不仅在自然语言处理方面有所增强,同时也在专业领域的应用中展现出更强的能力。