在人工智能领域,阿里云再次展现了其强大的研发实力。近日,阿里云正式发布了通义千问2.5版本,这款中文大模型在性能上全面超越了GPT-4 Turbo,被业界誉为地表最强中文大模型。
据了解,通义千问2.5的最新版本在多个基准测评中均取得了显著成绩。其最新开源的1100亿参数模型在MMLU、TheoremQA、GPQA等测试中均超越了Meta的Llama-3-70B模型,成为开源领域的新标杆。这一成绩不仅证明了通义千问2.5在模型参数和性能上的卓越,也体现了阿里云在人工智能领域的技术领先地位。
与通义千问2.1版本相比,通义千问2.5在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,这些能力分别提升了9%、16%、19%和10%,其中中文能力更是持续领先业界。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4 Turbo持平,成为该基准首次有国产大模型取得如此出色成绩。
阿里云此次不仅发布了通义千问2.5版本,还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在多个基准测评中均超越了Meta的Llama-3-70B模型,并在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上荣登榜首。这一成就再次巩固了通义开源系列在业界的领先地位。
除了模型性能的卓越外,通义的多模态模型和专有能力模型也展现出了业界顶尖的影响力。其中,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V,目前已在多家企业落地应用,为各行各业带来了实质性的帮助。此外,通义千问代码大模型CodeQwen1.5-7B也是业界领先的模型之一,在HuggingFace代码模型榜单Big Code上位居前列,同时还是国内用户规模第一的智能编码助手通义灵码的底座。
阿里云方面表示,通义千问2.5的发布是阿里云在人工智能领域持续创新的重要成果之一。未来,阿里云将继续加大在人工智能领域的投入和研发力度,推出更多高性能、高可靠性的模型和产品,为企业和开发者提供更加优质、高效的人工智能服务。