阿里巴巴发布Qwen Chat v0.2及Qwen2.5-1M开源语言模型

2025年01月27日由 daydream 发表 5393 0

2025年1月26日，阿里巴巴正式推出了其AI平台Qwen Chat的更新版本v0.2，并同时发布了最新的开源语言模型Qwen2.5-1M系列。此次更新标志着阿里巴巴在多模态AI工具开发方面取得了重要进展。

微信截图_20250127095847

Qwen Chat v0.2版本集成了三大主要功能：网页搜索、视频创作和图像生成。用户现在可以直接在聊天界面内执行实时网页搜索，根据提示创建视频，以及从文本描述生成高质量图像。这些新功能与现有的文档分析、物品创建和图像理解等功能相辅相成，使得Qwen Chat成为一款既适合专业工作又适合创意任务的多功能工具。

与此同时，阿里巴巴还发布了Qwen2.5-1M系列开源语言模型，包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两款模型。这两款模型均支持在单个上下文中处理高达100万个令牌（tokens），这在处理大规模文本输入任务（如文档摘要、代码分析和长内容生成）时具有显著优势。与大多数现有语言模型支持的令牌限制通常在数万个以内相比，这是一个重大突破。

为了配合新模型的推出，阿里巴巴还开源了一个基于vLLM（大型语言模型的高性能服务系统）的高级推理框架。该框架集成了稀疏注意力方法，使得模型在处理100万个令牌输入时的速度比传统方法快3至7倍。稀疏注意力优化了模型对输入文本相关部分的关注方式，从而在保持准确性的同时降低了计算开销。

此次发布还包括一份技术报告和博客文章，详细介绍了Qwen2.5-1M系列的架构和性能。用户可以通过多个平台探索这些模型，包括阿里巴巴的Qwen Chat进行实时交互、Hugging Face进行实验以及Modelscope进行额外的部署选项。

Qwen Chat是阿里巴巴云作为其更广泛的AI计划的一部分开发的，旨在创建易用且高性能的工具。Qwen模型家族包括各种专用模型，如用于编程的Qwen2.5-Coder和用于视觉语言任务的Qwen2-VL-Max。这些模型以强大的多语言支持和扩展的上下文长度能力而闻名，其中一些模型可以处理多达128K个令牌。

用户可以通过聊天界面中的切换功能访问这些新功能。网页搜索结果将直接融入对话中，文本到视频和图像生成工具允许用户直接输入提示以创建媒体输出，而现有的功能（如文档上传和物品创建）仍然在同一界面中可用。

文章来源：https://www.testingcatalog.com/alibaba-rolled-out-qwen-chat-v0-2-and-qwen2-5-1m-model/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇字节跳动推出新一代GUI代理模型UI-TARS

下一篇 OpenAI推出o3-mini AI推理模型，ChatGPT免费用户首次体验

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来