阿里巴巴发布Qwen Chat v0.2及Qwen2.5-1M开源语言模型

2025年01月27日 由 daydream 发表 4741 0

2025年1月26日,阿里巴巴正式推出了其AI平台Qwen Chat的更新版本v0.2,并同时发布了最新的开源语言模型Qwen2.5-1M系列。此次更新标志着阿里巴巴在多模态AI工具开发方面取得了重要进展。


微信截图_20250127095847


Qwen Chat v0.2版本集成了三大主要功能:网页搜索、视频创作和图像生成。用户现在可以直接在聊天界面内执行实时网页搜索,根据提示创建视频,以及从文本描述生成高质量图像。这些新功能与现有的文档分析、物品创建和图像理解等功能相辅相成,使得Qwen Chat成为一款既适合专业工作又适合创意任务的多功能工具。


与此同时,阿里巴巴还发布了Qwen2.5-1M系列开源语言模型,包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两款模型。这两款模型均支持在单个上下文中处理高达100万个令牌(tokens),这在处理大规模文本输入任务(如文档摘要、代码分析和长内容生成)时具有显著优势。与大多数现有语言模型支持的令牌限制通常在数万个以内相比,这是一个重大突破。


为了配合新模型的推出,阿里巴巴还开源了一个基于vLLM(大型语言模型的高性能服务系统)的高级推理框架。该框架集成了稀疏注意力方法,使得模型在处理100万个令牌输入时的速度比传统方法快3至7倍。稀疏注意力优化了模型对输入文本相关部分的关注方式,从而在保持准确性的同时降低了计算开销。


此次发布还包括一份技术报告和博客文章,详细介绍了Qwen2.5-1M系列的架构和性能。用户可以通过多个平台探索这些模型,包括阿里巴巴的Qwen Chat进行实时交互、Hugging Face进行实验以及Modelscope进行额外的部署选项。


Qwen Chat是阿里巴巴云作为其更广泛的AI计划的一部分开发的,旨在创建易用且高性能的工具。Qwen模型家族包括各种专用模型,如用于编程的Qwen2.5-Coder和用于视觉语言任务的Qwen2-VL-Max。这些模型以强大的多语言支持和扩展的上下文长度能力而闻名,其中一些模型可以处理多达128K个令牌。


用户可以通过聊天界面中的切换功能访问这些新功能。网页搜索结果将直接融入对话中,文本到视频和图像生成工具允许用户直接输入提示以创建媒体输出,而现有的功能(如文档上传和物品创建)仍然在同一界面中可用。

文章来源:https://www.testingcatalog.com/alibaba-rolled-out-qwen-chat-v0-2-and-qwen2-5-1m-model/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消