周二,阿里云宣布对其最先进的大型语言模型服务进行大幅降价,降价幅度高达85%,旨在吸引更多中国企业客户的关注。这一消息通过微信平台发布,并由《南华早报》率先报道。
据报道,阿里云旗下的Qwen-VL-Max模型现以每千个标记0.003元人民币(约合0.00041美元)的价格出售。Qwen-VL-Max是一款视觉推理模型,能够感知和理解文本及图像输入。此次降价后的价格远低于字节跳动等竞争对手的同类模型。
阿里云是中国电商巨头阿里巴巴集团的云计算部门。此次降价凸显了中国大型科技企业为争夺新兴人工智能业务而展开的激烈竞争。
在中国AI市场中,阿里云面临来自腾讯、百度、京东、华为和字节跳动(TikTok母公司)等公司的竞争。在过去18个月里,这些公司都推出了竞争性的大型语言模型,试图利用生成式AI技术的热潮。
大型语言模型(LLM)是基于大量数据进行训练,以生成类似人类的回应来回答用户查询和提示的AI模型。它们是各种生成式AI聊天机器人(如谷歌的Gemini和OpenAI的ChatGPT)以及下一代搜索引擎(如Perplexity AI)和图像生成器(如DALL-E)的基础。
阿里云主要关注中国企业,这些企业与美国企业一样,对生成式AI提高生产力的潜力感兴趣。今年5月,阿里云表示,已有超过9万家中国企业下载了其Qwen模型。
然而,阿里云也面临着激烈的竞争。过去一年里,中国生成式AI开发者推出了250多个新的大型语言模型供公众使用。除了大型科技企业外,中国还拥有一些热门的初创企业,如DeepSeek,该公司最近宣布了拥有671亿参数的DeepSeek-V3模型,成为最强大的开源模型之一。
阿里云的Qwen模型系列包括Qwen-VL、Qwen-VL-Chat、Qwen-VL-Max、Qwen2-VL和实验性的QVQ-72B-Preview。其中,Qwen2-VL-Max在DocVQA和MathVista等基准测试中表现出色,超越了OpenAI的GPT-4V和谷歌的Gemini Ultra。
阿里云通过大幅降价以争取更多业务的策略并非首次。今年2月,该公司宣布对其多项核心云计算服务进行最高55%的降价,5月又将其原始的Qwen-VL模型价格降低了97%。