谷歌有限责任公司宣布它正在扩展其Gemini人工智能模型系列,并增加现有模型的可用性。
首先,谷歌在其AI Studio和Vertex AI平台上全面推出更新的Gemini 2.0 Flash。这是在公司向所有用户提供2.0 Flash之后的举措在Gemini应用中适用于桌面和移动设备。
谷歌还发布了Gemini 2.0 Pro的实验版本,这是公司在编码和复杂提示方面表现最佳的旗舰模型,并宣布2.0 Flash Thinking实验版已全面开放。新的2.0 Flash Thinking模型是一个小型、快速的AI模型,专为逻辑和推理优化。
谷歌还发布了全新的模型Gemini 2.0 Flash-Lite,旨在成为公司最具成本效益的AI模型,现已进入公开预览。
谷歌表示,通过与开发者和高级用户分享Gemini 2.0的早期实验版本,公司获得了关于其AI模型优势的宝贵反馈。随着Gemini 2.0 Pro实验版本的发布,公司希望继续这一趋势。
实验版Gemini 2.0 Pro模型配备了200万个标记的上下文窗口,允许其处理大量文档和视频,或大约150万字。它还可以调用谷歌搜索等工具并执行代码。
Gemini 2.0 Pro是谷歌之前的旗舰Gemini 1.5 Pro模型的继任者,该模型于去年二月推出。
为了打造一个通过优化推理进行“深度思考”的模型,谷歌发布了2.0 Flash Thinking实验版在十二月。中国AI初创公司DeepSeek的开源R1推理模型同样进行深度思考,但获得了更多媒体关注。
谷歌在2.0 Flash的速度和性能基础上构建了新的实验模型,并训练其将提示分解为一系列步骤,以便它本质上完成其作业。
“2.0 Flash Thinking实验版展示了其思考过程,因此您可以看到它为何以某种方式回应,它的假设是什么,并追踪模型的推理线索,”谷歌Gemini应用的产品管理总监Patrick Kane在公告中说道。
公司还表示,将有一个版本的Flash Thinking可以与YouTube、搜索和谷歌地图等应用互动。这将允许推理模型作为一个有用的AI助手,利用其固有的推理能力。
新的2.0 Flash Thinking实验版和2.0 Pro实验版将推出到今天的Gemini网络和移动应用。
谷歌Gemini系列的最新模型2.0 Flash-Lite在保持Flash 1.5的速度和价格的同时,在大多数质量基准上表现更好。
与Flash 2.0一样,Flash-Lite提供100万个标记的上下文窗口和多模态输入。举例来说,谷歌表示,新模型可以为大约40,000张独特照片生成单行标题,并且在谷歌AI Studio的付费层中成本不到一美元。
这种规模上的速度和效率,成本如此之低,尤其受到营销和零售行业的青睐。对于营销人员来说,该模型可以帮助以低成本为客户生成定制电子邮件,而在零售中,它适合为产品照片生成大量文本描述而不超出预算。
Gemini 2.0 Flash-Lite在谷歌AI Studio和Vertex AI中进入公开预览。