谷歌宣布为其以搜索为核心的AI模式聊天机器人增加多模态功能,使其能够“识别”图像并回答相关问题,同时进一步扩大AI模式的使用范围,面向“数百万”新增用户开放。
此次更新将定制版Gemini AI与谷歌的Lens图像识别技术相结合,允许AI模式搜索用户拍摄或上传图片,并接收包含链接的“丰富、全面”的回复内容。该多模态更新现已上线,用户可通过安卓和iOS平台上的谷歌应用访问。
谷歌搜索产品副总裁罗比·斯坦表示:“AI模式基于我们在视觉搜索领域的多年研究,并进一步拓展了其功能。借助Gemini的多模态能力,AI模式能够理解图像中的整体场景,包括对象之间的关联性及其独特的材质、颜色、形状和排列方式。”
谷歌称,此次更新采用“发散式查询技术”,针对所识别图像及其中的对象发出多个查询,以提供“极具深度且符合上下文”的回复。这使得AI模式能够识别图像中展示的书籍,推荐类似的高评分作品,并回答用户问题以进一步优化推荐内容。
AI模式搜索是谷歌针对Perplexity和ChatGPT搜索推出的类似聊天机器人的服务,通过AI生成的摘要回复用户查询,这些摘要源自谷歌搜索索引中的所有内容。
AI模式于上月仅面向谷歌One AI高级订阅用户(仅限实验室版本)推出。如今,谷歌表示已开始向美国“数百万”实验室用户开放AI模式,不再局限于付费的高级订阅用户。