在拉斯维加斯举办的年度 Cloud Next 会议上,谷歌宣布将升级版 Imagen 2 集成到其 Vertex AI 开发者平台中。此次更新将谷歌最先进的图像生成 AI 能力带到了应用开发者手中,使他们能够构建新一代 AI 产品,将用户的想象力在几秒钟内转化为高质量的视觉资产。
最新版本的 Imagen 2 提升了语言理解和照片逼真度,使谷歌在最近的 Forrester 计算机视觉报告中获得领先地位。这种先进的文本到图像技术现已在 Vertex AI 上全面推出,使企业能够创建符合其特定品牌需求的图像。
在发布会上,谷歌介绍了几个令人兴奋的功能。首先,Text-to-Live Image(文本到动态图像)功能目前处于预览阶段,它允许营销和创意团队通过简单的文本提示生成动画图像、产品可视化、广告、GIF 和故事板,使静态图像栩栩如生。例如,展示了一朵在清晨露水中绽放的萱草和一锅在炉子上炖煮的美味炖菜,将静态图像赋予了生命力。
其次,谷歌宣布了 AI 生成图像的数字水印功能的一般可用性,该功能由 Google DeepMind 的 SynthID 提供支持。这确保了生成图像的完整性和真实性,解决了关于数字内容修改和滥用的担忧。
此外,Imagen 2.0 引入了新的编辑模式,为用户提供更强大的控制和创造力。用户可以轻松地从图像中移除不需要的元素,添加新元素,甚至扩展框架以获得更广阔的视野。
除了图像生成和编辑外,Vertex AI 上的 Imagen 还提供视觉字幕功能,为图像提供文本描述,以及视觉问答(VQA),为关于图像的问题提供答案。这些功能进一步增强了平台的通用性和在各种行业中的潜在应用。