DeepMind首席执行官Demis Hassabis表示,谷歌计划合并Gemini和Veo AI模型

2025年04月11日 由 佚名 发表 102 0

在最近的一次公开露面中,由LinkedIn联合创始人Reid Hoffman共同主持的播客中,Google DeepMind首席执行官Demis Hassabis透露,谷歌计划最终将其GeminiAI模型与Veo视频生成模型结合,以增强前者对物理世界的理解。

“我们从一开始就将Gemini,我们的基础模型,设计为多模态的”Hassabis说,“我们这样做是因为我们对通用数字助手有一个愿景,一个能够在现实世界中真正帮助你的助手。”

AI行业正逐渐向“全能”模型发展——这些模型能够理解和综合多种媒体形式。如果你愿意的话,谷歌最新的Gemini模型可以生成音频以及图像和文本,而OpenAI在ChatGPT中的默认模型也可以原生创建图像——当然包括吉卜力风格的艺术。亚马逊也宣布计划在今年晚些时候推出一个“任意对任意”模型。

这些全能模型需要大量的训练数据——包括图像、视频、音频、文本等等。Hassabis暗示,Veo的视频数据主要来自谷歌旗下的YouTube平台。

“基本上,通过观看大量的YouTube视频,[Veo 2]可以理解物理世界的规律”Hassabis说。

谷歌此前告诉TechCrunch,其模型“可能”根据与YouTube创作者的协议,使用“部分”YouTube内容进行训练。据报道,谷歌去年扩大了其服务条款部分是为了允许公司获取更多数据来训练其AI模型。

文章来源:https://techcrunch.com/2025/04/10/deepmind-ceo-demis-hassabis-says-google-will-eventually-combine-its-gemini-and-veo-ai-models/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消