在2025年的Google Cloud Next大会上,谷歌公司公布了其数据分析平台的重要更新,旨在使数据工作更加对话化、情境化和智能化。在一次独家采访中,谷歌云工程副总裁彼得·贝利斯解释了这些发展的战略,并讨论了公司所称的“自主数据到AI平台”。
“谷歌是唯一一家在所有跟踪的基准和评估中都拥有顶级模型的前沿模型提供商,同时也拥有数据堆栈,”贝利斯告诉我。“我们的愿景是将Gemini的智能注入数据工具和数据可以最好地利用的表面区域。”
让我们从新功能开始。谷歌在BigQuery和Looker中推出了专门针对不同用户角色的代理。想象一下,数据工程代理帮助构建和维护管道,数据科学代理在Colab笔记本中协助模型开发,以及Looker中的对话分析代理让您可以用简单的英语查询数据。
这些不仅仅是美化的聊天机器人。它们深度嵌入到您的工作流程中,基于您组织的数据进行训练,并通过新的BigQuery知识引擎在上下文中扎根,该引擎理解模式关系、业务术语和查询历史。
这里的“自主”不仅仅意味着设置后就可以忘记的基础设施。它意味着系统可以建议连接、推荐转换,并显示相关数据集——无需您手动处理CSV或追踪文档。
贝利斯这样说:“自主的重点在于平台应该让更多的人可以使用更多的数据,而不需要他们做更多的工作。”
结果令人印象深刻。他们在BigQuery中的SQL和Python代码助手在数千名客户中达到了60%的接受率——是贝利斯所描述的典型编码模型的两倍。使用量在过去九个月中增长了350%。
这为什么重要?因为今天,数据工作在很大程度上仍然是一种苦差事。大部分归结为处理重复性任务,比如记住将时间戳解析为标准格式的正确公式。“很多数据工作仍然是苦差事,”贝利斯承认,特别是在数据工程中。“我有什么数据,我该去哪里找?我该如何连接它?我该如何清理它?这很重复。”
真正的魔力不仅仅在于拥有一个复杂的AI模型——而在于教会该模型利用组织上下文。Gemini可以理解公司内的特定数据模式和查询历史,使其建议更加相关。
“大多数日志从未被阅读——除非发生了什么坏事,”贝利斯解释道。“在这里,我们说日志中有关于每个用户及其类似用户的重要信号。”
谷歌还瞄准了非结构化数据——通常在组织中未被利用的图像、音频、视频和文本。公司正在BigQuery中将其作为“一级公民”处理,通过多模态表实现统一存储和查询,与结构化数据并存。
对于考虑如何用这些工具衡量成功的企业,贝利斯建议关注完成不同角色关键任务所需的时间。“数据工作最终反映了一个组织的优先事项,”他说。最具说服力的指标?“被提问和回答的问题数量应该大幅增加。”
对话中最令人兴奋的部分是关于接下来会发生什么。谷歌并没有止步于对话式BI。公司设想的数据代理更像分析师——每天观察您的业务并主动显示变化。
“想象一下,一个分析师整天观察事物,并在发生有意义的事情时告诉你——而不仅仅是你,而是你组织中的每个知识工作者,”贝利斯说。
我向贝利斯提出了企业中的大问题:信任。许多公司仍然对将AI纳入关键业务决策持谨慎态度。但他的建议是务实的——从小处开始。构建面向内部的代理。设定明确的指示。将它们扎根于语义模型中。并像对待任何其他软件产品一样分层治理。
“你不必将决策权交给AI”他说。“但你确实需要建立一条有效使用它的路径——这意味着创造实验的空间。”
对于仍在努力建立数据基础的企业,谷歌邀请您尝试自主数据到AI平台的时机再好不过。数据工作的未来不仅仅是更智能的工具——而是从根本上改变谁可以参与数据对话以及这些对话如何迅速转化为行动。