亚马逊云计算部门Amazon Web Services(AWS)近日在其re:Invent 2024大会上推出了SageMaker Unified Studio,这是一个集数据发现、准备和处理于一体的综合性平台,旨在帮助企业更高效地构建AI模型。
自AWS多年前推出SageMaker平台以来,该平台一直专注于AI模型的创建、训练和部署。而此次发布的SageMaker Unified Studio,则进一步整合了AWS其他服务中的工具,包括原有的SageMaker Studio,为用户提供了一个统一的界面来管理组织内部的数据。
AWS数据与人工智能副总裁Swami Sivasubramanian表示,当前分析与AI正趋于融合,客户对数据的使用方式日益互联。新一代SageMaker通过整合多种功能,直接在SageMaker内为用户提供数据处理、机器学习模型开发和训练以及生成式AI所需的全部工具。
SageMaker Unified Studio允许用户发布和共享数据、模型、应用程序和其他资源,同时提供数据安全控制和可调整权限,以及与AWS Bedrock模型开发平台的集成。此外,该平台还内置了亚马逊的编程聊天机器人Q Developer,能够回答与数据发现和SQL生成相关的问题。
除了SageMaker Unified Studio,AWS还推出了SageMaker Catalog和SageMaker Lakehouse两个新工具。SageMaker Catalog允许管理员使用具有细粒度控制的单一权限模型,为SageMaker中的AI应用程序、模型、工具和数据定义和实施访问策略。而SageMaker Lakehouse则提供了从SageMaker和其他工具到存储在AWS数据湖、数据仓库和企业应用程序中的数据的连接。
AWS指出,SageMaker Lakehouse与任何兼容Apache Iceberg标准的工具都能协同工作,Apache Iceberg是一种用于大型分析表的开源格式。管理员可以在SageMaker Lakehouse所涉及的所有分析和AI工具中应用访问控制。
另外,AWS还通过新的集成改进了SageMaker与软件即服务(SaaS)应用程序的兼容性。现在,SageMaker用户可以无需先提取、转换和加载数据,即可直接访问如Zendesk和SAP等应用程序中的数据。
AWS表示,客户的数据可能分散在多个数据湖和数据仓库中,而SageMaker Unified Studio等工具的推出,使得客户能够使用其首选的分析和机器学习工具来处理数据,无论数据物理存储在哪里,以及如何存储,从而支持SQL分析、即席查询、数据科学、机器学习和生成式AI等多种用例。