IBM公司近日宣布,计划在其公有云平台上引入英特尔公司(Intel Corp.)的Gaudi 3人工智能处理器。这款处理器被视为英伟达公司(Nvidia Corp.)热销H100图形处理单元的一种替代选择。在英伟达最新、速度更快的Blackwell B200 GPU预计今年晚些时候发布之前,H100一直是其旗舰AI加速器。
据英特尔介绍,与H100相比,Gaudi 3在进行推理任务时,能效可提升高达2.3倍,同时一些大型语言模型的训练时间也有所减少。Gaudi 3是英特尔通过2019年收购一家初创公司获得的AI处理器系列的第三代产品,采用台积电5纳米工艺制造。
该处理器通过两组计算模块——MMEs和TPCs提供处理能力,两者各自针对不同的任务进行了优化。MME模块专注于执行矩阵乘法运算,这是AI模型中将输入数据转化为决策的关键数学计算。而TPC模块则基于超长指令字架构,旨在并行处理多种计算,以加速AI模型的性能。Gaudi 3中的TPC数量达到64个,是前代产品的近三倍,MME数量也增至四倍。
此外,Gaudi 3还配备了120GB的高速内存池,比英特尔上一代AI处理器的RAM时钟速度更快。在处理BF16数据类型时,其峰值速度可达每秒1835万亿次浮点运算(TFLOPS),这是AI模型常用的数据存储格式。
除了性能提升,Gaudi 3还内置了以太网模块,支持AI服务器内及服务器间的处理器互联,且单个以太网链路的带宽已翻倍至每秒200吉比特。
IBM计划于明年初在其IBM Cloud Virtual Servers for VPC公有云平台上提供Gaudi 3服务,并将在其watsonx产品套件中添加对Gaudi 3的支持,该套件包括用于构建、部署AI模型及执行相关任务的软件工具。