在2024年度的Hot Chips盛会上,IBM震撼发布了其下一代主机技术的核心成员——Telum II处理器与Spyre AI加速器,这一创新组合旨在极大地增强IBM Z系列系统的人工智能(AI)处理能力,以应对企业界对高效、安全、可扩展AI解决方案的迫切需求。
Telum II处理器,作为未来IBM Z及LinuxONE平台的强劲心脏,其规格指标极为亮眼。它搭载了八个高性能核心,主频飙升至5.5GHz,同时片上缓存容量实现了40%的大幅提升。尤为值得一提的是,该处理器内置了AI加速器,与前代产品相比,其计算能力飙升四倍,专为低延迟、高吞吐量的AI推理任务量身打造。
尤为引人注目的是Telum II新增的数据处理单元(DPU),这一专为I/O加速设计的片上功能,将数据处理效率推向新高,使得I/O密度得以提升50%。DPU的引入不仅简化了系统操作,更为数据密集型应用及AI工作负载带来了显著的性能飞跃。
而与Telum II并肩作战的Spyre加速器,则是IBM针对主机环境中大型语言模型(LLM)日益增长的需求所精心打造的解决方案。每颗Spyre芯片内嵌32个计算核心,全面支持int4、int8、fp8和fp16等多种数据类型,专为AI应用而生。Spyre加速器与Telum II紧密协作,共同实践IBM提出的“AI集成方法”,即将传统机器学习模型与LLM有机融合,力求实现更为精准、稳健的AI处理效果。
对于IBM的主机客户而言,这一技术革新意味着他们将在Z平台上享受到前所未有的AI应用体验。Telum II能够轻松应对大规模的AI工作负载及数据密集型业务需求,而Spyre加速器则专注于处理复杂的AI模型及生成式AI场景,所有这一切均在不影响IBM Z环境安全性与可靠性的前提下完成。
值得一提的是,Telum II处理器与Spyre加速器均将采用三星代工厂的先进5纳米工艺技术制造,IBM预计这两款产品将于2025年正式面向客户推出,为全球企业带来更加强大的AI驱动力。