Broadcom公司近日正式发布了新一代芯片Sian2,该芯片专为支撑人工智能集群背后的高速光网络而设计。据介绍,Sian2模块相较于其前代产品,在带宽上实现了翻倍,同时集成了多项可靠性功能,以确保数据在高速传输过程中保持准确无误。
在大型语言模型(LLM)的运行环境中,通常需要多个服务器协同工作,每个服务器承载模型的一小部分。这些分布在不同服务器上的模型片段需定期交换数据以协调任务,而这要求服务器之间通过共享网络连接。数据中心运营商通常采用光纤技术构建这种连接网络,因为光纤传输速度远超传统铜线,非常适合于AI集群中大量数据的高速交换。
在AI服务器中,图形处理卡将数据以电信号形式表示,但要通过光纤网络发送到集群中的另一台服务器,这些数据必须先被转换成光信号。这一转换过程由名为收发器的专业网络设备完成,而Broadcom新推出的Sian2芯片正是为数据中心收发器提供动力。
Sian2是一款数字信号处理器,其集成电路经过优化,能够高效地将电信号数据转换为光信号,同时也能执行反向操作,即将接收到的光信号转换回电信号,供服务器处理。在光网络中,数据通过不同的“通道”传输,每个通道处理一个独立的数据流。Sian2芯片将单个通道的数据传输速率提升至200吉比特每秒,是其前代产品Sian的两倍。
带宽的提升意味着构建光纤网络所需的收发器数量减半,从而降低了硬件采购成本,同时也减少了电力消耗,进一步节省了运营成本。此外,Sian2采用5纳米制造工艺,集成了激光驱动器组件,这是生成光网络传输所需光信号的关键部分。
光信号在光纤网络中传输时,可能会因散射而产生误差,累积的误差会影响AI模型的处理。为此,Sian2支持前向纠错(FEC)技术,该技术通过多次传输数据副本以提高网络可靠性。接收端服务器可比较多个数据副本,选择一致无误的数据进行处理,或在出现误差时通过智能算法估算正确数据。
Broadcom公司物理层产品部副总裁兼总经理Vijay Janapaty表示:“200吉比特每通道的数字信号处理器是构建下一代AI基础设施中高速光链路的关键。”
目前,Broadcom已向早期客户提供了Sian2芯片的样品。