IBM公司今天详细介绍了一款名为NorthPole的人工智能芯片,据称它的能效明显优于竞争处理器。
NorthPole芯片由IBM公司在加利福尼亚州阿尔马登的研究实验室的员工开发了八年。该芯片是在IBM早期的研究项目TrueNorth的基础上构建的,TrueNorth是一个优化人工智能的处理器。据IBM称,NorthPole芯片的性能大约提高了4000倍。
这款新推出的芯片使用了12纳米工艺,由220亿个晶体管组成。据IBM称,这些晶体管被组织成256个核心,每个核心可以在每个时钟周期内进行2048次计算,精确到8位。这意味着计算是在占用较少空间的较小数字上进行的。
NorthPole的每个256个核心都有一个集成的存储器池,用于存储计算所需的信息。由于芯片的存储电路和核心靠得很近,数据在它们之间的传输时间很短,从而减少了数据移动所带来的处理延迟,提高了性能。
IBM的首席脑部启发计算科学家Dharmendra Modha表示:“从体系结构上讲,NorthPole模糊了计算与内存之间的界限。在单个核心的层面上,NorthPole看起来就像是计算接近内存,在芯片外部的输入-输出层面上它看起来就像是主动内存。”
内置在NorthPole核心中的存储电路的另一个好处是提高了能源效率。在芯片的不同部分之间进行数据传输不仅会延迟处理,还会消耗电能。NorthPole的架构通过最小化数据在存储电路和核心之间的传输距离来节约能源。
IBM通过让芯片运行一个名为ResNet-50的开源图像识别模型来测量芯片的功耗。该模型通常用来比较不同人工智能处理器的性能。据IBM称,NorthPole芯片运行ResNet-50的能效比基于12纳米和14纳米节点的显卡和中央处理器分别高了25倍。
由于NorthPole芯片使用的是12纳米节点,所以它的能效由此受到限制,这比芯片制造商可用的最新三纳米工艺落后了几代。然而,这款处理器可以通过升级到更先进的制造技术来改进。IBM研究人员估计,这样的升级可以使NorthPole芯片的能效比基于“当前设计”的竞争芯片提高25倍。
处理器的功耗直接影响所产生的热量。IBM表示,NorthPole芯片的能效限制了其最高温度,因此只需要简单的外部冷却设备即可运行。因此,它有可能用于空间受限的系统,例如仅有有限冷却空间的自动驾驶汽车。