英伟达H100超越生成式人工智能,打破MLPerf记录
2023年06月29日 由 daydream 发表
716025
0
NVIDIA旗舰H100芯片再次展现出色的竞争力,在一组MLPerf训练基准测试中取得了最佳性能表现。该GPU与CoreWeave和Inflection AI合作进行了新的测试,并在各项指标中刷新了纪录。
这些测试在CoreWeave平台上的3,584个H100 GPU集群上运行。这些GPU通过InfiniBand互连技术相互连接,NVIDIA称这使得GPU在独立和扩展级别上都能提供出色的性能。
MLPerf基准测试旨在通过计算完成特定工作负载所需的时间来衡量特定硬件的能力。测试包括各种LLM(大型语言模型)和计算机视觉模型,以及少量CNN(卷积神经网络)和RNN(循环神经网络)。
NVIDIA声称H100在每个基准测试中都提供了最高性能,其中一些突出的例子包括在仅11分钟内训练GPT-3,以及在仅0.18分钟内完成ResNet基准测试。据报道,H100是唯一能够完成所有基准测试的芯片。
当NVIDIA主导市场时,其竞争对手却失去了竞争力。AMD的AI加速器产品与H100相比相差甚远。该公司最近推出了M1300X AI加速器芯片,其拥有192GB的VRAM,旨在与H100竞争。
尽管这款新芯片的基准测试结果尚未发布,市场的冷淡反应足以说明该产品短期内不会对NVIDIA构成威胁。
其他值得注意的竞争对手包括Cerebras,在训练大型语言模型时与NVIDIA的成本相当,以及Google的TPU,它们在能效和性能方面更出色,但受到特定工作负载的限制。在可预见的未来,看起来NVIDIA将继续在AI领域蓬勃发展,得益于能力强大的计算和良好集成的软件生态系统的双重驱动力。
来源:https://analyticsindiamag.com/nvidia-aces-generative-ai-breaks-mlperf-records/