英伟达首次公开最快AI超级计算机Eos:搭载4608个H100 GPU

2024年02月19日 由 neo 发表 318 0

英伟达发布了一段视频,展示了其最新的企业级超级计算机Eos的架构。这款超级计算机旨在数据中心规模上进行先进的人工智能开发,并被认为是公司最快的人工智能超级计算机。

目前由英伟达自用的Eos机器在最新的Top 500超级计算机性能排名中位列世界第9,基于FP64测量。在纯人工智能任务中,它可能是最快的之一。此外,Eos的蓝图还可用于为其他公司构建企业级超级计算机。

英伟达在视频中表示,EOS每天都在迎接挑战,协助数千名从事人工智能研究的内部开发人员解决以前无法解决的问题。


Eos配备了576套DGX H100系统,每套包含八个英伟达H100 GPU,用于人工智能(AI)和高性能计算(HPC)工作负载。总体来看,该系统集成了1152个英特尔至强铂金8480C处理器(每个CPU有56个核心)以及4608个H100 GPU,实现了令人印象深刻的Rmax 121.4 FP64 PetaFLOPS和18.4 FP8 ExaFLOPS的HPC和AI性能。

Eos的设计依赖于DGX SuperPOD架构,专为人工智能工作负载和可扩展性而构建。它采用了英伟达的Mellanox Quantum-2 InfiniBand及其内网计算技术,数据传输速度高达400 Gb/s,这对于有效训练大型人工智能模型以及扩展至关重要。

除了强大的硬件,Eos还配备了专门为人工智能开发和部署而构建的软件。因此,它可以应对各种应用,从类似ChatGPT的生成性人工智能到人工智能工厂。

英伟达在视频中表示,Eos拥有一个集成的软件堆栈,包括人工智能开发和部署软件,如编排和集群管理、加速计算存储和网络库,以及为人工智能工作负载优化的操作系统。Eos是英伟达人工智能专业知识实践的最新例证,通过创建这样的人工智能工厂,企业可以承担其最具挑战性的项目,并实现他们当今及未来的人工智能愿景。

目前尚不清楚Eos的成本,而英伟达的DGX H100系统的定价也是保密的,取决于数量等多个因素。考虑到每个英伟达H100的成本可能在3万到4万美元之间,我们可以推测Eos的总成本将非常高昂。

文章来源:https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-provides-the-first-public-view-of-its-fastest-ai-supercomputer-eos-is-powered-by-4608-h100-gpus-tuned-for-generative-ai
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消