高达exa,英伟达Selene新超算平台有何特点

自 AMD 推出 Zen 架构以来,外界一直期盼着它能够今早杀入 Top 10 超算名单高达exa。

高达exa,英伟达Selene新超算平台有何特点

毕竟 2012 年的时候,该公司的皓龙(Opteron)处理器曾助力 Titan 拿到过第一的成绩,可惜又在 2019 年 6 月跌出了前十。

高达exa,英伟达Selene新超算平台有何特点

好消息是,2020 年 6 月的时候,基于 AMD Zen 2 处理器架构的新平台,再次杀入了榜单第七的位置。

高达exa,英伟达Selene新超算平台有何特点

【2012 资料图】

高达exa,英伟达Selene新超算平台有何特点

Top500 名单可为各个企业带来巨大的名气,基于皓龙 6274 CPU 和英伟达 K20x 加速卡的超算平台,曾在 2012 年拿过第一(目前仍是第 12 位),具有 8.2 Mega Watts 的功耗和 17.6 PetaFLOPs 的算力。

高达exa,英伟达Selene新超算平台有何特点

随着 AMD 更新了两代霄龙(EPYC)处理器,该公司能够为 HPC 的每个插槽提供多达 64 个高性能内核,辅以充沛的内存带宽、以及用于存储和附加设备的连接选项。

高达exa,英伟达Selene新超算平台有何特点

不过从技术上来讲,其实是 AMD 合资的海光(Hygon)带来了首台基于 Zen 处理器架构的超算,其于 2018 年 11 月跻身 Top500 名单的第 38 位。

演示平台配备了 5120 个 Hygon 32 核心 CPU,目前仍在榜单上排名第 58 位。

2019 年 11 月的时候,基于 AMD 霄龙的官方超算系统才正式亮相,包括两套 Naples 和两套 Rome 系统平台。随着 2020 年 6 月的最新公布,可知另外七套 AMD 超算平台已经到来。

不过 Selene 更有趣的一点,是因为它使用了英伟达 A100 Ampere 加速卡,该公司甚至展示过 DGX A100“SuperPod”的概念,连结了 140 个 DGX A100 节点和 1120 个 A100 GPU,提供高达 700 PetaOP 的 AI 性能。

事实证明 SuperPOD 也恰好出现 Top500 超算列表的第 7 位,其使用更传统的 LINPACK FP64 FLOP,每个 DGX A100 节点都包含两颗 AMD EPYC CPU 和八个 A100 加速器。

在 1.3 兆瓦的功率下,其 FP64 吞吐性能达到了 27.6 PetaFLOPs 。据悉,Selene 使用了英伟达 Mellanox HDR Infiniband 进行连接,辅以 560 TiB 内存。

与早年基于皓龙 CPU 和 K20x 加速卡的 Titan 超算相比,其仅以 16% 的功耗、就将性能提升了 57%(能效提升近 10 倍)。

英伟达在发布会上表示,DGX A100 节点的售价为 19.9 万美元,换算可知 Selene 的硬件部署成本(不含交换机和安装布线)约为 2800 万美元。

从技术上来讲,它将 280 颗霄龙处理器和 1120 块 A100 GPU 加速卡配对,一起构成了 277760 运算核。

值得一提的是,美国 Exascale 项目即将迎来两套全新的 AMD 超算平台。

包括由 Cray(HPE)为橡树岭设计的 30 MegaWatt 平台,其采用了霄龙处理器和 AMD Radeon Instinct 加速卡,有望在 2021 年达成 1.5 exaFLOPs 的算力。

此外为劳伦斯·利弗莫尔国家实验室打造的平台,有望在 2023 年初达成 2.0 ExaFLOPs 的算力。

作为对比,美国 Aurora 项目计划在 2021 下半年,为阿贡国家实验室打造基于英特尔至强处理器和 Xe 加速卡的 1.0 Exaflops 算力平台。

最后,如果一切顺利,AMD 仍有望在 2020 年中达成让霄龙占据 10% 市场份额的目标。

2022-06-11

2022-06-11