微软MicrosoftAzure推出新的基于NvidiaA100的超级计算实例
微软的云计算服务Azure推出了据称是最快的公共云超级计算机。名为Azure ND A100 v4 Cloud GPU 实例的新服务由 Nvidia 的A100 Tensor Core GPU 提供支持,面向具有高性能和要求苛刻的工作负载的用户。
微软补充说,ND A100 v4 旨在利用事实上的行业标准高性能计算 (HPC) 和人工智能 (AI) 工具和库,无需任何特殊软件或框架即可使用。
根据 Microsoft 内部基准测试,164 台 ND A100 v4 虚拟机 ( VM ) 产生了 16.59 petaflops 的高性能 Linpack (HPL) 结果。
相比之下,截至 2020 年 11 月,该 HPL 结果将把云实例置于世界上最快的超级计算机 500 强名单中的前 20 名。
云超级计算机
微软表示,ND A100 v4 从单个 VM 和八个基于Nvidia Ampere架构的 A100 Tensor Core GPU 开始,并且可以在单个集群中扩展到数千个 GPU。
每个 GPU使用一个Nvidia HDR 200Gb/s InfiniBand 链路,它们可以为每个 VM 提供惊人的 1.6 Tb/s 互连带宽。
此外,Azure 已将每个 8 个 GPU 的 VM 与完整的 Nvidia NVLink 连接配对,以确保 VM 内的 GPU 到 GPU 连接超过 600 GB/s。
对于 Azure 机器学习的用户,Microsoft 还提供了一个经过优化的 VM,该 VM 预装了所有必需的驱动程序和库,并针对 ND A100 v4 进行了优化。
截至目前,ND A100 v4 服务已在四个 Azure 区域推出,即东部、西部 2、西欧和中南部。