AI人工智能英伟达Ampere A100打破16项AI性能纪录速度是Volta V100的4.2倍 |谷歌|

英伟达刚刚公布了采用 Ampere 架构的 A100 GPU 的首份实际性能数据：可知其在特定的 AI 基准测试项目中一共打破了 16 项性能纪录，速度是 Volta V100 的 4.2 倍，较主要竞争对手取得了巨大的领先优势。首先， 2018 年面世的 MLPerf 主要侧重于机器学习性能。该基准测试套件总共包括了八项测试，但英伟达 Ampere A100 GPU 的训练速度已经全面实现了超越。

本文插图
（来自：Nvidia）
其次，英伟达分享了 DGX SuperPOD 系统取得的八项新纪录。该系统通过 HDR InfiniBand 连接到一起，构成了一个庞大的 DGX A100 高性能计算系统集群。
DGX SuperPod 由 140 个 DGX A100 系统组成，共计拥有 1120 个 NVIDIA Ampere A100 GPU、170 个 Mellanox Quantum 200G Infiniband 交换机、4 PB 存储空间、以及 15 公里的光缆。

本文插图
令人赞叹的 DGX SuperPod 系统中包括大约 770 万个 Ampere CUDA 核心，作为 DGX V 扩展计划的一部分，其为该系统增加了近乎 700 Petaflops 的算力，目前已部署在加州圣克拉拉市的英伟达公司总部。

本文插图
通过与上一代 Volta V100（以及谷歌第三代 TPU 和华为Ascend HPC 等新品）进行比较，可知 Ampere A100 Tensor Core GPU 加速卡的性能增长也是相当惊人。
此外在 MLPerf 基准测试套件的详细结果中，还对即将推出的 AI 加速方案进行了预览，比如英特尔的 Cooper Lake-SP 至强处理器、以及谷歌的第四代 TPU。

本文插图
MLPerf 表示，其基准测试套件可对机器学习（ML）和人工智能（AI）工作负载进行评估，结果发现 Ampere A100 性能是 Volta V100 的 2.5 倍。即便是提升最小的项目，其领先幅度也有近 50%。
相比之下，华为 Ascend 芯片只能及时完成一项测试、且性能远不及 Volta V100。谷歌第三代 TPU 也只能及时完成两项测试，第一项较 Volta V100 领先 20% ，第二项却又落后 10%。

本文插图
至于八槽的 Cooper Lake-SP 平台，其能够在 1104.53 分钟内完成图像分类测试项目，但是英伟达的双 Ampere A100 系统只需 33.37 分钟。至于明年的谷歌第四代 TPU ，目前尚不知晓其具有多大的优势。

本文插图
【AI人工智能英伟达Ampere A100打破16项AI性能纪录速度是Volta V100的4.2倍】最后，英伟达展示了其 GPU 加速卡在 AI Full-Stack Innovations 项目中的表现。上一代 Volta V100 平台的 MLPerf 0.5 基准测试项目对比， Ampere A100 平台上的的 MLPerf 0.7 基准测试有 4.2 倍的性能提升。

AI人工智能英伟达Ampere A100打破16项AI性能纪录速度是Volta V100的4.2倍

推荐阅读

看雨听涛|失败种植体的拔除方法

用谎言来填补内心缺失的一切是不是很可悲

中年结清全部出借人近一年后，这家平台还在追债

刮脚背治乳腺增生吗

鲁迅先生骂人无数，可是却从来没有说过蒋介石半个不是，关系微妙

『』60平米小户型改造后颜值爆表，两房兼书房，生活学习两不误

环球网|美媒:新冠病例激增佛罗里达州感染比例高居全美之首

真正火到一塌糊涂的6部仙侠剧，尤其是最后一部

《西游记》里面的人物图片,西游记中的人物照片-

科普|“吞金”真的能自杀吗？

房产每日观察|吓人！家里天花板水泥块掉落！这事谁管？

云游天下|房车路上的酸甜苦辣（原创文章）

胡服射骑,赵武灵王变革,为什么失败吸取什么教训

汪涵|汪涵：从封神一哥到翻车倒地，他的结局和“眼瞎”脱不了干系

畅行花：精细化运作，打造新时代航旅消费品牌

疫情|关于疫情的作文怎么写？疫情的感悟优秀作文范文欣赏

浪迹金融■浙江2月份财政收入几乎没降！为什么？

新疆31日新报告无症状感染者61例，其中疏附县46例、阿克陶县15例

这房子到底该不该买啊?

「国平军史」起到迷惑对手作用，F-22等隐形战机：机腹会装备龙勃透镜

AI人工智能英伟达Ampere A100打破16项AI性能纪录 速度是Volta V100的4.2倍

推荐阅读

AI人工智能英伟达Ampere A100打破16项AI性能纪录速度是Volta V100的4.2倍