超级计算机+AI：NVIDIA Ampere架构开辟百万兆级时代-电子发烧友网

超级计算机+AI：NVIDIA Ampere架构开辟百万兆级时代

目前，全球有6座超级计算机中心率先采用 NVIDIA Ampere架构，将从天体物理学到病毒微生物学等多个科学领域带入百万兆级时代。

这些位于美国和德国的高性能计算中心（HPC）将共计使用近13,000个A100 GPU。

这些GPU的总峰值性能超过250 petaflops，将被用于使用64位浮点数学运算的模拟。而对于使用混合精度数学和利用A100 GPU对稀疏性支持的AI推理工作，它们可提供惊人的8.07 exaflops性能。

研究人员将运用这一强大性能从多个维度推动科学发展。他们计划模拟更大型的模型、训练和部署更深入的网络，并开拓运用AI来辅助模拟的新兴混合领域。

Argonne国家实验室是首批NVIDIA DGX-A100系统的使用者之一。图片由Argonne国家实验室提供

Argonne国家实验室（Argonne National Laboratory）的研究人员将通过模拟冠状病毒（由多达150万个原子组成）刺突蛋白的关键部分来研发新冠病毒疫苗。

Argonne国家实验室计算生物学家Arvind Ramanathan表示，刺突蛋白分子很难模拟，但A100可以加快对这些子系统的模拟，让我们了解这种病毒如何感染人类。”Argonne国家实验室将采用一个由24个NVIDIA DGX A100系统组成的集群。

他还表示，在其他项目中，“由于一次可以扫描数不计其数的药物，我们的新药研发能力明显增强。我们可能会了解之前所无法了解的知识，比如两种蛋白质如何相互结合等。”

A100为科学研究引入AI

Ramanathan表示：“许多工作难以在计算机上模拟，因此我们可以运用AI来智能指导下一步的采样地点和时间。”

而这只是科学家使用AI引导模拟这一新兴趋势的冰山一角。Ramanathan还告诉我们，GPU将把生物样品的处理时间缩短“至少两个数量级”。

国家能源研究科学计算中心（NERSC）有望成为全美第一批A100使用者中，规模最大的使用者。这座位于加利福尼亚州伯克利（Berkeley, Calif.）的计算中心正在与惠普（Hewlett Packard）合作，在其预制的百万兆级系统Perlmutter中部署6200个GPU。

NERSC主任Sudip Dosanjh表示：“在NERSC科学和算法领域，一个V100 GPU的性能比我们当前一代Cori系统上的KNL CPU节点高出5倍，我们期待着Perlmutter上的A100性能会更加强大。”

百万兆级计算团队使用AI进行模拟

NERSC的百万兆级计算专用团队已为Perlmutter确认了近30个项目，这些项目采用了大规模模拟、数据分析或深度学习技术。一些项目将高性能计算与AI相结合，比如使用强化学习控制光源实验的项目、使用生成模型在高能物理探测器上重现成本昂贵的模拟等。

NERSC的2个高性能计算应用程序，已经原型化了A100 GPU双精度Tensor核心的使用。相比上一代Volta GPU，它们的性能显著提高。

NERSC的高性能计算性能工程师Christopher Daley，在GTC 线上大会的一次演讲中表示，未来的百万兆级系统将使用专为10000路并行Perlmutter GPU产品而优化的软件。NERSC支持天体物理学、地球科学、聚变能和基因组学等领域的近千种科学应用。

NERSC的首席架构师Nicholas Wright表示：“在Perlmutter上，我们需要支持用户所需和期望的所有编程模型的编译器，包括MPI、OpenMP、OpenACC、CUDA和经过优化的数学库。而这些在NVIDIA HPC SDK上都有。”

德国努力绘制大脑图谱

AI将成为全新70 petaflops系统首批A100应用的重点技术，该系统由法国Atos专为德国西部尤利西超级计算中心（Jülich Supercomputing Center）设计。

比如能够作出快速短期天气预报的Deep Rain将对传统系统（进行大规模，但速度慢的大气模拟）进行补充。另一个项目计划构建人脑纤维图集，并结合数千张高分辨率2D脑图像进行深度学习。

尤利西采用的新型A100系统还将帮助研究人员，进一步理解结合夸克（物质的亚原子构造模块）所具有的强大力量。气候科学项目将可以建立地球地表和地下水流的宏观模型。

理论物理学家Dirk Pleiter目前管理尤利西应用技术研发团队。他表示：“许多应用程序都受到存储的限制。因此，我们最感兴趣的是A100存储占用量和带宽的增加情况。”

全新GPU能够将双精度数学运算速度提高多达2.5倍，而这也是一项研究人员迫切需要的功能。他表示：“我认为一旦人们发现有机会提高计算性能，他们会非常希望使用GPU。”

NVLink助跑数据密集型工作

卡尔斯鲁厄技术学院（Karlsruhe Institute of Technology, KIT）在尤利西以南约230英里处,与联想合作建立了一部全新的17 petaflops系统。该系统将在NVIDIA Mellanox 200 Gbit/s InfiniBand网络上集成740个A100 GPU，从而解决多项重大挑战，包括：

用于气候科学的千米级大气模拟

针对新冠病毒的研究，包括对Folding@home的支持

大型强子对撞机对希格斯玻色子以外粒子物理学的探索

可能取代锂离子电池的新一代材料研究

AI在机器人技术、语言处理和可再生能源中的应用

KIT超级计算中心主任、计算科学与数学教授Martin Frank表示：“我们的主要工作是数据密集型模拟和AI工作流，因此我们非常需要能够连接新GPU的第三代NVLink。”

他补充说：“我们也十分期待多实例GPU功能。该功能可以让每个节点最多拥有28个GPU，而不是原来的只有4个节点，这将使我们的许多应用都大大受益。”

在慕尼黑郊外，马克斯·普朗克研究所（Max Planck Institute）的计算机中心正在与联想合作创建一个名为Raven-GPU的系统。该系统集成了768个NVIDIA A100 GPU，将支持天体物理学、生物学、理论化学和新材料科学等领域的工作。该研究所的目标是在今年年底之前安装Raven-GPU，并且现在正在接受将应用程序移植到A100方面的请求。

印第安纳大学系统应对网络安全威胁

印第安纳大学（Indiana University）正在建造Big Red 200（6 petaflops系统）。该系统将使用256个A100 GPU，有望成为美国大学中速度最快的超级计算机。

该项目于6月发布，是最早采用惠普公司Cray Shasta技术的学术中心之一。其他学术中心也将在未来的百万兆级系统中使用这项技术。

Big Red 200将运用AI应对网络安全威胁。它还将解决遗传学方面的巨大挑战，帮助实现个性化医疗，为气候建模、物理学和天文学方面的工作提供支持。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4989

浏览量
103077
超级计算机

超级计算机

+关注

关注
2

文章
462

浏览量
41948

原文标题：性能跃升：A100 GPU助力高性能计算中心加速科学发展

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

NVIDIA发布高性价比生成式AI超级计算机

NVIDIA近日推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发者套件，这款超级

发表于 12-24 10:44 •127次阅读

NVIDIA 推出高性价比的生成式 AI 超级计算机

计算机，具有更高的性价比，通过软件升级即可实现性能提升。全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小，能够为商业 AI 开发者、科技爱好者和学生等各类

发表于 12-18 17:01 •372次阅读

<b class='flag-5'>NVIDIA</b> 推出高性价比的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

云端超级计算机使用教程

云端超级计算机是一种基于云计算的高性能计算服务，它将大量计算资源和存储资源集中在一起，通过网络向用户提供按需的

发表于 12-17 10:19 •124次阅读

NVIDIA加速全球大多数超级计算机推动科技进步

HPCwire 读者和编辑选择奖。自 2006 年发布 CUDA 以来，NVIDIA 不断推动 AI 和加速计算的进步，最新发布的全球最强超级计

发表于 11-24 14:38 •329次阅读

NVIDIA助力xAI打造全球最大AI超级计算机

NVIDIA 宣布，xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了

发表于 10-30 11:38 •379次阅读

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台，该平台

发表于 10-30 09:33 •153次阅读

丹麦推出首台AI超级计算机Gefion

近日，丹麦正式推出了该国首台人工智能超级计算机，命名为Gefion，以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席，彰显了该项目的重要性和影响力。 Gefion AI

发表于 10-29 15:13 •397次阅读

NVIDIA助力丹麦发布首台AI超级计算机

这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设，是一台 NVIDIA DGX SuperPOD 超级

发表于 10-27 09:42 •445次阅读

借助NVIDIA超级计算机加速量子计算发展

科学期刊《自然》（Nature）本月早些时候发表了一项研究，通过使用 NVIDIA 驱动的超级计算机，验证了量子计算的商业化途径。

发表于 07-25 09:55 •521次阅读

NVIDIA和Recursion利用AI超级计算机加快新药研发

BioHive 由 NVIDIA AI 驱动，用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中，它的排名上升了 100 多位。

发表于 05-16 09:46 •1273次阅读

NVIDIA Grace Hopper点亮AI超级计算新时代

瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力，以支持突破性研究。

发表于 05-15 09:46 •375次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

2024年3月19日，[英伟达]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL，并推出基于该架构的超级芯片GB200，将助推数据处理、工程模拟、电子设计自动化

发表于 05-13 17:16

NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。

发表于 04-26 11:25 •625次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

—— NVIDIA 于今日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell

发表于 03-19 10:56 •426次阅读

Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机，因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日T

发表于 02-19 12:45 •567次阅读