0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

NVIDIA英伟达企业解决方案 来源:未知 2023-05-30 01:40 次阅读

新型 AI 超级计算机将 256 个 Grace Hopper 超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式 AI、推荐系统和数据处理的巨型模型

COMPUTEX—2023 年 5 月 29 日—NVIDIA 今天宣布推出一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace Hopper 超级芯片和 NVIDIA NVLink Switch System 驱动的 NVIDIA DGX 超级计算机,旨在助力开发面向生成式 AI 语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。

NVIDIA DGX GH200 的超大共享内存空间通过 NVLink 互连技术以及 NVLink Switch System 使 256 个 GH200 超级芯片相连,使它们能够作为单个 GPU 运行。其提供 1 exaflop 的性能和 144 TB 的共享内存——相较 2020 年推出的上一代 NVIDIA DGX A100 内存大了近 500 倍。

NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI、大型语言模型和推荐系统是现代经济的数字引擎。DGX GH200 AI 超级计算机集成了 NVIDIA 最先进的加速计算和网络技术来拓展 AI 的前沿。”

NVIDIA NVLink 技术大规模扩展 AI

GH200 超级芯片使用 NVIDIA NVLink-C2C 芯片互连,将基于 Arm 的 NVIDIA Grace CPU 与 NVIDIA H100 Tensor Core GPU 整合在一起,从而不再需要传统的 CPU 至 GPU PCIe 连接。与最新的 PCIe 技术相比,这将 GPU 和 CPU 之间的带宽提高了 7 倍,将互连功耗减少了 5 倍以上,并为 DGX GH200 超级计算机提供了一个 600GB 的 Hopper 架构 GPU 构建模块。

DGX GH200 是第一款将 Grace Hopper 超级芯片与 NVIDIA NVLink Switch System 配对使用的超级计算机,这种新的互连方式使 DGX GH200 系统中的所有 GPU 作为一个整体协同运行。上一代系统在不影响性能的前提下只能通过 NVLink 把 8 个 GPU 整合成一个 GPU。

DGX GH200 架构相比上一代将 NVLink 带宽提升了 48 倍以上,实现在单个 GPU 上通过简单编程即可提供大型 AI 超级计算机的能力。

面向 AI 先锋的新研究工具

谷歌云、Meta 和微软是首批有望接入 DGX GH200 来探索其用于生成式 AI 工作负载的能力的公司。NVIDIA 还打算将 DGX GH200 设计作为蓝图提供给云服务提供商和其他超大规模企业,以便他们能够进一步根据他们自己的基础设施进行定制。

谷歌云计算副总裁 Mark Lohmeyer 表示:“构建先进的生成式模型需要创新的 AI 基础设施。Grace Hopper 超级芯片的全新 NVLink 和共享内存解决了大规模 AI 的关键瓶颈,我们期待它在谷歌云以及我们的生成式 AI 计划中发挥强大的能力。”

Meta 基础设施、AI 系统及加速平台副总裁 Alexis Björlin 表示:“随着 AI 模型规模越来越大,它们需要可扩展的强大基础设施,以满足不断增长的需求。NVIDIA 的 Grace Hopper 设计看起来能够让研究人员探索新的方法来解决他们面临的最巨大挑战。”

微软 Azure 基础设施企业副总裁 Girish Bablani 表示, “在以往训练大型 AI 模型是一项资源和时间密集型任务。DGX GH200 所具备的处理 TB 级数据集的潜力使得开发人员能够在更大的规模和更快的速度下进行高级别的研究。”

全新 NVIDIA Helios 超级计算机将推进研发

NVIDIA 正在打造自己的基于 DGX GH200 的 AI 超级计算机,以支持研发团队的工作。

这台名为 NVIDIA Helios 的超级计算机将配备四个 DGX GH200 系统。每个都将通过 NVIDIA Quantum-2 InfiniBand 网络互连,以提高训练大型 AI 模型的数据吞吐量。Helios 将包含 1024 个 Grace Hopper 超级芯片,预计将于今年年底上线。

完全集成,专为巨型模型而构建

DGX GH200 超级计算机包含 NVIDIA 软件,可为最大的 AI 和数据分析工作负载提供一个交钥匙式全栈解决方案。NVIDIA Base Command 软件提供 AI 工作流程管理、企业级集群管理和多个加速计算、存储和网络基础设施的库,以及为运行 AI 工作负载而优化的系统软件。

此外还包含 NVIDIA AI Enterprise,即 NVIDIA AI 平台的软件层。它提供 100 多个框架、预训练模型和开发工具,以简化生成式 AI、计算机视觉、语音 AI 等生产 AI 的开发和部署。

供货情况

NVIDIA DGX GH200 超级计算机预计将于今年年底上市。

观看黄仁勋在 COMPUTEX 2023 的主题演讲中介绍 NVIDIA DGX GH200 超级计算机

3a09e2ea-fe47-11ed-90ce-dac502259ad0.png

点击 “阅读原文”,或扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋为 COMPUTEX 2023 带来的主题演讲直播回放,了解 AI、图形及其他领域的最新进展!


原文标题:COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3773

    浏览量

    91027

原文标题:COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA发布高性价比生成式AI超级计算机

    NVIDIA近日推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发者套件,这款
    的头像 发表于 12-24 10:44 96次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    计算机,具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小,能够为商业 AI 开发者、科技爱好者和学生等各类
    发表于 12-18 17:01 338次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b>高性价比的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 12-17 10:19 102次阅读

    NVIDIA助力xAI打造全球最大AI超级计算机

    NVIDIA 宣布,xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了
    的头像 发表于 10-30 11:38 373次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper  GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台,该平台
    发表于 10-30 09:33 144次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    丹麦推出首台AI超级计算机Gefion

    近日,丹麦正式推出了该国首台人工智能超级计算机,命名为Gefion,以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席,彰显了该项目的重要性和影响力。 Gefion
    的头像 发表于 10-29 15:13 393次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD
    的头像 发表于 10-27 09:42 437次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 519次阅读

    NVIDIA AI Enterprise荣获金奖

    NVIDIA AI Enterprise、GH200 Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX 20
    的头像 发表于 05-29 09:27 448次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise荣获金奖

    NVIDIA和Recursion利用AI超级计算机加快新药研发

    BioHive 由 NVIDIA AI 驱动,用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中,它的排名上升了 100 多位。
    的头像 发表于 05-16 09:46 1267次阅读
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算机</b>加快新药研发

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟达]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL,并推出基于该架构的超级芯片GB200,将助推数据处理、工程模拟、电子设计自动化
    发表于 05-13 17:16

    NVIDIA Blackwell DGX SuperPOD助力万亿级生成式AI计算

    全新 DGX SuperPOD 采用新型高效液冷机架级扩展架构,基于 NVIDIA DGX GB200 系统构建而成,在 FP4 精度下可提供 11.5 exaflops 的
    发表于 03-21 09:49 212次阅读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB
    的头像 发表于 03-21 09:49 700次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    ——  NVIDIA 于今日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200
    发表于 03-19 10:56 425次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b> Blackwell 架构 <b class='flag-5'>DGX</b> SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIAAI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日T
    的头像 发表于 02-19 12:45 564次阅读
    Tesla 计划斥资 5 亿美元建造一台由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>