NVIDIA 如何应对会话式AI带来的推理挑战？-电子发烧友网

NVIDIA GPU曾于去年12月和今年7月两度树立了数据中心神经网络训练的性能标杆。今天发布的行业基准测试结果显示，NVIDIA也引领着数据中心内部与外部AI 网络的趋势。

NVIDIA Turing GPU和Xavier芯片系统在首个独立AI推理基准测试 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市场中最大、同时也是最具竞争力的领域，业内此前一直希望能够有一套客观的推理性能测试指标。

在参与此次测试的十二家公司中，只有NVIDIA AI平台提交了MLPerf的全部五项推理测试成绩（MLPerf是一个于2018年5月成立的行业基准测试小组）。这证明了NVIDIA CUDA-X AI和TensorRT软件的成熟程度。它们让用户能够更加轻松地将所有的NVIDIA GPU应用于数据中心、边缘等领域。

MLPerf定义了五项推理基准，涵盖了三个现有的人工智能应用：图像分类、目标检测和翻译。每项基准分为四个场景：与数据中心应用关联性最高的服务器和离线场景，以及用于满足边缘设备地芯片系统需求的单流和多流场景。

图1：NVIDIA在两个数据中心场景（离线和服务器）的全部五项基准测试中均排在第一位，Turing GPU被评为市面上单处理器性能最高的GPU。

图2：NVIDIA Turing在MLPerf数据中心场景中的成绩超过了其他市面上的处理器。

离线场景中具有代表性的场景有图像标记等，该场景下所有数据可在本地使用；而服务器场景代表性场景有在线翻译服务等，此场景下会突然或间歇性随机出现数据和请求工作。

Xavier在两个边缘场景（单流和多流）中被评为市面上性能最佳的边缘和移动芯片系统。

工业检测相机主要被用来在快速移动的生产线上发现不合格品，这是一种典型的单流任务。多流场景则是测试芯片能够处理多少个数据源 —— 该性能对于一辆可能需要使用6台以上摄像机的自动驾驶汽车而言，是一项关键的能力。

图3：NVIDIA Xavier在MLPerf边缘场景中成为市面上最佳的边缘和移动芯片系统。

该结果显示了NVIDIA CUDA和TensorRT软件的性能。它们为用户提供了一个通用平台，使用户可以在多个产品和应用中取得领先结果，而这正是NVIDIA所独有的能力。

在数据中心场景中，NVIDIA的两款GPU还出现了相互竞争的场面。NVIDIA TITAN RTX展示了Turing级 GPU的巨大潜力，尤其是在各种要求苛刻的任务中，比如运行用于语言翻译的GNMT模型等。

功能丰富、应用广泛的NVIDIA T4 Tensor Core GPU在多个场景取得了优秀的成绩。这个功耗仅为70瓦的GPU能够轻松安装到任何带有PCIe槽的服务器中，使用户能够根据需要扩展其计算力，进而大幅扩展其推理工作。

MLPerf已经获得行业和学术界的广泛支持。其成员包括Arm、Facebook、Futurewei、通用汽车、Google、哈佛大学、Intel、MediaTek、微软、NVIDIA及Xilinx。值得一提的是，相比于之前的两次训练比赛，此次基准测试吸引了更多的参与者。

NVIDIA此次共采用了三款产品，共计四种配置参加此次测试，并提交了全部20个场景中的19个场景的成绩，以此表明公司对这项工作的支持。NVIDIA的合作伙伴Dell EMC，以及NVIDIA的客户阿里巴巴同样使用NVIDIA GPU提交了成绩。相比于其他参与者，NVIDIA与合作伙伴和客户一同向用户全面地展示了NVIDIA产品组合的潜力。

全新的视角与产品

推理指的是在实时生产系统中，通过运行AI模型，从大量数据中筛选出可执行洞察的过程。这是一项仍处于发展中的新兴技术，而NVIDIA也在该领域中不断前进，未曾停止脚步。

今天，NVIDIA发布了用于MLPerf测试的Xavier芯片系统低功耗版本——Jetson Xavier NX，其最大功率仅为15瓦，却具有最高21 TOPS的性能。它将为那些对性能要求高、但功率有限的新一代机器人、无人机和其他自主设备提供驱动力。

除了新的硬件之外，NVIDIA还发布了在MLPerf基准测试中所使用的最新TensorRT 6优化，并在GitHub上以开源方式为用户提供该软件。用户可以在MLPerf 开发者博客中了解更多关于这些优化的信息。NVIDIA不断地对该软件进行升级，使用户可以从日益增加的AI自动化与性能中获益。

让推理变得更简单

今天的MLPerf测试还说明了一个结论，那就是推理很困难。例如，在实际工作负载中，由于推理还需要大量预处理和后处理步骤，那么在实际工作负载中其对推理性能的需求甚至比基准测试更高。

NVIDIA创始人兼首席执行官黄仁勋在去年GTC大会的主题演讲中就曾将这种复杂性概括为一个词：PLASTER。他表示，现代AI推理对可编程性（Programmability）、延迟性（Latency）、准确性（Accuracy）、模型大小（Accuracy）、吞吐量（Throughput）、能效（Energy efficiency）和学习率（Rate of Learning）的要求很高。

这就是为何用户越来越喜欢使用高性能的NVIDIA GPU和软件来处理各种要求苛刻的推理工作，其中就包括：BMW、Capital One、思科、Expedia、John Deere、微软、PayPal、Pinterest、宝洁、Postmates、Shazam、Snap、Shopify、Twitter、Verizon和沃尔玛等极具远见的公司。

本周，全球最大的邮政服务系统——美国邮政，也加入了此行列，使用NVIDIA GPU进行AI训练和推理。

硬盘制造商希捷希望通过在NVIDIA GPU上运行的AI推理将生产量提高10％。该公司预计，通过提高效率和质量，其将获得高达300％的投资回报。

Pinterest依靠NVIDIA GPU训练和评估其识别模型并对其1750亿条Pin贴文执行实时推理。

Snap使用NVIDIA T4加速器在谷歌云平台上执行推理。相比于仅采用了CPU的系统，这提高了其广告的效果，同时降低了成本。

Twitter发言人就这一趋势表示：“GPU的使用不仅大大缩短了训练时间，还让我们在推理时能够实时了解直播视频，让我们可以在自己的平台上了解各媒体。”

AI会话：关于推理

未来，会话式AI将带来大量的机会以及技术方面的挑战。NVIDIA在这一领域同样是当之无愧的领导者。

NVIDIA已经为会话式AI服务提供了经过优化的参照设计，比如自动语音识别、文本-语言转换和自然语言理解等。NVIDIA们的BERT、GNMT和Jasper等AI模型开源优化帮助开发者实现顶尖推理性能。NVIDIA的客户和合作伙伴中包括有会话式AI领域的一流公司，比如Kensho、微软、Nuance、Optum等。

最后要补充的是，MLPerf小组已经开始致力于改进其当前的0.5推理测试。NVIDIA将努力在基准测试中继续发挥领导作用。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4735

浏览量
128917
人工智能

人工智能

+关注

关注
1791

文章
47242

浏览量
238355
推理

推理

+关注

关注
0

文章
8

浏览量
7268

苏茨克维预测：推理型AI将带来不可预测性

未来的人工智能将展现出类似人类的推理能力。苏茨克维强调，随着AI推理能力的提升，事情将变得更加难以预测。他解释说，推理能力的增强意味着AI

发表于 12-17 09:55 •182次阅读

NVIDIA助力Amdocs打造生成式AI智能体

正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型（LLM）和领域适配模型的解决方案。该公司还在使用NVIDIA

发表于 11-19 14:48 •333次阅读

NVIDIA助力Figure发布新一代对话式人形机器人

该初创公司展示了新型机器人，其使用 NVIDIA Isaac Sim 处理合成数据，并使用基于 NVIDIA 加速计算进行实时推理训练的生成式 AI

发表于 11-04 10:10 •258次阅读

NVIDIA助力丽蟾科技打造AI训练与推理加速解决方案

丽蟾科技通过 Leaper 资源管理平台集成 NVIDIA AI Enterprise，为企业和科研机构提供了一套高效、灵活的 AI 训练与推理加速解决方案。无论是在复杂的

发表于 10-27 10:03 •214次阅读

AI如何助力EDA应对挑战

探究当今产业背景和科技潮流中半导体产业所面临的挑战与变革时，不难发现，一个至关重要的转折点已经发生——人工智能（AI）的崛起正以前所未有的力量，对电子设计自动化（EDA）乃至整个半导体产业带来颠覆性的变革。

发表于 10-17 10:21 •547次阅读

NVIDIA与思科合作打造企业级生成式AI基础设施

由 NVIDIA 加速计算平台、NVIDIA AI Enterprise 软件和 NVIDIA NIM 推理微服务加持的思科 Nexus H

发表于 10-10 09:35 •344次阅读

AI普及给嵌入式设计人员带来新挑战

探讨了人工智能（AI）的普及给嵌入式设计人员带来的新挑战。在创建“边缘机器学习（ML）”应用时，设计人员必须确保其能有效运行，同时最大限度地降低处理器和存储开销，以及物联网（IoT）设

发表于 08-22 14:20 •664次阅读

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA近日宣布了一项重大举措，正式推出NVIDIA AI Foundry服务与NVIDIA NIM（NVIDIA Inference

发表于 07-25 16:57 •540次阅读

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务，与同样刚推出的 Llama 3.1

发表于 07-25 09:48 •704次阅读

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

同发布“NVIDIA AI Computing by HPE”。作为极具开创性的一站式“交钥匙”私有云人工智能（private-cloud AI）解决方案，

发表于 06-21 14:39 •365次阅读

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

作为极具开创性的一站式“交钥匙”私有云人工智能（private-cloud AI）解决方案，NVIDIA AI Computing by HPE 包含了可持续的加速计算产品组合以及全生

发表于 06-20 17:36 •718次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程，为全球的2800万英伟达开发者提供前所未有的便利。

发表于 06-04 09:15 •676次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将

发表于 04-20 09:39 •720次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •579次阅读

生成式AI带来的机遇与挑战

David Brown指出，生成式AI的发展带来了极其广袤的市场，通过与NVIDIA等合作伙伴的携手合作，以及自研的Amazon Graviton和Amazon Trainium系列定

发表于 12-27 14:49 •856次阅读

搜索历史

NVIDIA 如何应对会话式AI带来的推理挑战？

全新的视角与产品

让推理变得更简单

AI会话：关于推理

评论

苏茨克维预测：推理型AI将带来不可预测性

NVIDIA助力Amdocs打造生成式AI智能体

NVIDIA助力Figure发布新一代对话式人形机器人

NVIDIA助力丽蟾科技打造AI训练与推理加速解决方案

AI如何助力EDA应对挑战

NVIDIA与思科合作打造企业级生成式AI基础设施

AI普及给嵌入式设计人员带来新挑战

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

英伟达推出AI模型推理服务NVIDIA NIM

利用NVIDIA组件提升GPU推理的吞吐

使用NVIDIA Triton推理服务器来加速AI预测

生成式AI带来的机遇与挑战