0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在BlueField DPU上通过DOCA加速方案开发

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-14 15:51 次阅读

DOCA 是用于在 BlueField DPU 上开发应用程序的软件框架。借助 DOCA,您可以从主机 CPU 中卸载基础设施工作负载,并通过 BlueField DPU 加速这些工作负载。这样可以实现软件定义且硬件加速的基础设施,更大限度地提高数据中心的性能和灵活性。

DOCA 现已推出!

NVIDIA 于 2020 年 10 月首次推出 DOCA。NVIDIA BlueField-2 DPU 现已正式推出,DOCA 也已进入早期提供阶段,这样一来,您便可以轻松开发和增强您的方案,利用 BlueField 的功能卸载、加速和隔离基础设施工作负载(包括网络、安全、存储和管理)。在本文中,我们将详细讨论 DOCA 包含什么,以及开发者和 ISV 如何借此创建基于 DPU 的解决方案。

首先,简要概述BlueField DPU的含义和功能。它包含了一个强大的智能网卡,可支持高速以太网或 InfiniBand 两种接口、一组 Arm 核、DRAM 和 PCIe 交换机,通过高速Mesh网络连接在一起。嵌入式 ConnectX 智能网卡包含许多加速器(网络、云、存储、加密、流媒体、时间同步等), BlueField 更是增加了面向安全、存储虚拟化、硬件隔离和远程管理的加速器和功能。

图 1.BlueField DPU 和 DOCA 框架允许将基础设施服务转移到 DPU,从而卸载和加速这些服务。DOCA 支持在应用层和基础架构服务层进行开发

使用 DOCA 的益处

BlueField 的许多功能和加速器均可通过特定 API、开源 SDK 或现有驱动进行访问,因此您可能会问为何应使用 DOCA。使用 DOCA 的主要益处是简化使用 DPU 的基础设施应用程序和功能的开发和部署流程。这样可以加快应用和其它BlueField的功能进入市场的速度:

统一访问所有 DPU 功能 – 让您不必学习和使用多种不同的工具。

在 DPU 的底层 API上提供一个抽象层给上层的库, – 您可以更快速、更轻松地进行开发,实现和上层业务的集成,并经优化而提供出色的性能;或者和底层接口合作达到更精细的控制。

向前/向后兼容性 – 使用 DOCA 进行开发意味着您的应用可以在未来版本的 BlueField DPU 上无缝运行,且得到了更高的性能和可扩展性。

基于容器化服务的 DPU 调配和部署 – DOCA 包含用于简化 DPU 设置、配置和服务编排的工具。

开发者的 DOCA 1.0 使用历程

DOCA 包含 SDK 软件开发套件和 DPU 运行时平台。SDK 包含 API、开发库、开发者工具和参考应用代码,其运行时包含服务、参考应用程序可执行文件和运行时工具。驱动支持 DOCA 库,DOCA库已经支持 DOCA 1.0包含的参考应用。此外,还有 DOCA 服务,如发送经过滤的遥测数据、DPU 和 SDK 管理工具,以及数据平面(在此版本中通过 DPDK 加速)或控制平面上软件定义网络 (SDN) 的编程接口。

选择您想在在 DPU 上运行的应用或与 DPU 集成的应用,开启您的 DOCA 使用历程。然后,定义您的应用应该在主机 CPU运行、或是在DPU 上运行,还是需要运行在两者之上。主机上运行的应用程序必须面向主机 CPU(通常为 X86)进行编译,而 DPU 上运行的应用程序必须面向 Arm 进行编译。无论采用哪种方式,应用程序都可以通过 DOCA 访问 DPU 的卸载和加速引擎,您可以选择用于开发的 DOCA 应用示例、库和 API。如果主应用程序仍然需要运行在主机 CPU 上,您可以在 DPU 的 Arm 核上创建一个小型代理来激活 BlueField 的 硬件卸载功能,而无需对现有应用程序进行大的修改。

图 2.开发者的 DOCA 使用历程 – 从开发到部署。

DOCA 编程选项

当您对 DPU 进行编程时,在许多情况下,可以直接访问驱动。这通常需要底层编程和详细的驱动知识。在大多数情况下,对 DOCA 库进行编程会更加轻松,这些库为驱动提供了上层的抽象层。它的优势就是已经针对每个用例进行了调优,可获得更出色的加速性能。参考应用提供了实际工作代码以及 DOCA 库的使用示例。在某些情况下,可以使用这些参考应用作为基础, 然后通过修改它们来满足运行在DPU上的不同应用和方案。

例如您想构建一个可加速的负载均衡器,或者集成一个分布式防火墙的代理到DPU,您就可以选择DOCA中关于深度数据包检测 (DPI)库的相关参考应用。这些库又运行在 DPDK 库上,利用 DPU 内的有状态连接跟踪和正则表达式 (regex) 匹配引擎进行加速。

表 1.三个例子来解释 DOCA 是如何运行在底层 API/Lib和DPU上,以及如何来访问底层API/Lib和DPU件功能的。

在大多数情况下,您可以对底层 API/Lib进行编程,而不是对DOCA 库进行编程, 但是如果可以对DOCA 库直接进行编的话, 其实会更简单,甚至还可以修改 DOCA 参考应用程序。对另一些 DOCA 库,如SPDK等,尽管目前尚未提供 DOCA 参考应用程序,但您还是使用 DOCA 1.0的库。关于存储的相关参考应用程序稍后将被添加到 DOCA中。关于时间同步或 IPSec 加密功能等这些应用,它们的API 和功能实现已经可以在最新的 BlueField 操作系统获得。功能实现将在未来版本的 DOCA 库中提供。

从两方面来看DOCA 工具

从开发者的角度来看,DOCA 可划分为两大领域:

SDK 组件,帮助您构建在 DPU 上运行或使用 DPU 的应用程序。

DOCA 运行时集,包含在 DPU 上运行应用程序所需的组件。

其中的SDK 又包含开发库、驱动和工具包,以及参考应用相关的文档和参考代码源。

运行时包含二进制库、运行时二进制文件、编译工具、安装工具、基准测试程序以及各种 DOCA 服务代理。借助这些,您可以使用不同的 DPU API 和功能,设置 DPU 卡、安装合适的操作系统,以及在 DPU 上运行您的软件。运行时还包括各种管理工具,用于配置和支撑服务器中和网络中的 DPU卡,同时支持编排容器化操作与各种加速服务。

DOCA 中包含的参考应用程序

DOCA 1.0 包括了使用DPI 的加速负载均衡器参考应用程序,以及使用 DPI 和 regex 模型匹配的下一代防火墙代理参考应用程序。他们都充分利用了 DOCA库和DPU 上的加速功能的优势。它们包含源文件,无需在 DPU 上进行编程。但是,它们可以提供 DPU API 和库的使用示例,从而简化应用程序的开发和集成。未来的 DOCA 版本中可能会添加更多的参考应用程序。

DPU 管理工具和其他功能

SDK 管理器 – 帮助您在运行 DPU 的机器上安装和更新 BlueField SDK。它会在主机上安装 DOCA SDK 和运行时,并在主机上安装用于更新 BlueField 的操作系统和 DOCA 的开发容器。

配置工具 – 旨在简化管理和自动化部署数据中心中的大量 DPU 卡,可以通过脚本和管理工具来实现。DOCA 1.0 中目前不包含这些工具,但很快会添加到 DOCA中。

遥测 – 可以在DPU上选择性地捕获和共享网络和服务器的关键遥测数据,然后分享和收集这些数据给日志管理工具、数据分析工具或网络安全工具等。

有一些 BlueField DPU 功能在DOCA 1.0 SDK 中不支持,但是 DOCA 运行时对此提供了支持。以下功能目前可以从 BlueField DPU 软件包或 Mellanox OFED 库中获得,并将被添加到未来版本的 DOCA SDK中:

网络流量加密(使用 IPSec 或 TLS)

面向时间同步数据中心的超级准确的精度时间协议 (PTP)

高性能计算/AI 的集合通信卸载

关于 NVIDIA GPUDirect Storage (GDS) 的支持

等等……

同样,通过 DPU 将远端网络存储虚拟为本地 NVMe SSD 或 virtio-blk(虚拟IO-块存储)设备的BlueField SNAP 技术。DOCA 运行时现在包含的 SNAP 功能,可支持通过 SPDK 库访问上层开发者 SDK,更多的SNAP功能将会逐渐添加到 DOCA SDK。

DOCA 愿景

DOCA 的路线图包括了支持使用 DOCA 访问 BlueField DPU 的几乎所有功能。图 3 是 DOCA 软件栈的计划,包括了对于运行在各种 DOCA 服务、库和驱动上的不同类型的上层应用。

图 3.随着DOCA 不断发展,将为几乎所有的 BlueField DPU 功能提供全面支持。

NVIDIA 希望您能轻松使用 DPU 的各种功能,并简化以下流程:在 DPU 上创建新应用程序,或者将现有应用程序与 BlueField DPU 集成。随着 新DOCA系列版本的发布, 将不断扩展 DOCA 中的驱动、库、服务和应用示例等。您将能够使用 NVIDIA DPU 创建更先进、更高效的解决方案,加速基础设施服务。使用 DOCA 提高数据中心的性能、效率、安全性和可管理性。

关于作者

John Kim 是 NVIDIA 网络事业部的存储市场总监,致力于帮助客户和供应商从高性能网络连接、智能网卡卸载和远程直接数据存取 (RDMA) 中获益,尤其是在存储、大数据和人工智能领域。John 是非常活跃的博主、会议演讲嘉宾和网络直播节目主持人,也是存储网络行业协会网络存储william hill官网 (SNIA NSF) 的主席。John的高科技生涯从 IT 支持人员和网络管理员开始,先后在NetApp 和 EMC等企业级软件公司以及存储供应商从事解决方案市场、产品管理和生态联盟工作。他于 2013 年加入 Mellanox,之后于 2020 年加入 NVIDIA。

Ariel Kit 是 NVIDIA 网络产品营销总监。 Ariel 负责管理 NVIDIA BlueField DPU 软件组合和网络安全的战略和交付。 Ariel 在网络安全和嵌入式片上系统领域拥有 6 年以上的产品开发经验,并拥有 12 年以上的研发管理经验。他有学士学位。通信系统工程和工商管理硕士。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5082

    文章

    19117

    浏览量

    304984
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103026
收藏 人收藏

    评论

    相关推荐

    NVIDIA DOCA 2.9版本的亮点解析

    NVIDIA DOCA通过开发者提供全面的软件框架以利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。其 API、库和工具生态系统简化了数据中心基础设施的
    的头像 发表于 11-27 11:15 305次阅读
    NVIDIA <b class='flag-5'>DOCA</b> 2.9版本的亮点解析

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 软件平台释放了 NVIDIA BlueField 网络平台的潜力,并为NVIDIA BlueField和ConnectX设备提供了所需的所有主机驱动程序。DOCA
    的头像 发表于 11-09 13:50 265次阅读

    基于DPU的容器冷启动加速解决方案

    1. 方案背景 1.1. 业务背景 随着容器技术的迅猛发展与广泛应用,一种新的云计算服务模式应运而生-函数即服务(FaaS, Function as a Service)。FaaS作为一种无服务器
    的头像 发表于 09-13 11:50 411次阅读
    基于<b class='flag-5'>DPU</b>的容器冷启动<b class='flag-5'>加速</b>解决<b class='flag-5'>方案</b>

    IB Verbs和NVIDIA DOCA GPUNetIO性能测试

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一个库,专门为实时在线 GPU 数据包处理而设计。它结合了 GPUDirect RDMA 和 GPUDirect
    的头像 发表于 08-23 17:03 606次阅读
    IB Verbs和NVIDIA <b class='flag-5'>DOCA</b> GPUNetIO性能测试

    中科驭数分析DPU云原生网络与智算网络中的实际应用

    CCF Chip 2024,精彩不能停!7月21日下午,中科驭数第二届中国计算机学会(CCF)芯片大会的“驭数专属时刻”仍在继续,驭数组织承办“DPU技术趋势和应用——DPU云原生
    的头像 发表于 08-02 11:21 706次阅读

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务器运行效率显著提升,有效降低成本。因此,新型数据中心建设时,围绕 DPU 构建数据中心网络的基础设施
    发表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDIA BlueField-3
    的头像 发表于 06-27 17:31 766次阅读

    基于芯启源NFP3800DPU芯片的深信服安全加速卡XSX40FNN网卡

    近日,国内DPU领域的领军企业芯启源宣布,基于芯启源NFP3800DPU芯片定制的深信服安全加速卡XSX40FNN网卡已成功应用于其防火墙产品,并已批量推向市场。
    的头像 发表于 05-29 14:06 947次阅读
    基于芯启源NFP3800<b class='flag-5'>DPU</b>芯片的深信服安全<b class='flag-5'>加速</b>卡XSX40FNN网卡

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNI
    的头像 发表于 05-29 09:22 489次阅读

    明天线上见!DPU构建高性能云算力底座——DPU技术开放日最新议程公布!

    技术不同行业中的应用解决方案有哪些?能带来怎样的业务效果? 3月29日本周五,中科驭数集结产品大咖及解决方案专家团,诚邀您参加以“DPU构建高性能云算力底座”为主题的线上
    的头像 发表于 04-03 18:12 1002次阅读

    中科驭数DPU技术开放日秀“肌肉”:云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

    DPU技术开放日既是对DPU技术应用的典型方案展示,也是DPU技术重要细分场景走向成熟的标志。
    的头像 发表于 04-01 11:48 782次阅读
    中科驭数<b class='flag-5'>DPU</b>技术开放日秀“肌肉”:云原生网络、RDMA、安全<b class='flag-5'>加速</b>、低延时网络等<b class='flag-5'>方案</b>组团亮相

    FPGA-Based DPU网卡的发展和应用

    采用单芯片的SoC形态,兼顾性能和功耗。FPGA-Based DPU硬件设计的挑战主要来自芯片面积和功耗。
    发表于 02-23 14:40 2071次阅读
    FPGA-Based <b class='flag-5'>DPU</b>网卡的发展和应用

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    作为专为 NVIDIA® BlueField® 网络平台而设计的数据中心基础设施软件框架,NVIDIA® DOCA™ 使广大开发者能够利用其行业标准 API NVIDIA
    的头像 发表于 02-23 10:02 472次阅读

    星云智联为金山云打造裸金属服务器DPU解决方案,助力高端用户实现更强大更高效的云体验

    国内领先的DPU和智能网卡芯片与解决方案提供商星云智联近日宣布,与中国知名云服务商金山云共同开发了基于星云智联NebulaMatrix DPU解决
    的头像 发表于 02-20 09:06 623次阅读

    ADXL345读到的加速度信号怎么转换成速度信号?

    ADXL345读到的加速度信号(1g=9807mm/sec 2)通过一次积分运算可以得出速度信号(mm/s)吗?得出的速度信号精度怎么样?
    发表于 12-29 06:25