使用NVIDIA TAO工具包和Appen实现AI模型微调-电子发烧友网

从头开始构建人工智能模型需要大量的数据、时间、金钱和专业知识。这与在人工智能领域取得成功的条件不符：快速上市，以及快速发展和定制解决方案的能力。 NVIDIA TAO 是一个人工智能模型调整框架，与从头开始的培训相比，它可以让您利用生产质量、预培训的人工智能模型，并在很短的时间内对其进行微调。

要进一步微调这些模型，或确认模型的精度，需要额外的高质量训练数据。 Appen 是 TAO 的数据注释合作伙伴，如果您没有合适的可用数据，它可以访问高质量的数据集和服务，为您的数据添加标签和注释，以满足您的独特需求。

在帖子中，我将向你展示如何使用 NVIDIA TAO 工具包一个基于 CLI 的NVIDIA TAO 框架的解决方案，以及 AppEN 的数据标记平台，以简化整个培训过程，并为特定用例创建高度定制的模型。

在您的团队确定了要使用 ML 解决的业务问题后，您可以从 NVIDIA 收集的计算机视觉和对话人工智能中的预训练人工智能模型中进行选择。计算机视觉模型可以包括人脸检测模型、文本识别、分割等。然后，您可以应用 TAO 工具包来构建、培训、测试和部署您的解决方案。

为了加快数据收集和扩充过程，您现在可以使用 Appen 数据注释平台为您的用例创建正确的培训数据。该强大的平台使您能够访问 Appen 全球超过 100 万名熟练的注释员，他们来自 170 多个国家，讲 235 种语言。 Appen 的数据注释平台和专业知识还为您提供了其他资源：

高质量数据集（用于需要数据时）

全球采购的人工标签机，用于为未标记的数据添加注释

一个易于使用的平台，您可以在其中启动注释作业并监控关键指标

质量保证检查和数据安全控制

有了干净、高质量的数据，您可以调整经过训练的 NVIDIA 模型以满足您的需求，并进行修剪和再培训，以达到所需的性能水平。

如何使用 Appen 的平台准备数据

如果您还没有用于训练模型的数据，您可以自己收集这些数据，也可以求助于 Appen ，找到适合您的用例的源数据集。 Appen 数据注释平台（ ADAP ）可使用多种格式：

音频（. wav ，. mp3 ）

图像（. jpeg ，. png ）

文本（. txt ）

视频（网址）

完成数据收集阶段后，除非您计划与 Appen 合作以满足数据收集需求，否则您可以使用 Appen 的平台快速标记您收集的数据。每行数据批注都需要 Appen 平台许可证和预算。

在此基础上，完成以下步骤，部署一个特别适合您需求的模型。在本文中，假设您正在为对象检测模型注释图像。

准备好你的数据

首先，将图像数据加载到网络可访问的位置：云或 ADAP 可以访问的位置，例如私有 Amazon S3 存储桶。

接下来，用两列结构输入 CSV 文件。第一列包含文件名，第二列包含图像的 URL 。您可以通过以下三种方式之一提供 URL ：

对数据使用公开可用的 URL 。

使用预先签名的 URL 。

使用 Appen 的安全数据访问工具，您可以使用该工具将数据库安全地连接到平台； Appen 仅在需要时访问您的数据。

第二列包含设备上的本地文件名。图 1 显示了 CSV 文件的外观。

图 1 。用于 ADAP 中数据上传的 CSV 结构

创建作业并上载数据

如果尚未登录，可以创建 ADAP 帐户并登录。在运行新作业之前，您必须拥有平台的活动许可证。要了解更多有关计划和定价的信息，联系 Appen 。

登录后，在Jobs下选择创造就业机会。

图 2 。 ADAP 工作概述页面

选择最适合工作的模板（情绪分析、搜索相关性等）。对于本例，请选择Image Annotation。

图 3 。 ADAP 作业模板页面–图像注释

在Image Annotation下，选择使用边界框对图像中的对象进行注释和分类。将 CSV 文件拖放到Upload选项卡中，上传 CSV 文件。

设计你的工作

为 Appen 的 100 多万名数据标签员提供指导，说明他们应该寻找什么，以及他们应该知道的任何要求。该模板提供了一个简单的工作设计来帮助您开始。

接下来，选择管理图像注释本体，在这里定义应该检测的类。更新说明，以提供有关用例的更多上下文，并描述注释者应如何识别和标记图像中的对象。您可以预览作业，并查看注释员将如何查看它。

最后，创建测试问题来测量和跟踪贴标机的性能。

启动作业

在平台上正式启动注释作业之前，先进行测试运行。在你开始工作后， Appen 的全球数据标签员会根据你的规格标注你的数据。

班长

实时监控注释的准确率。在工作设计、试题或注释员等领域根据需要进行调整。

图 8 。 ADAP 注释进度监控页面

后果

选择Download、Full下载标签数据输出的报告。

将输出转换为 KITTI 格式

从这里开始，您需要一个脚本来将标记的数据转换为可供 TAO 工具包使用的格式，例如 KITTI 格式。

使用上一步的输出，可以使用以下部分将标记的数据转换为类似 Pascal Visual Object Class （ VOC ）格式的格式。

训练你的模特

用 Appen 注释的数据现在可以用于训练对象检测模型。 TAO 工具包允许您根据数据调整流行的网络架构和主干，从而训练、微调、删减和导出高度优化和精确的人工智能模型，以供部署。对于本例，您可以选择 YOLOV3 对象检测模型，如下例所示：

$ wget --content-disposition https://api.ngc.nvidia.com/v2/resources/nvidia/tlt_cv_samples/versions/v1.0.2/zip -O tlt_cv_samples_v1.0.2.zip $ unzip -u tlt_cv_samples_v1.0.2.zip -d ./tlt_cv_samples_v1.0.2 && rm -rf tlt_cv_samples_v1.0.2.zip && cd ./tlt_cv_samples_v1.0.2

下载笔记本示例后，您可以使用以下命令启动笔记本：

$ jupyter notebook --ip 0.0.0.0 --port 8888 --allow-root

在 localhost 上打开 internet 浏览器并打开以下 URL ：

http://0.0.0.0:8888

因为您正在创建一个 YOLOv3 模型，所以打开 yolo _ v3 / yolo _ v3 。 ipynb 笔记本。按照笔记本上的说明训练模型。

根据结果，微调模型，直到达到度量目标。如果需要，您可以在此阶段创建自己的主动学习循环。根据置信度或其他选择指标，使用 CSV 文件方法对数据进行优先级排序，如前面步骤所述。您还可以提前加载数据（包括输入和预测），这样 Appen 的注释员可以在模型经过培训后验证模型，并使用我们的领域专家和 open crowd 查看预测。

Pro tip:使用 Appen 解决方案 Workflows 轻松构建和自动化多步骤数据注释项目。

迭代

随着您不断提高模型性能， Appen 可以在后续的模型培训中进一步帮助您进行数据收集和注释。为了避免模型漂移或适应不断变化的业务需求，请定期对模型进行再培训。

结论

NVIDIATAO 工具包与 Appen 的数据平台相结合，使您能够训练、微调和优化预训练模型，以更快地启动人工智能解决方案。在不牺牲质量的情况下，将开发时间缩短十倍。在NVIDIA 和 Appen 的综合专业知识和工具的帮助下，您将满怀信心地推出人工智能。

关于作者

Titus Capilnean 领导 Appen 的营销传播，推动负责任、包容的人工智能，并与全球公司进行培训数据对话。他拥有 2016 年的机器学习证书、霍尔特国际商学院（ Hult International Business School ）的行政 MBA 学位，并在 Forbes 上发表了几篇关于人工智能的评论文章。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4985

浏览量
103031
人工智能

人工智能

+关注

关注
1791

文章
47258

浏览量
238410

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 开发了一个全新的生成式 AI 模型。利用输入的文本和音频，该模型可以创作出包含任意的音乐、人声和声音组合的作品。

发表于 11-27 11:29 •351次阅读

基于EasyGo Vs工具包和Nl veristand软件进行的永磁同步电机实时仿真

EasyGo Vs Addon是一款领先的FPGA仿真工具包软件，它强大地连接了VeriStand软件与Matlab/Simulink，为实时测试和验证领域带来了前所未有的便利和效率，特别适用于汽车

发表于 11-27 11:28 •226次阅读

基于EasyGo Vs<b class='flag-5'>工具包</b>和Nl veristand软件进行的永磁同步电机实时仿真

基于NVIDIA TAO工具包训练汽车目标识别模型

2023年以ChatGPT为代表的大语言模型横空出世，它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力，为人工智能技术的发展开辟了新的可能性。同时，人工智能技术正在进入各种应用领域，在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。

发表于 11-07 10:53 •224次阅读

基于<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TAO</b><b class='flag-5'>工具包</b>训练汽车目标识别<b class='flag-5'>模型</b>

FPGA仿真工具包软件EasyGo Vs Addon介绍

EasyGo Vs Addon是一款领先的FPGA仿真工具包软件，它强大地连接了VeriStand软件与Matlab/Simulink，为实时测试和验证领域带来了前所未有的便利和效率，特别适用于汽车、航空航天和能源电力等实时测试和验证至关重要的行业。

发表于 10-24 15:55 •360次阅读

FPGA仿真<b class='flag-5'>工具包</b>软件EasyGo Vs Addon介绍

采用德州仪器 (TI) 工具包进行模拟前端设计应用说明

电子发烧友网站提供《采用德州仪器 (TI) 工具包进行模拟前端设计应用说明.pdf》资料免费下载

发表于 09-09 11:21 •0次下载

采用德州仪器 (TI) <b class='flag-5'>工具包</b>进行模拟前端设计应用说明

NVIDIA RTX AI套件简化AI驱动的应用开发

NVIDIA 于近日发布 NVIDIA RTX AI套件，这一工具和 SDK 集合能够帮助 Windows 应用开发者定制、优化和部署适用于 Windows 应用的

发表于 09-06 14:45 •445次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务，以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的

发表于 07-24 09:39 •708次阅读

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

AI大模型与AI框架的关系

多个领域取得显著成果。而AI框架则是为开发和训练AI模型提供的一套标准接口、特性库和工具包，它集成了算法的封装、数据的调用以及计算资源的使用，是AI

发表于 07-15 11:42 •1084次阅读

揭秘NVIDIA AI Workbench 如何助力应用开发

能够根据其具体需求调整 AI 模型。此类工作在过去可能需要复杂的设置，而新工具使这项工作变得空前简单。 NVIDIA AI Workben

发表于 07-10 18:51 •640次阅读

大模型为什么要微调？大模型微调的原理

在人工智能（AI）领域，特别是自然语言处理（NLP）领域，大模型（如BERT、GPT系列等）的出现为许多复杂任务提供了强大的解决方案。然而，这些预训练的大模型虽然具有广泛的适用性，但在特定任务上往往

发表于 07-10 10:43 •4090次阅读

MediaTek与NVIDIA TAO加速物联网边缘AI应用发展

在即将到来的COMPUTEX 2024科技盛会上，全球知名的芯片制造商MediaTek宣布了一项重要合作——将NVIDIA的TAO（TensorRT Accelerated Optimizer）与其NeuroPilot SDK（软件开发

发表于 06-12 14:49 •473次阅读

Edge Impulse发布新工具，助 NVIDIA 模型大规模部署

借助 Edge Impulse 和 NVIDIA TAO 工具包的协同效应，工程师得以快速构建并部署至边缘优化硬件（如上述型号）的计算机视觉模型。该平台还支持用户运用经由 GPU 优化

发表于 03-25 16:00 •750次阅读

QE for Motor V1.3.0：汽车开发辅助工具解决方案工具包

电子发烧友网站提供《QE for Motor V1.3.0：汽车开发辅助工具解决方案工具包.pdf》资料免费下载

发表于 02-19 10:44 •0次下载

NVIDIA TAO 5.2版本发布

NVIDIA TAO 提供了一个低代码开源 AI 框架，无论你是初学者还是专业的数据科学家，都可以使用该框架加速视觉 AI 模型开发。开发者

发表于 01-03 10:11 •626次阅读

搜索历史

使用NVIDIA TAO工具包和Appen实现AI模型微调

评论

最新Simplicity SDK软件开发工具包发布

NVIDIA推出全新生成式AI模型Fugatto

基于EasyGo Vs工具包和Nl veristand软件进行的永磁同步电机实时仿真

基于NVIDIA TAO工具包训练汽车目标识别模型

FPGA仿真工具包软件EasyGo Vs Addon介绍

采用德州仪器 (TI) 工具包进行模拟前端设计应用说明

NVIDIA RTX AI套件简化AI驱动的应用开发

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

AI大模型与AI框架的关系

揭秘NVIDIA AI Workbench 如何助力应用开发

大模型为什么要微调？大模型微调的原理

MediaTek与NVIDIA TAO加速物联网边缘AI应用发展

Edge Impulse发布新工具，助 NVIDIA 模型大规模部署

QE for Motor V1.3.0：汽车开发辅助工具解决方案工具包

NVIDIA TAO 5.2版本发布