想在STM32 MCU上部署机器学习模型？这份入门教程，让你一学就会~-电子发烧友网

机器学习 (ML) 在服务器和移动应用中已经风靡多年，现在这种趋势已蔓延到边缘设备，并且变得突出。由于边缘设备需要节能，因此开发人员需要学习和了解如何将ML模型部署到基于微控制器的系统中。

在微控制器上运行的ML模型通常被称为tinyML。然而，将模型部署到微控制器并非易事，但它正在变得越来越容易，没有经过任何专业培训的开发人员也能在规定时间完成部署。

本文探讨了嵌入式环境开发人员如何通过STMicroelectronics的STM32微控制器开始使用ML。为此，文中展示了如何通过X-CUBE-AI将TensorFlow Lite for Microcontrollers模型转换用于STM32CubeIDE，来创建“Hello World”应用。

tinyML用例介绍

tinyML是一个不断发展的领域，它将ML功能整合到微控制器等资源和功耗受限的设备中，通常采用深度神经网络。然后，这些微控制器设备可以运行ML模型，在边缘进行有价值的工作。以下几个用例中的tinyML非常值得关注。

第一个用例常见于许多移动设备和家庭自动化设备，即关键词识别。通过关键词识别，嵌入式设备可以使用麦克风捕获语音并检测预先训练的关键词。tinyML模型使用表示语音的时间序列输入，将其转换为语音特征，通常为频谱图，其中包含随时间变化的频率信息。然后，将频谱图输入经过训练的神经网络，以检测特定的字词，结果就是检测到特定字词的概率。图1显示了这个过程的示例。

图1：关键词识别是tinyML的有趣用例。输入的语音被转换为频谱图，然后输入经过训练的神经网络，以确定是否有预先训练的字词。（图片来源：Arm®）

许多嵌入式环境开发人员感兴趣的另一个tinyML用例为图像识别。微控制器从摄像头捕获图像，然后将其输入预先训练的模型。模型可以辨别图中的内容。例如，模型可以确定是否有猫、狗或者鱼等等。图像识别用于边缘的一个很好的例子是视频门铃。视频门铃通常可以检测门口是否有人，或者是否有放下的包裹。

最后一个非常常见的用例是用tinyML进行预见性维护。预见性维护使用ML基于异常检测、分类算法和预测模型来预测设备状态。同样，从HVAC系统到工厂车间设备，应用非常广泛。

尽管上述三个用例是目前常见的tinyML，但开发人员无疑还可以找到更多潜在的用例。以下是相关应用的列表：

手势分类

异常检测

模拟量表读取器

指导和控制 (GNC)

包装检测

无论哪个用例，开始熟悉tinyML的最好方法是使用“Hello World”应用，它可以帮助开发人员学习和理解实现并运行一个最基础的系统所遵循的基本流程。在STM32微控制器上运行tinyML模型，有5个必要步骤：

1、捕获数据
2、标记数据
3、训练神经网络
4、转换模型
5、在微控制器上运行模型

捕获、标记和训练“Hello World”模型

关于捕获和标记用于训练模型所需的数据，开发人员通常有许多选择。首先，有大量的线上训练数据库。开发人员可以搜索他人收集和标记的数据。例如，对于基本的图像检测，有CIFAR-10或ImageNet。如需训练模型来检测照片中的微笑，也有一个图像集。从在线数据存储库开始显然是不错的选择。

如果所需的数据尚未在互联网上公开，开发人员也可以生成自己的数据。可以使用Matlab或其他工具来生成数据集。如果不能自动生成数据，也可以手动完成。最后，如果觉得这些都太耗时，也可在互联网上购买数据集。收集数据往往是最令人兴奋和有趣的选择，但也最费事。

这里探讨的“Hello World”示例展示了如何训练模型来生成正弦波并将其部署到STM32上。这个示例由Pete Warden和Daniel Situnayake整理，当时他们在谷歌开展TensorFlow Lite for Microcontrollers工作。这样一来，工作变得更容易，因为他们已经整理出了简单的捕获、标记和训练模型的公开教程。可以在Github上找到（点击此处）；打开链接后，开发人员应点击“Run in Google Colab”（在Google Colab中运行）按钮。Google Colab是Google Collaboratory的简称，它允许开发人员在浏览器中编写和执行Python，无需配置，并提供对Google GPU的免费访问。

浏览训练示例将输出两个不同的模型文件；一个是为微控制器量化的model.tflite TensorFlow模型，一个是没有量化的model_no_quant.tflite模型。量化可以表明如何以数字方式存储模型的激活和偏置。量化后可以得到更小的模型，更适合于微控制器。好奇的读者可以在图2中查看训练过的模型结果与实际正弦波结果的对比。模型的输出以红色显示。正弦波输出并不完美，但对“Hello World”程序而言，其效果已经很好了。

图2：TensorFlow模型正弦波预测与实际值的对比。（图片来源：Beningo Embedded Group）

选择开发板

在研究如何转换TensorFlow模型以便在微控制器上运行之前，需要选择该模型中部署的微控制器。本文将重点介绍STM32微控制器，因为STMicroelectronics公司有许多tinyML/ML工具，可以很好地转换和运行模型。此外，STMicroelectronics有多种与其ML工具兼容的元器件（图3）。

图3：图示为STMicroelectronics AI生态系统目前支持的微控制器和微处理器单元(MPU)。（图片来源：STMicroelectronics）

如果办公室里有这样一块开发板，就非常适合启动和运行“Hello World”应用。然而，如果对本例之外的应用感兴趣，想要了解手势控制或关键词识别，可以选择STM32 B-L4S5I-IOT01A开发套件物联网节点（图4）。

该开发板带有STM32L4+系列Arm Cortex®-M4处理器。该处理器有2MB闪存和640KB RAM，为tinyML模型提供了充足的空间。该模块还带有STMicroelectronics的MP34DT01微机电系统 (MEMS) 麦克风，可用于关键词识别的应用开发，适用于tinyML用例实验。此外，同样来自STMicroelectronics的板载LIS3MDLTR三轴加速计，可用于基于tinyML的手势检测。

图4：STM32 B-L4S5I-IOT01A开发套件物联网节点搭载Arm Cortex-M4处理器、MEMS麦克风和三轴加速计，是适应性tinyML实验平台。（图片来源：STMicroelectronics）

使用STM32Cube.AI转换和运行TensorFlow Lite模型

凭借可以运行tinyML模型的开发板，开发人员现在可以开始对TensorFlow Lite模型进行转换，以便在微控制器上运行。TensorFlow Lite模型可以直接在微控制器上运行，但需要一个运行时环境来处理它。

运行模型时，需要执行一系列的功能。这些功能首先收集传感器数据，然后筛选，提取必要特征，并反馈给模型。该模型输出结果，然后对结果进一步筛选，通常还会再进行一些操作。图5显示了该过程的概况。

图5：数据如何从传感器流向运行时，再到tinyML应用的输出。（图片来源：Beningo Embedded Group）

STM32CubeMx的X-CUBE-AI插件提供了解释TensorFlow Lite模型的运行时环境，并提供了开发人员可以利用的替代运行时和转换工具。X-CUBE-AI插件在项目中默认不启用。然而，在创建新项目并初始化威廉希尔官方网站板后，在Software Packs-> Select Components（软件包-> 选择组件）下，有一个启用AI运行时的选项。这里有几个选项；确保本例中使用的是Application模板，如图6所示。

图6：X-CUBE-AI插件需要使用本例的应用模板来启用。（图片来源：Beningo Embedded Group）

启用X-CUBE-AI后，STMicroelectronics X-CUBE-AI类别将出现在工具链中。点击该类别，开发人员能选择自己创建的模型文件并设置模型参数，如图7所示。可通过分析按钮对模型进行分析，并为开发人员提供RAM、ROM和执行周期信息。强烈建议开发人员比较Keras和TFLite模型选项。在较小的正弦波模型示例中，没有显著差异，但却可以发现其中的区别。点击“Generate code”（生成代码）可生成该项目。

图7：分析按钮为开发人员提供RAM、ROM和执行周期信息。（图片来源：Beningo Embedded Group）

代码生成器将初始化项目，并为tinyML模型构建运行时环境。但默认情况下，不会为模型提供输入。开发人员需要添加代码，为模型提供输入值 — x值，模型将解释该值并生成正弦y值。如图8所示，需要在acquisition_and_process_data和post_process函数中增加几段代码。

图8：所示代码将连接伪输入传感器值到正弦波模型。（图片来源：Beningo Embedded Group）

此时，本例运行就绪。注意：添加一些printf语句来获取模型输出，以便快速验证。快速编译和部署能让“Hello World”tinyML 模型运行。获取整个周期的模型输出得到图9所示的正弦波。它并不完美，但对于首个tinyML应用来说非常优秀。由此，开发人员可以将输出与脉冲宽度调制器 (PWM) 联结起来，并产生正弦波。

图9：在 STM32上运行时的“Hello World”正弦波模型输出。（图片来源：Beningo Embedded Group）

嵌入式系统上的ML技巧和窍门

开发人员若要在基于微控制器的系统上开始使用ML，需要做相当多的工作，才能让自己的首个tinyML应用运行起来。然而，记住几个“技巧和窍门”，可以简化和加快其开发：

浏览TensorFlow Lite for Microcontrollers的“Hello World”示例，包括Google Colab文件。花点儿时间调整参数，了解这些参数对经过训练的模型的影响。

在微控制器应用中使用量化模型。量化模型经过压缩，可以使用uint8_t而非32位浮点数。因此，该模型更小，执行速度更快。

了解TensorFlow Lite for Microcontrollers资源库中的其他示例。其他示例包括手势检测和关键词检测。

以“Hello World”为例，将模型输出连接到PWM和低通滤波器上，以查看产生的正弦波。执行运行时实验，增加和减少正弦波频率。

选择包括“额外”传感器的开发板，以便尝试广泛的ML应用。

尽管收集数据很有趣，但一般来说，购买或使用开源数据库来训练模型更容易。

开发人员遵循这些“技巧和窍门”，可以在确保应用安全的同时节省更多的时间并省去更多的麻烦。

本文小结

机器学习已经蔓延至网络边缘，而基于资源受限微控制器的系统是其主要目标。最新的工具可以转换和优化机器学习模型，以在实时系统上运行。如图所示，在STM32开发板上实现和运行模型相对容易，但也会涉及复杂性问题。虽然只探讨了产生正弦波的简单模型，但也可以实现更复杂的模型，如手势检测和关键词识别。

来源：得捷电子DigiKey
免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

mcu

mcu

+关注

关注
146

文章
17141

浏览量
351101
STM32

STM32

+关注

关注
2270

文章
10897

浏览量
355873
模型

模型

+关注

关注
1

文章
3238

浏览量
48824
ML

ML

+关注

关注
0

文章
149

浏览量
34654
机器学习

机器学习

+关注

关注
66

文章
8414

浏览量
132612

AI模型部署边缘设备的奇妙之旅：目标检测模型

智视觉模块上部署 PaddleDetection 模型如果说有自己制作数据的话，需要将数据上传，然后在修改全局配置项，修改数据集地址以及对应的类别数。按照厂家提供的配置直接进行训练转换。训练完成后，会自动生成一个rknn

发表于 12-19 14:33

构建云原生机器学习平台流程

构建云原生机器学习平台是一个复杂而系统的过程，涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。

发表于 12-14 10:34 •121次阅读

如何在STM32f4系列开发板上部署STM32Cube.AI，

已下载STM32Cube.AI扩展包，但是无法使用，感觉像是没有部署AI模型，我是想要通过摄像头拍照，上传图像后，经过开发板处理器进行AI模型处理识别过后，告诉我识别结果，显示在TFL

发表于 11-18 09:39

AI大模型与传统机器学习的区别

AI大模型与传统机器学习在多个方面存在显著的区别。以下是对这些区别的介绍：一、模型规模与复杂度 AI大

发表于 10-23 15:01 •604次阅读

【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

”，好奇于这种大模型算力中心到底是如何建设的，用什么设备、什么架构建设的？对这些问题真是一无所知，甚至都没有想过，带着这份好奇开始阅读。先浏览目录，共分十三章，目录中出现最多的就是GPU，比如

发表于 10-08 10:40

第一篇：V1.5-STM32f103c8t6智能小车笔记标准库开发 6612电机驱动新手入门项目

这是全网最详细、性价比最高的STM32实战项目入门教程，通过合理的硬件设计和详细的视频笔记介绍，硬件使用STM32F103主控资料多方便学习，通过3万字笔记、12多个小时视频、20多章

发表于 08-12 18:25 •1624次阅读

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

上周收到《大语言模型应用指南》一书，非常高兴，但工作项目繁忙，今天才品鉴体验，感谢作者编写了一部内容丰富、理论应用相结合、印刷精美的著作，也感谢电子发烧友william hill官网提供了一个

发表于 07-21 13:35

基于MCU的神经网络模型设计

力不从心。神经网络作为一种强大的机器学习模型，能够提供高效的数据处理和分析能力，但其计算复杂度和资源需求往往超出了普通MCU的能力范围。因此

发表于 07-12 18:21 •1081次阅读

基于stm32h743IIK在cubeai上部署keras模型，模型输出结果都是同一组概率数组，为什么？

基于stm32h743IIK，在cubeai上部署keras模型，模型输出结果都是同一组概率数组，一

发表于 05-20 08:18

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。

发表于 03-15 08:10

allegro快速入门教程

电子发烧友网站提供《allegro快速入门教程.pdf》资料免费下载

发表于 02-29 09:32 •71次下载

盘点那些硬件+项目学习套件：STM32U5单片机开发板及入门常见问题解答

入门+项目进阶开发板。主控为ST新一代超低功耗MCU旗舰版STM32U5，开发板采用底板+核心板的分离设计，底板统一，支持

发表于 02-19 16:59

盘点那些硬件+项目学习套件：STM32MP157 Linux开发板及入门常见问题解答

STM32开发是完全没问题的。初学者要学STM32，比较推荐我们的 STM32U5开发板，手把手教你学

发表于 02-01 14:25

英特尔CPU部署Qwen 1.8B模型的过程

本文介绍了在英特尔 13 代酷睿 CPU i5 - 13490F 设备上部署 Qwen 1.8B 模型的过程，你需要至少 16GB 内存的机器来完成这项任务，我们将使用英特尔的大

发表于 01-12 10:28 •2624次阅读

如何使用TensorFlow构建机器学习模型

在这篇文章中，我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。

发表于 01-08 09:25 •981次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

想在STM32 MCU上部署机器学习模型？这份入门教程，让你一学就会~

评论

AI模型部署边缘设备的奇妙之旅：目标检测模型

构建云原生机器学习平台流程

如何在STM32f4系列开发板上部署STM32Cube.AI，

AI大模型与传统机器学习的区别

【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

第一篇：V1.5-STM32f103c8t6智能小车笔记标准库开发 6612电机驱动新手入门项目

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

基于MCU的神经网络模型设计

基于stm32h743IIK在cubeai上部署keras模型，模型输出结果都是同一组概率数组，为什么？

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

allegro快速入门教程

盘点那些硬件+项目学习套件：STM32U5单片机开发板及入门常见问题解答

盘点那些硬件+项目学习套件：STM32MP157 Linux开发板及入门常见问题解答

英特尔CPU部署Qwen 1.8B模型的过程

如何使用TensorFlow构建机器学习模型