news 2026/5/21 23:29:52

实操,在单片机上移植CMSIS-NN神经网络库

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
实操,在单片机上移植CMSIS-NN神经网络库
关注+星标公众号,不错过精彩内容 来源 | 瑞萨嵌入式小百科

随着人工智能的发展,以及MCU性能的提高,在MCU上跑一些算法已经不是什么遥不可及的事了。

到目前为止,很多MCU跑AI算法已经很“轻松”了,今天就手把手教大家移植CMSIS-NN V6.0.0到瑞萨RA8单片机(VisionBoard开发板)。

CMSIS-NN是什么?

官方的解释是:

CMSIS NN software library is a collection of efficient neural network kernels developed to maximize the performance and minimize the memory footprint of neural networks on Arm Cortex-M processors.

翻译一下就是:

CMSIS NN 软件库是一组高效的神经网络核(函数),旨在最大限度地提高 Arm Cortex-M 处理器上神经网络的性能并最大限度地减少内存占用。

CMSIS-NN是一个计算库,它向上提供了神经网络(NN)计算接口,实现了神经网络计算的硬件加速。它内部实现了纯CPU计算、DSP计算、MVE计算,屏蔽了底层硬件的具体细节,降低了编程难度。

为什么移植CMSIS-NN v6.0.0版本?

1

CMSIS-NN核心特性

总结一下官方的介绍,可以知道CMSIS-NN库的核心特性:

  • 专为Cortex-M处理器开发;

  • 神经网络计算函数;

  • 最大化性能;

  • 最小化内存占用

2

CMSIS-NN的硬件和软件支持

除此之外,CMSIS-NN库还有几点也是值得关注的:

  • 支持DSP扩展的处理器,使用SIMD优化,例如Cortex-M4核;

  • 支持ARM的Heilum技术的处理器,使用M核向量扩展(MVE,M-profile Vector Extension)进行优化,例如 Cortex-M55 或 Cortex-M85;

  • MVE扩展恰好是ARM Cortex-M85内置的;

  • VisionBoard主控芯片瑞萨RA8D1的CPU核正是ARM Cortex-M85;

  • CMSIS-NN可以作为TensorFlow Lite for Microcontroller的后端实现;

3

CMSIS-NN核心特性

CMSIS-NN v6.0.0版本的发布说明中,介绍了新特性:

全连接(FC)、卷积(CONV)和深度卷积(DWCONV)添加了MVE指令的int4类型支持;

重新实现 LSTM 以与 TFLM 参考内核保持一致;

LSTM 对 int16 输入的支持

DSP/MVEI 支持转置卷积

支持分组卷积

支持 FC 的非零滤波器偏移

对 MVEI 的 Int16 输入卷积支持

对 int16x8 卷积的 Int32 偏置支持

更能多内容可以查看本文末尾的CMSIS-NN v6.0.0 Release Note;

如何移植CMSIS-NN v6.0.0到VisionBoard?

1

创建RT-Thread项目

RT-Thread Studio创建基于VisionBoard开发板的模板项目,过程比较简单,不再赘述。

2

添加CMSIS-NN源码

RT-Thread Studio创建基于VisionBoard开发板的模板项目后,在packages目录手动下载CMSIS-NN v6.0.0版本:

3

修改RT-Thread代码

修改项目顶层的Kconfig文件,添加如下代码行:

注意:Kconfig修改需要完需要保证最后有一行空行,否则menuconfig命令会报奇怪的错误。

检查packages目录内是否有SConsript文件,并且内容如下:

如果没有,可以手动创建。

4

修改CMSIS-NN代码

CMSIS-NN目录顶层创建SConscript文件,内容如下:

创建Kconfig文件,内容如下:

5

编译RT-Thread项目

完成以上修改之后,已经可以编译CMSIS-NN库的代码了。

在命令行中执行如下命令,编译整个项目:

编译输出最后部分如下图所示:

如何测试CMSIS-NN v6.0.0?

1

CMSIS-NN核心特性

CMSIS-NN库内部带有了单元测试,具体位于 Tests/UnitTest 子目录,其中 unittest_targets.py 脚本可以用于生成测试脚手架代码,使用方法如下:

当前生成的代码是单独生成elf文件,并在ARM虚拟硬件(AVH)平台上运行的。

默认情况下,执行python unittest_targets.py —download-and-generate-test-runners命令,会为每个测试用例生成一个main函数,每个测试用例单独编译为一个elf文件,之后使用ARM虚拟硬件(AVH)执行elf进行测试。

为了能够生成在RT-Thread上运行的测试代码,需要修改部分测试脚本代码,实现将每个测试用例注册为一个独立的finsh命令,在串口命令行中交互测试。

具体修改的代码差异如下:

这段修改实现了:

  • 调用unity的ruby脚本,传递main_name命令行参数,用于修改单元测试入口函数名称(不指定默认是main);

  • 生成一个独立的RT-Thread finsh命令注册代码.c文件;

  • 生成一个用于编译的SConscript代码文件;

另外,再结合上层目录的SConcsript包含所有子目录的SConscript,就可以实现将所有单元测试编译为finsh命令了。

修改完该脚本文件后,执行如下命令,生成RT-Thread平台测试代码:

命令执行输出如下:

2

测试代码的构建规则SConscript

然后需要在CMSIS-NN的Tests子目录内,添加SConscript文件:

这段SConscript的作用是,将子目录的SConscript脚本包含到整个项目的构建流程中去。

接着需要在CMSIS-NN的Tests/UnitTest子目录内,添加SConscript文件:

完成以上修改后,通过menuconfig打开 PKG_USING_CMSIS_NN_TESTS 配置项目,再次 scons 编译,就可以编译单元测试代码文件了。

3

解决链接失败问题

但是还会有一些编译错误,原因主要有:

  1. 原来的测试脚本为每个测试用例独立生成main函数,每个目录单独编译;

    链接到一起时,会有大量重复的setUp/tearDown/resetTest/verifyTest函数定义;

  2. 原来的测试数据数组没有加static修饰,被重复include到多个.c文件;

    链接到一起时,会有数组重复的数组定义;

为了解决上述两类问题,分别创建两个脚本。

修复重复函数定义的 fix_testCode.sh:

解决方法,所有 setUp/tearDown/resetTest/verifyTest 函数添加 weak 属性修饰;

修复重复数组定义的 fix_testData.sh:

解决方法,所有测试数据的数组添加static修饰。

分别执行上面两个脚本之后,再次编译,就没有编译错误了。

4

运行单元测试

顺利编译之后,下载固件:

运行后,在串口输入help命令可以看到:

输入命令,运行avgpool算子的测试:

其他几个算子的s8类型测试:

修改后的CMSIS-NN代码仓:

https://github.com/xusiwei/CMSIS-NN

参考链接

1.CMSIS-NN源码仓:

https://github.com/ARM-software/CMSIS-NN

2.TFLM项目介绍页:]

https://tensorflow.google.cn/lite/microcontrollers/overview?hl=zh-cn

3.CMSIS-NN v6.0.0 Release Note:

https://github.com/ARM-software/CMSIS-NN/releases/tag/v6.0.0

4.Ruby下载页面:

https://www.ruby-lang.org/zh_cn/downloads/

------------END------------

单片机选项字节在IAR、CS+、e²studio下的设置

在1 GHz 主频单片机上部署AI模型

10分钟在MCU上快速部署LWIP

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 11:20:28

Excalidraw与Notion集成:打造一体化知识库

Excalidraw与Notion集成:打造一体化知识库 在技术团队的日常协作中,你是否经历过这样的场景?一场头脑风暴后,白板上画满了系统架构草图和流程逻辑,大家意犹未尽。会议结束,照片被丢进群聊,几天…

作者头像 李华
网站建设 2026/5/20 16:12:34

智能测试用例生成:是银弹还是玩具?面试中如何客观评价?

在2025年的软件测试行业,随着人工智能和机器学习技术的飞速发展,智能测试用例生成工具已成为热门话题。它们被誉为能自动化生成测试数据、场景和路径的“革命性创新”,但同时也被质疑为脱离实际、难以落地的“玩具”。对于软件测试从业者而言…

作者头像 李华
网站建设 2026/5/20 16:12:40

【大模型开发者必看】:Open-AutoGLM电子书高清完整版下载(附源码解析)

第一章:Open-AutoGLM电子书下载 获取《Open-AutoGLM》电子书是深入了解该开源项目自动化推理与代码生成能力的第一步。该项目围绕轻量化大语言模型在代码任务中的应用展开,提供了完整的文档支持与实践案例。 官方发布渠道 电子书可通过项目官网及 GitHu…

作者头像 李华
网站建设 2026/5/20 21:56:19

2024最值得入手的Open-AutoGLM相关礼物TOP10(科技达人私藏款曝光)

第一章:Open-AutoGLM 礼物选购推荐智能推荐系统的核心机制 Open-AutoGLM 是一款基于开源大语言模型的智能礼物推荐工具,能够根据用户输入的关系、预算、兴趣等维度,自动生成个性化礼品建议。其核心逻辑在于语义理解与知识图谱的融合&#xff…

作者头像 李华
网站建设 2026/5/20 16:52:47

好写作AI:跨界搞研究?别让AI拖了你创新的后腿

当你选择挑战一个交叉学科课题——比如“计算社会学”、“生物信息学”或“量子化学”——的那一刻,就意味着你选择了一条艰难但充满潜力的路。然而,当你试图向AI工具寻求帮助时,常常会感到失望:它似乎理解每个独立学科的概念&…

作者头像 李华
网站建设 2026/5/21 22:05:49

Open-AutoGLM异地部署避坑指南,20年IT老兵亲授不可不知的8大陷阱

第一章:Open-AutoGLM异地部署的认知革命在分布式AI系统演进的浪潮中,Open-AutoGLM的异地部署标志着架构思维的根本性转变。传统集中式模型服务已无法满足低延迟、高可用与数据合规性的多重诉求。通过将推理引擎分散至地理上隔离的多个节点,系…

作者头像 李华