news 2026/4/22 15:10:13

【红外小目标检测实战 五】轻量化模型结构及去除DFL以加速边缘推理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【红外小目标检测实战 五】轻量化模型结构及去除DFL以加速边缘推理

接前篇,常规卷积在CUDA上回进行内存重排,使之变为连续的,然后放到CUDA核或者Tensor核上进行一系列高性能的乘加操作。但是风车卷积不是常规的卷积,虽说参数量也小,但是在jetson上无对应的高性能算子,导致访存不连续,进而拉慢了推理性能。本篇去掉了风车型卷积,改回SPDConv,同时去掉了边缘设备上不友好的DFL结构,并将激活函数从SiLU改为ReLU重新训练,以提高边缘设备推理性能。

一、模型信息

模型结构图

YAML文件

nc:1# number of classesscales:# model compound scaling constants, i.e. 'model=yolo11n.yaml' will call yolo11.yaml with scale 'n'# [depth, width, max_channels]n:[0.5,0.50,1024]# s: [1.0, 1.00, 1024]# m: [1.00, 2.00, 512]backbone:# [from, repeats, module, args]-[-1,1,SPDConv,[32]]-[-1,1,SPDConv,[64]]-[-1,2,C3k2,[64,True,0.25]]# 2 P2-[-1,1,Conv,[64,3,2]]-[-1,2,C3k2,[128,True,0.25]]# 4 P3-[-1,1,Conv,[128,3,2]]-[-1,2,C3k2,[256,False]]# 6 P4-[-1,1,SPPF,[256,5]]-[-1,2,C2PSA,[256]]# 8head:-[-1,1,nn.Upsample,[None,2,"nearest"]]-[[-1,4],1,Concat,[1]]# cat backbone P3-[-1,2,C3k2,[128,False]]# 11-[-1,1,nn.Upsample,[None,2,"nearest"]]-[[-1,2],1,Concat,[1]]# cat backbone P2-[-1,2,C3k2,[64,False]]# 14-[-1,1,Conv,[64,3,2]]-[[-1,11],1,Concat,[1]]-[-1,2,C3k2,[128,False]]# 17# 向上分支,融合原始特征-[-1,1,nn.Upsample,[None,2,"nearest"]]-[[-1,2],1,Concat,[1]]# cat backbone P2-[-1,2,MicroC3,[64]]# 20-[-1,1,HDC,[64]]-[-1,1,ART,[64]]# 22-[17,1,Conv,[128,3,2]]-[[-1,8],1,Concat,[1]]# 24-[-1,2,C3k2,[256,True]]#-[[22,17,25],1,Detect,[nc]]# Detect(P2, P3, P4)# - [[21, 17, 24], 1, Detect, [nc]] # 减少一个concat

模型参数量分析

n-model总体FLOPs很小,只有4.78G,参数量500多K。
s-modelFLOPs也只有21.554G

二、详细改动

1.关闭DFL

ultralytics/nn/modules/head.py

classDetect(nn.Module):...def__init__(self,nc:int=80,ch:tuple=()):""" Initialize the YOLO detection layer with specified number of classes and channels. Args: nc (int): Number of classes. ch (tuple): Tuple of channel sizes from backbone feature maps. """super().__init__()self.nc=nc# number of classesself.nl=len(ch)# number of detection layers# self.reg_max = 16 # DFL channels (ch[0] // 16 to scale 4/8/12/16/20 for n/s/m/l/x)self.reg_max=1# !!!注释掉上面一句,修改为这个

2.修改模块激活函数

ultralytics/nn/modules/conv.py

classConv(nn.Module):""" Standard convolution module with batch normalization and activation. Attributes: conv (nn.Conv2d): Convolutional layer. bn (nn.BatchNorm2d): Batch normalization layer. act (nn.Module): Activation function layer. default_act (nn.Module): Default activation function (SiLU). """# default_act = nn.SiLU() # default activationdefault_act=nn.ReLU()# !!!修改在此处

其余使用到的模块,也需要检查激活函数是否为ReLU.

三、实验结果

测试集上混淆矩阵

网络在自制测试集上的召回率和准确率都很高。

推理性能

n-model在jetson nx板子上,可以达到90FPS!

四、后续

  • 推理代码分享
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 19:04:04

CBAM注意力机制实战:在医学图像分析中的应用案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 使用快马平台实现一个基于CBAM注意力机制的医学图像分割模型。输入:一个肺部CT扫描数据集,包含正常和病变区域。输出:一个能够自动分割病变区域…

作者头像 李华
网站建设 2026/4/22 19:02:51

5分钟搭建安全的Nacos配置中心原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 生成一个预配置好的Nacos服务端原型项目,已正确处理Nacos.Core.Auth.Plugin.Nacos.Token.Secret.Key配置。要求:1) 包含Docker Compose文件 2) 预生成安全密…

作者头像 李华
网站建设 2026/4/21 8:55:44

Figma MCP在大型团队中的最佳实践

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个Figma团队协作看板,专门用于管理MCP组件库。功能包括:1.组件使用情况统计 2.变更影响分析 3.团队成员评论系统 4.版本对比工具 5.审批工作流。要求…

作者头像 李华
网站建设 2026/4/18 5:27:13

Git小白必看:轻松理解并解决文件覆盖警告

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个交互式Git新手教程,重点讲解YOUR LOCAL CHANGES错误。功能:1) 动画演示错误产生原因 2) 交互式命令行模拟器 3) 分步指导解决方案 4) 常见错误提示…

作者头像 李华
网站建设 2026/4/20 1:27:26

亲测好用10个AI论文平台,专科生轻松搞定毕业论文!

亲测好用10个AI论文平台,专科生轻松搞定毕业论文! AI 工具如何助力论文写作? 对于专科生来说,撰写毕业论文是一件既重要又棘手的任务。从选题到定稿,每一个环节都充满了挑战,尤其是面对繁重的文献整理、结构…

作者头像 李华
网站建设 2026/4/21 6:40:34

避坑指南:Qwen2.5-0.5B微调训练常见问题全解析

避坑指南:Qwen2.5-0.5B微调训练常见问题全解析 1. 背景与任务目标 随着大语言模型(LLM)在自然语言处理领域的广泛应用,微调(Fine-tuning) 已成为将通用模型适配到特定任务的关键手段。本文聚焦于阿里云开…

作者头像 李华