news 2026/5/1 7:15:44

YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

YOLO26最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLO有效涨点神器!!

购买相关资料后畅享一对一答疑

畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具!见文末!

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 动态第一条置顶动态中有直达链接,感谢支持!祝各位科研人硕果累累!!!

DualConv: Dual Convolutional Kernels for
Lightweight Deep Neural Networks(提出原文戳这)

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

一、摘要

CNN 架构通常对内存和计算要求很高,这使得它们对于硬件资源有限的嵌入式系统不可行。 我们提出双卷积核(DualConv)来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型,例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。 在本文中,我们广泛测试了 DualConv 的分类功能,因为这些网络架构构成了许多其他任务的骨干。 我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。 实验结果表明,结合我们的结构创新,DualConv 显着降低了深度神经网络的计算成本和参数数量,同时在某些情况下令人惊讶地实现了比原始模型略高的精度。 我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%,而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。 当参数数量不是问题时,DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。 此外,DualConv 显着提高了 YOLO-V3 目标检测速度,并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。

(a) 标准卷积、(b) 深度可分离卷积、© 组卷积、(d) 异构卷积和 (e) 所提出的双卷积的卷积滤波器设计。 M是输入通道数(即输入特征图的深度),N是卷积滤波器的数量,也是输出通道的数量(即输出特征图的深度),Di是宽度和高度维度 输入特征图的,K×K是卷积核大小,G是组卷积和对偶卷积中的组数,1/P是异构卷积中3×3卷积核的比例。 请注意,异构滤波器以移位的方式排列[18]。

我们提出了 DualConv,它将 3×3 组卷积与 1×1 逐点卷积相结合,解决了跨通道通信和原始输入特征图中信息保存的问题。 与 HetConv 相比,DualConv 通过添加最少的参数来提高网络性能。 DualConv应用于常见的网络结构来执行图像分类和目标检测。 通过比较标准卷积和 DualConv 的实验结果,证明了所提出的 DualConv 的有效性和效率。 从实验结果可以看出,DualConv 可以集成在标准网络架构和轻量级网络架构中,以提高网络精度并减少网络参数、计算成本和推理时间。 我们还证明了 DualConv 可以很好地适应各种图像数据集,并具有很强的泛化能力。 未来的研究工作将集中在嵌入式设备上的部署,以进一步证明 DualConv 在实际应用中的效率。

跑出结果后-相关方法详情请结合B站视频阅读全文,融入自己文章中!!!

二、 修改步骤!

2.1 修改YAML文件

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

2.2 新建.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

2.3 修改tasks.py

详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:AI学术叫叫兽er 源码在相簿的链接中,动态中也有链接,感谢支持!祝科研遥遥领先!

三、验证是否成功即可

执行命令

python train.py

改完收工!
关注B站:Ai学术叫叫兽er
从此走上科研快速路
遥遥领先同行!!!!

写在最后

学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通,所以本文作者即B站Up主:Ai学术叫叫兽
在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。
因为经历过所以更懂小白的痛苦!
因为经历过所以更具有指向性的指导!

祝所有科研工作者都能够在自己的领域上更上一层楼!

所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!

以下为给大家庭小伙伴们免费更新过的绘图代码,均配有详细教程,超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音:Ai学术叫叫兽!

所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!



所有科研参考资料均可点击此链接,合适的才是最好的,希望我的能力配上你的努力刚好合适!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 11:13:32

小白也能懂:Qwen2.5-VL本地化部署与图文交互实战

小白也能懂:Qwen2.5-VL本地化部署与图文交互实战 你不需要会配环境、不用查报错、不碰命令行——插上RTX 4090,点开浏览器,就能让AI“看图说话”。这不是演示视频,是今天下午你就能在自己电脑上跑起来的真实体验。 本文面向完全没…

作者头像 李华
网站建设 2026/4/22 10:51:20

人脸识别OOD模型保姆级教程:从部署到特征提取全流程

人脸识别OOD模型保姆级教程:从部署到特征提取全流程 1. 这不是普通的人脸识别,而是“会思考”的识别系统 你有没有遇到过这样的问题: 门禁系统把模糊的侧脸误认为是本人,直接放行;考勤系统对戴口罩、反光眼镜的照片…

作者头像 李华
网站建设 2026/4/21 12:54:12

语音数据清洗利器:FSMN-VAD自动分割工具

语音数据清洗利器:FSMN-VAD自动分割工具 你是否遇到过这些场景: 准备训练一个语音识别模型,但手头的录音里夹杂大量空白、咳嗽、翻页声,手动剪辑3小时才处理完10分钟音频;客服对话录音长达2小时,想提取其…

作者头像 李华
网站建设 2026/4/29 9:52:55

I2S双工通信结构解析:完整指南收发同步实现方式

以下是对您提供的博文《I2S双工通信结构解析:完整指南收发同步实现方式》的 深度润色与专业重构版本 。本次优化严格遵循您的全部要求: ✅ 彻底去除AI痕迹,语言自然、老练、有工程师现场感 ✅ 摒弃“引言/概述/总结”等模板化结构,全文以 问题驱动+逻辑递进+实战穿插 …

作者头像 李华
网站建设 2026/4/22 3:47:42

Z-Image-Turbo显存不足怎么办?优化建议来了

Z-Image-Turbo显存不足怎么办?优化建议来了 1. 问题很真实:为什么16GB显存还会爆? 你不是一个人在战斗。很多用户第一次启动Z-Image-Turbo时,看到日志里跳出CUDA out of memory或者WebUI卡在“生成中”不动,心里一紧…

作者头像 李华
网站建设 2026/4/30 17:42:14

Windows驱动管理空间优化大师:释放系统潜能的实用工具

Windows驱动管理空间优化大师:释放系统潜能的实用工具 【免费下载链接】DriverStoreExplorer Driver Store Explorer [RAPR] 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 您是否遇到过系统盘空间莫名减少?连接新设备时频繁…

作者头像 李华