news 2026/2/1 2:28:22

即插即用系列 | ICCV 2025 LEGNet:基于边缘-高斯聚合的轻量级遥感检测网络

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
即插即用系列 | ICCV 2025 LEGNet:基于边缘-高斯聚合的轻量级遥感检测网络

论文名称:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection

论文原文 (Paper):https://arxiv.org/abs/2503.14012
代码 (code):https://github.com/AeroVILab-AHU/LEGNet


GitHub 仓库链接(包含论文解读及即插即用代码):https://github.com/AITricks/AITricks
哔哩哔哩视频讲解:https://space.bilibili.com/57394501?spm_id_from=333.337.0.0

目录

  • [CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络
      • 1. 核心思想(3–5句话)
      • 2. 背景与动机
        • 2.1 背景与痛点
        • 2.2 动机图解分析
      • 3. 主要创新点
      • 4. 方法细节(核心干货)
        • 4.1 整体网络架构
        • 4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)
        • 4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)
        • 理念与机制总结
      • 5. 即插即用模块的作用
      • 6. 实验简单分析
      • 7. 获取即插即用代码关注 【AI即插即用】

[CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络

论文标题:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection


1. 核心思想(3–5句话)

本文针对遥感图像中常见的低质量问题(如低分辨率、运动模糊、阴影遮挡等),提出了一种轻量级骨干网络LEGNet。其核心创新在于设计了Edge-Gaussian Aggregation (EGA)模块,巧妙地结合了传统图像处理的先验知识:在浅层网络利用Scharr 算子锐化边缘以对抗模糊,在深层网络利用高斯先验 (Gaussian Prior)抑制噪声并增强特征显著性。这种“显式算子引导 + 隐式特征学习”的策略,使得模型在极低的参数量下,能够从退化图像中稳健地提取判别性特征。


2. 背景与动机

2.1 背景与痛点

遥感目标检测(RSOD)面临的最大挑战不仅仅是尺度变化,更在于成像质量的退化。传感器噪声、大气干扰、运动模糊以及光照不足(如阴影区域)会导致:

  1. 对比度降低:前景与背景难以分离。
  2. 结构断裂:关键的边缘信息丢失。
  3. 特征响应模糊:深度特征难以聚焦目标中心。
    现有的方法(如 LSKNet, PKINet)虽然在多尺度方面做得很好,但往往忽略了针对“低质量特征”的显式增强,且轻量化模型通常难以保留微弱的细节。
2.2 动机图解分析

看图说话:

  • 对比现状:请观察图中的红色虚线框区域。在面对树木遮挡(第一行)和建筑物阴影/低光照(第二行)等极端情况时,强大的基线模型如 ResNet-50、ARC-R50 甚至专门设计的 PKINet-S 都出现了严重的漏检 (Missing)。这说明现有网络在特征模糊或信噪比低时,特征提取能力失效。
  • 本文优势:最右侧的LEGNet-S在同样恶劣的条件下,成功检测出了被遮挡的车辆和阴影中的目标。
  • 核心引出:这直接证明了单纯堆叠卷积层是不够的,我们需要引入一种机制,能够主动地去“锐化”边缘、“提亮”特征,这就是本文提出 EGA 模块的直接动机。

3. 主要创新点

  1. EGA (Edge-Gaussian Aggregation) 模块:创新性地将传统图像处理算子引入深度网络。浅层使用方向感知的 Scharr 滤波器提取边缘,深层使用高斯核进行特征建模,有效对抗图像退化。
  2. LoG-Stem 层:在网络入口处设计了基于“高斯-拉普拉斯算子 (LoG)”的 Stem 层,替代传统的卷积 Stem,在初始阶段就实现了噪声抑制与边缘增强的双重功效。
  3. LEGNet 轻量级架构:构建了一个高效的四阶段骨干网络,在参数量显著低于 ResNet-50(仅约 1/3甚至更少)的情况下,在 DOTA、VisDrone 等数据集上取得了 SOTA 性能。
  4. 分层处理策略:提出了“浅层重边缘,深层重语义(高斯)”的宏观设计理念,避免了在深层强行提取边缘导致的特征冗余和干扰。

4. 方法细节(核心干货)

4.1 整体网络架构

数据流解析:

  • Input:输入图像I II
  • LoG-Stem:图像首先经过 LoG-Stem 层。这里利用 LoG 滤波器(高斯平滑+拉普拉斯边缘检测)进行下采样,输出1 / 4 1/41/4分辨率的特征图,能够有效过滤高频噪声并保留边缘。
  • 4-Stage Pyramidal Structure
    • Stage 1:处理1 / 4 1/41/4分辨率特征。包含N 1 N_1N1LEG Block关键点:此阶段侧重于边缘提取。
    • Stage 2-4:分别处理1 / 8 , 1 / 16 , 1 / 32 1/8, 1/16, 1/321/8,1/16,1/32分辨率特征。通过DRFD 模块进行下采样,随后堆叠LEG Block关键点:这些阶段侧重于高斯特征建模。
  • Output:输出多尺度特征金字塔,送入检测头(如 Oriented R-CNN)。

4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)

模块拆解:
这是 LEGNet 的基本构建单元,设计非常精简:

  1. 输入:特征F i n F_{in}Fin
  2. EGA 处理:输入首先通过EGA 模块(核心中的核心,见下文),得到增强后的特征F e g a F_{ega}Fega
  3. ECA 注意力:为了突出关键通道,F e g a F_{ega}Fega经过 GAP(全局平均池化)和 1D 卷积(ECA 策略),生成通道权重。
  4. 特征重加权:将通道权重作用于F e g a F_{ega}Fega,并与原始输入F i n F_{in}Fin进行残差连接和归一化,得到输出。
    设计目的:在极低的计算成本下,通过 EGA 注入先验知识,并通过 ECA 筛选关键通道信息。

4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)

设计拆解与工作机制:
这是本文的灵魂所在,它包含一个条件分支选择机制

  • 分支 1:Edge Extraction (用于 Stage 1)

    • 操作:使用固定的Scharr 算子(比 Sobel 旋转不变性更好)分别计算 X 和 Y 方向的梯度,然后合成边缘图A e d g e A_{edge}Aedge
    • 目的:在浅层,特征分辨率高,显式的边缘信息能帮助网络在模糊图像中“看清”物体轮廓。
  • 分支 2:Gaussian Modeling (用于 Stage 2-4)

    • 操作:使用固定的高斯卷积核对特征图进行平滑处理,得到A g a u s s A_{gauss}Agauss
    • 目的:在深层,分辨率降低,边缘不再清晰,特征呈现“斑点状”分布。高斯核能抑制背景噪声,强化目标中心的响应(类似 Heatmap),解决特征响应微弱的问题。
  • 特征融合

    • 将提取的先验特征(边缘或高斯图)加回到输入特征上。
    • 通过一个轻量级的Conv Block进行特征变换。
    • 最后通过Sigmoid生成权重图,对原始特征进行空间加权(Element-wise Multiplication)
理念与机制总结

LEGNet 的哲学是“Prior-Guided Feature Refinement” (先验引导的特征细化)
作者认为,与其让网络从零开始学习如何对抗模糊和噪声,不如直接把“去噪”和“边缘增强”的数学算子(LoG, Scharr, Gaussian)硬编码到网络中。

  • 浅层:网络需要“眼镜”看清轮廓→ \rightarrow引入 Scharr 算子。
  • 深层:网络需要“聚光灯”找到物体核心→ \rightarrow引入高斯核。
    这种设计不仅计算量极小(算子参数固定,不需要训练),而且物理意义明确,极大地提高了模型在低质量图像上的鲁棒性。

5. 即插即用模块的作用

本论文提出的模块具有很强的通用性,适用于以下场景:

  1. LoG-Stem 层

    • 适用场景:任何对噪声敏感的视觉任务(如夜间检测、雨雾天检测)。
    • 用法:可以直接替换 ResNet、VGG 等标准骨干网络的第一层7 × 7 7\times77×7卷积,能显著提升初始特征的纯净度。
  2. EGA 模块 (Edge-Gaussian Aggregation)

    • 适用场景轻量化模型设计低质量图像增强
    • 用法:可以作为一种 Attention 机制插入到现有 CNN 的 Block 中。如果你做的是无人机航拍(运动模糊多)或卫星遥感(分辨率低),在浅层插入 Scharr 分支,在深层插入 Gaussian 分支,往往能带来涨点。

6. 实验简单分析

  • DOTA-v1.0 SOTA
    • LEGNet-S (Small版本) 达到了80.03% mAP,这是单尺度训练下首次突破 80% 大关的轻量级模型,甚至超过了 ResNet-50 和专门设计的 ARC-R50。
    • LEGNet-T (Tiny版本) 仅用3.6M的参数量就达到了78.96% mAP,性价比极高。
  • 鲁棒性验证
    • 在 VisDrone2019(无人机视角,小目标极多)上,LEGNet-S 达到了32.2% AP,在小目标 (A P s AP_sAPs) 上比基线提升了 2.1%,证明了其对微弱特征的捕捉能力。
  • 消融实验
    • 去掉 LoG-Stem 掉点,去掉 EGA 掉点更为严重。
    • 有趣的是,如果只用 Edge 分支或者只用 Gaussian 分支,效果都不如“浅层Edge+深层Gaussian”的组合好,验证了作者“分层处理”理念的正确性。

到此,所有的内容就基本讲完了。如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

7. 获取即插即用代码关注 【AI即插即用】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/24 10:48:16

54、深入解析STREAMS机制:从流头操作到终端控制

深入解析STREAMS机制:从流头操作到终端控制 1. 流头操作:qattach()与qdetach() 当打开一个模块或驱动程序时, qattach() 函数会被调用。其主要作用是为驱动程序或模块设置一个队列对,并调用其 open 函数。 qattach() 的参数之一是一个现有的队列对,新的队列对将链…

作者头像 李华
网站建设 2026/1/25 22:59:57

12、C++ 数据序列化与文件处理实战

C++ 数据序列化与文件处理实战 在 C++ 编程中,数据序列化和文件处理是非常重要的部分。本文将详细介绍如何使用不同的库进行 XML、JSON 数据的序列化和反序列化,以及如何创建包含图像的 PDF 文件和处理 ZIP 归档文件。 1. XML 数据的序列化和反序列化 在 C++ 标准库中,没…

作者头像 李华
网站建设 2026/1/30 10:45:33

三相四桥臂逆变器接不平衡与非线性负载时的调制与控制算法的MATLAB/Simulink仿真模型...

三相四桥臂逆变器MATLAB/Simulink仿真模型,接不平衡负载时的调制算法。 接非线性负载时的多PR控制器并联算法。 提供仿真模型、设计报告及参考文献三相四桥臂逆变器这玩意儿在新能源和微电网里属于硬核装备。接上吹风机、电机这类不平衡负载时,常规的三桥…

作者头像 李华
网站建设 2026/1/29 22:48:48

14、SQLite数据库中电影数据的管理与操作

SQLite数据库中电影数据的管理与操作 1. SQLite简介 SQLite是一个用C语言编写的进程内关系型数据库管理库,它并非客户端 - 服务器数据库引擎,而是嵌入到应用程序中的。整个数据库,包括表、索引、触发器和视图,都包含在一个单一的磁盘文件中。由于访问数据库意味着访问本地…

作者头像 李华
网站建设 2026/1/29 9:05:21

Windows系统文件Windows.Services.TargetedContent.dll缺少损坏问题 下载修复

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/1/30 3:16:35

设备预测性维护技术拆解与落地实战

在工业智能化落地进程中,设备预测性维护技术已成为开发者构建智能运维体系的核心抓手。但实际开发中,多数团队面临“协议适配难、算法落地繁、系统对接贵”的痛点——某自动化团队为适配10种品牌设备,花费3个月开发协议解析模块;某…

作者头像 李华