论文名称:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection
论文原文 (Paper):https://arxiv.org/abs/2503.14012
代码 (code):https://github.com/AeroVILab-AHU/LEGNet
GitHub 仓库链接(包含论文解读及即插即用代码):https://github.com/AITricks/AITricks
哔哩哔哩视频讲解:https://space.bilibili.com/57394501?spm_id_from=333.337.0.0
目录
- [CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络
- 1. 核心思想(3–5句话)
- 2. 背景与动机
- 2.1 背景与痛点
- 2.2 动机图解分析
- 3. 主要创新点
- 4. 方法细节(核心干货)
- 4.1 整体网络架构
- 4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)
- 4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)
- 理念与机制总结
- 5. 即插即用模块的作用
- 6. 实验简单分析
- 7. 获取即插即用代码关注 【AI即插即用】
[CVPR/arXiv 2025] LEGNet 论文精读:传统算子“复活”!边缘与高斯驱动的轻量级遥感目标检测网络
论文标题:LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection
1. 核心思想(3–5句话)
本文针对遥感图像中常见的低质量问题(如低分辨率、运动模糊、阴影遮挡等),提出了一种轻量级骨干网络LEGNet。其核心创新在于设计了Edge-Gaussian Aggregation (EGA)模块,巧妙地结合了传统图像处理的先验知识:在浅层网络利用Scharr 算子锐化边缘以对抗模糊,在深层网络利用高斯先验 (Gaussian Prior)抑制噪声并增强特征显著性。这种“显式算子引导 + 隐式特征学习”的策略,使得模型在极低的参数量下,能够从退化图像中稳健地提取判别性特征。
2. 背景与动机
2.1 背景与痛点
遥感目标检测(RSOD)面临的最大挑战不仅仅是尺度变化,更在于成像质量的退化。传感器噪声、大气干扰、运动模糊以及光照不足(如阴影区域)会导致:
- 对比度降低:前景与背景难以分离。
- 结构断裂:关键的边缘信息丢失。
- 特征响应模糊:深度特征难以聚焦目标中心。
现有的方法(如 LSKNet, PKINet)虽然在多尺度方面做得很好,但往往忽略了针对“低质量特征”的显式增强,且轻量化模型通常难以保留微弱的细节。
2.2 动机图解分析
看图说话:
- 对比现状:请观察图中的红色虚线框区域。在面对树木遮挡(第一行)和建筑物阴影/低光照(第二行)等极端情况时,强大的基线模型如 ResNet-50、ARC-R50 甚至专门设计的 PKINet-S 都出现了严重的漏检 (Missing)。这说明现有网络在特征模糊或信噪比低时,特征提取能力失效。
- 本文优势:最右侧的LEGNet-S在同样恶劣的条件下,成功检测出了被遮挡的车辆和阴影中的目标。
- 核心引出:这直接证明了单纯堆叠卷积层是不够的,我们需要引入一种机制,能够主动地去“锐化”边缘、“提亮”特征,这就是本文提出 EGA 模块的直接动机。
3. 主要创新点
- EGA (Edge-Gaussian Aggregation) 模块:创新性地将传统图像处理算子引入深度网络。浅层使用方向感知的 Scharr 滤波器提取边缘,深层使用高斯核进行特征建模,有效对抗图像退化。
- LoG-Stem 层:在网络入口处设计了基于“高斯-拉普拉斯算子 (LoG)”的 Stem 层,替代传统的卷积 Stem,在初始阶段就实现了噪声抑制与边缘增强的双重功效。
- LEGNet 轻量级架构:构建了一个高效的四阶段骨干网络,在参数量显著低于 ResNet-50(仅约 1/3甚至更少)的情况下,在 DOTA、VisDrone 等数据集上取得了 SOTA 性能。
- 分层处理策略:提出了“浅层重边缘,深层重语义(高斯)”的宏观设计理念,避免了在深层强行提取边缘导致的特征冗余和干扰。
4. 方法细节(核心干货)
4.1 整体网络架构
数据流解析:
- Input:输入图像I II。
- LoG-Stem:图像首先经过 LoG-Stem 层。这里利用 LoG 滤波器(高斯平滑+拉普拉斯边缘检测)进行下采样,输出1 / 4 1/41/4分辨率的特征图,能够有效过滤高频噪声并保留边缘。
- 4-Stage Pyramidal Structure:
- Stage 1:处理1 / 4 1/41/4分辨率特征。包含N 1 N_1N1个LEG Block。关键点:此阶段侧重于边缘提取。
- Stage 2-4:分别处理1 / 8 , 1 / 16 , 1 / 32 1/8, 1/16, 1/321/8,1/16,1/32分辨率特征。通过DRFD 模块进行下采样,随后堆叠LEG Block。关键点:这些阶段侧重于高斯特征建模。
- Output:输出多尺度特征金字塔,送入检测头(如 Oriented R-CNN)。
4.2 核心模块 A:LEG Module (Lightweight Edge-Gaussian Module)
模块拆解:
这是 LEGNet 的基本构建单元,设计非常精简:
- 输入:特征F i n F_{in}Fin。
- EGA 处理:输入首先通过EGA 模块(核心中的核心,见下文),得到增强后的特征F e g a F_{ega}Fega。
- ECA 注意力:为了突出关键通道,F e g a F_{ega}Fega经过 GAP(全局平均池化)和 1D 卷积(ECA 策略),生成通道权重。
- 特征重加权:将通道权重作用于F e g a F_{ega}Fega,并与原始输入F i n F_{in}Fin进行残差连接和归一化,得到输出。
设计目的:在极低的计算成本下,通过 EGA 注入先验知识,并通过 ECA 筛选关键通道信息。
4.3 核心模块 B:EGA Module (Edge-Gaussian Aggregation)
设计拆解与工作机制:
这是本文的灵魂所在,它包含一个条件分支选择机制:
分支 1:Edge Extraction (用于 Stage 1)
- 操作:使用固定的Scharr 算子(比 Sobel 旋转不变性更好)分别计算 X 和 Y 方向的梯度,然后合成边缘图A e d g e A_{edge}Aedge。
- 目的:在浅层,特征分辨率高,显式的边缘信息能帮助网络在模糊图像中“看清”物体轮廓。
分支 2:Gaussian Modeling (用于 Stage 2-4)
- 操作:使用固定的高斯卷积核对特征图进行平滑处理,得到A g a u s s A_{gauss}Agauss。
- 目的:在深层,分辨率降低,边缘不再清晰,特征呈现“斑点状”分布。高斯核能抑制背景噪声,强化目标中心的响应(类似 Heatmap),解决特征响应微弱的问题。
特征融合:
- 将提取的先验特征(边缘或高斯图)加回到输入特征上。
- 通过一个轻量级的
Conv Block进行特征变换。 - 最后通过
Sigmoid生成权重图,对原始特征进行空间加权(Element-wise Multiplication)。
理念与机制总结
LEGNet 的哲学是“Prior-Guided Feature Refinement” (先验引导的特征细化)。
作者认为,与其让网络从零开始学习如何对抗模糊和噪声,不如直接把“去噪”和“边缘增强”的数学算子(LoG, Scharr, Gaussian)硬编码到网络中。
- 浅层:网络需要“眼镜”看清轮廓→ \rightarrow→引入 Scharr 算子。
- 深层:网络需要“聚光灯”找到物体核心→ \rightarrow→引入高斯核。
这种设计不仅计算量极小(算子参数固定,不需要训练),而且物理意义明确,极大地提高了模型在低质量图像上的鲁棒性。
5. 即插即用模块的作用
本论文提出的模块具有很强的通用性,适用于以下场景:
LoG-Stem 层:
- 适用场景:任何对噪声敏感的视觉任务(如夜间检测、雨雾天检测)。
- 用法:可以直接替换 ResNet、VGG 等标准骨干网络的第一层7 × 7 7\times77×7卷积,能显著提升初始特征的纯净度。
EGA 模块 (Edge-Gaussian Aggregation):
- 适用场景:轻量化模型设计或低质量图像增强。
- 用法:可以作为一种 Attention 机制插入到现有 CNN 的 Block 中。如果你做的是无人机航拍(运动模糊多)或卫星遥感(分辨率低),在浅层插入 Scharr 分支,在深层插入 Gaussian 分支,往往能带来涨点。
6. 实验简单分析
- DOTA-v1.0 SOTA:
- LEGNet-S (Small版本) 达到了80.03% mAP,这是单尺度训练下首次突破 80% 大关的轻量级模型,甚至超过了 ResNet-50 和专门设计的 ARC-R50。
- LEGNet-T (Tiny版本) 仅用3.6M的参数量就达到了78.96% mAP,性价比极高。
- 鲁棒性验证:
- 在 VisDrone2019(无人机视角,小目标极多)上,LEGNet-S 达到了32.2% AP,在小目标 (A P s AP_sAPs) 上比基线提升了 2.1%,证明了其对微弱特征的捕捉能力。
- 消融实验:
- 去掉 LoG-Stem 掉点,去掉 EGA 掉点更为严重。
- 有趣的是,如果只用 Edge 分支或者只用 Gaussian 分支,效果都不如“浅层Edge+深层Gaussian”的组合好,验证了作者“分层处理”理念的正确性。
到此,所有的内容就基本讲完了。如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。