news 2026/5/7 19:07:41

什么是ResNet

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
什么是ResNet

什么是ResNet

ResNet(Residual Network,残差网络)是2015年由何凯明等人提出的深层卷积神经网络(CNN)架构,因解决了“深层网络训练难题”而成为计算机视觉领域的里程碑模型。它在ImageNet图像分类竞赛中以显著优势夺冠,并深刻影响了后续几乎所有深度学习视觉任务的模型设计。

核心问题:深层网络的“退化现象”

在ResNet提出前,研究者发现一个矛盾:当网络深度增加到一定程度后,模型性能会先提升、后下降(即使没有过拟合)。这种“深度增加但精度下降”的现象被称为“退化(Degradation)”,其本质是深层网络在反向传播时,梯度经过多层传递后会逐渐消失或爆炸,导致底层参数难以更新,模型无法有效学习。(但深度增加后,梯度∂Loss​∂x\frac{∂Loss​}{∂x}xLoss经多层传递后趋近于 0。)

ResNet的核心创新:残差块与跳跃连接

为解决退化问题,ResNet引入了残差块(Residual Block)结构,其核心是“跳跃连接(Skip Connection)”——让输入直接跳过部分网络层,与该部分的输出相加,形成“残差学习”机制。

1. 残差块的结构

一个基础残差块包含:

  • 若干卷积层(通常是2-3层),负责学习“残差函数”F(x)F(x)F(x)
  • 一条跳跃连接(通常是直接映射,即恒等映射),将输入xxx直接传递到块的输出端;
  • 输出为“残差函数 + 输入”:H(x)=F(x)+xH(x) = F(x) + xH(x)=F(x)+x

简单来说,传统网络要求卷积层直接学习目标映射H(x)H(x)H(x),而ResNet让卷积层学习“目标映射与输入的差值”(即残差F(x)=H(x)−xF(x) = H(x) - xF(x)=H(x)x),再通过跳跃连接将输入“加回来”。

2. 跳跃连接的作用
  • 缓解梯度消失:反向传播时,梯度可以通过跳跃连接直接传递到浅层(无需经过所有卷积层),避免梯度在深层传递中衰减至0;
  • 简化学习目标:残差F(x)F(x)F(x)通常比直接学习H(x)H(x)H(x)更容易(例如,当最优映射接近恒等映射时,F(x)F(x)F(x)只需学习接近0的小值);
  • 保留低层特征:输入xxx直接传递到深层,避免低层特征在多层变换中被“稀释”。

ResNet的典型结构

ResNet根据网络深度分为多个版本(如ResNet-18、34、50、101、152),数字代表总层数(含卷积层和全连接层)。其中:

  • 浅层ResNet(18/34层):使用“基础残差块”,由2个3×3卷积层组成;
  • 深层ResNet(50/101/152层):使用“瓶颈残差块(Bottleneck Block)”,通过1×1卷积先降维、再用3×3卷积计算、最后1×1卷积升维,在增加深度的同时减少参数和计算量。

整体结构遵循“卷积层 + 残差块堆叠 + 全局池化 + 全连接层”的范式,通过残差块的重复堆叠实现“超深”网络(最深达152层)。

ResNet的意义与影响

  1. 突破深度限制:首次实现了100层以上网络的有效训练,证明“更深的网络可以更优”;
  2. 成为基础架构:残差连接被广泛借鉴到后续模型中(如ResNeXt、DenseNet、Transformer等),成为深度学习的“标准组件”;
  3. 推动视觉任务发展:在图像分类、目标检测(如Faster R-CNN)、语义分割(如U-Net改进版)等任务中,基于ResNet的模型长期保持SOTA(State-of-the-Art)性能。

简言之,ResNet通过“残差学习”和“跳跃连接”解决了深层网络的训练难题,不仅刷新了当时的视觉任务精度,更重塑了深度学习模型的设计思路,至今仍是计算机视觉领域的基础模型之一。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 15:52:37

为什么游戏需要“加载时间“?——从硬盘读取到内存渲染

🎮 为什么游戏需要"加载时间"?——从硬盘读取到内存渲染 💾大家好,我是无限大,欢迎收看十万个为什么系列文章 希望今天的内容能对大家有所帮助想象一下:你迫不及待地打开新买的3A大作&#xff0c…

作者头像 李华
网站建设 2026/5/2 12:37:56

基于springboot的民间救援队救助系统设计与实现

背景分析近年来,自然灾害、突发公共事件频发,传统救援体系在响应速度、资源调配等方面存在局限性。民间救援队作为重要补充力量,因组织分散、信息不对称等问题,难以高效协同。SpringBoot框架的轻量化、快速开发特性,为…

作者头像 李华
网站建设 2026/5/6 3:25:32

2026年年初想转行网络安全,可以先看看过来人的建议

在当前就业形势下,不少朋友面临转行的困境。网络安全作为一个热门领域,自然也吸引了许多人的目光。本文将就转行网络安全这一话题,提供一些切实可行的建议。 网络安全行业概况 网络安全涵盖了从基础的脚本编写到高级的漏洞研究等多个层面。该…

作者头像 李华
网站建设 2026/4/30 3:44:27

光刻胶用抗氧化剂4,4-亚丁基-双(6-叔丁基间甲酚)BBM

4,4-亚丁基双(6-叔丁基间甲酚)1 化学特性与功能作用1.1 基本特性4,4’-亚丁基-双(6-叔丁基间甲酚)(简称BBM)是一种高效酚类抗氧化剂,其化学名称为4,4-Butylidenebis(6-tert-butyl-m-cresol),分子式为C₂₆H…

作者头像 李华
网站建设 2026/5/2 0:32:59

高效协作:工程团队与LLM共建可维护代码的标准化流程

在与LLM进行大量协作编程之后,我将坚持一种中等层次的工作流程,在完全自主编写代码和纯粹氛围式编程之间位于第38百分位。以下方法帮助我为长期项目产生高质量代码: • 学习新工具和架构:如果你计划长期使用这些工具,在…

作者头像 李华
网站建设 2026/5/1 23:56:09

必看收藏!有手就行!50分钟教会你用LoRA微调打造专业会议语音助手

文章详细介绍了使用LoRA微调技术对Qwen2.5-0.5B-Instruct模型进行微调,使其成为会议语音助手的完整流程。从环境配置、模型下载、数据准备到代码实现和测试验证,展示了即使在普通笔记本上也能完成微调训练。微调可增强模型特定领域的能力,减少…

作者头像 李华