news 2026/4/15 7:25:25

AI大模型-深度学习-卷积神经网络-残差网络

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI大模型-深度学习-卷积神经网络-残差网络

目的

为避免一学就会、一用就废,这里做下笔记

说明

本文内容紧承前文-卷积神经网络CNN,欲渐进,请循序

一、是什么?—— 定义与核心思想

残差网络(ResNet)是一种通过引入“快捷连接”来构建极深卷积神经网络的架构。其核心思想是“残差学习”。

残差二字的由来:

  • 在数学和统计学中,残差指的是观测值预测值之间的差值。
  • 在ResNet中,理想的"观测值"设为H(x)
  • 基准预测值设为B(x)=x(即输入和输出相同,什么也不改变)
  • 残差F(x)=H(x)-B(x)=H(x)-x
  • 传统网络:让多层网络直接学习一个目标映射H(x)
  • 残差网络:让多层网络学习一个残差映射F(x) = H(x) - x,而最终的输出仍是H(x)=F(x) + x。这里的x就是通过快捷连接直接传递过来的输入。

简单比喻

  • 传统学习像是让你从零开始画一只猫。
  • 残差学习则是:我先给你一张猫的草图x,你只需要在上面修改(添加或删减几笔)F(x),就能得到更完美的猫H(x)。如果你的修改是零,那至少还有一张不错的草图保底。

关键技术恒等快捷连接。它允许输入信号x跨层直接传递,与经过卷积层变换后的输出F(x)进行逐元素相加

二、为什么?—— 解决的问题与动机

提出残差网络,是为了解决传统深度CNN在扩展时遇到的两个根本性难题:

  1. 梯度消失/爆炸:网络层数过深时,误差梯度在反向传播中会不断连乘,导致传到浅层时变得极其微小(消失)或巨大(爆炸),使得浅层参数无法有效更新。

  2. 网络退化:这是ResNet论文中更关键的一个发现。即使使用标准化等技术缓解了梯度问题,当网络深度增加时,训练集和测试集的准确率反而会下降。这并非过拟合(因为训练误差也升高),而是表明极深的普通网络难以被优化,它连在训练集上找到一个好的解都做不到。

根本原因:在深度网络中,让多个非线性层直接拟合一个复杂的恒等映射(即输入=输出)是非常困难的。而很多深层网络的有效部分,恰恰接近于一个恒等映射。

残差网络的解决方案:通过快捷连接,将“拟合恒等映射”这个困难任务,转变为“将残差推向0”的简单任务。如果恒等映射是最优的,那么将残差权重推为零即可;如果需要非恒等映射,也只需在恒等映射的基础上进行小幅调整。这极大地降低了优化难度

三、怎么办?—— 实现方式与关键结构

残差网络通过构建残差块来实现其思想,下图是一个基础的残差块结构:

上图展示了一个包含两个卷积层的基本残差块的完整数据流。输入x可以“抄近路”直接跳到相加环节,这保证了即使在最坏情况下(所有卷积层权重无效),网络至少能保留输入信息,而不会被“损坏”。这使得信号可以跨越多个层直接传播,显著缓解了梯度消失问题。

在实际构建深层网络(如ResNet-34, ResNet-50)时,会采用两种关键设计:

  1. 瓶颈结构:在更深的残差块中,使用1x1卷积先降维再升维,大幅减少计算量。
  2. 下采样调整:当需要缩小特征图尺寸(步长为2)或增加通道数时,快捷连接也需要进行相应调整(通常通过一个1x1卷积,步长为2来完成),以确保F(x)x的尺寸匹配,可以相加。

总结

  • 是什么:一种通过“快捷连接”实现残差学习的深度CNN。
  • 为什么:为了解决极深网络中的梯度消失网络退化问题,降低优化难度。
  • 怎么办:构建“恒等快捷连接 + 逐元素相加”残差块作为基本单元,堆叠成深度网络,并在需要时用1x1卷积进行维度匹配。

正是这个简洁而深刻的设计,使训练数百甚至上千层的网络成为可能,深刻影响了深度学习的发展。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 16:28:54

HsMod开源工具:炉石传说功能增强插件全解析与部署指南

HsMod开源工具:炉石传说功能增强插件全解析与部署指南 【免费下载链接】HsMod Hearthstone Modify Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod 在炉石传说的日常游戏中,玩家常常面临诸多体验痛点:冗长…

作者头像 李华
网站建设 2026/4/12 4:59:27

AI驱动3D创作:让创意设计更高效的开源工作流解决方案

AI驱动3D创作:让创意设计更高效的开源工作流解决方案 【免费下载链接】ComfyUI-Workflows-ZHO 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-Workflows-ZHO 在数字创意领域,3D建模长期面临技术门槛高、流程复杂的挑战。传统工作流…

作者头像 李华
网站建设 2026/4/11 0:13:47

跨平台磁盘清理工具Czkawka:释放存储空间的高效解决方案

跨平台磁盘清理工具Czkawka:释放存储空间的高效解决方案 【免费下载链接】czkawka 一款跨平台的重复文件查找工具,可用于清理硬盘中的重复文件、相似图片、零字节文件等。它以高效、易用为特点,帮助用户释放存储空间。 项目地址: https://g…

作者头像 李华
网站建设 2026/4/13 4:34:10

Qwen3-Embedding-4B成本控制:自动伸缩部署实战

Qwen3-Embedding-4B成本控制:自动伸缩部署实战 1. Qwen3-Embedding-4B:轻量高效、多语言就绪的嵌入新选择 Qwen3-Embedding-4B不是一款“大而全”的通用大模型,而是一把专为向量化任务打磨的精准工具——它不生成文字,不回答问题…

作者头像 李华
网站建设 2026/4/14 9:33:38

老设备复活:5个专业技巧实现旧Mac系统升级

老设备复活:5个专业技巧实现旧Mac系统升级 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 旧设备系统更新往往受限于硬件驱动支持,而OpenCore Lega…

作者头像 李华
网站建设 2026/4/12 8:47:02

告别鼠标水土不服?Mac Mouse Fix如何让第三方鼠标在macOS焕发新生

告别鼠标水土不服?Mac Mouse Fix如何让第三方鼠标在macOS焕发新生 【免费下载链接】mac-mouse-fix Mac Mouse Fix - A simple way to make your mouse better. 项目地址: https://gitcode.com/GitHub_Trending/ma/mac-mouse-fix 当设计师小林将刚买的专业绘图…

作者头像 李华