当前位置：首页 > news >正文

《深度学习》—— ResNet 残差神经网络

news 2026/5/17 3:26:17

文章目录

一、什么是ResNet？
二、残差结构（Residual Structure）
三、Batch Normalization（BN----批归一化）

一、什么是ResNet？

ResNet 网络是在 2015年由微软实验室中的何凯明等几位大神提出，斩获当年ImageNet竞赛中分类任务第一名，目标检测第一名。获得COCO数据集中目标检测第一名，图像分割第一名。
ResNet 网络中的两个核心组成部分
- 残差结构（Residual Structure）
- Batch Normalization（批归一化）
为什么要提出残差结构？
- 在ResNet 网络没有提出来之前，所有的神经网络都是通过卷积层和池化层的叠加组成的。
- 很多人认为卷积层和池化层的层数越多，模型的效果会越好
- 在实际的试验中发现，随着卷积层和池化层的叠加，学习效果不会逐渐变好，反而出现2个问题：
  
  1.梯度消失和梯度爆炸
  梯度消失：若每一层的误差梯度小于1，反向传播时，网络越深，梯度越趋近于0
  梯度爆炸：若每一层的误差梯度大于1，反向传播时，网络越深，梯度越来越大
  
  2.退化问题
  随着层数的增加，预测效果反而越来越差, 下面是何凯明他们论文中实验的可视化图，可以看出模型层数多的反而没有少的效果好
为了解决梯度消失或梯度爆炸问题，论文提出通过数据的预处理以及在网络中使用 BN（Batch Normalization）层来解决。
为了解决深层网络中的退化问题，可以人为地让神经网络某些层跳过下一层神经元的连接，隔层相连，弱化每层之间的强联系。这种神经网络被称为 残差网络（ResNets）
ResNet论文提出了 residual结构（残差结构）来减轻退化问题，下图是使用residual结构的卷积网络，可以看到随着网络的不断加深，效果并没有变差，而是变的更好了
ResNet 网络有不同数量的网络层模型，下图为 ResNet18、ResNet34、ResNet50、ResNet101、ResNet152 网络的表格化结构图：

二、残差结构（Residual Structure）

如下图所示，残差块包含两条路径，一条是主路径（通常包含多个卷积层），用于提取特征；另一条是恒等快捷连接，允许输入直接跳过主路径的某些层与输出相加
所谓相加是特征矩阵相同位置上的数字进行相加
两条路径的输出在特征维度上需要保持一致，以便进行相加操作。这通常通过调整卷积层的步长（stride）、使用1x1卷积核进行升维或降维等方式来实现。
以ResNet 18网络为例：
- 下面是 ResNet 18网络完整的图形化结构图
部分残差块如下：
非残差结构-第一层时(左边结构)：
经过卷操作得到输出为[56,56,64]:
- 通过设置步长stride=1、3x3卷积和卷积核64，使得高宽与卷积核不变
- 激活函数relu处理
- 通过设置步长stride=1、3x3卷积和卷积核64，重复特征提取
残差结构-第二层(右边结构)：
由上一层的输入为[56,56,64]——>输出为[28,28,128]：
- 通过设置步长stride=2、3x3卷积和卷积核128，使得高宽从56缩减一半到28，卷积核从64个更改为128个
- 激活函数relu处理
- 通过设置步长stride=1、3x3卷积和卷积核128，重复特征提取
快捷连接的输入为[56,56,64]——>[1x1x128]——>输出为[28,28,128]:
- 通过设置步长stride=2、1x1卷积和卷积核更改，使得高宽从56缩减一半到28，卷积核从64个更改为128个。
- 与经过卷积层处理后的输出值相加

三、Batch Normalization（BN----批归一化）

参考博客

所谓Feature Map（特征图）是卷积核卷出来的,你用各种情况下的卷积核去乘以原图，会得到各种各样的feature map。
在输入一张图片时往往会使用预处理来使得图片满足某一个分布规律，以加快特征提取。然后进行一次卷积得到一个feature map，而这个feature map就不一定还满足之前所要求的分布规律。
Batch Normalization是指批标准化处理，将一批数据的feature map满足均值为0，方差为1的分布规律。注意不是对某一张图片的feature map，而是一整批的feature map，因为BN需要计算整个batch的均值和方差。
如下图
原理
- 标准化处理：在训练过程中，对每个小批量数据进行标准化处理，即对每个特征维度进行归一化操作。这有助于缓解内部协变量偏移（Internal Covariate Shift）问题，即网络在训练过程中由于参数更新导致的数据分布变化问题。
- 可学习参数：为了恢复出原始网络所要学习的特征分布，BN引入了可学习的缩放因子（γ）和偏移因子（β），使得网络可以通过学习这些参数来调整标准化后的数据分布。
- 训练与测试：在训练阶段，BN使用当前小批量数据的均值和方差进行标准化处理；在测试阶段，则使用训练过程中所有小批量数据的均值和方差的移动平均进行标准化处理。
使用注意
- （1）训练时要将traning参数设置为True进行统计，在验证时将trainning参数设置为False，对统计的值进行验证。在pytorch中可通过创建模型的model.train()和model.eval()方法控制。
- （2）batch_size （每次迭代中，模型同时处理多少个数据点）尽可能设置大点，设置小后表现可能很糟糕，设置的越大求的均值和方差越接近整个训练集的均值和方差。
- （3）建议将BN层放在卷积层（Conv）和激活层（例如Relu）之间

《深度学习》—— ResNet 残差神经网络

文章目录一、什么是ResNet？二、残差结构（Residual Structure）三、Batch Normalization（BN----批归一化） 一、什么是ResNet？ ResNet 网络是在 2015年由微软实验室中的何凯明等几位大神提出，斩获…...

编程日记 2024/9/27 3:55:30

针对考研的C语言学习（定制化快速掌握重点3）

1.数组常见错误数组传参实际传递的是数组的起始地址，若在函数中改变数组内容，数组本身也会发生变化 #include<stdio.h> void change_ch(char* str) {str[0] H; } int main() {char ch[] "hello";change_ch(ch);printf("%s\n&q…...

编程日记 2024/9/27 3:53:28

pikachu XXE(XML外部实体注入)通关

靶场：pikachu 环境: 系统：Windows10 服务器：PHPstudy2018 靶场：pikachu 关卡提示说：这是一个接收xml数据的api 常用的Payload 回显 <?xml version"1.0"?> <!DOCTYPE foo [ <!ENTITY …...

编程日记 2024/9/27 3:50:23

shell脚本定时任务通知到钉钉

shell脚本定时任务通知到钉钉 1、背景前两天看了一下定时任务，垃圾清理、日志相关、系统巡检这些，有的服务器运行就有问题，或者不运行，正好最近在做运维标准重制运维手册，顺便把自动化这块优化一下，所…...

编程日记 2024/9/27 3:49:22

2.4K star的GOT-OCR2.0：端到端OCR 模型

GOT-OCR2.0是一款新一代的光学字符识别（OCR）技术，标志着人工智能在文本识别领域的重大进步。作为一款开源模型，GOT-OCR2.0不仅支持传统的文本和文档识别，还能够处理乐谱、图表以及复杂的数学公式，为用户提供…...

编程日记 2024/9/27 3:48:21

【JavaEE】——线程的安全问题和解决方式

阿华代码，不是逆风，就是我疯，你们的点赞收藏是我前进最大的动力！！希望本文内容能够帮助到你！ 目录一：问题引入二：问题深入 1：举例说明 2：图解双线程计算…...

编程日记 2024/9/27 3:47:20

初步认识了解分布式系统

背景认识：我们要学习redis，还是得了解一下什么是分布式。为什么呢？因为redis只有在分布式系统中才能发挥它最大的作用，也就是领域展开，所以接下来我们就简单过一下什么是分布式系统一些术语认识： &#x…...

编程日记 2024/9/27 3:40:13

react 为什么不能学习 vue3 进行静态节点标记优化性能？

因为 React 使用的是 JSX，而 JSX 本质上就是 JS 语言，是具有非常高的动态的，而 Vue 使用的 template 则是给了足够的约束，比如说 Vue 的 template 里面使用了很多特定的标记来做不同的事情，比如说 v-if 就是进行变量判…...

编程日记 2024/9/27 3:39:12

Elasticsearch黑窗口启动乱码问题解决方案

问题描述 elasticsearch启动后有乱码现象解决方案： 提示：这里填写该问题的具体解决方案： 到 \config 文件下找到 jvm.options 文件打开后在文件末尾空白处添加 -Dfile.encodingGBK 保存后重启即可。...

编程日记 2024/9/27 3:38:11

Logtus IT员工参加国际技术大会

Logtus IT的员工参加了国际技术大会，该大会致力于在金砖国家框架内开发俄罗斯的技术。该活动包括一个展览，俄罗斯开发商展示了他们的信息技术、电子和电信成就。展示了面向国内和国际市场（包括政府机构）的解决方案、产品和平台。 …...

编程日记 2024/9/27 3:36:09

ant design vue组件中table组件设置分组头部和固定总结栏

问题：遇到了个需求，不仅要设置分组的头部，还要在顶部有个统计总和的栏。分组表头的配置主要是这个，就是套娃原理，不需要展示数据的直接写个title就行，需要展示数据的字段才需要详细的配置属性。 const co…...

编程日记 2024/9/27 3:34:05

2024年信息安全企业CRM选型与应用研究报告

数字化的生活给人们带来便利的同时也带来一定的信息安全隐患，如网络侵权、泄露用户隐私、黑客攻击等。在互联网高度发展的今天，信息安全与我们每个人、每个组织甚至每个国家都息息相关。信息安全行业蓬勃发展。根据智研咨询数据，2021年&…...

编程日记 2024/9/27 3:33:03

【后端开发】JavaEE初阶——计算机是如何工作的？？？

前言： 🌟🌟本期讲解计算机工作原理，希望能帮到屏幕前的你。 🌈上期博客在这里：【MySQL】MySQL中JDBC编程——MySQL驱动包安装——（超详解） 🌈感兴趣的小伙伴看一看小编主…...

编程日记 2024/9/27 3:32:02

Linux（Ubuntu）源码安装postgresql16.3

文章目录 Linux（Ubuntu）源码安装postgresql016.3下载程序包编译安装软件初次执行configure错误调试1:configure: error: ICU library not found再次执行configureBuild 设置环境初始化数据库启动数据库参考 Linux（Ubuntu）源码安装…...

编程日记 2024/9/27 3:28:59

Python 入门教程（7）面向对象 | 7.6、多态

文章目录一、多态1、鸭子类型2、实现多态的机制2.1、鸭子类型2.2、继承与重写 3、Python多态的优势4、总结前言： 在面向对象编程（OOP）中，多态（Polymorphism）是一种非常重要的概念，多态就是同一…...

编程日记 2024/9/27 3:27:58

Cilium + ebpf 系列文章-什么是ebpf?（一）

前言： 这篇非常非常干，很有可能读不懂。这里非常非常推荐，建议使用Cilium官网的lab来辅助学习！！！Resources Library - IsovalentExplore Isovalents Resource Library, your one-stop destination for ins…...

编程日记 2024/9/27 3:26:57

RabbitMQ08_保证消息可靠性

保证消息可靠性一、生产者可靠性1、生产者重连机制（防止网络波动）2、生产者确认机制Publisher Return 确认机制Publisher Confirm 确认机制二、MQ 可靠性1、数据持久化交换机、队列持久化消息持久化 2、Lazy Queue 惰性队列三、消费者可靠性1、消费者…...

编程日记 2024/9/27 3:25:55

恶意Bot流量识别分析实践

1、摘要随着互联网的发展，自动化工具和脚本（Bots）的使用越来越普遍。虽然一些善意 Bots 对于网站的正常运行和数据采集至关重要，但恶意 Bots 可能会对网站带来负面影响，如爬取敏感信息、恶意注册、刷流量等。因此&am…...

编程日记 2024/9/27 3:24:54

Java2 实用教程（第6版）习题2 第四题

【源文件的命名与书中的不同】四、阅读程序题 1、上机运行下列程序，注意观察输出的结果。 public class E2_1 {public static void main(String args[]){for(int i20302;i<20322;i){System.out.println((char) i);}} } 运行结果： 低住佐佑佒…...

编程日记 2024/9/27 3:22:52

HashMap和ConcurrentHashMap的区别

1.是什么 HashMap和ConcurrentHashMap都是Java集合框架中的成员，它们用于存储键值对，但它们在并发场景下的表现和行为有很大的不同。以下是它们之间的一些主要区别： 1. 并发安全性 HashMap: HashMap不是线程安全的。如果多个线程同时访问Has…...

编程日记 2024/9/27 3:21:51

基于CircuitPython的Fruit Jam OS：在RP2350上构建复古微型计算机系统

1. 项目概述：当复古计算精神遇见现代微控制器如果你和我一样，对早期个人计算机那种开机即用、一切尽在掌控的纯粹体验抱有怀念，同时又痴迷于现代开源硬件带来的无限可能，那么Fruit Jam OS绝对是一个会让你眼前一亮的项目。它不是一…...

编程新知 2026/5/17 2:27:59

ncmdump终极指南：如何快速免费解锁网易云音乐NCM格式

ncmdump终极指南：如何快速免费解锁网易云音乐NCM格式【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的加密文件无法在其他设备播放而烦恼吗？ncmdump正是你需要的解决方案！这…...

编程新知 2026/5/17 2:27:59

ElevenLabs菲律宾语语音突然变卡顿？紧急排查清单：DNS劫持、Token过期、区域节点错配（含curl诊断脚本）

更多请点击： https://intelliparadigm.com 第一章：ElevenLabs菲律宾语语音突然变卡顿？紧急排查清单：DNS劫持、Token过期、区域节点错配（含curl诊断脚本） 当ElevenLabs API在调用菲律宾语（fil-P…...

编程新知 2026/5/17 1:24:25

Go语言设计模式：创建型模式

Go语言设计模式：创建型模式一、设计模式概述设计模式是软件设计中反复出现问题的解决方案。Go语言作为一种现代化的编程语言，同样可以应用经典的设计模式。 Go语言中的设计模式特点接口优先：通过接口实现解耦组合优于继承：Go不…...

编程新知 2026/5/16 23:32:58

告别手写代码：用达芬奇Configurator+DBC文件，5分钟搞定AUTOSAR CAN控制器配置

达芬奇ConfiguratorDBC文件：5分钟完成AUTOSAR CAN控制器高效配置指南在汽车电子开发领域，AUTOSAR架构的普及使得嵌入式软件开发流程日益标准化，但随之而来的配置复杂度也让许多工程师头疼。特别是在CAN通信配置环节，传统的手动逐…...

编程新知 2026/5/16 23:18:02

2026届最火的降AI率神器解析与推荐

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能生成内容逐渐普及起来，信息质量以及真实性面临到严峻挑战。各类平台加之…...

编程新知 2026/5/16 22:24:29

SyncedStore深度解析：揭秘CRDT技术如何实现无冲突数据同步

SyncedStore深度解析：揭秘CRDT技术如何实现无冲突数据同步【免费下载链接】SyncedStore SyncedStore CRDT is an easy-to-use library for building live, collaborative applications that sync automatically. 项目地址: https://gitcode.com/gh_mirrors/sy/Sy…...

编程新知 2026/5/16 21:43:21