当前位置：首页 > news >正文

深度学习最强奠基作ResNet《Deep Residual Learning for Image Recognition》论文解读(上篇)

news 2026/2/9 18:04:16

1、摘要

1.1 第一段

作者说深度神经网络是非常难以训练的，我们使用了一个残差学习框架的网络来使得训练非常深的网络比之前容易得很多。

把层作为一个残差学习函数相对于层输入的一个方法，而不是说跟之前一样的学习unreferenced functions

作者提供了非常多的实验证据证明残差网络非常容易训练，并且能够获得非常好的精度，特别是当把层增加了之后，在ImageNet数据集上使用了152层（在当时GoogleNet也很快出来了，不过不是用了152层深，而是用了很多并行的层）。152层的深度是非常厉害的。

比VGG的网络深了8倍，但是有更低的复杂度（这个是非常有趣的，网络深度是8倍，但是计算复杂度却更低）。用了这些残差网络做了一个ensemble之后得到了3.57的测试精度，这个结果让他们赢下了ImageNet 2015的竞赛。

在CIFAR-10上演示了怎么训练10到1000层的网络。

任何一个得到冠军亚军的文章都应该也会被大家关注，特别是提出了一个框架和一个方法的文章。

CIFAR-10在计算机视觉上是一个很常见也非常小的数据集，训练1000层的网络是非常夸张的，在这之前可能没有见过1000层的网络长什么样子。

1.2第二段

对于很多视觉的任务来说，深度是很重要的。我仅仅是把我的网络换成了之前学习到的残差网络，在COCO目标检测数据集上得到了28%的相对改进。通过ILSVRC&COCO 2015的竞赛上拿下了第一名。

主要的工作就是把CNN的主干网络替换成了作者所提出来的残差网络，在一系列的任务上都取得了比较好的结果还赢下了竞赛第一名。如果大家做物体检测的话，COCO应该是这一领域最大的数据集了。

按照正常情况，接下来我们应该去看一下结论，比较有意思这篇文章竟然没有结论。

这篇文章是发表在CVPR上的，CVPR要求正文不能超过8页，这篇文章需要放上的结果比较多，包括ImageNet和COCO，导致结果没有空间去放结论部分。

2 重要公式、表格、图片

左图是训练误差，右图是测试误差，在CIFA-10上，用了20层和56层的plain networks。结果表明，56层的网络误差反而更高，训练误差更高、测试误差也更高。在训练更深的网络上，其实不仅仅是过拟合，而且是训练不动的。

这张图主要讲整个架构的实现，原始输入经过一层可学习权重的层，再经过一层 relu，再经过一层可学习权重的层，再与之前的原始数据加在一起的结果经过relu。就是这样的一个结构，构成了网络的主体。

这是在ImageNet数据集上，左图是没有加残差的时候用的是18层和34层的结果，右图是加了残差之后的结果。

34层的28.54%的错误率在加上残差后可以降低到25.3%

这是赢下15年比赛的最后结果

这张图是赢下15年比赛的最后结果

（到这里是第一遍的阅读）

深度学习最强奠基作ResNet《Deep Residual Learning for Image Recognition》论文解读(上篇)

1、摘要

1.1 第一段

1.2第二段

2 重要公式、表格、图片

相关文章：

深度学习最强奠基作ResNet《Deep Residual Learning for Image Recognition》论文解读(上篇)

第22次CCF计算机软件能力认证

Go语言基础之基本数据类型

Linux Tracing Technologies

iOS自定义下拉刷新控件

Springboot写单元测试

一篇文章教你使用Docker本地化部署Chatgpt（非api，速度非常快！！！）及裸连GPT的方式（告别镜像GPT）

前馈神经网络dropout实例

Android DataStore：安全存储和轻松管理数据

opencv进阶12-EigenFaces 人脸识别

The internal rate of return (IRR)

半导体自动化专用静电消除器主要由哪些部分组成

【C++入门到精通】C++入门 —— deque(STL)

Codeforces Round 893 (Div. 2) D.Trees and Segments

SpringBoot + Vue 前后端分离项目微人事(九)

【业务功能篇71】Cglib的BeanCopier进行Bean对象拷贝

让eslint的错误信息显示在项目界面上

手摸手带你实现一个开箱即用的Node邮件推送服务

【Linux网络】网络编程套接字 -- 基于socket实现一个简单UDP网络程序

Python学习笔记第六十四天（Matplotlib 网格线）

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

无法与IP建立连接，未能下载VSCode服务器

测试markdown--肇兴

基础测试工具使用经验

Linux云原生安全：零信任架构与机密计算

【配置 YOLOX 用于按目录分类的图片数据集】

Linux-07 ubuntu 的 chrome 启动不了

Spring Boot+Neo4j知识图谱实战：3步搭建智能关系网络！

IoT/HCIP实验-3/LiteOS操作系统内核实验(任务、内存、信号量、CMSIS..)

C++使用 new 来创建动态数组