当前位置：首页 > article >正文

关于深度学习的一份介绍

article 2026/3/31 11:45:02

在这篇文章中，我将介绍有关深度学习的东西，主要是它与神经网络的关系、目前主要的网络有哪些，以及加深神经网络的意义等。

一、联系

在之前的文章中，我曾介绍过神经网络，而所谓的神经网络其实就是深度学习的一种架构，当神经网络的不存在隐藏层时，就是普通的感知机，但如果添加并加深隐藏层数，那么就是深度学习。加深这些隐藏层数量，可以增强模型的学习能力，使之能够处理更为复杂的数据结构和模式，这是深度学习的一大特点。

二、主要网络

通常，我们认为是在2012年举行的大规模图像识别大赛ILSVRC以压倒性优势胜出而被人们重视深度学习。而随着这些年的发展，主要的网络有VGG、GoogleNet、ResNet等。

接下来我将大致介绍一下这三种网络：

2.1 VGG

VGG是由卷积层和池化层够成的基础CNN，其中，它具有权重的层数一般都是16层或者19层，因此，它也被叫做VGG16或VGG19。如下是一个使用了该网络进行预测的代码：

import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()train_images = tf.image.resize(train_images, [75, 75])
test_images = tf.image.resize(test_images, [75, 75])train_images, test_images = train_images / 255.0, test_images / 255.0train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)base_model = VGG16(weights='imagenet', include_top=False, input_shape=(75, 75, 3))model = Sequential()
model.add(base_model)
model.add(Flatten())
model.add(Dense(4096, activation='relu'))
model.add(Dense(4096, activation='relu'))
model.add(Dense(10, activation='softmax')) for layer in base_model.layers:layer.trainable = Falsemodel.compile(optimizer=Adam(lr=0.0001), loss='categorical_crossentropy', metrics=['accuracy'])history = model.fit(train_images, train_labels, epochs=10, validation_data=(test_images, test_labels))test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print('Test accuracy:', test_acc)

2.2 GoogleNet

GoogleNet与CNN具有相同的结构，但不同的是GoogleNet在具有长度的基础上也具有宽度，即广度，而它这种横向具有宽度的结构被称为“Inception结构”。这种Inception结构使用许多不同大小的滤波器和池化，然后再将之合并。GoogleNet的特征正是将这种结构作为一个构成元素去构成整个网络，因此，该网络也称为Inception-v1。如下是使用这种网络的代码：

import tensorflow as tf
from tensorflow.keras.applications import InceptionV3
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, GlobalAveragePooling2D
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()train_images = tf.image.resize(train_images, [75, 75])
test_images = tf.image.resize(test_images, [75, 75])train_images, test_images = train_images / 255.0, test_images / 255.0train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)base_model = InceptionV3(weights='imagenet', include_top=False, input_shape=(75, 75, 3))model = Sequential()
model.add(base_model)
model.add(GlobalAveragePooling2D()) 
model.add(Dense(1024, activation='relu')) 
model.add(Dense(10, activation='softmax')) for layer in base_model.layers:layer.trainable = Falsemodel.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),loss='categorical_crossentropy',metrics=['accuracy'])history = model.fit(train_images, train_labels, epochs=10, validation_data=(test_images, test_labels))test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print('Test accuracy:', test_acc)

2.3 ResNet

ResNet是微软团队开发的网络，它比其它的网络具有更深的结构。但通常，如果我们一味加深网络，往往会出现各种各样的问题，导致性能的不佳，因此，在该网络中导入了“快捷结构”，它也叫“捷径”或“快捷连接”。

其中，出现的主要问题就是梯度消失或梯度爆炸以及退化问题，具体来说就是在深层网络中，反向传播过程中的梯度可能会变得非常小（梯度消失）或非常大（梯度爆炸），这使得网络难以训练。而退化问题就是即使优化算法能够解决梯度消失或爆炸的问题，更深的模型性能可能并不会如预期那样优于较浅的模型。实际上，在某些情况下，更深的模型性能反而会下降。

解决这些问题的方法——快捷连接，具体来说，这些连接将输入直接加到输出层上（假设尺寸匹配；如果不匹配，则通过线性投影调整尺寸），形成所谓的“残差块”。这种设计让网络学习残差函数F(x)=H(x)−x，而不是原始的目标映射H(x)，其中x是输入，H(x)是期望的底层映射。

如下是使用这种网络的代码：

import tensorflow as tf
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.utils import to_categorical(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()train_images = tf.image.resize(train_images, [224, 224])
test_images = tf.image.resize(test_images, [224, 224])train_images, test_images = train_images / 255.0, test_images / 255.0train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)base_model = ResNet50(weights='imagenet', include_top=False, input_shape=(224, 224, 3))model = Sequential()
model.add(base_model)
model.add(GlobalAveragePooling2D()) 
model.add(Dense(1024, activation='relu')) 
model.add(Dense(10, activation='softmax'))for layer in base_model.layers:layer.trainable = Falsemodel.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),loss='categorical_crossentropy',metrics=['accuracy'])history = model.fit(train_images, train_labels, epochs=10, validation_data=(test_images, test_labels))test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print('Test accuracy:', test_acc)

三、加深的意义

随着神经网络深度的加深，一般会有这些方面的意义，分别是表达能力的提升、解决复杂问题的能力的提升、参数效率、迁移学习等。

具体来说，首先是表达能力方面，随着网络层数的增加，神经网络能够学习到数据中更复杂的特征和模式。深层网络可以捕捉到输入数据中的多层次抽象表示，从而更好地理解图像、文本或声音等复杂的数据结构；

然后是解决复杂能力的提升，随着神经网络深度的加深，其可以构建出更加复杂的函数模型，从而能更好去处理复杂的任务；

接着是参数效率，因为深度的加深，神经网络可以逐层提炼和组合特征，而不是一次性就去捕捉所有的细节，所以性能可以得到很好的提升；

最后是迁移学习上，我们可以先构建一个较深的网络出来，然后训练这个较深的网络得到优秀的参数，接着将这些参数复制到新的网络上再学习，这样可以得到更好的效果来，并降低过拟合的风险以及减少训练时间。

此上

关于深度学习的一份介绍

一、联系

二、主要网络

2.1 VGG

2.2 GoogleNet

2.3 ResNet

三、加深的意义

相关文章：

关于深度学习的一份介绍

JavaScript系列02-函数深入理解

Netty是怎么实现Java NIO多路复用的？（源码）

SourceTree配置SSH步骤详解

Rocky Linux 8.5 6G内存静默模式(没图形界面)安装Oracle 19C

免费轻巧多功能 PDF 处理工具：转换、压缩、提取一应俱全

基于ssm的校园跑腿管理系统+vue

java数据结构_Map和Set_9.1

横向移动靶场-Tr0ll: 3

请解释 Node.js 中的网络模块（http、https），如何创建 HTTP服务器？

【WPF命令绑定之--没有Command属性的控件如何进行命令绑定？】

记20忘10之六：line

【愚公系列】《Python网络爬虫从入门到精通》036-DataFrame日期数据处理

【系统稳定性】1.11 QVM稳定性问题分析（一）

使用ChatGPT-Deep Reaserch两步给出文献综述！

从0开始的操作系统手搓教程14——进一步完成中断子系统

小米火龙CPU和其他几代温度太高的CPU是由谁代工的

Educational Codeforces Round 174 (Rated for Div. 2)

微服务即时通信系统---（七）文件管理子服务

mosfet的驱动设计-开关损耗

Unity3D 对象实例化详解

萌新学 Python 之 with 文件操作语句

C# Unity 唐老狮 No.2 模拟面试题

FFmpeg-chapter3-读取视频流（原理篇）

Docker迁移/var/lib/docker之后镜像容器丢失问题

单片机中的flah和RAM

【Pytest】setup和teardown的四个级别

第8天：面向对象编程入门 - 类与对象

单细胞marker基因表达密度图-(还有一个包装函数）

python多线程之Event机制笔记