当前位置：首页 > news >正文

动手学深度学习—卷积神经网络LeNet（代码详解）

news 2026/2/9 20:27:06

1. LeNet

LeNet由两个部分组成：

卷积编码器：由两个卷积层组成；
全连接层密集块：由三个全连接层组成。

在这里插入图片描述

每个卷积块中的基本单元是一个卷积层、一个sigmoid激活函数和平均汇聚层；
每个卷积层使用5×5卷积核和一个sigmoid激活函数；
这些层将输入映射到多个二维特征输出，通常同时增加通道的数量；
每个4×4池操作（步幅2）通过空间下采样将维数减少4倍。

import torch
from torch import nn
from d2l import torch as d2l# 定义模型net
net = nn.Sequential(nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Flatten(),nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),nn.Linear(120, 84), nn.Sigmoid(),nn.Linear(84, 10))

该模型去掉了最后一层的高斯激活，下面将一个大小为28×28的单通道（黑白）图像通过LeNet，打印每一层输出的形状。

# 观察各层的输入输出通道数，宽度和高度
X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)
for layer in net:X = layer(X)print(layer.__class__.__name__,'output shape:\t', X.shape)

在这里插入图片描述

第一个卷积层使用2个像素的填充，来补偿5×5卷积核导致的特征减少；
第二个卷积层没有填充，因此高度和宽度都减少了4个像素；
随着层叠的上升，通道的数量从输入时的1个，增加到第一个卷积层之后的6个，再到第二个卷积层之后的16个；
每个汇聚层的高度和宽度都减半；
每个全连接层减少维数，最终输出一个维数与结果分类数相匹配的输出。

2. 模型训练

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size=batch_size)

"""定义精度评估函数：1、将数据集复制到显存中2、通过调用accuracy计算数据集的精度
"""
def evaluate_accuracy_gpu(net, data_iter, device=None): #@save# 判断net是否属于torch.nn.Module类if isinstance(net, nn.Module):net.eval()# 如果不在参数选定的设备，将其传输到设备中if not device:device = next(iter(net.parameters())).device# Accumulator是累加器，定义两个变量：正确预测的数量，总预测的数量。metric = d2l.Accumulator(2)with torch.no_grad():for X, y in data_iter:# 将X, y复制到设备中if isinstance(X, list):# BERT微调所需的（之后将介绍）X = [x.to(device) for x in X]else:X = X.to(device)y = y.to(device)# 计算正确预测的数量，总预测的数量，并存储到metric中metric.add(d2l.accuracy(net(X), y), y.numel())return metric[0] / metric[1]

"""定义GPU训练函数：1、为了使用gpu，首先需要将每一小批量数据移动到指定的设备（例如GPU）上；2、使用Xavier随机初始化模型参数；3、使用交叉熵损失函数和小批量随机梯度下降。
"""
#@save
def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):"""用GPU训练模型(在第六章定义)"""# 定义初始化参数，对线性层和卷积层生效def init_weights(m):if type(m) == nn.Linear or type(m) == nn.Conv2d:nn.init.xavier_uniform_(m.weight)net.apply(init_weights)# 在设备device上进行训练print('training on', device)net.to(device)# 优化器：随机梯度下降optimizer = torch.optim.SGD(net.parameters(), lr=lr)# 损失函数：交叉熵损失函数loss = nn.CrossEntropyLoss()# Animator为绘图函数animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs],legend=['train loss', 'train acc', 'test acc'])# 调用Timer函数统计时间timer, num_batches = d2l.Timer(), len(train_iter)for epoch in range(num_epochs):# Accumulator(3)定义3个变量：损失值，正确预测的数量，总预测的数量metric = d2l.Accumulator(3)net.train()# enumerate() 函数用于将一个可遍历的数据对象for i, (X, y) in enumerate(train_iter):timer.start() # 进行计时optimizer.zero_grad() # 梯度清零X, y = X.to(device), y.to(device) # 将特征和标签转移到devicey_hat = net(X)l = loss(y_hat, y) # 交叉熵损失l.backward() # 进行梯度传递返回optimizer.step()with torch.no_grad():# 统计损失、预测正确数和样本数metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])timer.stop() # 计时结束train_l = metric[0] / metric[2] # 计算损失train_acc = metric[1] / metric[2] # 计算精度# 进行绘图if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:animator.add(epoch + (i + 1) / num_batches,(train_l, train_acc, None))# 测试精度test_acc = evaluate_accuracy_gpu(net, test_iter) animator.add(epoch + 1, (None, None, test_acc))# 输出损失值、训练精度、测试精度print(f'loss {train_l:.3f}, train acc {train_acc:.3f},'f'test acc {test_acc:.3f}')# 设备的计算能力print(f'{metric[2] * num_epochs / timer.sum():.1f} examples/sec'f'on {str(device)}')

在这里插入图片描述

lr, num_epochs = 0.9, 10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

在这里插入图片描述

3. 小结

卷积神经网络（CNN）是一类使用卷积层的网络；
卷积神经网络中，可以组合使用卷积层、非线性激活函数和汇聚层；
为了构造高性能的卷积神经网络，通常对卷积层进行排列，逐渐降低其表示的空间分辨率，同时增加通道数；
在传统的卷积神经网络中，卷积块编码得到的表征在输出之前需由一个或多个全连接层进行处理。

动手学深度学习—卷积神经网络LeNet（代码详解）

1. LeNet LeNet由两个部分组成： 卷积编码器：由两个卷积层组成；全连接层密集块：由三个全连接层组成。每个卷积块中的基本单元是一个卷积层、一个sigmoid激活函数和平均汇聚层；每个卷积层使用55卷积核和一个sigmoid激…...

编程日记 2023/8/16 15:21:20

腾讯面经总结

最近在准备面试，看了很多大厂的面经，抽空将腾讯面试的题目整理了一下，希望对大家有所帮助~ 一面 1、mysql索引结构？ 2、redis持久化策略？ 3、zookeeper节点类型说一下； 4、zookeeper选举机制&#xff…...

编程日记 2023/8/16 15:20:19

matlab机器人工具箱基础使用

资料：https://blog.csdn.net/huangjunsheng123/article/details/110630665 用vscode直接看工具箱api代码比较方便，代码说明很多一、模型设置 1、基础效果 %采用机器人工具箱进行正逆运动学验证 a[0,-0.3,-0.3,0,0,0];%DH参数 d[0.05,0,0,0.06,0.05,…...

编程日记 2023/8/16 15:19:16

1、下载地址： WonderLeak - Visual Studio Marketplace https://www.relyze.com/ 2、WonderLeak支持vs2017 2019扩展，或者单独启动 3、https://www.relyze.com/docs/wonderleak/help/w/overview/msvc_extension1.png 4、对于二进制程序来说支持以下…...

编程日记 2023/8/16 15:18:15

二刷LeetCode--155. 最小栈(C++版本),思维题

思路:本题需要使用两个栈,一个就是正常栈,执行出入操作,另一个栈只负责将对应的最小值进行保存即可.每次入栈的时候,最小值栈的栈顶也需要入栈元素,不过这个元素是最小值,那么就需要进行比较,因此在getmin()的时候只需要将最小值栈的栈顶元素弹出即可.初始化的时候只需要将最小…...

编程日记 2023/8/16 15:17:14

进程的状态与转换

进程在其生命周期内，由于系统中各进程之间的相互制约及系统的运行环境的变化，使得进程的状态也在不断地发生变化。通常进程有以下5种状态，前三种是基础讷航的基本状态 1）运行态。进程正在处理机上运行。在单处理机机中&#xff0…...

编程日记 2023/8/16 15:16:13

用MariaDB创建数据库，SQL练习，MarialDB安装和使用

前言：MariaDB数据库管理系统是MySQL的一个分支，主要由开源社区在维护，采用GPL授权许可 MariaDB的目的是完全兼容MySQL，包括API和命令行，使之能轻松成为MySQL的代替品。在存储引擎方面，使用XtraDB来代替MySQ…...

编程日记 2023/8/16 15:15:12

【Docker】使用Docker-Compose 搭建基于 WordPress 的博客网站

引本文将使用流行的博客搭建工具 WordPress 搭建一个私人博客站点。部署过程中使用到了 Docker 、MySQL 。站点搭建完成后经行了发布文章的体验。 WordPress WordPress 是一个广泛使用的开源内容管理系统（CMS），用于构建和管理网站、博客和…...

编程日记 2023/8/16 15:14:11

Hlang社区-前端社区宣传首页实现

文章目录前言页面结构固定钉头部轮播JS特效完整代码总结前言这里的话，博主其实也是今年参与考研的大军之一，所以的话，是抽空去完成这个项目的，当然这个项目的肯定是可以在较短的时间内完成的。那么废话不多说，昨天也是干到1点多，把这个首页写出来了。先看看看效果吧：…...

编程日记 2023/8/16 15:13:08

【LeetCode-Medium】833. 字符串中的查找与替换

题目链接 833. 字符串中的查找与替换标签字符串步骤 Step1. 初始化 ans[]： for (int i 0; i < s.length(); i) { // 初始化ansans[i] s[i]; }Step2. 根据 index, source, target 查找；如果找到，那么将 ans[i] 更改为 target&am…...

编程日记 2023/8/16 15:12:06

数据结构中公式前中后缀表达式-二叉树应用

目录数据结构中公式前中后缀表达式-二叉树应用数据结构中公式前中后缀表达式-二叉树应用什么是前缀表达式、中缀表达式、后缀表达式前缀表达式、中缀表达式、后缀表达式，是通过树来存储和计算表达式的三种不同方式以如下公式为例通过树来存储该公式&#x…...

编程日记 2023/8/16 15:11:04

Visual Studio 2022连接远程系统进行C/C++开发

Visual Studio被称为是宇宙最强IDE，以前开发Linux C/C服务器程序，基本上都是在Windows上使用VS编写跨平台的C/C代码，然后先在VS中编译、链接、调试，然后在Linux下编译、链接，再针对Linux下的特定代码进行调试。后面Vis…...

编程日记 2023/8/16 15:10:02

TiDB数据库从入门到精通系列之二：TiDB数据库的简介

TiDB数据库从入门到精通系列之二：TiDB数据库的简介一、TiDB数据库的简介二、五大核心特性三、四大核心应用场景四、TiDB数据库与MySQL数据库的兼容性一、TiDB数据库的简介 TiDB是开源分布式关系型数据库，是一款同时支持在线事务处理与在线分析处理 (H…...

编程日记 2023/8/16 15:09:00

opencv视频截取每一帧并保存为图片python代码CV2实现练习

当涉及到视频处理时，Python中的OpenCV库提供了强大的功能，可以方便地从视频中截取每一帧并将其保存为图片。这是一个很有趣的练习，可以让你更深入地了解图像处理和多媒体操作。使用OpenCV库，你可以轻松地读取视频文件&#xff0…...

编程日记 2023/8/16 15:07:56

虹科方案 | 汽车总线协议转换解决方案（二）

上期说到，虹科的PCAN-LIN网关在CAN、LIN总线转换方面有显著的作用，尤其是为BMS电池通信的测试提供了优秀的解决方案。假如您感兴趣，可以点击文末相关链接进行回顾！ 而今天，虹科将继续给大家带来Router系列在各个领域的…...

编程日记 2023/8/16 15:06:55

[Android] 通过JNI 让 JAVA 调用 android native 接口

前言： JNI (java native interface) 是一个库，可以让 java 代码和其他语言互动，比如 java 通过 JNI 调用融合了 jni库的 c/c 代码，注意，这里要求 c/c代码中必须通过链接 jni 库并按照 JNI 规范定义一套可供 JAVA 调用…...

编程日记 2023/8/16 15:05:51

MySQL高可用MHA

目录前言一、概述二、配置免密、组从复制三、MHA配置四、测试总结前言 MySQL高可用管理工具（MHA，Master High Availability）是一个用于自动管理MySQL主从复制的工具，它可以提供高可用性和自动故障转移。MHA由原版的MHA工具…...

编程日记 2023/8/16 15:04:49

DoIP学习笔记系列：（五）“安全认证”的.dll从何而来？

文章目录 1. “安全认证”的.dll从何而来？1.1 .dll文件base1.2 增加客户需求算法传送门 DoIP学习笔记系列：导航篇 1. “安全认证”的.dll从何而来？无论是用CANoe还是VFlash，亦或是编辑cdd文件，都需要加载一个与$27服务相关的.dll（Windows的动态库文件），这个文件是从哪…...

编程日记 2023/8/16 15:03:48

205、仿真-51单片机直流数字电流表多档位切换Proteus仿真设计(程序+Proteus仿真+原理图+流程图+元器件清单+配套资料等)

毕设帮助、开题指导、技术解答(有偿)见文未目录一、硬件设计二、设计功能三、Proteus仿真图四、原理图五、程序源码资料包括： 方案选择单片机的选择方案一：STM32系列单片机控制，该型号单片机为LQFP44封装，内部资源…...

编程日记 2023/8/16 15:02:44

服务器如何防止cc攻击

对于搭载网站运行的服务器来说，cc攻击应该并不陌生，特别是cc攻击的攻击门槛非常低，有个代理IP工具，有个cc攻击软件就可以轻易对任何网站发起攻击，那么服务器如何防止cc攻击?请看下面的介绍。服务器如何防止cc攻击&a…...

编程日记 2023/8/16 15:01:43

基于算法竞赛的c++编程（28）结构体的进阶应用

结构体的嵌套与复杂数据组织在C中，结构体可以嵌套使用，形成更复杂的数据结构。例如，可以通过嵌套结构体描述多层级数据关系： struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

编程新知 2025/11/16 19:06:23

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

文｜魏琳华编｜王一粟一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，…...

编程新知 2026/2/8 20:43:00

Java 8 Stream API 入门到实践详解

一、告别 for 循环！ 传统痛点： Java 8 之前，集合操作离不开冗长的 for 循环和匿名类。例如，过滤列表中的偶数： List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

编程新知 2026/1/12 10:41:22

相机从app启动流程

一、流程框架图二、具体流程分析 1、得到cameralist和对应的静态信息目录如下：重点代码分析：启动相机前，先要通过getCameraIdList获取camera的个数以及id，然后可以通过getCameraCharacteristics获取对应id camera的capabilities（静态信息）进行一些openCamera前的…...

编程新知 2026/1/31 5:09:19

unix/linux，sudo，其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化，本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来，让我们拨开时间的迷雾，一同探寻 sudo 那波澜壮阔（也颇为实用主义）的发展历程。历史背景：su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前，Unix 系统管理员和需要特权操作的…...

编程新知 2025/11/18 21:31:41