当前位置：首页 > news >正文

现代卷积网络实战系列2：PyTorch构建训练函数、LeNet网络

news 2026/2/10 22:32:06

🌈🌈🌈现代卷积网络实战系列总目录

本篇文章的代码运行界面均在Pycharm中进行
本篇文章配套的代码资源已经上传

1、MNIST数据集处理、加载、网络初始化、测试函数
2、训练函数、PyTorch构建LeNet网络
3、PyTorch从零构建AlexNet训练MNIST数据集
4、PyTorch从零构建VGGNet训练MNIST数据集
5、PyTorch从零构建GoogLeNet训练MNIST数据集
6、PyTorch从零构建ResNet训练MNIST数据集

4、训练函数

4.1 调用训练函数

train(epochs, net, train_loader, device, optimizer, test_loader, true_value)

因为每一个epoch训练结束后，我们需要测试一下这个网络的性能，所有会在训练函数中频繁调用测试函数，所有测试函数中所有需要的参数，训练函数都需要
这七个参数，是训练一个神经网络所需要的最少参数

4.2 训练函数

训练函数中，所有训练集进行多次迭代，而每次迭代又会将数据分成多个批次进行迭代

def train(epochs, net, train_loader, device, optimizer, test_loader, true_value):for epoch in range(1, epochs + 1):net.train()all_train_loss = []for batch_idx, (data, target) in enumerate(train_loader):data = data.to(device)target = target.to(device)optimizer.zero_grad()output = net(data)loss = F.cross_entropy(output, target)loss.backward()optimizer.step()cur_train_loss = loss.item()all_train_loss.append(cur_train_loss)train_loss = np.round(np.mean(all_train_loss) * 1000, 2)print('\nepoch step:', epoch)print('training loss: ', train_loss)test(net, test_loader, device, true_value, epoch)print("\nTraining finished")

定义训练函数
安装epochs迭代数据
进入pytorch的训练模式
all_train_loss 存放训练集5万张图片的损失值
按照batch取数据
数据进入GPU
标签进入GPU
梯度清零
当前batch进入网络后得到输出
根据输出得到当前损失
反向传播
梯度下降
获取损失的损失值（PyTorch框架中的数据）
把当前batch的损失加入all_train_loss数组中，结束batch的迭代
将5张图片的损失计算出来并且进行求平均，这里乘以1000是因为我觉得计算出的损失太小了，所以乘以1000，方便看损失的变化，保留两位有效数字
打印当前epoch
打印损失
调用测试函数，测试当前训练的网络的性能，结束epoch的迭代
打印训练完成

5、LeNet

向传播来优化学习策略，而是采用的无监督学习的方案，这其实限制了Neocognitron模型。反向传播算法于1974年哈佛大学的 Paul Werbos 提出，并由LeCun于1989将反向传播算法引入了卷积神经网络并且用于手写数字识别任务上，这个就是LeNet-1，通过几年的迭代，LeNet在1998的手写体数字识别任务上取得了很大的成功，这个版本的LeNet就是著名的LeNet-5。为什么LeNet-5这么被广泛使用呢？因为LeNet-5在美国被大规模用于自动对银行支票上的手写数字进行分类。在LeNet之前，字符识别主要是通过手工特征工程来完成特征提取，然后利用机器学习模型来学习手工特征进行分类。因此，特征工程就是一个很大的问题，究竟什么样的特征是需要的特征呢？LeNet-5可以自己学习图像的特征，这就意味着，网络模型自己学习特征成为可能，手工提取特征将成为过去式。卷积还可以被看作是“滑动平均”的推广。

5.1 网络结构

LeNet可以说是首次提出卷积神经网络的模型
主要包含下面的网络层：

5*5的二维卷积
sigmoid激活函数（这里使用了relu）
5*5的二维卷积
sigmoid激活函数
数据一维化
全连接层
全连接层
softmax分类器

将网络结构打印出来：

LeNet(
-------(conv1): Conv2d(1, 10, kernel_size=(5, 5), stride=(1, 1))
-------(conv2): Conv2d(10, 20, kernel_size=(5, 5), stride=(1, 1))
-------(conv2_drop): Dropout2d(p=0.5, inplace=False)
-------(fc1): Linear(in_features=320, out_features=50, bias=True)
-------(fc2): Linear(in_features=50, out_features=10, bias=True)
)

5.2 PyTorch构建LeNet

class LeNet(nn.Module):def __init__(self, num_classes):super(LeNet, self).__init__()self.conv1 = nn.Conv2d(1, 10, kernel_size=5)self.conv2 = nn.Conv2d(10, 20, kernel_size=5)self.conv2_drop = nn.Dropout2d()self.fc1 = nn.Linear(320, 50)self.fc2 = nn.Linear(50, num_classes)def forward(self, x):x = F.relu(F.max_pool2d(self.conv1(x), 2))x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))x = x.view(-1, 320)x = F.relu(self.fc1(x))x = F.dropout(x, training=self.training)x = self.fc2(x)return F.log_softmax(x, dim=1)

这个时候已经是一个完整的项目了，看看10个epoch训练过程的打印：

D:\conda\envs\pytorch\python.exe A:\0_MNIST\train.py

Reading data…
train_data: (60000, 28, 28) train_label (60000,)
test_data: (10000, 28, 28) test_label (10000,)

Initialize neural network
test loss: 2301.68
test accuracy: 11.3 %

epoch step: 1
training loss: 634.74
test loss: 158.03
test accuracy: 95.29 %

epoch step: 2
training loss: 324.04
test loss: 107.62
test accuracy: 96.55 %

epoch step: 3
training loss: 271.25
test loss: 88.43
test accuracy: 97.04 %

epoch step: 4
training loss: 236.69
test loss: 70.94
test accuracy: 97.61 %

epoch step: 5
training loss: 211.05
test loss: 69.69
test accuracy: 97.72 %

epoch step: 6
training loss: 199.28
test loss: 62.04
test accuracy: 97.98 %

epoch step: 7
training loss: 187.11
test loss: 59.65
test accuracy: 97.98 %

epoch step: 8
training loss: 178.79
test loss: 53.89
test accuracy: 98.2 %

epoch step: 9
training loss: 168.75
test loss: 51.83
test accuracy: 98.43 %

epoch step: 10
training loss: 160.83
test loss: 50.35
test accuracy: 98.4 %

Training finished
进程已结束，退出代码为 0

可以看出基本上只要一个epoch就可以得到很好的训练效果了，后续的epoch中的提升比较小

现代卷积网络实战系列2：PyTorch构建训练函数、LeNet网络

🌈🌈🌈现代卷积网络实战系列总目录本篇文章的代码运行界面均在Pycharm中进行本篇文章配套的代码资源已经上传 1、MNIST数据集处理、加载、网络初始化、测试函数 2、训练函数、PyTorch构建LeNet网络 3、PyTorch从零构建AlexNet训练MNIST数据…...

编程日记 2023/9/29 1:14:14

leetCode 62.不同路径动态规划 + 空间复杂度优化

62. 不同路径 - 力扣（LeetCode） 一个机器人位于一个 m x n 网格的左上角 （起始点在下图中标记为 “Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为 “Finish” &#xf…...

编程日记 2023/9/29 1:13:13

在 .NET 8 Release Candidate 1 中推出 .NET MAUI：质量

作者：David Ortinau 排版：Alan Wang 今天，我们很高兴地宣布 .NET MAUI 在 .NET 8 Release Candidate 1 中已经可用，该版本带有适用于生产应用程序的正式许可证，因此您可以放心地将此版本用于生产环境。我们在 .NET 8 中…...

编程日记 2023/9/29 1:10:11

Spring 学习（八）事务管理

1. 事务 1.1 事务的 ACID 原则数据库事务（transaction）是访问并可能操作各种数据项的一个数据库操作序列。事务必须满足 ACID 原则——即原子性（Atomicity）、一致性（Consistency）、隔离性（Iso…...

编程日记 2023/9/29 1:07:08

CodeTON Round 6 (Div 1 + Div 2, Rated, Prizes!)(A - E)

CodeTON Round 6 (Div. 1 Div. 2, Rated, Prizes!)(A - E) CodeTON Round 6 (Div. 1 Div. 2, Rated, Prizes!) A. MEXanized Array（分类讨论） 可以发现当 n < k 或者 k > x 1 的时候无法构成 ， 其余的时候贪心的用 x 最大化贡献即…...

编程日记 2023/9/29 1:06:06

Spring 源码分析（五）——Spring三级缓存的作用分别是什么？

Spring 的三级缓存是经典面试题，也会看到一些文章讲三级缓存与循环依赖之的关系。那么，三级缓存分别存储的什么呢？他们的作用又分别是什么？ 一、一、二级缓存一级缓存是一个名为 singletonObjects 的 ConcurrentHashMap&#x…...

编程日记 2023/9/29 0:57:58

第一步：导入View from django.views import View 第二步：新建这个基类 class CLS_executer(View):db DB_executerdef get(self, request):executer_list list(self.db.objects.all().values())return HttpResponse(json.dumps(executer_list), conte…...

编程日记 2023/9/29 0:52:53

matplotlib绘图实现中文宋体的两种方法（亲测）

方法一：这种方法我没有测试。第一步找宋体字体 （win11系统） 2.matplotlib字体目录，如果不知道的话，可以通过以下代码查询： matplotlib.matplotlib_fname() 如果你是Anaconda3 安装的matplotlib&#x…...

编程日记 2023/9/29 0:50:52

非常有用的JavaScript高阶面试技巧！

🍀一、闭包闭包是指函数中定义的函数，它可以访问外部函数的变量。闭包可以用来创建私有变量和方法，从而保护代码不受外界干扰。 // 例1 function outerFunction() {const privateVariable "私有变量";function innerFunction()…...

编程日记 2023/9/29 0:49:51

windows 安装Linux子系统 Ubuntu 并配置python3

环境说明： Windows 11 Ubuntu 20.04.6 安装步骤以及问题： 1、开启Windows Subsystem for Linux dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart 2、开启虚拟机特性 dism.exe /online /enabl…...

编程日记 2023/9/29 0:41:44

pytorch的pixel_shuffle转tflite文件

torch.pixel_shuffle()是pytorch里面上采样比较常用的方法，但是和tensoflow的depth_to_space不是完全一样的，虽然看起来功能很像，但是细微是有差异的 def tf_pixelshuffle(input, upscale_factor):temp []depth upscale_factor *upscale_f…...

编程日记 2023/9/29 0:38:41

sentinel-dashboard-1.8.0.jar开机自启动脚本

启动阿里巴巴的流控组件控制面板需要运行一个jar包，通常需要运行如下命令： java -server -Xms4G -Xmx4G -Dserver.port8080 -Dcsp.sentinel.dashboard.server127.0.0.1:8080 -Dproject.namesentinel-dashboard -jar sentinel-dashboard-1.8.0.jar &…...

编程日记 2023/9/29 0:37:40

c++堆排序-建堆-插入-删除-排序

本文以大根堆为例，用数组实现，它的nums[0]是数组最大值。时间复杂度分析： 建堆o(n) 插入删除o(logn) 堆排序O(nlogn) 首先上代码 #include<bits/stdc.h>using namespace std; void down(vector<int>&nums, int idx, i…...

编程日记 2023/9/29 0:35:38

使用代理后pip install 出现ssl错误

window直接设置代理 httphttp://127.0.0.1:7890;httpshttp://127.0.0.1...

编程日记 2023/9/29 0:34:37

护眼灯什么价位的好？最具性价比的护眼台灯推荐

到了晚上光线比较弱，这时候就需要开灯，要是孩子需要近距离看字学习等等，给孩子选择的灯具要特别的重视。护眼灯就是目前颇受学生家长青睐的灯具之一，越来越多的人会购买一个护眼灯给自己的孩子让孩子能够在灯光下学习的时候&#…...

编程日记 2023/9/29 0:29:32

vue event bus 事件总线

vue event bus 事件总线创建工程： H:\java_work\java_springboot\vue_study ctrl按住不放右键悬着 powershell H:\java_work\java_springboot\js_study\Vue2_3入门到实战-配套资料\01-随堂代码素材\day04\准备代码\08-事件总线-扩展 vue --version vue crea…...

编程日记 2023/9/29 0:28:32

深信服云桌面用户忘记密码后的处理

深信服云桌面用户忘记了密码，分两种情况，一个是忘记了登录深信服云桌面的密码，另外一个是忘记了进入操作系统的密码。一、忘记了登录深信服云桌面的密码登录虚拟桌面接入管理系统界面，在用户管理中选择用户后，点击后…...

编程日记 2023/9/29 0:27:31

Cocos Creator3.8 实战问题（一）cocos creator prefab 无法显示内容

问题描述： cocos creator prefab 无法显示内容， 或者只显示一部分内容。 creator编辑器中能看见： 预览时，看不见内容： **问题原因：** prefab node 所在的layer，默认是default。解决方法&…...

编程日记 2023/9/29 0:26:30

朴素贝叶斯深度解码：从原理到深度学习应用

目录一、简介贝叶斯定理的历史和重要性定义例子朴素贝叶斯分类器的应用场景定义例子常见应用场景二、贝叶斯定理基础条件概率定义例子贝叶斯公式定义例子三、朴素贝叶斯算法原理基本构成定义例子分类过程定义例子不同变体定义例子四、朴素贝叶斯的种类高斯朴素贝叶斯&a…...

编程日记 2023/9/29 0:25:29

RUST 每日一省：闭包

Rust中的闭包是一种可以存入外层函数中变量或作为参数传递给其他函数的匿名函数。你可以在一个地方创建闭包，然后在不同的上下文环境中调用该闭包来完成运算。和一般的函数不同，闭包可以从定义它的作用域中捕获值。语法闭包由“||”和“{}”组合而成。…...

编程日记 2023/9/29 0:23:27

简易版抽奖活动的设计技术方案

1.前言本技术方案旨在设计一套完整且可靠的抽奖活动逻辑，确保抽奖活动能够公平、公正、公开地进行，同时满足高并发访问、数据安全存储与高效处理等需求，为用户提供流畅的抽奖体验，助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

编程新知 2026/2/7 17:41:40

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

0. 概述上一节对安装和使用有个基本介绍。根据这个 issue 的描述，后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作，其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

编程新知 2026/1/24 6:44:11

AtCoder 第409场初级竞赛 A~E题解

A Conflict 【题目链接】原题链接：A - Conflict 【考点】枚举【题目大意】找到是否有两人都想要的物品。【解析】遍历两端字符串，只有在同时为 o 时输出 Yes 并结束程序，否则输出 No。【难度】 GESP三级【代码参考】 #i…...

编程新知 2025/12/16 4:45:38

基于当前项目通过npm包形式暴露公共组件

1.package.sjon文件配置其中xh-flowable就是暴露出去的npm包名 2.创建tpyes文件夹，并新增内容 3.创建package文件夹...

编程新知 2026/2/1 21:58:45

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上，看到基于小智 AI DIY 玩具的演示，感觉有点意思，想着自己也来试试。如果只是想烧录现成的固件，乐鑫官方除了提供了 Windows 版本的 Flash 下载工具之外，还提供了基于网页版的 ESP LA…...

编程新知 2026/2/3 8:13:35

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中，附加包含目录、附加库目录和附加依赖项是三个至关重要的设置，它们相互配合，确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中，这些概念容易让人混淆，但深入理解它们的作用和联…...

编程新知 2026/1/26 2:22:24

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

考察一般的三次多项式，以r为参数： p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]； 此多项式的根为： 尽管看起来这个多项式是特殊的，其实一般的三次多项式都是可以通过线性变换化为这个形式…...

编程新知 2026/1/30 3:24:00

CVPR2025重磅突破：AnomalyAny框架实现单样本生成逼真异常数据，破解视觉检测瓶颈！

本文介绍了一种名为AnomalyAny的创新框架，该方法利用Stable Diffusion的强大生成能力，仅需单个正常样本和文本描述，即可生成逼真且多样化的异常样本，有效解决了视觉异常检测中异常样本稀缺的难题，为工业质检、医疗影像…...

编程新知 2026/2/5 4:18:48

nnUNet V2修改网络——暴力替换网络为UNet++

更换前，要用nnUNet V2跑通所用数据集，证明nnUNet V2、数据集、运行环境等没有问题阅读nnU-Net V2 的 U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。 U-Net存在两个局限，一是网络的最佳深度因应用场景而异，这取决于任务的难度和可用于训练的标注数…...

编程新知 2026/2/7 10:22:16

STM32标准库-ADC数模转换器

文章目录一、ADC1.1简介1. 2逐次逼近型ADC1.3ADC框图1.4ADC基本结构1.4.1 信号 “上车点”：输入模块（GPIO、温度、V_REFINT）1.4.2 信号 “调度站”：多路开关1.4.3 信号 “加工厂”：ADC 转换器（规则组注入…...

编程新知 2026/2/10 11:01:42

现代卷积网络实战系列2：PyTorch构建训练函数、LeNet网络

🌈🌈🌈现代卷积网络实战系列总目录

4、训练函数

4.1 调用训练函数

4.2 训练函数

5、LeNet

5.1 网络结构

5.2 PyTorch构建LeNet

相关文章：

现代卷积网络实战系列2：PyTorch构建训练函数、LeNet网络

leetCode 62.不同路径动态规划 + 空间复杂度优化

在 .NET 8 Release Candidate 1 中推出 .NET MAUI：质量

Spring 学习（八）事务管理

CodeTON Round 6 (Div 1 + Div 2, Rated, Prizes!)(A - E)

Spring 源码分析（五）——Spring三级缓存的作用分别是什么？

Django基于类视图实现增删改查

matplotlib绘图实现中文宋体的两种方法（亲测）

非常有用的JavaScript高阶面试技巧！

windows 安装Linux子系统 Ubuntu 并配置python3

pytorch的pixel_shuffle转tflite文件

sentinel-dashboard-1.8.0.jar开机自启动脚本

c++堆排序-建堆-插入-删除-排序

使用代理后pip install 出现ssl错误

护眼灯什么价位的好？最具性价比的护眼台灯推荐

vue event bus 事件总线

深信服云桌面用户忘记密码后的处理

Cocos Creator3.8 实战问题（一）cocos creator prefab 无法显示内容

朴素贝叶斯深度解码：从原理到深度学习应用

RUST 每日一省：闭包

简易版抽奖活动的设计技术方案

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

AtCoder 第409场初级竞赛 A~E题解

基于当前项目通过npm包形式暴露公共组件

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

CVPR2025重磅突破：AnomalyAny框架实现单样本生成逼真异常数据，破解视觉检测瓶颈！

nnUNet V2修改网络——暴力替换网络为UNet++

STM32标准库-ADC数模转换器