当前位置：首页 > news >正文

现代卷积网络实战系列2：训练函数、PyTorch构建LeNet网络

news 2026/2/9 7:01:51

4、训练函数

4.1 调用训练函数

train(epochs, net, train_loader, device, optimizer, test_loader, true_value)

因为每一个epoch训练结束后，我们需要测试一下这个网络的性能，所有会在训练函数中频繁调用测试函数，所有测试函数中所有需要的参数，训练函数都需要
这七个参数，是训练一个神经网络所需要的最少参数

4.2 训练函数

训练函数中，所有训练集进行多次迭代，而每次迭代又会将数据分成多个批次进行迭代

def train(epochs, net, train_loader, device, optimizer, test_loader, true_value):for epoch in range(1, epochs + 1):net.train()all_train_loss = []for batch_idx, (data, target) in enumerate(train_loader):data = data.to(device)target = target.to(device)optimizer.zero_grad()output = net(data)loss = F.cross_entropy(output, target)loss.backward()optimizer.step()cur_train_loss = loss.item()all_train_loss.append(cur_train_loss)train_loss = np.round(np.mean(all_train_loss) * 1000, 2)print('\nepoch step:', epoch)print('training loss: ', train_loss)test(net, test_loader, device, true_value, epoch)print("\nTraining finished")

定义训练函数
安装epochs迭代数据
进入pytorch的训练模式
all_train_loss 存放训练集5万张图片的损失值
按照batch取数据
数据进入GPU
标签进入GPU
梯度清零
当前batch进入网络后得到输出
根据输出得到当前损失
反向传播
梯度下降
获取损失的损失值（PyTorch框架中的数据）
把当前batch的损失加入all_train_loss数组中，结束batch的迭代
将5张图片的损失计算出来并且进行求平均，这里乘以1000是因为我觉得计算出的损失太小了，所以乘以1000，方便看损失的变化，保留两位有效数字
打印当前epoch
打印损失
调用测试函数，测试当前训练的网络的性能，结束epoch的迭代
打印训练完成

5、LeNet

5.1 网络结构

LeNet可以说是首次提出卷积神经网络的模型
主要包含下面的网络层：

5*5的二维卷积
sigmoid激活函数（这里使用了relu）
5*5的二维卷积
sigmoid激活函数
数据一维化
全连接层
全连接层
softmax分类器

将网络结构打印出来：

LeNet(
-------(conv1): Conv2d(1, 10, kernel_size=(5, 5), stride=(1, 1))
-------(conv2): Conv2d(10, 20, kernel_size=(5, 5), stride=(1, 1))
-------(conv2_drop): Dropout2d(p=0.5, inplace=False)
-------(fc1): Linear(in_features=320, out_features=50, bias=True)
-------(fc2): Linear(in_features=50, out_features=10, bias=True)
)

5.2 PyTorch构建LeNet

class LeNet(nn.Module):def __init__(self, num_classes):super(LeNet, self).__init__()self.conv1 = nn.Conv2d(1, 10, kernel_size=5)self.conv2 = nn.Conv2d(10, 20, kernel_size=5)self.conv2_drop = nn.Dropout2d()self.fc1 = nn.Linear(320, 50)self.fc2 = nn.Linear(50, num_classes)def forward(self, x):x = F.relu(F.max_pool2d(self.conv1(x), 2))x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))x = x.view(-1, 320)x = F.relu(self.fc1(x))x = F.dropout(x, training=self.training)x = self.fc2(x)return F.log_softmax(x, dim=1)

这个时候已经是一个完整的项目了，看看10个epoch训练过程的打印：

D:\conda\envs\pytorch\python.exe A:\0_MNIST\train.py

Reading data…
train_data: (60000, 28, 28) train_label (60000,)
test_data: (10000, 28, 28) test_label (10000,)

Initialize neural network
test loss: 2301.68
test accuracy: 11.3 %

epoch step: 1
training loss: 634.74
test loss: 158.03
test accuracy: 95.29 %

epoch step: 2
training loss: 324.04
test loss: 107.62
test accuracy: 96.55 %

epoch step: 3
training loss: 271.25
test loss: 88.43
test accuracy: 97.04 %

epoch step: 4
training loss: 236.69
test loss: 70.94
test accuracy: 97.61 %

epoch step: 5
training loss: 211.05
test loss: 69.69
test accuracy: 97.72 %

epoch step: 6
training loss: 199.28
test loss: 62.04
test accuracy: 97.98 %

epoch step: 7
training loss: 187.11
test loss: 59.65
test accuracy: 97.98 %

epoch step: 8
training loss: 178.79
test loss: 53.89
test accuracy: 98.2 %

epoch step: 9
training loss: 168.75
test loss: 51.83
test accuracy: 98.43 %

epoch step: 10
training loss: 160.83
test loss: 50.35
test accuracy: 98.4 %

Training finished
进程已结束，退出代码为 0

可以看出基本上只要一个epoch就可以得到很好的训练效果了，后续的epoch中的提升比较小

现代卷积网络实战系列2：训练函数、PyTorch构建LeNet网络

4、训练函数 4.1 调用训练函数 train(epochs, net, train_loader, device, optimizer, test_loader, true_value)因为每一个epoch训练结束后，我们需要测试一下这个网络的性能，所有会在训练函数中频繁调用测试函数，所有测试函数中所有需要的…...

编程日记 2023/9/23 5:03:38

rust特性

特性，也叫特质，英文是trait。 trait是一种特殊的类型，用于抽象某些方法。trait类似于其他编程语言中的接口，但又有所不同。 trait定义了一组方法，其他类型可以各自实现这个trait的方法，从而形成多态。一、…...

编程日记 2023/9/23 5:00:34

TouchGFX之画布控件

TouchGFX的画布控件，在使用相对较小的存储空间的同时保持高性能，可提供平滑、抗锯齿效果良好的几何图形绘制。 TouchGFX 设计器中可用的画布控件： LineCircleShapeLine Progress圆形进度条存储空间分配和使用为了生成反锯齿效果良好的…...

编程日记 2023/9/23 4:59:33

STM32F103RCT6学习笔记2：串口通信

今日开始快速掌握这款STM32F103RCT6芯片的环境与编程开发，有关基础知识的部分不会多唠，直接实践与运用！文章贴出代码测试工程与测试效果图： 目录串口通信实验计划： 串口通信配置代码： 测试效果图&#…...

编程日记 2023/9/23 4:58:32

图像的噪声图像的平滑均值滤波均值滤波代码实现 import cv2 as cv import numpy as np import matplotlib.pyplot as plt from pylab import mplmpl.rcParams[font.sans-serif] [SimHei]img cv.imread("dog.png")#均值滤波cv.blur(img, (5, 5))将对图像img进行…...

编程日记 2023/9/23 4:57:31

MasterAlign相机参数设置-增益调节

相机参数设置-曝光时间调节操作说明相机参数的设置对于获取清晰、准确的图像至关重要。曝光时间是其中一个关键参数，它直接影响图像的亮度和清晰度。以下是关于曝光时间调节的详细操作步骤，以帮助您轻松进行设置。步骤一：登录系统首先&…...

编程日记 2023/9/23 4:55:29

9月22日，每日信息差

今天是2023年09月22日，以下是为您准备的14条信息差第一、亚马逊将于2024年初在Prime Video中加入广告。Prime Video内容中的广告将于2024年初在美国、英国、德国和加拿大推出，随后晚些时候在法国、意大利、西班牙、墨西哥和澳大利亚推出第二、中国移…...

编程日记 2023/9/23 4:53:27

Java版本企业工程项目管理系统源码+spring cloud 系统管理+java 系统设置+二次开发

工程项目各模块及其功能点清单一、系统管理 1、数据字典：实现对数据字典标签的增删改查操作 2、编码管理：实现对系统编码的增删改查操作 3、用户管理：管理和查看用户角色 4、菜单管理：实现对系统菜单的增删改查操…...

编程日记 2023/9/23 4:51:26

Android studio中如何下载sdk

打开 file -> settings 这个页面, 在要下载的 SDK 前面勾上, 然后点 apply 在 platforms 中就可以看到下载好的 SDK: Android SDK目录结构详细介绍可以参考这篇文章: 51CTO博客- Android SDK目录结构...

编程日记 2023/9/23 4:50:25

STM32单片机中国象棋TFT触摸屏小游戏

实践制作DIY- GC0167-中国象棋一、功能说明： 基于STM32单片机设计-中国象棋二、功能介绍： 硬件组成：STM32F103RCT6最小系统2.8寸TFT电阻触摸屏24C02存储器1个按键（悔棋） 游戏规则： 1.有悔棋键&…...

编程日记 2023/9/23 4:48:23

【PHP图片托管】CFimagehost搭建私人图床 - 无需数据库支持

文章目录 1.前言2. CFImagehost网站搭建2.1 CFImagehost下载和安装2.2 CFImagehost网页测试2.3 cpolar的安装和注册 3.本地网页发布3.1 Cpolar临时数据隧道3.2 Cpolar稳定隧道（云端设置）3.3.Cpolar稳定隧道（本地设置） 4.公网访问测…...

编程日记 2023/9/23 4:45:18

CCITT 标准的CRC-16检验算法

/******该文件使用查表法计算CCITT 标准的CRC-16检验码，并附测试代码********/ #include #define CRC_INIT 0xffff //CCITT初始CRC为全1 #define GOOD_CRC 0xf0b8 //校验时计算出的固定结果值 /****下表是常用ccitt 16,生成式1021反转成8408后的查询表格****/ u…...

编程日记 2023/9/23 4:44:16

docker启动mysql服务

创建基础文件 mkdir mysql mkdir -p mysql/data获取默认的my.cnf docker run -name mysql -d -p 3306:3306 mysql:latest docker cp mysql:/etc/my.cnf ./vim mysql/my.cnf # For advice on how to change settings please see # http://dev.mysql.com/doc/refman/8.1/en/se…...

编程日记 2023/9/23 4:38:06

Postman应用——Request数据导入导出

文章目录导入请求数据导出请求数据导出Collection导出Environments 导出所有请求数据导出请求响应数据 Postman可以导入导出Request和Variable变量配置，可以通过文本方式（JOSN文本）或链接方式进行导入导出。导入请求数据可以通过JSON文件…...

编程日记 2023/9/23 4:37:05

十四、MySql的用户管理

文章目录一、用户管理二、用户（一）用户信息（二）创建用户1.语法：2.案例： （三） 删除用户1.语法：2.示例： （四）修改用户密码1.语法&#…...

编程日记 2023/9/23 4:35:02

01.自动化交易综述

算法交易的概念： 利用自动化平台，执行预先设置的一系列规则完成交易行为。算法交易的优势 1.历史数据评估 2.执行高效 3.无主观情绪输入 4.可度量评价 5.交易频率算法交易的劣势 1.成本，成本低难以体现收益 2.技巧算法交易流程大前…...

编程日记 2023/9/23 4:31:59

基于SpringBoot的网上超市系统的设计与实现

目录前言一、技术栈二、系统功能介绍管理员功能实现用户功能实现三、核心代码 1、登录模块 2、文件上传模块 3、代码封装前言网络技术和计算机技术发展至今，已经拥有了深厚的理论基础，并在现实中进行了充分运用，尤其是基于计…...

编程日记 2023/9/23 4:29:57

国内首家！阿里云 Elasticsearch 8.9 版本释放 AI 搜索新动能

简介： 阿里云作为国内首家上线 Elasticsearch 8.9版本的厂商，在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的基础上，提供增强 AI 的最佳实践与 ES 本身的混合搜索能力，为用户带来了更多创新和探索的可能性。近年来&a…...

编程日记 2023/9/23 4:26:54

uniapp获取一周日期和星期

UniApp可以使用JavaScript中的Date对象来获取当前日期和星期几。以下是一个示例代码，可以获取当前日期和星期几，并输出在一周内的每天早上和晚上： // 获取当前日期和星期 let date new Date(); let weekdays ["Sunday", "M…...

编程日记 2023/9/23 4:25:53

QT之QListWidget的介绍

QListWidget常用成员函数 1、成员函数介绍2、例子显示图片和按钮的例子 1、成员函数介绍 1)QListWidget(QWidget *parent nullptr) 构造函数，创建一个新的QListWidget对象。 2)void addItem(const QString &label) 在列表末尾添加一个项目，项目标…...

编程日记 2023/9/23 4:23:51

后进先出（LIFO）详解

LIFO 是 Last In, First Out 的缩写，中文译为后进先出。这是一种数据结构的工作原则，类似于一摞盘子或一叠书本： 最后放进去的元素最先出来 -想象往筒状容器里放盘子： （1）你放进的最后一个盘子&#xff08…...

编程新知 2026/2/8 1:22:58

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/11/5 13:03:58

【HarmonyOS 5.0】DevEco Testing：鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的一体化测试平台，覆盖应用全生命周期测试需求，主要提供五大核心能力： 测试类型检测目标关键指标功能体验基…...

编程新知 2026/1/28 8:17:53

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件，然后打开终端，进入下载文件夹，键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

编程新知 2026/1/29 3:35:37

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题安装 flash-attn 会一直卡在 build 那一步或者运行报错解决办法是因为你安装的 flash-attn 版本没有对应上，所以报错，到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本，cu、torch、cp 的版本一定要对…...

编程新知 2025/11/3 2:11:24

C++ 求圆面积的程序（Program to find area of a circle）

给定半径r，求圆的面积。圆的面积应精确到小数点后5位。例子： 输入：r 5 输出：78.53982 解释：由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982，因为我们只保留小数点后 5 位数字。输…...

编程新知 2026/1/31 12:52:15

深度学习习题2

1.如果增加神经网络的宽度，精确度会增加到一个特定阈值后，便开始降低。造成这一现象的可能原因是什么？ A、即使增加卷积核的数量，只有少部分的核会被用作预测 B、当卷积核数量增加时，神经网络的预测能力会降低 C、当卷…...

编程新知 2026/1/26 5:53:30

网站指纹识别

网站指纹识别网站的最基本组成：服务器（操作系统）、中间件（web容器）、脚本语言、数据厍为什么要了解这些？举个例子：发现了一个文件读取漏洞，我们需要读/etc/passwd，如…...

编程新知 2026/2/2 17:06:29

C++.OpenGL （20/64）混合（Blending）

混合（Blending）透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...

编程新知 2026/1/20 5:33:17

【Java多线程从青铜到王者】单例设计模式(八)

wait和sleep的区别我们的wait也是提供了一个还有超时时间的版本，sleep也是可以指定时间的，也就是说时间一到就会解除阻塞，继续执行 wait和sleep都能被提前唤醒(虽然时间还没有到也可以提前唤醒)，wait能被notify提前唤醒&#xf…...

编程新知 2026/2/6 9:31:18

现代卷积网络实战系列2：训练函数、PyTorch构建LeNet网络

4、训练函数

4.1 调用训练函数

4.2 训练函数

5、LeNet

5.1 网络结构

5.2 PyTorch构建LeNet

相关文章：

现代卷积网络实战系列2：训练函数、PyTorch构建LeNet网络

rust特性

TouchGFX之画布控件

STM32F103RCT6学习笔记2：串口通信

Opencv-图像噪声（均值滤波、高斯滤波、中值滤波）

MasterAlign相机参数设置-增益调节

9月22日，每日信息差

Java版本企业工程项目管理系统源码+spring cloud 系统管理+java 系统设置+二次开发

Android studio中如何下载sdk

STM32单片机中国象棋TFT触摸屏小游戏

【PHP图片托管】CFimagehost搭建私人图床 - 无需数据库支持

CCITT 标准的CRC-16检验算法

docker启动mysql服务

Postman应用——Request数据导入导出

十四、MySql的用户管理

01.自动化交易综述

基于SpringBoot的网上超市系统的设计与实现

国内首家！阿里云 Elasticsearch 8.9 版本释放 AI 搜索新动能

uniapp获取一周日期和星期

QT之QListWidget的介绍

后进先出（LIFO）详解

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

【HarmonyOS 5.0】DevEco Testing：鸿蒙应用质量保障的终极武器

1.3 VSCode安装与环境配置

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

C++ 求圆面积的程序（Program to find area of a circle）

深度学习习题2

网站指纹识别

C++.OpenGL （20/64）混合（Blending）

【Java多线程从青铜到王者】单例设计模式(八)