当前位置：首页 > news >正文

卷积神经网络——LeNet——FashionMNIST

news 2026/3/28 8:21:42

一、整体结构

在这里插入图片描述

二、model.py

import torch
from torch import nn
from torchsummary import summaryclass LeNet(nn.Module):def __init__(self):super(LeNet,self).__init__()self.c1 = nn.Conv2d(in_channels=1,out_channels=6,kernel_size=5,padding=2)self.sig = nn.Sigmoid()self.s2 = nn.AvgPool2d(kernel_size=2,stride=2)self.c3 = nn.Conv2d(in_channels=6,out_channels=16,kernel_size=5)self.s4 = nn.AvgPool2d(kernel_size=2,stride=2)self.flatten = nn.Flatten()self.f5 = nn.Linear(in_features=5*5*16,out_features=120)self.f6 = nn.Linear(in_features=120,out_features=84)self.f7 = nn.Linear(in_features=84,out_features=10)def forward(self,x):x = self.sig(self.c1(x))x = self.s2(x)x = self.sig(self.c3(x))x = self.s4(x)x = self.flatten(x)x = self.f5(x)x = self.f6(x)x = self.f7(x)return x# if __name__ =="__main__":
#     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
#
#     model = LeNet().to(device)
#
#     print(summary(model,input_size=(1,28,28)))

三、model_train.py

# 导入所需的Python库
from torchvision.datasets import FashionMNIST
from torchvision import transforms
import torch.utils.data as Data
import torch
from torch import nn
import time
import copy
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from model import LeNet  # model.py中定义了LeNet模型
from tqdm import tqdm  # 导入tqdm库，用于显示进度条# 定义数据加载和处理函数
def train_val_data_process():# 加载FashionMNIST数据集，Resize到28x28尺寸，并转换为Tensortrain_data = FashionMNIST(root="./data",train=True,transform=transforms.Compose([transforms.Resize(size=28), transforms.ToTensor()]),download=True)# 将加载的数据集分为80%的训练数据和20%的验证数据train_data, val_data = Data.random_split(train_data, lengths=[round(0.8 * len(train_data)), round(0.2 * len(train_data))])# 为训练数据和验证数据创建DataLoader，设置批量大小为32，洗牌，2个进程加载数据train_dataloader = Data.DataLoader(dataset=train_data,batch_size=32,shuffle=True,num_workers=2)val_dataloader = Data.DataLoader(dataset=val_data,batch_size=32,shuffle=True,num_workers=2)# 返回训练和验证的DataLoaderreturn train_dataloader, val_dataloader# 定义模型训练和验证过程的函数
def train_model_process(model, train_dataloader, val_dataloader, num_epochs):# 设置使用CUDA如果可用device = torch.device("cuda" if torch.cuda.is_available() else "cpu")# 打印使用的设备dev = "cuda" if torch.cuda.is_available() else "cpu"print(f'当前模型训练设备为: {dev}')# 初始化Adam优化器和交叉熵损失函数optimizer = torch.optim.Adam(model.parameters(), lr=0.001)criterion = nn.CrossEntropyLoss()# 将模型移动到选定的设备上model = model.to(device)# 复制模型权重用于后续更新最佳模型best_model_wts = copy.deepcopy(model.state_dict())best_acc = 0.0  # 初始化最佳准确度# 初始化用于记录训练和验证过程中损失和准确度的列表train_loss_all = []val_loss_all = []train_acc_all = []val_acc_all = []# 记录训练开始时间start_time = time.time()# 迭代指定的训练轮数for epoch in range(1, num_epochs + 1):# 记录每个epoch开始的时间since = time.time()# 打印分隔符和当前epoch信息print("-" * 10)print(f"Epoch: {epoch}/{num_epochs}")# 初始化训练和验证过程中的损失和正确预测数量train_loss = 0.0train_corrects = 0val_loss = 0.0val_corrects = 0# 初始化批次计数器train_num = 0val_num = 0# 创建训练进度条progress_train_bar = tqdm(total=len(train_dataloader), desc=f'Training {epoch}', unit='batch')# 训练数据集的遍历for step, (b_x, b_y) in enumerate(train_dataloader):# 将数据移动到相应的设备上b_x = b_x.to(device)b_y = b_y.to(device)# 训练模型model.train()# 前向传播output = model(b_x)# 计算预测标签pre_label = torch.argmax(output, dim=1)# 计算损失loss = criterion(output, b_y)# 清空梯度optimizer.zero_grad()# 反向传播loss.backward()# 更新权重optimizer.step()# 累加损失和正确预测数量train_loss += loss.item() * b_x.size(0)train_corrects += torch.sum(pre_label == b_y.data)# 更新批次计数器train_num += b_x.size(0)# 更新训练进度条progress_train_bar.update(1)# 关闭训练进度条progress_train_bar.close()# 创建验证进度条progress_val_bar = tqdm(total=len(val_dataloader), desc=f'Validation {epoch}', unit='batch')# 验证数据集的遍历for step, (b_x, b_y) in enumerate(val_dataloader):# 将数据移动到相应的设备上b_x = b_x.to(device)b_y = b_y.to(device)# 评估模型model.eval()# 前向传播output = model(b_x)# 计算预测标签pre_label = torch.argmax(output, dim=1)# 计算损失loss = criterion(output, b_y)# 累加损失和正确预测数量val_loss += loss.item() * b_x.size(0)val_corrects += torch.sum(pre_label == b_y.data)# 更新批次计数器val_num += b_x.size(0)# 更新验证进度条progress_val_bar.update(1)# 关闭验证进度条progress_val_bar.close()# 计算并记录epoch的平均损失和准确度train_loss_all.append(train_loss / train_num)train_acc_all.append(train_corrects.double().item() / train_num)val_loss_all.append(val_loss / val_num)val_acc_all.append(val_corrects.double().item() / val_num)# 打印训练和验证的损失与准确度print(f'{epoch} Train Loss: {train_loss_all[-1]:.4f} Train Acc: {train_acc_all[-1]:.4f}')print(f'{epoch} Val Loss: {val_loss_all[-1]:.4f} Val Acc: {val_acc_all[-1]:.4f}')# 计算并打印epoch训练耗费的时间time_use = time.time() - sinceprint(f'第 {epoch} 个 epoch 训练耗费时间: {time_use // 60:.0f}m {time_use % 60:.0f}s')# 若当前epoch的验证准确度为最佳，则更新最佳模型权重if val_acc_all[-1] > best_acc:best_acc = val_acc_all[-1]best_model_wts = copy.deepcopy(model.state_dict())# 训练结束，保存最佳模型权重torch.save(best_model_wts, 'D:/Pycharm/deepl/LeNet/weight/best_model.pth')# 如果当前epoch为总epoch数，则保存最终模型权重if epoch == num_epochs:torch.save(model.state_dict(), f'D:/Pycharm/deepl/LeNet/weight/{num_epochs}_model.pth')# 将训练过程中的统计数据整理成DataFrametrain_process = pd.DataFrame(data={"epoch": range(1, num_epochs + 1),"train_loss_all": train_loss_all,"val_loss_all": val_loss_all,"train_acc_all": train_acc_all,"val_acc_all": val_acc_all})# 打印总训练时间consume_time = time.time() - start_timeprint(f'总耗时：{consume_time // 60:.0f}m {consume_time % 60:.0f}s')# 返回包含训练过程统计数据的DataFramereturn train_process# 定义绘制训练和验证过程中损失与准确度的函数
def matplot_acc_loss(train_process):# 创建图形和子图plt.figure(figsize=(12, 4))# 绘制训练和验证损失plt.subplot(1, 2, 1)plt.plot(train_process["epoch"], train_process["train_loss_all"], 'ro-', label="train_loss")plt.plot(train_process["epoch"], train_process["val_loss_all"], 'bs-', label="val_loss")plt.legend()plt.xlabel("epoch")plt.ylabel("loss")# 保存损失图像plt.savefig('./result_picture/training_loss_accuracy.png', bbox_inches='tight')# 绘制训练和验证准确度plt.subplot(1, 2, 2)plt.plot(train_process["epoch"], train_process["train_acc_all"], 'ro-', label="train_acc")plt.plot(train_process["epoch"], train_process["val_acc_all"], 'bs-', label="val_acc")plt.legend()plt.xlabel("epoch")plt.ylabel("accuracy")# 保存准确率曲线图plt.savefig('./result_picture/training_accuracy.png', bbox_inches='tight')plt.show()if __name__ == "__main__":model = LeNet()train_dataloader, val_dataloader = train_val_data_process()train_process = train_model_process(model, train_dataloader, val_dataloader, num_epochs=20)matplot_acc_loss(train_process)

四、model_test.py

import torch
import torch.utils.data as Data
from torchvision import transforms
from torchvision.datasets import FashionMNIST
from model import LeNet
from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt
# t代表testdef t_data_process():test_data = FashionMNIST(root="./data",train=False,transform=transforms.Compose([transforms.Resize(size=28), transforms.ToTensor()]),download=True)test_dataloader = Data.DataLoader(dataset=test_data,batch_size=1,shuffle=True,num_workers=0)return test_dataloaderdef t_model_process(model, test_dataloader):if model is not None:print('Successfully loaded the model.')device = "cuda" if torch.cuda.is_available() else "cpu"model = model.to(device)# 初始化参数test_corrects = 0.0test_num = 0all_preds = []  # 存储所有预测标签all_labels = []  # 存储所有实际标签# 只进行前向传播，不计算梯度with torch.no_grad():for test_x, test_y in test_dataloader:test_x = test_x.to(device)test_y = test_y.to(device)# 设置模型为验证模式model.eval()# 前向传播得到一个batch的结果output = model(test_x)# 查找最大值对应的行标pre_lab = torch.argmax(output, dim=1)# 收集预测和实际标签all_preds.extend(pre_lab.tolist())all_labels.extend(test_y.tolist())# 计算准确率test_corrects += torch.sum(pre_lab == test_y.data)# 将所有的测试样本进行累加test_num += test_x.size(0)# 计算准确率test_acc = test_corrects.double().item() / test_numprint(f'测试的准确率：{test_acc}')# 绘制混淆矩阵conf_matrix = confusion_matrix(all_labels, all_preds)sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')plt.xlabel('Predicted labels')plt.ylabel('True labels')plt.title('Confusion Matrix')plt.show()plt.savefig('./result_picture/Confusion_Matrix.png', bbox_inches='tight')if __name__=="__main__":# 加载模型model = LeNet()print('loading model')# 加载权重model.load_state_dict(torch.load('D:/Pycharm/deepl/LeNet/weight/best_model.pth'))# 加载测试数据test_dataloader = t_data_process()# 加载模型测试的函数t_model_process(model,test_dataloader)device = "cuda" if torch.cuda.is_available() else "cpu"model = model.to(device)classes = ['T-shirt/top','Trouser','Pullover','Dress','coat','Sandal','Shirt','Sneaker','Bag','Ankle boot']with torch.no_grad():for b_x,b_y in test_dataloader:b_x = b_x.to(device)b_y = b_y.to(device)model.eval()output = model(b_x)pre_lab = torch.argmax(output,dim=1)result = pre_lab.item()label = b_y.item()print(f'预测值：{classes[result]}',"-----------",f'真实值：{classes[label]}')

卷积神经网络——LeNet——FashionMNIST

目录一、整体结构二、model.py三、model_train.py四、model_test.py GitHub地址一、整体结构二、model.py import torch from torch import nn from torchsummary import summaryclass LeNet(nn.Module):def __init__(self):super(LeNet,self).__init__()self.c1 nn.Conv…...

编程日记 2024/7/9 20:02:29

k8s-第十二节-DaemonSet

DaemonSet是什么？ DaemonSet 是一个确保全部或者某些节点上必须运行一个 Pod的工作负载资源（守护进程），当有node(节点)加入集群时，也会为他们新增一个 Pod。下面是常用的使用案例：可以用来部署以下进程的pod 集群守护进程，如Kured、node-problem-detector日志收集…...

编程日记 2024/7/9 19:59:27

Mysql-内置函数

一.什么是函数？ 函数是指一段可以直接被另外一段程序调用的程序或代码。 mysql内置了很多的函数,我们只需要调用即可。二.字符串函数 MySQL中内置了很多字符串函数: 三.根据需求完成以下SQL编写由于业务需求变更,企业员工的工号,统一为5位数,目前不足5位数的全…...

编程日记 2024/7/9 19:58:26

新浪API系列：支付API打造无缝支付体验，畅享便利生活（3）

在当今数字化时代，支付功能已经成为各类应用和平台的必备要素之一。作为开发者，要构建出安全、便捷的支付解决方案，新浪支付API是你不可或缺的利器。新浪支付API提供了全面而强大的接口和功能，帮助开发者轻松实现在线支付的集成和…...

编程日记 2024/7/9 19:57:25

终于弄明白了什么是EI！

EI是Engineering Index的缩写，中文意为“工程索引”，是由美国工程信息公司(Engineering Information, Inc.)编辑出版的著名检索工具。它始创于1884年，拥有超过一个世纪的历史，是全球工程界最权威的文献检索系统之一。EI虽然名为“…...

编程日记 2024/7/9 19:56:24

微信小程序常见页面跳转方式

1. wx.navigateTo() 保留当前页，跳转到不是 tabbar 的页面，会新增页面到页面栈。通过返回按钮或 wx.navigateBack()返回上一个页面。 2. wx.redirectTo() 跳转到不是 tabbar 的页面，替换当前页面。不能返回。 3. wx.switchTab() 跳转到 …...

编程日记 2024/7/9 19:55:23

Vim常用整理快捷键

一、光标跳转参数释义w下一行首字符e下一行尾字符0跳至行首$跳至行尾gg跳至文首5gg跳至第五行gd标记跳转到当前光标所在的变量的定义位置fn找当前行后的n字符，跳转到n字符位置二、修改类操作参数释义D删除光标之后的字符dd删除整行x删除当前字符yy复制一行p向…...

编程日记 2024/7/9 19:53:20

【docker 把系统盘空间耗没了！】windows11 更改 ubuntu 子系统存储位置

系统：win11 ubuntu 22 子系统，docker 出现问题：系统盘突然没空间了，一片红经过排查，发现 AppData\Local\packages\CanonicalGroupLimited.Ubuntu22.04LTS_79rhkp1fndgsc\ 这个文件夹竟然有 90GB 下面提供解决办法步…...

编程日记 2024/7/9 19:52:19

前端如何让网页页面完美适配不同大小和分辨率屏幕

推荐使用postcss插件，它会自动将项目所有的px单位统一转换为vw等单位（包括npm安装的第三方组件），从而实现适配，具体配置规则可参考官网或npm网站介绍。另外对于大屏的适配，需要缩放网页，可使用…...

编程日记 2024/7/9 19:51:17

gitlab-runner安装部署CI/CD

手动安装卸载旧版： gitlab-runner --version gitlab-runner stop yum remove gitlab-runner下载gitlab对应版本的runner # https://docs.gitlab.com/runner/install/bleeding-edge.html#download-any-other-tagged-releasecurl -L --output /usr/bin/gitlab-run…...

编程日记 2024/7/9 19:50:16

数据分析案例-2024 年全电动汽车数据集可视化分析

🤵‍♂️ 个人主页：艾派森的个人主页 ✍🏻作者简介：Python学习者 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话， 欢迎评论 💬点赞&#x1f4…...

编程日记 2024/7/9 19:49:15

H桥驱动器芯片详解

H桥驱动器芯片详解上一篇文章讲解了H桥驱动器的控制原理，本文以汽车行业广泛应用的DRV8245芯片为例，详细讲解基于集成电路的H桥驱动器芯片。 1.概述 DRV824x-Q1系列器件是德州仪器（TI）的一款专为汽车应用设计的全集成H桥驱动器…...

编程日记 2024/7/9 19:48:14

哪个充电宝口碑比较好？怎么选充电宝？2024年口碑优秀充电宝推荐

在如今快节奏的生活中，充电宝已然成为我们日常生活中的必备品。然而，市场上充电宝品牌众多，质量参差不齐，如何选择一款安全、可靠且口碑优秀的充电宝成为了消费者关注的焦点。安全性能不仅关系到充电宝的使用寿命，更关…...

编程日记 2024/7/9 19:46:12

Memcached 介绍与详解及在Java Spring Boot项目中的使用与集成

Memcached 介绍 Memcached 是一种高性能的分布式内存对象缓存系统，主要用于加速动态Web应用以减少数据库负载，从而提高访问速度和性能。作为一个开源项目，Memcached 被广泛应用于许多大型互联网公司，如Facebook、Twitter 和 YouT…...

编程日记 2024/7/9 19:45:11

淮北在选择SCADA系统时，哪些因素会影响其稳定性？

关键字:LP-SCADA系统, 传感器可视化, 设备可视化, 独立SPC系统, 智能仪表系统,SPC可视化,独立SPC系统在选择SCADA系统时，稳定性是一个关键因素，因为它直接影响到生产过程的连续性和安全性。以下是一些影响SCADA系统稳定性的因素： 硬件质量…...

编程日记 2024/7/9 19:44:09

Linux: 命令行参数和环境变量究竟是什么？

Linux: 命令行参数和环境变量究竟是什么？ 一、命令行参数1.1 main函数参数意义1.2 命令行参数概念1.3 命令行参数实例二、环境变量2.1 环境变量概念2.2 环境变量：PATH2.2.1 如何查看PATH中的内容2.2.2 如何让自己的可执行文件不带路径运行 2.3 环境变量…...

编程日记 2024/7/9 19:42:07

数学系C++ 类与对象 STL（九）

目录目录面向对象：py，c艹，Java都是,但c是面向过程特征： 对象内敛成员函数【是啥】： 构造函数和析构函数构造函数复制构造函数/拷贝构造函数： 【……】实参与形参的传递方式：值…...

编程日记 2024/7/9 19:41:06

CSS技巧专栏：一日一例 2.纯CSS实现多彩边框按钮特效

大家好，今天是 CSS技巧一日一例专栏的第二篇《纯CSS实现多彩边框按钮特效》先看图：开工前的准备工作正如昨日所讲，为了案例的表现，也处于书写的习惯，在今天的案例开工前，先把昨天的准备工作重做一遍。清除浏览器的默认样式定义页面基本颜色设定body的样式清除butt…...

编程日记 2024/7/9 19:40:05

JCEF 在idea 开发 java 应用

JCEF（Java Chromium Embedded Framework）是一个Java库，用于在Java应用程序中嵌入Chromium浏览器引擎。如果您想在IDEA开发环境中使用JCEF，您可以按照以下步骤进行操作： 1. 下载JCEF库文件：您可以从JCEF的官…...

编程日记 2024/7/9 19:39:04

绝区伍--2024年AI发展路线图

2024 年将是人工智能具有里程碑意义的一年。随着新模式、融资轮次和进步以惊人的速度出现，很难跟上人工智能世界发生的一切。让我们深入了解 2024 年可能定义人工智能的关键事件、产品发布、研究突破和趋势。 2024 年第一季度 2024 年第一季度将推出一些主要车型并…...

编程日记 2024/7/9 19:35:01

从桁架到螺栓：HM-3420在汽车后桥装配中的实战应用

HM-3420螺栓连接技术在汽车后桥装配中的创新实践汽车后桥作为承载车身重量与传递动力的关键部件，其结构强度直接关系到整车安全性能。在传统装配工艺中，桁架连接往往面临应力集中、疲劳寿命不足等挑战。HM-3420螺栓连接系统的出现，为这一领域…...

编程新知 2026/3/28 6:40:48

利用ADS实现多频段阻抗自动优化的实战指南

1. 从零开始理解多频段阻抗匹配刚入行那会儿，我对阻抗匹配的理解还停留在"把50欧姆搞对就行"的层面。直到某次调试一个同时工作在900MHz和2.4GHz的双频天线时，才发现单频段匹配的思路完全不够用——调好了低频段，高频段性能就崩了…...

编程新知 2026/3/28 5:54:12

别再死磕ECharts了！试试这个Vue关系图谱插件relation-graph，上手快效果好

从ECharts到relation-graph：Vue关系图谱开发的效率革命如果你正在使用Vue开发需要展示复杂关系网络的应用，可能已经尝试过ECharts的关系图功能。但当你需要更专业的交互体验、更直观的数据表达时，relation-graph这个专为Vue设计的关系图谱插…...

编程新知 2026/3/28 5:36:05

Gemma-3-12B-IT WebUI部署：支持HTTPS反向代理与Nginx负载均衡配置

Gemma-3-12B-IT WebUI部署：支持HTTPS反向代理与Nginx负载均衡配置 1. 项目概述如果你正在寻找一个性能强大、易于部署，并且能通过Web界面直接对话的开源大模型，那么Gemma-3-12B-IT绝对值得关注。这个由Google开发的120亿参数模型&#xff…...

编程新知 2026/3/28 4:58:19

如何用Python零依赖快速获取百度搜索结果？python-baidusearch深度解析

如何用Python零依赖快速获取百度搜索结果？python-baidusearch深度解析【免费下载链接】python-baidusearch 自己手写的百度搜索接口的封装，pip安装，支持命令行执行。Baidu Search unofficial API for Python with no external dependencies …...

编程新知 2026/3/28 4:40:02

OpenClaw权限管理：Qwen3-VL:30B飞书助手分级控制方案

OpenClaw权限管理：Qwen3-VL:30B飞书助手分级控制方案 1. 为什么需要权限管理当我第一次在团队内部署OpenClaw飞书助手时，很快就遇到了一个现实问题：不同部门的同事对AI助手的操作需求差异巨大。财务组需要处理报销单据识别，研发…...

编程新知 2026/3/28 4:21:59

脉冲雷达系统仿真：从理论建模到Matlab代码实现

1. 脉冲雷达系统仿真入门指南第一次接触雷达系统仿真时，我和大多数初学者一样，面对满屏的数学公式和专业术语完全摸不着头脑。直到把实验室那台老式示波器玩坏了三次之后，我才真正理解脉冲雷达仿真的核心逻辑——它本质上就是在计算机里搭建…...

编程新知 2026/3/28 2:12:27

2026年必看：专业婚恋软件推荐，找到真爱不迷路

在当今快节奏的社会中，越来越多的高知青年面临着交友难、脱单难的问题。传统的社交方式往往难以满足他们对高质量伴侣的需求，而专业的婚恋软件则成为他们寻找真爱的重要途径。本文将重点推荐一款备受好评的婚恋软件——即恋App，并结合具体数据…...

编程新知 2026/3/28 1:48:04

Simulink Simscape传感模块实战指南：从基础到高级应用

1. Simscape传感模块基础入门第一次接触Simulink Simscape的传感模块时，我完全被那些复杂的参数搞晕了。后来才发现，这些模块其实就是物理系统的"眼睛"和"耳朵"，专门用来捕捉机械系统中的各种运动状态和力学特性。举个生…...

编程新知 2026/3/28 1:01:35

【AI+教育】告别“硬啃”长文，它把文档直接变成你的专属视频课

在这个信息大爆炸的时代，我们最不缺的就是资料：网盘里屯满的行业报告、收藏了却从未打开的学术论文、买来盖泡面的大部头教材……知识就在那里，但“学进去”实在太难了。秘塔推出的“今天学点啥”，就是为了解决这个痛点而生的。它的核心逻辑非常简单粗暴：你把看不进去的文…...

编程新知 2026/3/28 0:09:20

目录

一、整体结构

二、model.py

三、model_train.py

四、model_test.py

相关文章：