当前位置：首页 > news >正文

Pytorch学习笔记#2: 搭建神经网络训练MNIST手写数字数据集

news 2026/2/9 6:39:25

学习自https://pytorch.org/tutorials/beginner/basics/quickstart_tutorial.html

导入并预处理数据集

pytorch中数据导入和预处理主要用torch.utils.data.DataLoader 和 torch.utils.data.Dataset
Dataset 存储样本及其相应的标签，DataLoader在数据上生成一个可迭代对象(Dataset stores the samples and their corresponding labels, and DataLoader wraps an iterable around the Dataset.)

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor# Download training data from open datasets.
training_data = datasets.FashionMNIST(root="data",train=True,download=True,transform=ToTensor(),
)# Download test data from open datasets.
test_data = datasets.FashionMNIST(root="data",train=False,download=True,transform=ToTensor(),
)

将数据集作为参数传递给 DataLoader。这在我们的数据集上包装了一个可迭代对象，并支持自动批处理、采样、混洗和多进程数据加载。并且每一个batch大小为64。

batch_size = 64# Create data loaders.
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size=batch_size)for X, y in test_dataloader:print(f"Shape of X [N, C, H, W]: {X.shape}")print(f"Shape of y: {y.shape} {y.dtype}")break

搭建神经网络

MNIST手写数字数据集的图片是2828的，所以第一层的输入为2828。
因为识别结果是0~9这10种，所以最后一层的输出就是10个。

我们需要定义神经网络结构，这部分在__init__(self)部分实现。
且我们需要forward部分定义网络正向传播的方法。

class NeuralNetwork(nn.Module):def __init__(self):super().__init__()self.flatten = nn.Flatten()self.linear_relu_stack = nn.Sequential(nn.Linear(28 * 28, 512),nn.ReLU(),nn.Linear(512, 512),nn.ReLU(),nn.Linear(512, 10))def forward(self, x):x = self.flatten(x)logits = self.linear_relu_stack(x)return logitsmodel = NeuralNetwork().to(device)
print(model)

训练模型

首先，我们需要先定义损失函数和优化器（优化梯度下降算法）

loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3) # lr为学习率

在一次循环中，神经网络通过forward进行预测（我们写的forward函数），然后再利用预测误差。通过反向传播来进行梯度下降（pytorch帮我们实现）。

def train(dataloader, model, loss_fn, optimizer):size = len(dataloader.dataset)model.train()for batch, (X, y) in enumerate(dataloader):X, y = X.to(device), y.to(device)# Compute prediction errorpred = model(X)loss = loss_fn(pred, y)# Backpropagationoptimizer.zero_grad()loss.backward()optimizer.step()if batch % 100 == 0:loss, current = loss.item(), (batch + 1) * len(X)print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")

def test(dataloader, model, loss_fn):size = len(dataloader.dataset)num_batches = len(dataloader)model.eval()test_loss, correct = 0, 0with torch.no_grad():for X, y in dataloader:X, y = X.to(device), y.to(device)pred = model(X)test_loss += loss_fn(pred, y).item()correct += (pred.argmax(1) == y).type(torch.float).sum().item()test_loss /= num_batchescorrect /= sizeprint(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

开始训练！

epochs = 5
for t in range(epochs):print(f"Epoch {t+1}\n-------------------------------")train(train_dataloader, model, loss_fn, optimizer)test(test_dataloader, model, loss_fn)
print("Done!")

在这里插入图片描述

Pytorch学习笔记#2: 搭建神经网络训练MNIST手写数字数据集

学习自https://pytorch.org/tutorials/beginner/basics/quickstart_tutorial.html 导入并预处理数据集 pytorch中数据导入和预处理主要用torch.utils.data.DataLoader 和 torch.utils.data.Dataset Dataset 存储样本及其相应的标签，DataLoader在数据上生成一个可迭…...

编程日记 2023/5/11 17:58:21

C语言猜名次、猜凶手、杨辉三角题目详解

猜名次题目：5位运动员参加了10米台跳水比赛，有人让他们预测比赛结果：A选手说：B第二，我第三；B选手说：我第二，E第四；C选手说：我第一，D第二&#xff…...

编程日记 2023/5/11 17:58:18

蚁群算法负荷预测

%% 清空环境变量 clc clear close all format compact %% 网络结构建立 %% 清空环境变量 clc clear close all format compact %% 网络结构建立 %读取数据 dataxlsread(天气_电量_数据.xlsx,C12:J70);%前7列为每个时刻的发电量最后列为天气 for i1:58 input(i,:)[data…...

编程日记 2023/5/11 17:58:09

ubuntu添加系统服务实现开机root权限运行

需求开机自动运行程序(或脚本)，需要以root权限运行但不输入密码，也不能将密码写入文件。环境 Ubuntu 20.04 解决方案添加系统服务，然后通过systemctl控制。操作步骤假设目标程序为/home/xxx/test 1、创建service配置文件 [Unit…...

编程日记 2023/5/11 17:58:05

【阅读笔记】你不知道的Javascript--类与类型委托3

目录类一些常见原理混入行为委托委托理论类与对象更妙的设计与语法类型冷门关键词typeof 防范机制值原生函数访问内部属性类一些常见原理在继承或者实例化时，JavaScript 的对象机制并不会自动执行复制行为； 多态：JS 中的多态&#xff0c…...

编程日记 2023/5/10 19:48:49

文件服务设计

一、需求背景文件的上传、下载功能是软件系统常见的功能，包括上传文件、下载文件、查看文件等。例如：电商系统中需要上传商品的图片、广告视频，办公系统中上传附件，社交类系统中上传用户头像等等。文件上传下载大致流程为&#…...

编程日记 2023/5/11 17:58:02

【批处理脚本】-1.22-字符串界定符号 ““

"><--点击返回「批处理BAT从入门到精通」总目录--> 共3页精讲（列举了所有字符串界定符号 ""的用法，图文并茂，通俗易懂）在从事“嵌入式软件开发”和“Autosar工具开发软件”过程中，经常会在其集成开发环境IDE（CodeWarrior，S32K DS，Davinci，…...

编程日记 2023/5/11 17:57:57

【Flutter·学习实践·UI篇】基础且重要的UI知识

前言参考学习官网：《Flutter实战第二版》学习前先记住：Flutter 中万物皆为Widget，心中默念3次以上铭记于心。这一点和开发语言Dart的变量一切皆是对象的概念，相互对应。 Widget 在前面的介绍中，我们知道在Flutt…...

编程日记 2023/5/11 17:57:54

【OpenCV】车牌自动识别算法的设计与实现

写目录一. 🦁 设计任务说明1.1 主要设计内容1.1.1 设计并实现车牌自动识别算法，基本功能要求1.1.2 参考资料1.1.3 参考界面布局1.2 开发该系统软件环境及使用的技术说明1.3 开发计划二. 🦁 系统设计2.1 功能分析2.1.1 车辆图像获取2.1.2 车牌…...

编程日记 2023/5/11 17:51:14

SpringBoot发送邮件

目录1. 获取授权码2. jar包引入3. 配置application4. 代码实现1. 获取授权码以126邮箱为例，点开设置，选择POP3/SMTP/IMAP 开启POP3/SMTP服务，新增授权密码扫码二维码，发送要求的短信内容到指定的号码即可，然后会返回…...

编程日记 2023/5/11 17:51:10

BigInteger类和BigDecimal类的简单介绍

文章目录📖前言：🎀BigInteger类和BigDecimal类的由来🎀BigDecimal类的优点🎀BigDecimal类容易引发的错误🏅处理方法📖前言： 本篇博客主要介绍BigInteger类和BigDecimal类的用途及常…...

编程日记 2023/5/11 17:51:06

mysql五种索引类型---实操版本

背景最近学习了Mysql的索引，索引对于Mysql的高效运行是非常重要的，正确的使用索引可以大大的提高MySql的检索速度。通过索引可以大大的提升查询的速度。不过也会带来一些问题。比如会降低更新表的速度（因为不但要把保存数据还要保存一下索引…...

编程日记 2023/5/11 17:51:02

【微信小程序】-- 页面导航 -- 编程式导航（二十三）

💌 所属专栏：【微信小程序开发教程】 😀 作者：我是夜阑的狗🐶 🚀 个人简介：一个正在努力学技术的CV工程师，专注基础和实战分享 ，欢迎咨询！ &…...

编程日记 2023/5/11 17:50:57

路由追踪工具 traceroute 使用技巧

路由追踪工具 traceroute 使用技巧路由追踪工作原理路由追踪实例1. 如何运行 traceroute2. 禁用 IP 地址和主机名映射3. 配置回复等待时间4. 配置每一跳的查询次数5. 配置 TTL 值我想知道一个数据包从出发地到目的地所遵循的路由，即所有转发实体（中间的路…...

编程日记 2023/5/11 17:50:52

NGINX学习笔记 - 一篇了解NGINX的基本概念(一)

NGINX是什么？ NGINX是一款由俄罗斯人伊戈尔赛索耶夫使用C语言开发的、支持热部署的、轻量级的WEB服务器/反向代理服务器/电子邮件代理服务器，因为占用内存较少，启动极快，高并发能力强，所以在互联网项目中广泛应用。可…...

编程日记 2023/5/12 7:23:12

Spring-Cloud-Gateway的过滤器的执行顺序问题

过滤器的种类 Spring-Cloud-Gateway中提供了3种类型的过滤器，分别是：路由过滤器、Default过滤器和Global过滤器。路由过滤器和Default过滤器路由过滤器和Default过滤器本质上是同一种过滤器，只不过作用范围不一样，路由过滤器…...

编程日记 2023/5/11 17:50:47

Android性能优化的底层逻辑

前言性能优化仿佛成了每个程序员开发的必经之路，要想出人头地，与众不同，你还真需要下点功夫去研究Android的性能优化，比如说，从优化应用启动、UI加载、再到内存、CPU、GPU、IO、还有耗电等等，当你展开一个方…...

编程日记 2023/5/14 5:15:24

Gradle+SpringBoot多模块开发

关于使用Gradle结合SpringBoot进行多模块开发。本来是打算使用buildSrc之类的，但是感觉好像好麻烦，使用这种方法就可以实现，没必要采用其他的。我不怎么会表述，可能写的跟粑粑一样，哈哈哈哈这是我的项目地址。存在…...

编程日记 2023/5/11 8:18:48

Qt 之 emit、signals、slot的使用

本文福利，莬费领取Qt开发学习资料包、技术视频，内容包括（C语言基础，Qt编程入门，QT信号与槽机制，QT界面开发-图像绘制，QT网络，QT数据库编程，QT项目实战，QSS&am…...

编程日记 2023/5/11 11:01:59

每日学术速递3.6

Subjects: cs.CV 1.Multi-Source Soft Pseudo-Label Learning with Domain Similarity-based Weighting for Semantic Segmentation 标题：用于语义分割的基于域相似性加权的多源软伪标签学习作者：Shigemichi Matsuzaki, Hiroaki Masuzawa, Jun Miura …...

编程日记 2023/5/11 8:18:24

rknn优化教程（二）

文章目录 1. 前述2. 三方库的封装2.1 xrepo中的库2.2 xrepo之外的库2.2.1 opencv2.2.2 rknnrt2.2.3 spdlog 3. rknn_engine库 1. 前述 OK，开始写第二篇的内容了。这篇博客主要能写一下： 如何给一些三方库按照xmake方式进行封装，供调用如何按…...

编程新知 2025/6/11 15:25:30

【Oracle APEX开发小技巧12】

有如下需求： 有一个问题反馈页面，要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据，方便管理员及时处理反馈。我的方法：直接将逻辑写在SQL中，这样可以直接在页面展示完整代码： SELECTSF.FE…...

编程新知 2026/2/7 17:35:15

大型活动交通拥堵治理的视觉算法应用

大型活动下智慧交通的视觉分析应用一、背景与挑战大型活动（如演唱会、马拉松赛事、高考中考等）期间，城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例，暖城商圈曾因观众集中离场导致周边…...

编程新知 2026/1/23 7:15:40

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括：采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中，设置任务排序规则尤其重要，因为它让看板视觉上直观地体…...

编程新知 2026/1/23 12:42:28

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2026/2/1 5:45:17

Linux云原生安全：零信任架构与机密计算

Linux云原生安全：零信任架构与机密计算构建坚不可摧的云原生防御体系引言：云原生安全的范式革命随着云原生技术的普及，安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测，到2025年，零信任架构将成为超…...

编程新知 2025/8/17 17:11:47

基于Docker Compose部署Java微服务项目

一. 创建根项目根项目（父项目）主要用于依赖管理一些需要注意的点： 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件，否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

编程新知 2026/2/5 3:09:56

MySQL 8.0 OCP 英文题库解析（十三）

Oracle 为庆祝 MySQL 30 周年，截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。从今天开始，将英文题库免费公布出来，并进行解析，帮助大家在一个月之内轻松通过OCP认证。本期公布试题111~120 试题1…...

编程新知 2026/1/31 7:25:57

Unit 1 深度强化学习简介

Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库，例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体，比如 SnowballFight、Huggy the Do…...

编程新知 2026/2/8 12:54:53

企业如何增强终端安全？

在数字化转型加速的今天，企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机，到工厂里的物联网设备、智能传感器，这些终端构成了企业与外部世界连接的 “神经末梢”。然而，随着远程办公的常态化和设备接入的爆炸式…...

编程新知 2026/1/29 9:14:58

导入并预处理数据集

搭建神经网络

训练模型

开始训练！

相关文章：