当前位置：首页 > news >正文

神经网络分类任务（手写数字识别）

news 2026/2/10 1:16:20

1.Mnist分类任务

网络基本构建与训练方法，常用函数解析
torch.nn.functional模块
nn.Module模块

学习方法：边用边查，多打印，duo'gua

使用jupyter的优点，可以打印出每一个步骤。

2.读取数据集

自动下载

%matplotlib inline
#查看本机torch的版本
import torch
print(torch.__version__)#打印torch的版本

加载并读取数据集

from pathlib import Path
import requestsDATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).exists():content = requests.get(URL + FILENAME).content(PATH / FILENAME).open("wb").write(content)import pickle
import gzipwith gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

观察数据的结构

784是mnist数据集每个样本的像素点个数

print(x_train[0].shape)
print(x_train.shape)
y_train

显示一个记录的灰度图

from matplotlib import pyplot
import numpy as nppyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
print(x_train.shape)

numpy和torch的区别：
torch->gpu->tensor
numpy->cpu->ndarray

数据转化：

import torchx_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
x_train, x_train.shape, y_train.min(), y_train.max()
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())

3 torch.nn.functional 很多层和函数在这里都会见到

torch.nn.functional中有很多功能，后续会常用的。那什么时候使用nn.Module，什么时候使用nn.functional呢？一般情况下，如果模型有可学习的参数，最好用nn.Module，其他情nn.functional相对更简单一些

import torch.nn.functional as Floss_func = F.cross_entropydef model(xb):return xb.mm(weights) + biasbs = 64
xb = x_train[0:bs]  # a mini-batch from x
yb = y_train[0:bs]
weights = torch.randn([784, 10], dtype = torch.float,  requires_grad = True) 
#线性代数的相关知识，weights与输入想乘之后，需要输出的格式为10分类，所以的weights的矩阵为(784,10)
bs = 64
bias = torch.zeros(10, requires_grad=True)#偏执的设置，常数值作为初始化，因为这个东西对模型的影###响不是很大。print(loss_func(model(xb), yb))：#计算真实值和预测值之间的误差

4 创建一个model来更简化代码

必须继承nn.Module且在其构造函数中需调用nn.Module的构造函数
无需写反向传播函数，nn.Module能够利用autograd自动实现反向传播
Module中的可学习参数可以通过named_parameters()或者parameters()返回迭代器

from torch import nnclass Mnist_NN(nn.Module):def __init__(self):super().__init__()self.hidden1 = nn.Linear(784, 128)self.hidden2 = nn.Linear(128, 256)self.out  = nn.Linear(256, 10)#定义前向传播，torch有一个优点：前向传播自己定义，反向传播自动实现。def forward(self, x):x = F.relu(self.hidden1(x))x = F.relu(self.hidden2(x))x = self.out(x)return x

net = Mnist_NN()
print(net)

可以打印我们定义好名字里的权重和偏置项

for name, parameter in net.named_parameters():print(name, parameter,parameter.size())

5 使用TensorDataset和DataLoader来简化

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoadertrain_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True)#shuffle=True：洗牌的操作。
valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=bs * 2)def get_data(train_ds, valid_ds, bs):return (DataLoader(train_ds, batch_size=bs, shuffle=True),DataLoader(valid_ds, batch_size=bs * 2),)

一般在训练模型时加上model.train()，这样会正常使用Batch Normalization和 Dropout
测试的时候一般选择model.eval()，这样就不会使用Batch Normalization和 Dropout

神经网络分类任务（手写数字识别）

1.Mnist分类任务网络基本构建与训练方法，常用函数解析 torch.nn.functional模块 nn.Module模块学习方法：边用边查，多打印，duogua 使用jupyter的优点，可以打印出每一个步骤。 2.读取数据集自动下载 %matplotl…...

编程日记 2023/4/21 4:21:30

FCN网络(Fully Convolutional Networks)

首个端到端的针对像素级预测的全卷积网络原理：将图片进行多次卷积下采样得到chanel为21的特征层，再经过上采样得到和原图一样大的图片，最后经过softmax得到类别概率值将全连接层全部变成卷积层：通常的图像分类网络最后几层是全…...

编程日记 2023/4/21 4:16:52

随想录二刷Day15——二叉树

文章目录二叉树2. 递归遍历二叉树3. 二叉树的迭代遍历4. 二叉树的统一迭代法二叉树 2. 递归遍历二叉树 144. 二叉树的前序遍历 class Solution { public:vector<int> preorderTraversal(TreeNode* root) {vector<int> result;preorder(root, result);return res…...

编程日记 2023/4/21 4:16:49

docker-compose部署kafka服务时如何同时允许内外网访问？

背景最近在学习kafka相关知识，需要搭建自己的kafka环境。综合考虑后决定使用docker-compose来管理维护这个环境。 docker-compose.yml Bitnami的yml文件就很不错，这里直接拿来用了。 version: "2"services:zookeeper:image: docker.io/bi…...

编程日记 2023/4/21 4:16:46

数据结构刷题（二十）：17电话号码的字母组合、39组合总和、40组合总和II

一、电话号码的字母组合题目链接思路：回溯三部曲。确定回溯函数参数：题目中给的 digits，还要有一个参数就是int型的index（记录遍历第几个数字，就是用来遍历digits的，同时也代表了递归的深度）&am…...

编程日记 2023/4/21 4:16:44

Java面试总结（五）

sleep() 方法和 wait() 方法对比相同点两者都可以暂停线程的执行；两者都可以响应中断。不同点 sleep()方法不会释放锁，wait()方法会释放锁； sleep()方法主要用于暂停线程的执行，wait()方法主要用于线程之间的交互/通信&…...

编程日记 2023/4/21 4:16:42

三维人脸实践：基于Face3D的渲染、生成与重构＜二＞

face3d: Python tools for processing 3D face git code: https://github.com/yfeng95/face3d paper list: PaperWithCode 3DMM方法，基于平均人脸模型，可广泛用于基于关键点的人脸生成、位姿检测以及渲染等，能够快速实现人脸建模与渲染。推…...

编程日记 2023/4/21 4:16:39

在linux上部署Java项目

在Linux部署Java环境要是想要部署java web程序,首先要配置环境 jdk tomcat mysql 安装jdk 推荐的方法是使用yum直接安装openjdk(开源的,与官方的jdk功能差不多),目前使用的最多的就是jdk8系列 yum list | grep jdk 在源上搜索所有关于jdk的文件 devel表示development的意思…...

编程日记 2023/4/21 4:16:36

线性表的接口

线性表的实现方式顺序表顺序表是一种线性表的实现方式，它是用一组地址连续的存储单元依次存储线性表中的数据元素，使得逻辑上相邻的元素在物理上也相邻⁴。顺序表可以用数组来实现，它的优点是可以快速定位第几个元素，但是缺点…...

编程日记 2023/4/21 4:16:34

spark三种操作模式的不同点分析

通常情况下,由于mapreduce计算引擎的效率问题,大部分公司使用的基本都是hive数仓spark计算引擎的方式搭建集群,所以对于spark的三种操作方式来进行简单的分析。在日常开发中，使用最多的方式取决于具体的需求和场景。以下是每种方式的一些常见用途：Spark …...

编程日记 2023/4/21 4:16:31

Vue3做出B站【bilibili】 Vue3+TypeScript【快速入门一篇文章精通系列（一）前端项目案例】

本项目分为二部分 1、后台管理系统（用户管理，角色管理，视频管理等） 2、客户端（登录注册、发布视频） Vue3做出B站【bilibili】 Vue3TypeScript【快速入门一篇文章精通系列（一）前端项目…...

编程日记 2023/4/21 4:16:28

猜数游戏--课后程序(Python程序开发案例教程-黑马程序员编著-第3章-课后作业)

实例10：猜数游戏猜数游戏是一个古老的密码破译类、益智类小游戏，通常由两个人参与，一个人设置一个数字，一个人猜数字，当猜数字的人说出一个数字，由出数字的人告知是否猜中：若猜测的数字大于设…...

编程日记 2023/4/21 4:16:25

Nvidia jetson nano 部署yolov5_技术文档

Nvidia jetson nano 部署yolov5_技术文档每天一句小姜格言：我行，我不是一般人儿部署开始： 1、通过FileZilla，将window文件传输至jetson nano 上的nano文件夹下。 2、查看cuda 我买的jetson nano是带有配置好的镜像。系统配置…...

编程日记 2023/4/21 4:16:23

获取当前天数前N天先封装到js里面 export const isTime (val) > {// 1.获取当前时间年月日时分秒格式xxxx-xx-xx xx:xx:xxvar myDate new Date() // 当前时间var y myDate.getFullYear() // 当前年份四位数var m myDate.getMonth() 1 < 10? 0 (myDate.getMont…...

编程日记 2023/4/21 4:16:20

Linux---基本指令

专栏：Linux 个人主页：HaiFan. 基本指令ls 指令pwd命令cd 指令touch指令mkdir指令（重要）rmdir指令 && rm 指令（重要）man指令（重要）cp指令（重要）mv指令…...

编程日记 2023/4/21 4:16:17

【UE4 RTS游戏】02-摄像机运动_完成摄像机在X轴上运动的相关步骤

效果通过控制键盘WS键使得“CameraPawn”进行前后移动步骤将landscape的Z轴位置更改为0删除“PostProcessVolume”将“LightmassImportanceVolume”移入Lighting文件夹内新建一个蓝图类，父类是Pawn，命名为“CameraPawn”将“MyController”重命名为“Cam…...

编程日记 2023/4/18 1:19:16

Kubernetes学习（五）持久化存储

Volume 卷容器中的文件在磁盘上是临时存放的，这给容器中运行的特殊应用带来了一些问题。首先，当容器崩溃时，kubectl将重新启动容器，容器中的文件将会丢失--应为容器会以干净的状态重建。其次，当在一个Pod中运行多个容…...

编程日记 2023/4/18 1:19:15

下一个7年，保持期待、持续思考，酷雷曼继续向前！

过去7年，我们一直在思考， VR技术究竟能为我们的生活带来什么？ 是足不出户就能云游千里的秀美风光？ 是在家就能沉浸式体验线上消费的便利？ 还是为商企和用户搭建更快速的沟通桥梁？ NO.1、技术变革在信…...

编程日记 2023/4/18 1:19:13

天梯赛训练L1-010--L1-012

目录 1、L1-010 比较大小 2、L1-011 A-B 3、L1-012 计算指数 4，一些题外话 1、L1-010 比较大小分数 10 本题要求将输入的任意3个整数从小到大输出。输入格式： 输入在一行中给出3个整数，其间以空格分隔。输出格式： 在一…...

编程日记 2023/4/17 14:07:42

三分钟完成Stable Diffusion本地安装（零基础体验AI绘画）

三分钟完成Stable Diffusion本地安装前言安装步骤下载链接前言最近AI绘画很火，很多无编程基础的小伙伴也想体验一下，所以写这篇博客来帮助小伙伴们愉快的体验一下~废话少说，我们直接开整！ 安装步骤首先，下载本项目的…...

编程日记 2023/4/17 18:52:38

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2026/1/21 9:20:07

蓝桥杯 2024 15届国赛 A组儿童节快乐

P10576 [蓝桥杯 2024 国 A] 儿童节快乐题目描述五彩斑斓的气球在蓝天下悠然飘荡，轻快的音乐在耳边持续回荡，小朋友们手牵着手一同畅快欢笑。在这样一片安乐祥和的氛围下，六一来了。今天是六一儿童节，小蓝老师为了让大家在节…...

编程新知 2025/12/5 2:40:04

el-switch文字内置

el-switch文字内置效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

编程新知 2026/1/26 10:00:16

ios苹果系统，js 滑动屏幕、锚定无效

现象：window.addEventListener监听touch无效，划不动屏幕，但是代码逻辑都有执行到。 scrollIntoView也无效。原因：这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作，从而会影响…...

编程新知 2026/2/4 19:47:03

【学习笔记】深入理解Java虚拟机学习笔记——第4章虚拟机性能监控，故障处理工具

第2章虚拟机性能监控，故障处理工具 4.1 概述略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具命令：jps [options] [hostid] 功能：本地虚拟机进程显示进程ID（与ps相同），可同时显示主类&#x…...

编程新知 2026/1/15 1:34:10

Kafka入门-生产者

生产者生产者发送流程： 延迟时间为0ms时，也就意味着每当有数据就会直接发送异步发送API 异步发送和同步发送的不同在于：异步发送不需要等待结果，同步发送必须等待结果才能进行下一步发送。普通异步发送首先导入所需的k…...

编程新知 2026/1/26 4:49:33

站群服务器的应用场景都有哪些？

站群服务器主要是为了多个网站的托管和管理所设计的，可以通过集中管理和高效资源的分配，来支持多个独立的网站同时运行，让每一个网站都可以分配到独立的IP地址，避免出现IP关联的风险，用户还可以通过控制面板进行管理功…...

编程新知 2025/9/1 19:01:24

Git常用命令完全指南：从入门到精通

Git常用命令完全指南：从入门到精通一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...

编程新知 2025/10/3 0:40:01

第7篇：中间件全链路监控与 SQL 性能分析实践

7.1 章节导读在构建数据库中间件的过程中，可观测性和性能分析是保障系统稳定性与可维护性的核心能力。特别是在复杂分布式场景中，必须做到： 🔍 追踪每一条 SQL 的生命周期（从入口到数据库执行）&#…...

编程新知 2025/12/11 0:27:15

1.Mnist分类任务

2.读取数据集

3 torch.nn.functional 很多层和函数在这里都会见到

4 创建一个model来更简化代码

5 使用TensorDataset和DataLoader来简化

相关文章：