当前位置：首页 > news >正文

pytorch-多分类实战之手写数字识别

news 2026/2/8 18:56:45

1. 网络设计

输入是手写数字图片28x28，输出是10个分类0~9，有两个隐藏层，如下图所示：
在这里插入图片描述

2. 代码实现

2.1 网络代码

第一层将784降维到200，第二次使用200不降维，输出层200降维到10，每一层之后加一个激活函数relu，每一层都需要梯度信息所以requires_grad=True；
forward函数最后不要加softmax，因为后面CrossEntropyLoss中包含了softmax操作。
在这里插入图片描述

2.2 train

优化目标是w1、b1、w2、b2、w3、b3，使用SGD优化器，使用CrossEntropyLoss计算loss
在这里插入图片描述

3. 完整代码

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from    torchvision import datasets, transformsbatch_size=200
learning_rate=0.01
epochs=10train_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=True, download=True,transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=False, transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)w1, b1 = torch.randn(200, 784, requires_grad=True),\torch.zeros(200, requires_grad=True)
w2, b2 = torch.randn(200, 200, requires_grad=True),\torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\torch.zeros(10, requires_grad=True)# torch.nn.init.kaiming_normal_(w1)
# torch.nn.init.kaiming_normal_(w2)
# torch.nn.init.kaiming_normal_(w3)def forward(x):x = x@w1.t() + b1x = F.relu(x)x = x@w2.t() + b2x = F.relu(x)x = x@w3.t() + b3x = F.relu(x)return xoptimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
criteon = nn.CrossEntropyLoss()for epoch in range(epochs):for batch_idx, (data, target) in enumerate(train_loader):data = data.view(-1, 28*28)logits = forward(data)loss = criteon(logits, target)optimizer.zero_grad()loss.backward()# print(w1.grad.norm(), w2.grad.norm())optimizer.step()if batch_idx % 100 == 0:print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(epoch, batch_idx * len(data), len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.item()))test_loss = 0correct = 0for data, target in test_loader:data = data.view(-1, 28 * 28)logits = forward(data)test_loss += criteon(logits, target).item()pred = logits.data.max(1)[1]correct += pred.eq(target.data).sum()test_loss /= len(test_loader.dataset)print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(test_loss, correct, len(test_loader.dataset),100. * correct / len(test_loader.dataset)))

如下图：
未使用torch.nn.init.kaiming_normal_(w1)初始化参数的情况，可以看出Loss在2.302585后就不下降了。
在这里插入图片描述
如下图：使用了torch.nn.init.kaiming_normal_(w1)初始化参数的情况下，Loss下降还是比较快的。

因此使用好的初始化参数对网络的训练起到至关重要的作用

pytorch-多分类实战之手写数字识别

目录

1. 网络设计

2. 代码实现

2.1 网络代码

2.2 train

3. 完整代码

相关文章：

pytorch-多分类实战之手写数字识别

httpsok-快速申请谷歌SSL免费证书

LiveGBS流媒体平台GB/T28181功能-国标级联中如何自定义通道国标编号编辑通道编号保持唯一性

mysql 大表凌晨定时删除数据

ArcGIS和ArcGIS Pro快速加载ArcGIS历史影像World Imagery Wayback

数据仓库的—数据仓库的体系架构

【C/C++基础知识】const 关键字

Docker之数据卷和Dockerfile

pull拉取最新代码

工控 modbusTCP 报文

在Ubuntu服务器上快速安装一个redis并提供远程服务

玩机进阶教程------手机定制机定制系统解除系统安装软件限制的一些步骤解析

Bilstm双向长短期神经网络多输入单输出回归分析

ELK+Filebeat日志分析系统

flex吃干抹净

【单片机毕业设计8-基于stm32c8t6的RFID校园门禁系统】

uni-app web端使用getUserMedia，摄像头拍照

2024-简单点-观察者模式

STM32—DMA直接存储器访问详解

【JavaEE初阶系列】——网络编程 TCP客户端/服务器程序实现

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

浅谈 React Hooks

Prompt Tuning、P-Tuning、Prefix Tuning的区别

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动

解锁数据库简洁之道：FastAPI与SQLModel实战指南

五年级数学知识边界总结思考-下册

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

Linux --进程控制

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

莫兰迪高级灰总结计划简约商务通用PPT模版