当前位置：首页 > article >正文

Python打卡训练营day40——2025.05.30

article 2026/4/28 9:58:46

知识点回顾：

彩色和灰度图片测试和训练的规范写法：封装在函数中
展平操作：除第一个维度batchsize外全部展平
dropout操作：训练阶段随机丢弃神经元，测试阶段eval模式关闭dropout
作业：仔细学习下测试和训练代码的逻辑，这是基础，这个代码框架后续会一直沿用，后续的重点慢慢就是转向模型定义阶段了。这个模型结构是一个简单的全连接神经网络，用于处理输入大小为 28×28（即 784 个特征）的数据，通常用于 MNIST 手写数字识别任务

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
import numpy as np# 设置中文字体支持
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题# 1. 数据预处理
transform = transforms.Compose([transforms.ToTensor(),  # 转换为张量并归一化到[0,1]transforms.Normalize((0.1307,), (0.3081,))  # MNIST数据集的均值和标准差])# 2. 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data',train=True,download=True,transform=transform)test_dataset = datasets.MNIST(root='./data',train=False,transform=transform)# 3. 创建数据加载器batch_size = 64  # 每批处理64个样本train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)# 4. 定义模型、损失函数和优化器class MLP(nn.Module):def __init__(self):super(MLP, self).__init__()self.flatten = nn.Flatten()  # 将28x28的图像展平为784维向量self.layer1 = nn.Linear(784, 128)  # 第一层：784个输入，128个神经元self.relu = nn.ReLU()  # 激活函数self.layer2 = nn.Linear(128, 10)  # 第二层：128个输入，10个输出（对应10个数字类别）def forward(self, x):x = self.flatten(x)  # 展平图像x = self.layer1(x)   # 第一层线性变换x = self.relu(x)     # 应用ReLU激活函数x = self.layer2(x)   # 第二层线性变换，输出logitsreturn x# 检查GPU是否可用device = torch.device("cuda" if torch.cuda.is_available() else "cpu")# 初始化模型model = MLP()model = model.to(device)  # 将模型移至GPU（如果可用）criterion = nn.CrossEntropyLoss()  # 交叉熵损失函数，适用于多分类问题optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam优化器# 5. 训练模型（记录每个 iteration 的损失）def train(model, train_loader, test_loader, criterion, optimizer, device, epochs):model.train()  # 设置为训练模式# 新增：记录每个 iteration 的损失all_iter_losses = []  # 存储所有 batch 的损失iter_indices = []     # 存储 iteration 序号（从1开始）for epoch in range(epochs):running_loss = 0.0correct = 0total = 0for batch_idx, (data, target) in enumerate(train_loader):data, target = data.to(device), target.to(device)  # 移至GPU(如果可用)optimizer.zero_grad()  # 梯度清零output = model(data)  # 前向传播loss = criterion(output, target)  # 计算损失loss.backward()  # 反向传播optimizer.step()  # 更新参数# 记录当前 iteration 的损失（注意：这里直接使用单 batch 损失，而非累加平均）iter_loss = loss.item()all_iter_losses.append(iter_loss)iter_indices.append(epoch * len(train_loader) + batch_idx + 1)  # iteration 序号从1开始# 统计准确率和损失（原逻辑保留，用于 epoch 级统计）running_loss += iter_loss_, predicted = output.max(1)total += target.size(0)correct += predicted.eq(target).sum().item()# 每100个批次打印一次训练信息（可选：同时打印单 batch 损失）if (batch_idx + 1) % 100 == 0:print(f'Epoch: {epoch+1}/{epochs} | Batch: {batch_idx+1}/{len(train_loader)} 'f'| 单Batch损失: {iter_loss:.4f} | 累计平均损失: {running_loss/(batch_idx+1):.4f}')# 原 epoch 级逻辑（测试、打印 epoch 结果）不变epoch_train_loss = running_loss / len(train_loader)epoch_train_acc = 100. * correct / totalepoch_test_loss, epoch_test_acc = test(model, test_loader, criterion, device)print(f'Epoch {epoch+1}/{epochs} 完成 | 训练准确率: {epoch_train_acc:.2f}% | 测试准确率: {epoch_test_acc:.2f}%')# 绘制所有 iteration 的损失曲线plot_iter_losses(all_iter_losses, iter_indices)# 保留原 epoch 级曲线（可选）# plot_metrics(train_losses, test_losses, train_accuracies, test_accuracies, epochs)return epoch_test_acc  # 返回最终测试准确率# 6. 测试模型def test(model, test_loader, criterion, device):model.eval()  # 设置为评估模式test_loss = 0correct = 0total = 0with torch.no_grad():  # 不计算梯度，节省内存和计算资源for data, target in test_loader:data, target = data.to(device), target.to(device)output = model(data)test_loss += criterion(output, target).item()_, predicted = output.max(1)total += target.size(0)correct += predicted.eq(target).sum().item()avg_loss = test_loss / len(test_loader)accuracy = 100. * correct / totalreturn avg_loss, accuracy  # 返回损失和准确率# 7.绘制每个 iteration 的损失曲线def plot_iter_losses(losses, indices):plt.figure(figsize=(10, 4))plt.plot(indices, losses, 'b-', alpha=0.7, label='Iteration Loss')plt.xlabel('Iteration（Batch序号）')plt.ylabel('损失值')plt.title('每个 Iteration 的训练损失')plt.legend()plt.grid(True)plt.tight_layout()plt.show()# 8. 执行训练和测试（设置 epochs=2 验证效果）epochs = 2  print("开始训练模型...")final_accuracy = train(model, train_loader, test_loader, criterion, optimizer, device, epochs)print(f"训练完成！最终测试准确率: {final_accuracy:.2f}%")

@浙大疏锦行

Python打卡训练营day40——2025.05.30

相关文章：

Python打卡训练营day40——2025.05.30

Java八股-数据类型转换有哪些？类型互转会有什么问题？为什么用bigDecimal 不用double ？自动装箱和拆箱？包装类？

redis未授权(CVE-2022-0543)

【运维实战】Linux 中su和sudo之间的区别以及如何配置sudo!

LevelDB、BoltDB 和 RocksDB区块链应用比较

c/c++的opencv图像金字塔缩放

PDF文件转换之输出指定页到新的 PDF 文件

浏览器之禁止打开控制台【F12】

进阶智能体实战九、图文需求分析助手（ChatGpt多模态版）（帮你生成模块划分+页面+表设计、状态机、工作流、ER模型）

GEARS以及与基础模型结合

SFINAE(替换并不是错误)机制详解详解

怎么用外网打开内网的网址？如在异地在家连接访问公司局域网办公网站

计算机网络 | 1.1 计算机网络概述思维导图

AI对软件工程的影响及未来发展路径分析报告

redis缓存与数据库协调读写机制设计

最悉心的指导教程——阿里云创建ECS实例教程+Vue+Django前后端的服务器部署（通过宝塔面板）

【Python】os模块

Syslog 全面介绍及在 C 语言中的应用

windows中Redis、MySQL 和 Elasticsearch启动并正确监听指定端口

Paimon远程文件系统连接机制解析

学者观察 | Web3.0的技术革新与挑战——北京理工大学教授沈蒙

pycharm终端遇不显示虚拟环境的问题

聊聊网络变压器的浪涌等级标准是怎样划分的呢？

2025年Google I/O大会上，谷歌展示了一系列旨在提升开发效率与Web体验的全新功能

ONLYOFFICE文档API：编辑器的品牌定制化

HTTP/HTTPS与SOCKS5三大代理IP协议，如何选择最佳协议？

远程调用 | OpenFeign+LoadBalanced的使用

NSSCTF [NISACTF 2022]ezheap

ADB推送文件到指定路径解析

【HarmonyOS Next之旅】DevEco Studio使用指南(二十七) -＞开发云函数