当前位置: 首页 > article >正文

Fashion-MNIST实战:从数据加载到模型评估的完整流程

1. 为什么选择Fashion-MNIST作为入门项目如果你刚开始接触深度学习中的图像分类任务Fashion-MNIST绝对是最佳选择之一。这个数据集包含了10类时尚单品的灰度图片每张图片都是28x28像素大小。相比经典的MNIST手写数字数据集Fashion-MNIST的分类难度稍高但数据量依然控制在合理范围训练集6万张测试集1万张普通笔记本电脑也能轻松处理。我第一次用这个数据集时最直观的感受就是它既保留了MNIST的简洁特性又增加了真实世界物品的分类挑战。比如区分衬衫和T恤就比区分数字1和7困难得多这对初学者理解模型的实际表现很有帮助。另一个优势是数据集已经做好了标准化的标注省去了自己收集和标注数据的麻烦。提示虽然现在很多模型在MNIST上能达到99%以上的准确率但Fashion-MNIST上70%-90%的准确率更为常见这让我们更容易观察不同模型架构和训练技巧的效果差异。2. 环境准备与数据加载2.1 安装必要的工具包在开始之前我们需要准备好Python环境和必要的库。推荐使用Anaconda创建虚拟环境然后安装以下包conda create -n fashion-mnist python3.8 conda activate fashion-mnist pip install torch torchvision matplotlib这里我建议固定torchvision版本因为不同版本的预处理方式可能有细微差别。我在实际项目中遇到过因为版本更新导致的数据归一化不一致问题pip install torchvision0.10.02.2 下载并探索数据集使用torchvision加载数据非常简单几行代码就能完成import torch from torchvision import datasets, transforms transform transforms.ToTensor() train_data datasets.FashionMNIST( root./data, trainTrue, downloadTrue, transformtransform ) test_data datasets.FashionMNIST( root./data, trainFalse, downloadTrue, transformtransform )第一次运行时会自动下载数据集到指定目录约60MB。下载完成后我们可以检查数据的结构和内容print(f训练集样本数: {len(train_data)}) print(f测试集样本数: {len(test_data)}) print(f单张图片形状: {train_data[0][0].shape}) # 输出示例 # 训练集样本数: 60000 # 测试集样本数: 10000 # 单张图片形状: torch.Size([1, 28, 28])3. 数据预处理与可视化3.1 理解数据格式Fashion-MNIST中的图片都是单通道灰度图经过ToTensor转换后像素值范围从0-255压缩到0.0-1.0数据维度变为(C, H, W)格式通道×高度×宽度数据类型转换为torch.float32我们可以可视化几个样本看看import matplotlib.pyplot as plt labels_map { 0: T-shirt, 1: Trouser, 2: Pullover, 3: Dress, 4: Coat, 5: Sandal, 6: Shirt, 7: Sneaker, 8: Bag, 9: Ankle boot } figure plt.figure(figsize(8, 8)) for i in range(9): img, label train_data[i] ax figure.add_subplot(3, 3, i1) ax.set_title(labels_map[label]) ax.axis(off) plt.imshow(img.squeeze(), cmapgray) plt.show()3.2 构建数据加载器直接使用整个数据集训练效率很低我们需要创建DataLoader进行批量处理from torch.utils.data import DataLoader batch_size 64 train_loader DataLoader(train_data, batch_sizebatch_size, shuffleTrue) test_loader DataLoader(test_data, batch_sizebatch_size, shuffleFalse)这里有几个实用技巧训练集建议设置shuffleTrue打乱顺序避免模型学习到数据顺序测试集保持shuffleFalse便于结果分析batch_size根据显存大小调整普通笔记本建议32-128之间4. 构建卷积神经网络模型4.1 基础CNN架构设计针对28x28的小尺寸图像我们可以设计一个轻量级CNNimport torch.nn as nn import torch.nn.functional as F class FashionCNN(nn.Module): def __init__(self): super().__init__() self.conv1 nn.Conv2d(1, 32, 3, padding1) self.pool nn.MaxPool2d(2, 2) self.conv2 nn.Conv2d(32, 64, 3, padding1) self.fc1 nn.Linear(64*7*7, 128) self.fc2 nn.Linear(128, 10) def forward(self, x): x self.pool(F.relu(self.conv1(x))) x self.pool(F.relu(self.conv2(x))) x x.view(-1, 64*7*7) x F.relu(self.fc1(x)) x self.fc2(x) return x model FashionCNN()这个架构的特点是两层3x3卷积每层后接ReLU激活和2x2最大池化最终展平后接两个全连接层参数量约20万非常适合快速实验4.2 模型训练与验证准备好损失函数和优化器后就可以开始训练import torch.optim as optim criterion nn.CrossEntropyLoss() optimizer optim.Adam(model.parameters(), lr0.001) epochs 10 for epoch in range(epochs): model.train() running_loss 0.0 for images, labels in train_loader: optimizer.zero_grad() outputs model(images) loss criterion(outputs, labels) loss.backward() optimizer.step() running_loss loss.item() # 每个epoch结束后验证 model.eval() correct 0 total 0 with torch.no_grad(): for images, labels in test_loader: outputs model(images) _, predicted torch.max(outputs.data, 1) total labels.size(0) correct (predicted labels).sum().item() print(fEpoch {epoch1}, Loss: {running_loss/len(train_loader):.3f}, fTest Acc: {100*correct/total:.2f}%)训练过程中有几个关键点需要注意每个batch前要执行optimizer.zero_grad()清空梯度训练和验证模式要用model.train()和model.eval()切换验证时要用torch.no_grad()禁用梯度计算5. 模型评估与改进5.1 基础模型表现分析完成10个epoch训练后基础CNN通常能达到88%-90%的测试准确率。我们可以进一步分析错误样本from sklearn.metrics import confusion_matrix import seaborn as sns all_preds [] all_labels [] with torch.no_grad(): for images, labels in test_loader: outputs model(images) _, preds torch.max(outputs, 1) all_preds.extend(preds.numpy()) all_labels.extend(labels.numpy()) cm confusion_matrix(all_labels, all_preds) plt.figure(figsize(10,8)) sns.heatmap(cm, annotTrue, fmtd, cmapBlues, xticklabelslabels_map.values(), yticklabelslabels_map.values()) plt.xlabel(Predicted) plt.ylabel(Actual) plt.show()常见的混淆情况包括衬衫被误分类为T恤或套衫套衫与外套容易混淆凉鞋和运动鞋有时分错5.2 模型优化技巧基于基础模型我们可以尝试以下改进数据增强增加随机旋转、水平翻转等变换train_transform transforms.Compose([ transforms.RandomHorizontalFlip(), transforms.RandomRotation(10), transforms.ToTensor() ])学习率调度使用ReduceLROnPlateau动态调整学习率scheduler optim.lr_scheduler.ReduceLROnPlateau( optimizer, modemax, factor0.5, patience2 )正则化在全连接层添加Dropoutself.dropout nn.Dropout(0.5) x self.dropout(F.relu(self.fc1(x)))更深的网络尝试ResNet等更复杂架构from torchvision import models model models.resnet18(pretrainedFalse) model.conv1 nn.Conv2d(1, 64, kernel_size7, stride2, padding3, biasFalse)经过这些优化模型准确率通常能提升2-5个百分点。但要注意避免过拟合可以通过早停法Early Stopping来控制训练轮数。

相关文章:

Fashion-MNIST实战:从数据加载到模型评估的完整流程

1. 为什么选择Fashion-MNIST作为入门项目 如果你刚开始接触深度学习中的图像分类任务,Fashion-MNIST绝对是最佳选择之一。这个数据集包含了10类时尚单品的灰度图片,每张图片都是28x28像素大小。相比经典的MNIST手写数字数据集,Fashion-MNIST的…...

自动驾驶感知工程师的‘第三只眼’:深入聊聊LiDAR点云与法线在障碍物识别中的那些事儿

自动驾驶感知工程师的‘第三只眼’:深入聊聊LiDAR点云与法线在障碍物识别中的那些事儿 在自动驾驶系统的感知模块中,LiDAR点云数据如同工程师的"第三只眼",为车辆提供了毫米级精度的三维环境感知能力。然而,原始点云数据…...

数字赋能睡眠”成睡眠日新热点,觅睡方新品发布会引领睡眠科技新风向

...

黑客的“瑞士军刀”:用 Python 玩转渗透测试与安全自动化

Python 在网络安全领域扮演着极其重要的角色——它语法简洁、生态丰富,能快速将想法转化为工具。无论是渗透测试、漏洞研究、安全自动化,还是逆向工程与取证,Python 都是安全从业者的“瑞士军刀”。下面我将从应用领域、常用库、学习路径和实…...

Arduino Mega四路电机驱动库:20kHz PWM与电流反馈实现

1. 项目概述DualVNH5019MotorShieldMod3 是一款专为 Arduino Mega 平台设计的双电机驱动扩展库,用于同时控制两块 Pololu Dual VNH5019 电机驱动扩展板(Shield),从而实现对四路有刷直流电机的独立、高精度驱动与状态监控。该库并非…...

EtherCAT与PROFINET协议转换实战:GW-PN-ECATM网关在欧姆龙伺服系统中的应用案例

EtherCAT与PROFINET协议转换实战:GW-PN-ECATM网关在欧姆龙伺服系统中的应用案例 工业自动化领域正经历着通信协议多样化的挑战。不同厂商的设备往往采用专属的实时以太网协议,比如西门子主导的PROFINET和倍福主导的EtherCAT。这种碎片化现状给系统集成带…...

GD32F470驱动MS1100 VOC传感器硬件与ADC设计

1. MS1100 VOC气体传感器硬件与驱动设计详解半导体气体传感器在室内空气质量监测领域具有不可替代的地位。MS1100(常以CJMCU-1100模块形式流通)是一款面向消费级应用的VOC(挥发性有机化合物)检测器件,专为甲醛、苯、甲…...

避坑指南:达梦数据库ARM版在麒麟系统安装时必做的5项系统配置(附权限管理最佳实践)

达梦数据库ARM版在麒麟系统部署的5个关键系统配置与权限管理实战 第一次在麒麟系统上部署达梦数据库ARM版时,我踩遍了所有能想到的坑——从莫名其妙的"Too many open files"报错,到因权限混乱导致的数据文件无法访问。这些看似简单的系统配置问…...

Unity Addressables远程内容避坑指南:从CDN配置到缓存清理的实战全记录

Unity Addressables远程内容避坑指南:从CDN配置到缓存清理的实战全记录 在游戏开发中,资源管理一直是影响项目质量和开发效率的关键因素。Unity Addressables系统为资源管理提供了强大的解决方案,特别是其远程内容分发功能,允许开…...

Keil4 STC15浮点运算翻车实录:如何用强制类型转换拯救你的计算结果

Keil4 STC15浮点运算避坑指南:强制类型转换的实战技巧 最近在调试STC15芯片的项目时,遇到了一个让人抓狂的问题——明明代码逻辑没问题,但浮点运算结果却总是莫名其妙出错。作为一个在嵌入式领域摸爬滚打多年的老工程师,我不得不承…...

乙巳马年·皇城大门春联生成终端W教育应用:辅助中文与文学作业批改与创意启发

乙巳马年皇城大门春联生成终端在教育中的应用:辅助中文与文学作业批改与创意启发 最近和几位做语文老师的朋友聊天,他们都在感慨一件事:批改学生的对联、诗词创作作业,实在是太费神了。不仅要看平仄对不对、对仗工不工整&#xf…...

MATLAB实战:用BEMD算法给图像做‘CT扫描‘(附完整代码)

MATLAB实战:BEMD算法在医学影像分析中的创新应用 医学影像分析领域正经历着从传统方法到自适应算法的范式转变。当我们面对CT、MRI等复杂图像时,如何有效提取多层次特征成为诊断和治疗的关键。二维经验模态分解(BEMD)算法因其独特的自适应特性&#xff0…...

HW防火墙实战:如何用FW五元组抓包精准定位网络延迟(附CLI+Web配置)

HW防火墙实战:五元组抓包技术精准定位网络延迟的终极指南 当电商大促期间API响应突然飙升至3秒,当视频会议卡顿到只剩PPT画质,当核心业务系统频繁报错——这些场景背后,往往隐藏着网络延迟的幽灵。作为运维工程师,我们…...

从‘素模’到‘高仿’:我是如何用Blender和PS给Tianbot Mini小车激光雷达‘化妆’并跑进Gazebo的

从‘素模’到‘高仿’:Blender与PS联袂打造Gazebo仿真视觉盛宴 第一次在Gazebo中加载Tianbot Mini的激光雷达模型时,那种"塑料玩具"般的质感让我瞬间理解了为什么专业团队要花重金做3D视觉设计。作为RoboMaster参赛队的后勤技术支持&#xff0…...

Transformer目标跟踪实战:从ViT到DiffusionTrack的保姆级代码解析

Transformer目标跟踪实战:从ViT到DiffusionTrack的保姆级代码解析 1. 目标跟踪技术演进与Transformer革命 计算机视觉领域的目标跟踪技术近年来经历了从传统相关滤波到深度学习,再到Transformer架构的范式转变。2020年ViT(Vision Transformer…...

你的Emby媒体库还缺个‘新闻官’?手把手教你用TMDB API和Telegram Bot丰富推送卡片信息

打造专业级Emby媒体资讯频道:TMDB API与Telegram Bot深度整合指南 每次打开Emby Server,是否总觉得那些千篇一律的推送信息缺少了些专业感?想象一下,当你的媒体库新增一部电影时,订阅者收到的不是简陋的文字通知&#…...

Word论文党必看:MathType公式编号从指定章节开始的终极解决方案

Word论文排版进阶:MathType公式编号从指定章节开始的实战指南 在撰写学术论文时,公式编号的规范性往往成为困扰研究者的细节痛点。特别是当论文结构要求从中间章节开始编号时(比如前三章没有公式,第四章才开始出现(4.1)编号&#…...

破解NCM加密:让你的音乐自由播放的终极指南

破解NCM加密:让你的音乐自由播放的终极指南 【免费下载链接】ncmppGui 一个使用C编写的转换ncm文件的GUI工具 项目地址: https://gitcode.com/gh_mirrors/nc/ncmppGui 你是否曾经历过这样的沮丧:精心收藏的网易云音乐歌曲,却被限制在特…...

AHT20温湿度传感器嵌入式I²C驱动实现详解

1. AHT20温湿度传感器模块技术解析与嵌入式驱动实现1.1 模块概述与工程定位AHT20是一款高精度、低功耗的数字温湿度传感器,由奥松电子(Aosong)设计生产,广泛应用于环境监测、智能楼宇、农业物联网及消费类电子设备中。该模块采用单…...

鸿蒙DS工具无线调试避坑指南:手把手教你解决‘连接被拒绝‘问题

鸿蒙DS工具无线调试避坑指南:手把手教你解决连接被拒绝问题 无线调试作为现代开发流程中的重要环节,能显著提升开发效率。对于鸿蒙开发者而言,掌握DS工具的无线调试技巧尤为重要。本文将深入解析无线调试中常见的"连接被拒绝"错误&…...

用Docker容器玩转ROCm源码编译:隔离环境下的HIP开发套件构建指南

用Docker容器玩转ROCm源码编译:隔离环境下的HIP开发套件构建指南 在AI框架开发领域,频繁切换不同版本的ROCm环境进行测试和开发是家常便饭。传统直接在宿主机上安装多版本ROCm不仅容易导致环境污染,还可能引发驱动冲突等问题。本文将介绍如何…...

MATLAB GUI界面设计与图像处理的奇妙融合

MATLAB gui界面设计 MATLAB图像处理 gui界面开发 傅立叶变换,灰度图,二值化,直方图均衡,高通滤波器,低通滤波器,巴特沃斯滤波器,噪声处理,边缘检测在图像处理的领域中,MA…...

从BRDF到MIS:一篇讲透游戏引擎中的现代光线采样技术

从BRDF到MIS:游戏引擎中的现代光线采样实战指南 当你在Unity中拖拽一个点光源靠近粗糙墙面时,是否注意到噪点突然增多?或是Unreal里金属材质在动态光源下出现闪烁?这些现象背后,隐藏着实时渲染领域最核心的采样策略博弈…...

Harmonyos应用实例172:杠杆原理与反比例关系

应用实例二:杠杆原理与反比例关系 知识点:第二十六章《反比例函数》—— 实际问题与反比例函数。 功能:模拟物理杠杆实验 F⋅L=WF \cdot L = WF⋅L=...

车载诊断架构 --- 公钥注入异常 DTC 设计逻辑

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 对抗焦虑的几点人生建议,第一,放下"应该"的执念。社会对每个年龄段都有一套"应该":25岁该稳定,30岁该成家,35岁该高管…但…...

LDO设计避雷手册:基于SMIC 0.18μm工艺的5个仿真翻车案例

LDO设计避雷手册:基于SMIC 0.18μm工艺的5个仿真翻车案例 在模拟IC设计领域,低压差线性稳压器(LDO)的设计看似简单,实则暗藏玄机。特别是当设计从理论计算转向实际仿真时,各种意想不到的问题会接踵而至。本…...

【UE5】从蓝图接口到后期处理:构建沉浸式拾取交互系统

1. 从零搭建UE5拾取交互系统 第一次在UE5里做拾取功能时,我对着闪烁的物体高亮效果兴奋了半天。这种沉浸式交互体验看似简单,背后却需要蓝图接口、通道检测和后期处理材质的精密配合。今天我们就用面包店模拟器的案例,手把手实现从物品检测到…...

【开题答辩全过程】以 基于Android的服装搭配APP为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…...

比话降AI的售后有多靠谱?真实退款经历分享

比话降AI的售后有多靠谱?真实退款经历分享 写这篇文章不是为了给比话打广告。是因为我在找降AI工具的过程中踩了不少坑,最后在比话这里的体验确实让我觉得值得记录一下。特别是关于售后这块——大部分人选降AI工具只看价格和效果,但等到出了问…...

Ai-WB2-01S双模模块在GD32F470上的AT驱动移植

1. Ai-WB2-01S 模块技术解析与 GD32F470 平台驱动移植实践1.1 模块定位与核心特性Ai-WB2-01S 是安信可科技推出的一款高度集成的双模无线通信模块,其核心价值在于将 Wi-Fi 与 Bluetooth Low Energy(BLE)功能封装于单一封装内,通过…...