当前位置：首页 > news >正文

动手学深度学习（2）-3.5 图像分类数据集

news 2025/7/9 12:51:19

文章目录

- 引言
- 正文
- - 图像分类数据集
  - - 主要包介绍
    - 主要流程
    - 具体代码
    - 练习
- 总结

引言

这里主要是看一下如何加载数据集，并且生成批次训练的数据。
最大的收获是，知道了如何在训练阶段提高模型训练的性能
- 增加batch_size
- 增加num_worker
- 数据预加载

正文

图像分类数据集

主要包介绍

这个模块主要是将如何加载数据集，并且生成一个迭代器，每一次访问都会俺批次生成数据。
具体应用到以下几个功能：
- torchvision.datasets:获取数据集
  - 这个包拥有很多用于计算机视觉处理的功能，这个包主要有一些公开常用的计算机的视觉数据集，比如说mnist还有fashion-mnist等。
  - 这个包中的数据集可以直接被dataloader调用，会方便很多
  - dataset这个类还可以被继承实现，制作自己的dataset类
- transforms：
  - 图像预处理还有数据增强功能专用包，可以单独使用，也可以多个功能按照顺序进行组合compose,作为一个预处理函数。
- utils.data.DataLoader
  - 自动批量加载或训练数据的功能

主要流程

在加载数据集时，需要按照如下流程进行处理：
- 制定数据预处理的环节，并组合为完整的流程
  - 使用transform实现图片的剪裁还有重置大小等基本预处理操作
  - 将所有操作进行组合
- 获取数据集，并转为dataset类
  - 继承或者直接使用torchvision.dataset类
- 生成批量获取数据集dataloader加载生活器
  - 生成DataLoader实例
- 逐批次验证数据集

具体代码

def load_data_fashion_mnist(batch_size, resize=None):  #@save"""下载Fashion-MNIST数据集，然后将其加载到内存中"""trans = [transforms.ToTensor()]if resize:trans.insert(0, transforms.Resize(resize))trans = transforms.Compose(trans)mnist_train = torchvision.datasets.FashionMNIST(root="../data", train=True, transform=trans, download=True)mnist_test = torchvision.datasets.FashionMNIST(root="../data", train=False, transform=trans, download=True)return (data.DataLoader(mnist_train, batch_size, shuffle=True,num_workers=get_dataloader_workers()),data.DataLoader(mnist_test, batch_size, shuffle=False,num_workers=get_dataloader_workers()))# 逐批次遍历数据
train_iter, test_iter = load_data_fashion_mnist(32, resize=64)
for X, y in train_iter:print(X.shape, X.dtype, y.shape, y.dtype)break

练习

问题一

在加载训练参数的过程中，影响模型的性能的参数有哪些？
- batch_size：表示加载到内存中的数据量，越大，所需要的内存越多，反之亦然。
- DataLoader(num_workers = ?) :表示用于加载数据的线程数，线程越多，加载的越快，同样的需要的内存越多。

问题二

pytorch中的数据迭代器的性能非常重要，有哪些方式可以改进它？
- DataLoader 的 persistent_workers 参数：
  - 控制在每一个训练epoch后不需要关闭或者重启数据加载工作的进程
  - persistent_worker = True
- 使用数据预取Prefetching
  - GPU在执行任务的同时，CPU可以预先加载下一批数据
- num_wokrer
  - 提高加载数据的进程数量，提高运算效率
- pin_memory加速数据传输
  - pin_memory = True
  - 加速数据从CPU到GPU的过程

pytorch提供的其他的数据集

图像分类数据集

CIFAR-10/CIFAR-100: 包含 10 类（CIFAR-10）或 100 类（CIFAR-100）的小图像。
MNIST: 手写数字数据集。
Fashion-MNIST: 与 MNIST 类似，但用于衣物分类。
ImageNet: 一个大规模的图像分类数据集。
SVHN (Street View House Numbers): 用于数字识别的街景房号数据集。

目标检测和分割数据集

COCO (Common Objects in Context): 用于多种视觉任务，包括目标检测、图像分割和标注。
VOC (Pascal Visual Object Classes): 包括图像分类、目标检测和图像分割任务。
Cityscapes: 用于城市场景理解，包括语义分割和实例分割。

其他

CelebA: 用于面部属性识别的大规模人脸属性数据集。
STL-10: 用于自我监督学习和图像分类的数据集。
Omniglot: 包含多种语言的字符，用于一次学习和其他语言任务。
EMNIST: 扩展的 MNIST 数据集，包括字母和数字。

总结

很多的东西，还是要自己系统地了解一下，不然很多东西都不了解，现在知道了。继续弄吧，这都是欠下的技术债。

动手学深度学习（2）-3.5 图像分类数据集

文章目录引言正文图像分类数据集主要包介绍主要流程具体代码练习总结引言这里主要是看一下如何加载数据集，并且生成批次训练的数据。最大的收获是，知道了如何在训练阶段提高模型训练的性能增加batch_size增加num_worker数据预加载正文图像分类…...

编程日记 2023/9/7 0:04:15

C标准输入与标准输出——stdin,stdout

🔗 《C语言趣味教程》👈 猛戳订阅！！！ —— 热门专栏《维生素C语言》的重制版 —— 💭 写在前面：这是一套 C 语言趣味教学专栏，目前正在火热连载中，欢迎猛戳订阅&#…...

编程日记 2023/9/7 0:03:11

目录 1、查看查看磁盘使用情况2、扩容思路3、卸载并删除/home4、扩大/root逻辑卷5、扩大/文件系统6、重建/home逻辑卷7、创建/home文件系统8、将新建的文件系统挂载到/home目录下9、恢复/home并删除备份10、再次查看看磁盘存储系统：centos7.9 1、查看查看磁盘使用…...

编程日记 2023/9/7 0:02:10

Ceph PG Peering数据修复

ceph数据修复当PG完成了Peering过程后，处于Active状态的PG就可以对外提供服务了。如果该PG的各个副本上有不一致的对象，就需要进行修复。 Ceph的修复过程有两种：Recovery和Backfill。 Recovery是仅依据PG日志中的缺失记录来修复不一致的对…...

编程日记 2023/9/7 0:01:09

服务器上使用screen和linux的基本操作

临时换源 pip install torch1.7.1 -i https://pypi.tuna.tsinghua.edu.cn/simple some-package pip install torch1.7.1 -i http://pypi.douban.com/simple some-package临时清华源和豆瓣源配环境的一点小问题我们尽量是去配置能满足代码的环境，而不要想着修改…...

编程日记 2023/9/7 0:00:04

Kafka3.0.0版本——文件存储机制

这里写木目录标题一、Topic 数据的存储机制1.1、Topic 数据的存储机制的概述1.2、Topic 数据的存储机制的图解1.3、Topic 数据的存储机制的文件解释二、Topic数据的存储位置示例一、Topic 数据的存储机制 1.1、Topic 数据的存储机制的概述 Topic是逻辑上的概念&#xff0c…...

编程日记 2023/9/6 23:59:02

Linux如何安装MySQL

Linux安装MySQL5.7 1、下载官网下载地址：http://dev.mysql.com/downloads/mysql/ 2、复制下面几个文件 3、检查当前系统是否安装过mysql、检查当前mysql依赖环境、检查/tmp文件夹权限 1）检查当前系统是否安装过mysql，执行安装命令前&am…...

编程日记 2023/9/6 23:58:01

确保网络的安全技术介绍

防火墙技术防火墙是隔离本地网络与外界网络的一道防御系统。通常用于内部局域网与外部广域网之间，通过限制外部网络用户以非法手段来访问内部资源，来达到保护内部网络的安全。根据安全规则，防火墙对任何外部网络访问内部网络的行为进 …...

编程日记 2023/9/6 23:57:00

算法通关村第十九关——最小路径和

LeetCode64. 给定一个包含非负整数的 m n 网格 grid,请找出一条从左上角到右下角的路径，使得路径上的数字总和为最小。输入：grid[[1,3,1],[1,5,1],[4,2,1]] 输出：7 解释：因为路径1→3→1→1→1的总和最小。 public int minPath…...

编程日记 2023/9/6 23:54:57

Linux 访问进程地址空间函数 access_process_vm

文章目录一、源码解析二、Linux内核用途2.1 ptrace请求2.2 进程的命令行参考资料一、源码解析 /*** get_task_mm - acquire a reference to the tasks mm** Returns %NULL if the task has no mm. Checks PF_KTHREAD (meaning* this kernel workthread has transiently a…...

编程日记 2023/9/6 23:53:56

selenium 动态爬取页面使用教程以及使用案例

Selenium 介绍概述 Selenium是一款功能强大的自动化Web浏览器交互工具。它可以模拟真实用户在网页上的操作，例如点击、滚动、输入等等。Selenium可以爬取其他库难以爬取的网站，特别是那些需要登录或使用JavaScript的网站。Selenium可以自动地从Web页面…...

编程日记 2023/9/6 23:52:54

小程序中如何查看会员的积分和变更记录

积分是会员卡的一个重要功能，可以用于激励会员消费和提升用户粘性。在小程序中，商家可以方便地查看会员卡的积分和变更记录，以便更好地了解会员的消费行为和积分变动情况。下面将介绍如何在小程序中查看会员卡的积分和变更记录。 1. 找到指…...

编程日记 2023/9/6 23:51:54

音视频 ffmpeg命令直播拉流推流

直播拉流 ffplay rtmp://server/live/streamName ffmpeg -i rtmp://server/live/streamName -c copy dump.flv对于不是rtmp的协议 -c copy要谨慎使用直播推流 ffmpeg -re -i out.mp4 -c copy flvrtmp://server/live/streamName参数：-re,表示按时间戳读取文件参…...

编程日记 2023/9/6 23:50:52

Python钢筋混凝土结构计算.pdf-T001-混凝土强度设计值

以下是使用Python求解上述问题的完整代码： # 输入参数 f_ck 35 # 混凝土的特征抗压强度（单位：MPa） f_cd 25 # 混凝土的强度设计值（单位：MPa） # 求解安全系数 gamma_c f_ck / f_cd # …...

编程日记 2023/9/6 23:49:51

长风破浪会有时，直挂云帆济沧海！（工作室年会总结）

前言我也是有段时间没写过总结性的博客了。最近是很忙的，尤其是年会那两天，我甚至可以说这是我这辈子目前最忙的两天。但这段经历还是很值得我记录下来的，也是给后面有需要的人提供的一些建议。我个人也是第一次筹办这种大型些的活动&#x…...

编程日记 2023/9/6 23:48:49

（数字图像处理MATLAB+Python）第十一章图像描述与分析-第五、六节：边界描述和矩描述

文章目录一：边界描述（1）边界链码A：概述B：边界链码改进C：程序 （2）傅里叶描绘子A：概述B：程序二：矩描述（1）矩A：…...

编程日记 2023/9/6 23:47:47

Redis之bigkey问题解读

目录什么是bigkey？ bigkey引发的问题如何查找bigkey redis-cli --bigkeys MEMORY USAGE bigKey如何删除渐进式删除 unlink bigKey生产调优什么是bigkey？ bigkey简单来说就是存储本身的key值空间太大，或者hash，list&…...

编程日记 2023/9/6 23:46:45

ElementUI浅尝辄止27：Steps 步骤条

引导用户按照流程完成任务的分步导航条，可根据实际应用场景设定步骤，步骤不得少于 2 步。 1.如何使用？ 设置active属性，接受一个Number，表明步骤的 index，从 0 开始。需要定宽的步骤条时，设置s…...

编程日记 2023/9/6 23:45:44

React 18 迁移状态逻辑至 Reducer 中

参考文章迁移状态逻辑至 Reducer 中对于拥有许多状态更新逻辑的组件来说，过于分散的事件处理程序可能会令人不知所措。对于这种情况，可以将组件的所有状态更新逻辑整合到一个外部函数中，这个函数叫作 reducer。使用 reducer 整合状态逻…...

编程日记 2023/9/6 23:44:42

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

目录一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

编程新知 2025/6/15 19:07:20

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括：采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中，设置任务排序规则尤其重要，因为它让看板视觉上直观地体…...

编程新知 2025/7/7 16:20:25

相机Camera日志分析之三十一：高通Camx HAL十种流程基础分析关键字汇总（后续持续更新中）

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：有对最普通的场景进行各个日志注释讲解，但相机场景太多，日志差异也巨大。后面将展示各种场景下的日志。通过notepad++打开场景下的日志，通过下列分类关键字搜索，即可清晰的分析不同场景的相机运行流程差异…...

编程新知 2025/6/15 13:22:13

让回归模型不再被异常值“带跑偏“，MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中，损失函数的选择对模型性能具有决定性影响。均方误差（MSE）作为经典的损失函数，在处理干净数据时表现优异，但在面对包含异常值的噪声数据时，其对大误差的二次惩罚机制往往导致模型参数…...

编程新知 2025/7/8 4:19:56

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

前言： 最近在做行为检测相关的模型，用的是时空图卷积网络（STGCN），但原有kinetic-400数据集数据质量较低，需要进行细粒度的标注，同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...

编程新知 2025/7/7 8:22:46

AI+无人机如何守护濒危物种？YOLOv8实现95%精准识别

【导读】野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而，传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案，能够实现大范围覆盖并远程采集数据。尽管具备这些优势&#xf…...

编程新知 2025/7/2 1:37:28

uniapp手机号一键登录保姆级教程（包含前端和后端）

目录前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号（第三种）后台调用云函数获取手机号错误码常见问题前置条件手机安装有sim卡手机开启…...

编程新知 2025/7/9 6:58:16

GO协程(Goroutine)问题总结

在使用Go语言来编写代码时，遇到的一些问题总结一下 [参考文档]：https://www.topgoer.com/%E5%B9%B6%E5%8F%91%E7%BC%96%E7%A8%8B/goroutine.html 1. main()函数默认的Goroutine 场景再现： 今天在看到这个教程的时候，在自己的电…...

编程新知 2025/7/8 13:24:57