当前位置：首页 > news >正文

在pytorch中自定义dataset读取数据

news 2026/2/10 2:18:46

这篇是我对哔哩哔哩up主 @霹雳吧啦Wz 的视频的文字版学习笔记感谢他对知识的分享

有关我们数据读取预训练

以及如何将它打包成一个一个batch输入我们的网络的

首先我们来看一下之前我们在讲resnet网络时所使用的源码

我们去使用了官方实现的image folder去读取我们的图像数据

然后再使用官方提供的data loader去对我们读取的数据进行一个打包

大家有没有想过这个image folder它的内部到底实现了哪些功能呢

那么我们今天为什么要讲这个dataset呢

因为在之前我们讲分类网络时

有很多小伙伴私信问我

如果我的图片不是rgb图像

是灰度图像或者是雷达图像

深度图像等等

就是非rgb的图像时

我该如何去载入并预处理我的图像

那么如果你直接通过官方提供的这个方法呢

其实它是有一定的局限性的

而且比如如果你想去设计一个比较独特的网络

比如说你设计的网络

它有多个输入

那么这种情况呢官方所提供的这些方法都是无法满足你的需求的

所以本节课我们来讲一下如何去实现我们自己的一个data set

以及进一步去讲解我们的data loader是如何利用我们data set所生成的数据

打包成一批一批的数据输入网络的

那么本节课所讲的一个代码呢

我已经提前上传到我的github上了

在pytourh classification模块下的custom dataset这个文件夹当中

然后这三个文件呢就是我们今天主要要讲的内容了

那么这个内容呢也是我们在后面讲利用多gpu训练时

所使用到的一个数据读取

以及预处理的部分

那么我们接下来就进入到我们的代码当中

首先呢我们看一下我们的main这个脚本

首先呢我们这里所使用的数据集

还是我之前所说的划分类数据集

之前也有小伙伴在问我数据在哪下载呀

我该如何去划分训练集以及验证集

那么今天呢我在这里就详细地将整个流程仔细的讲一遍

并且呢我这里写了一个新的关于划分数据集的一个脚本

相比原来那个脚本呢使用起来会更加的方便

不需要再将训练集以及验证集单独划分到不同的文件夹当中了

首先呢如果你想使用之前我们所说的花分类数据集

那么大家可以自己去在这个链接当中去下载

下载完之后呢

你会得到一个点tgz的一个压缩文件

然后解压之后呢

我们可以看到都有个flower photos

在这个文件夹下呢主要有这五个子文件夹

每个文件夹呢它对应的一种花的类型

比如说我们看这个daisy

这个daisy呢它对应的就是雏菊

也就是说在这个文件夹下面的所有图片都是关于雏菊这个类别

那么我们下载完之后呢

我们这里的root这个变量就指向我们的flower photos

那么我这里就已经设置好了

就保存在我所给定的这个路径下

然后呢我们就进入到我们这个main函数

接下来呢我们就使用我们的read split data

这个方法来划分我们的训练集一验证集

那么这个方法呢我们只需要传入一个root这个参数就可以了

然后我们来仔细的看一下这个方法

进入这个方法之后呢

我们可以看到有两个参数

第一个是root

就是我们刚刚所说指向我们解压后的文件夹的路径

然后这个rate它是我们划分验证集所占所有样本的一个比例

我们这里将我们引入的random这个随机的这个包

设置一个随机种子设置为零

这里为什么要设计随机种子呢

就在于能够保证随机结果是可以复现的

也就是说只要我们将这个random的种子设置为零之后

无论是在你的电脑上

我的电脑上还是其他人电脑上

我们待会儿通过随机函数所随机划分的数据都是一模一样的

也就是都是可复现的

这样呢就能够保证大家划分的数据集都是一模一样的

然后接下来呢我们来判断一下我们所传入的这个路径

它是否存在

如果不存在

我们就会报出一个错误

接下来我们再通过os库的例子

第二来便利我们所给的那个路径下的所有的文件

那么它它变的文件呢可能就包含有文件夹以及我们普通的文件

然后这里呢我们就通过一个for循环来遍历它所编辑得到的

每一个文件夹或文件

接下来我们再判断

如果我们的这个路径它所对应的是个文件夹的话

那么我们就将它进行保存

如果不是文件夹的话

那我们就将它丢弃

那么这样我们得到的flower class就应该有五个值

初始化几个空列表

那么这里呢我再多说一句

我们这里为什么要使用PIL的image这个库

而不去使用open cv

因为在touch它所提供的这一系列预处理方法

其实它主要还是针对pl库所读入的images

比如我们随机看一个预处理方法

那么在他预处理方法的计划当中呢

他写的就是针对一个PIL的image进行一个处理的

然后这里我再多说一句

就是有时候我们在调试过程当中可能会遇到这种情况

就是我想看一下变量的一个信息

但是我设置断点之后

我们在debug这个信息当中呢

看到每个变量一直在显示正在载入数据

然后一直看不到

那么这个问题要怎么解决呢

那么这里呢大家可以点击这个file

然后在设置当中

然后在我们的build execution deployment

然后在这个地方呢大家可以勾选一下这个

然后再点ok

这样的话你在调试过程当中

每一个变量它的参数值就会很快的载入进来了

那么通过stack方法之后呢

它会增加一个新的维度

那么这个新维度是在dimension等于零的位置上

那么拼接之后我们可以来看一下我们所得到的shape

那接下来我们再将我们的labels也转化成tensor形式

因为刚在我们item的方法当中呢

我们通过transform方法将我们的image已经转换成tensor格式了

但我们label它并不是tender格式

所以这里我们要通过touch as tensor这个方法

我们label也转换成tensor

然后我们所得到的labels呢

它就是一个tensor变量了

然后我们再通过return

就可以将我们打包好的图片以及标签信息进行一个返回

那么接下来我们再停止我们的一个调试过程

我们再回到我们的main函数当中

那么这里我们讲了这么多

我说的这些到底是不是对的呢

我们接下来再通过我们所得到的这个train data loader

应该读取它的图片以及标签信息

看是否是正确的

那么这里我又实现了个plot data loader image这个方法

那我们来看一下这个方法

这个方法当中呢

首先我们获取一下我们这个data load的batchsize

然后我们这个json pass就指向我们刚刚生成的这个json文件

然后我们这里判断一下存存在

如果不存在就报错

然后我们再打开这个计算文件

然后载入它就得到了我们的一个字典

然后通过transport方法来调整它的一个通道顺序

原来通道顺序是channel

高度宽度

那么通过transpose之后

我们就还原成了高度宽度以及channel

然后在我们刚刚预处理过程当中呢

首先我们这个Totensor会将我们的数据范围从0~255

缩放到0~1之间

然后呢通过这个normalize这个方法

将我们数据rgb 个通道的数值分别减去这三个均值

然后再除以这三个标准差

得到我们标准化之后的数据

那么现在我们读入的数据就是标准化之后的数据

如果我们要绘制它呢

我们就需要将它转化回去

所以呢我们这里就对我们的rgb 通道首先乘以这三个数值

然后再加上这三个数值

然后再乘以255

我们就可以还原回原来的一个图像了

那么我们这里绘制的一个图像当中一共有1个行，plot number个列

我们这里呢由于我们刚刚进行了一系列操作之后呢

它是一个float类型

我们这里将它转化成一个int 类型然后再show

在pytorch中自定义dataset读取数据

这篇是我对哔哩哔哩up主霹雳吧啦Wz 的视频的文字版学习笔记感谢他对知识的分享有关我们数据读取预训练以及如何将它打包成一个一个batch输入我们的网络的首先我们来看一下之前我们在讲resnet网络时所使用的源码我们去使用了官方实现的image folder去读取我们的图像数据然…...

编程日记 2023/12/9 9:35:44

ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

1.关于稀疏卷积的解释：https://zhuanlan.zhihu.com/p/382365889 2. 答案： 在深度学习领域，尤其是计算机视觉任务中，遮蔽图像建模（Masked Image Modeling, MIM）是一种自监督学习策略，其基本思想…...

编程日记 2023/12/9 9:33:42

Java后端的登录、注册接口是怎么实现的

目录 Java后端的登录、注册接口是怎么实现的 Java后端的登录接口是怎么实现的 Java后端的注册接口怎么实现？ 如何防止SQL注入攻击？ Java后端的登录、注册接口是怎么实现的 Java后端的登录接口是怎么实现的 Java后端的登录接口的实现方式有很多种&a…...

编程日记 2023/12/9 9:32:41

TCP Keepalive 和 HTTP Keep-Aliv

HTTP的Keep-Alive 在http1.0的版本中，它是基于请求-应答模型和TCP协议的，也就是在建立TCP连接后，客户端发送一次请求并且接收到响应后，就会立马断开TCP连接，称为HTTP短连接，这种方式比较耗费时间以及浪费资…...

编程日记 2023/12/9 9:27:37

操作系统复习笔记

操作系统的目标和作用操作系统的目标 1.方便性 2.有效性 3.可扩展性 4.开放性操作系统的作用 1.OS作为用户与计算机硬件系统之间的接口 2.OS作为计算机系统资源的管理者 3.OS实现了对计算机系统资源的抽象推动操作系统发展的主要动力 1.不断提高计算机系统资源的…...

编程日记 2023/12/9 9:25:35

Java中实现单例模式的方式

1. 使用静态内部类实现单例模式在Java中，使用静态内部类实现单例模式是一种常见而又有效的方式。这种方式被称为“静态内部类单例模式”或者“Holder模式”。这种实现方式有以下优点： 懒加载（Lazy Initialization）：静…...

编程日记 2023/12/9 9:24:35

Vue3-01-创建项目

环境准备 1.需要用到 16.0 以及更高版本的 node.js 2.使用vscode编辑器进行项目开发可以在命令行中查看node的版本号: node -v创建项目 1.准备一个目录例如，我创建项目的时候是在该目录下进行的;D:\projectsTest\vue3project2.执行创建命令（*&#x…...

编程日记 2023/12/9 9:23:34

Go 语言中的反射机制

欢迎大家到我的博客浏览，更好的阅读体验请点击反射 | YinKais Blog 反射在大多数的应用和服务中并不常见，但是很多框架都依赖 Go 语言的反射机制简化代码。因为 Go 语言的语法元素很少、设计简单，所以它没有特别强的表达能…...

编程日记 2023/12/9 9:21:32

[leetcode 前缀和]

525. 连续数组 M :::details 给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组，并返回该子数组的长度。示例 1: 输入: nums [0,1] 输出: 2 说明: [0, 1] 是具有相同数量 0 和 1 的最长连续子数组。示例 2: 输入: nums [0,1,0] 输出: …...

编程日记 2023/12/9 9:20:31

Python与ArcGIS系列（十五）根据距离抓取字段

目录 0 简述1 实例需求2 arcpy开发脚本0 简述在处理gis数据的时候，会遇到这种需求：将一个图层与另一个图层中相近的要素进行字段赋值。本篇将介绍如何利用arcpy及arcgis的工具箱实现这个功能。 1 实例需求为了介绍这个功能的实现，我们需要有一个特定的功能需求。在这里选…...

编程日记 2023/12/9 9:17:29

YOLOv8分割训练及分割半自动标注

YOLOv8是基于目标检测算法YOLOv5的改进版，它在YOLOv5的基础上进行了优化和改进，加入了一些新的特性和技术，如切片注意力机制、骨干网络的选择等。本文以yolov8-seg为基准，主要整理分割训练流程及使用v8分割模型进行半自动标注的过程。一、v8-seg训练 1.1 环境配置 github…...

编程日记 2023/12/9 9:15:27

jsp页面通过class或者id获取a标签上的属性的值

要通过class和id两种方式获取a标签上的某个属性的值，或者给其赋值，可以使用JavaScript。以下是两种方法的示例： <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name&q…...

编程日记 2023/12/9 9:13:25

题目：美丽的区间（蓝桥OJ 1372）

题目描述： 解题思路： 采用双指针的快慢指针。图解可以采用前缀和，但会相较麻烦。题解： #include<bits/stdc.h> using namespace std;const int N 1e5 9; int a[N];// 因为是连续区间（连续区间&#xff1…...

编程日记 2023/12/9 9:08:22

解决：During handling of the above exception, another exception occurred

解决：During handling of the above exception, another exception occurred 文章目录解决：During handling of the above exception, another exception occurred背景报错问题报错翻译报错位置代码报错原因解决方法参考内容：今天的分享就到…...

编程日记 2023/12/9 9:07:20

计算机基础知识65

cookie和session的使用 # 概念：cookie 是客户端浏览器上的键值对 # 目的：为了做会话保持 # 来源：服务端写入的，服务端再返回的响应头中写入，浏览器会自动取出来存起来是以key value 形式，有过期时间、path…...

编程日记 2023/12/9 9:05:18

Python开发运维：Python垃圾回收机制

目录一、理论 1.Python垃圾回收机制一、理论 1.Python垃圾回收机制 （1）引⽤计数器 1）环状双向链表 refchain 在python程序中创建的任何对象都会放在refchain链表中。 name "david" age 20 hobby ["篮球",游泳…...

编程日记 2023/12/9 9:01:15

ros2/ros安装ros-dep||rosdep init错误

第一个错误的做法： sudo apt-get install python3-pip sudo pip3 install 6-rosdep sudo 6-rosdep 如果使用上述代码将会摧毁整个系统，不重装系统反正我是搞不定啊，因为我不知道那个写软件的人到底做了什么。因为这个我安装的版本是humble&…...

编程日记 2023/12/9 8:59:13

《深入理解计算机系统》学习笔记 - 第四课 - 机器级别的程序

Lecture 05 Machine Level Programming I Basics 机器级别的程序文章目录 Lecture 05 Machine Level Programming I Basics 机器级别的程序intel 处理器的历史和体系结构芯片的构成AMD 公司(Advanced Micro Devices，先进的微型设备) C, 汇编, 机器代码定义汇编/机器…...

编程日记 2023/12/9 8:53:08

云原生（Cloud Native）——概念，技术，背景，优缺点，实践例子

云原生（Cloud Native）是一种构建和运行应用程序的方法，这些应用程序充分利用云计算的优势。云原生应用程序通常设计为在现代、动态的环境中运行，如公共云、私有云和混合云。这种方法强调微服务架构、容器化、自动化、易于管理和可…...

编程日记 2023/12/9 8:48:03

ElasticSearch之线程池

ElasticSearch节点可用的CPU核的数量，通常可以交给ElasticSearch来自行检测和判定，另外可以在elasticsearch.yml中显式指定。样例如下： node.processors: 2如下表格中的processors即CPU核的数量。线程池的列表线程池名称类型线程数量队列…...

编程日记 2023/12/9 8:46:02

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/8/19 23:46:57

k8s从入门到放弃之Ingress七层负载

k8s从入门到放弃之Ingress七层负载在Kubernetes（简称K8s）中，Ingress是一个API对象，它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress，你可…...

编程新知 2025/9/7 0:12:53

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义，在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容，其实不管是方块还是方块实体，都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器，用于动态创…...

编程新知 2025/11/25 22:59:17

2025盘古石杯决赛【手机取证】

前言第三届盘古石杯国际电子数据取证大赛决赛最后一题没有解出来，实在找不到，希望有大佬教一下我。还有就会议时间，我感觉不是图片时间，因为在电脑看到是其他时间用老会议系统开的会。手机取证 1、分析鸿蒙手机检材&#x…...

编程新知 2026/1/29 17:12:17

12.找到字符串中所有字母异位词

🧠 题目解析题目描述： 给定两个字符串 s 和 p，找出 s 中所有 p 的字母异位词的起始索引。返回的答案以数组形式表示。字母异位词定义： 若两个字符串包含的字符种类和出现次数完全相同，顺序无所谓，则互为…...

编程新知 2026/1/31 12:52:29

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接：3403. 从盒子中找出字典序最大的字符串 I 代码如下： class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

编程新知 2025/10/31 5:18:02

文章目录 A 基础语言模型A.1 TransformerA.2 Bert B 大语言模型结构B.1 GPTB.2 LLamaB.3 ChatGLMB.4 Qwen C 大语言模型微调C.1 Fine-tuningC.2 Adapter-tuningC.3 Prefix-tuningC.4 P-tuningC.5 LoRA A 基础语言模型 A.1 Transformer （1）资源论文&a…...

编程新知 2026/1/23 11:58:06

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

编程新知 2026/1/25 13:33:35

快刀集(1): 一刀斩断视频片头广告

一刀流：用一个简单脚本，秒杀视频片头广告，还你清爽观影体验。 1. 引子作为一个爱生活、爱学习、爱收藏高清资源的老码农，平时写代码之余看看电影、补补片，是再正常不过的事。电影嘛，要沉浸，…...

编程新知 2026/1/8 0:40:27

iview框架主题色的应用

1.下载 less要使用3.0.0以下的版本 npm install less2.7.3 npm install less-loader4.0.52./src/config/theme.js文件 module.exports {yellow: {theme-color: #FDCE04},blue: {theme-color: #547CE7} }在sass中使用theme配置的颜色主题，无需引入，直接可…...

编程新知 2026/1/31 9:29:45

在pytorch中自定义dataset读取数据

相关文章：

在pytorch中自定义dataset读取数据

ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

Java后端的登录、注册接口是怎么实现的

TCP Keepalive 和 HTTP Keep-Aliv

操作系统复习笔记

Java中实现单例模式的方式

Vue3-01-创建项目

Go 语言中的反射机制

[leetcode 前缀和]

Python与ArcGIS系列（十五）根据距离抓取字段

YOLOv8分割训练及分割半自动标注

jsp页面通过class或者id获取a标签上的属性的值

题目：美丽的区间（蓝桥OJ 1372）

解决：During handling of the above exception, another exception occurred

计算机基础知识65

Python开发运维：Python垃圾回收机制

ros2/ros安装ros-dep||rosdep init错误

《深入理解计算机系统》学习笔记 - 第四课 - 机器级别的程序

云原生（Cloud Native）——概念，技术，背景，优缺点，实践例子

ElasticSearch之线程池

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

k8s从入门到放弃之Ingress七层负载

渲染学进阶内容——模型

2025盘古石杯决赛【手机取证】

12.找到字符串中所有字母异位词

3403. 从盒子中找出字典序最大的字符串 I

算法岗面试经验分享-大模型篇

人机融合智能 | “人智交互”跨学科新领域

快刀集(1): 一刀斩断视频片头广告

iview框架主题色的应用