当前位置：首页 > news >正文

PyTorch 创建数据集

news 2025/7/8 4:51:33

图片数据和标签数据准备

1.本文所用图片数据在同级文件夹中 ,文件路径为'train/’

在这里插入图片描述

2.标签数据在同级文件，文件路径为'train.csv'

在这里插入图片描述

3。将标签数据提取

train_csv=pd.read_csv('train.csv')

创建继承类

第一步，首先创建数据类对象此时可以想象为单个数据单元的创建 { 图像，标签}

在这里插入图片描述

继承的是Dataset类（数据集类）

from torch.utils.data import Dataset
from PIL import Image          //从文件路径中提取图片所需要的函数class Imagedata(Dataset):        //继承Dataset类def __init__(self,df,dir,transform=None):     //往类里传输需要的数据必须在这定义，后面初始化函数才能使用传入的数据，//df表示传入的标签数据，dir表示图像数据文件地址，transform是图像增强的处理操作super().__init__()                      //声明后面操作需要用的数据self.df=df                           self.dir=dirself.transform=transformdef __len__(self):                     //模板函数，没什么卵用return len(self.df)def __getitem__(self, idex):           //将单个数据和标签整合到一块的初始化函数img_id=self.df.iloc[idex,0]        //图片的名称在df文件中，标签也在df的文件中，如下图，为的就是提出图像数据文件中的图片，否则从图片数据文件中一张一张提取出来很难，名称太长img=Image.open(self.dir+img_id)   //拿到了图片的整个完整地址  img=np.array(img)                //Image提取出来的为image类型，需要转换为numpy数组，才能存储到数据集中//上面两行也可以换为cv2.imread(dir),直接读取的数据就可以往里面存，避免了数据转换label=self.df.iloc[idex,1]       //从df中提取对应的标签，就是同一张图像的标签，由idex固定return img,label                 //返回整理好的单个数据单元（图像+标签）

在这里插入图片描述

第二步，创造好了单个数据单元对象，那么需要将多个数据单元整合起来构成一个完整的数据集

先将单个数据单元实现，因为上面的代码为类对象代码，并没有实现

train_dataset=ImageDataset(df=train_csv,dir='train/')  //df为标签文件，dir表示你图像存储的文件地址

得到了单个数据单元，那么开始将数据整合，先调用数据整合函数：

from torch.utils.data import DataLoader

通过数据流来整合

train_data=DataLoader(train_dataset,batch_size=32)    //train_dataset 为单个对象     batch_size为设置几个为一小组，为后面的分组训练做准备

那么最后得到的train_data就是带有图像和标签的数据集，可以验证一下：

for img,label in train_data:print(img,label)

在这里插入图片描述

图像增强技术(降噪，标准化)

上面没有加入图像增强代码，创建数据集时候，可以先将图像增强后再存入数据集，增强的主要目的就是提高训练准确率，标准化可以使图像在神经网络训练的更快，因为图像的数据明显变小，举个例子，由像素[233,221,222]可以直接变为[2.33,2.21,2.22]

如下使图像增强代码，用的使torchvision,每行代码都有注释

from torchvision import transformstransform_train = transforms.Compose([transforms.ToTensor(),        //将图像变为Tensor张量，并将图像像素由255-0变为1-0，压缩，并将图像的维度从 (H x W x C) 转换为 (C x H x W)transforms.Pad(32, padding_mode='symmetric')   //表示在图像的四周各填充 32 个像素。transforms.RandomHorizontalFlip(),    //以一定的概率对图像进行随机水平翻转。这有助于增加数据的多样性，提高模型的泛化能力。防止拟合transforms.RandomVerticalFlip(),      //以一定的概率对图像进行随机垂直翻转。同样是为了增加数据多样性transforms.RandomRotation(10),       //以一定的概率对图像进行随机旋转，旋转角度在 -10 到 10 度之间。增加数据的多样性transforms.Normalize((0.485, 0.456, 0.406),     //指定每个通道的均值。通常是在 ImageNet 数据集上计算得到的均值。(0.229, 0.224, 0.225))])   //指定每个通道的标准差。也是在 ImageNet 数据集上计算得到的标准差。

那么在数据单元创建的时候加入，以下是完整代码：

from torch.utils.data import Datasetclass ImageDataset(Dataset):def __init__(self, df, dir, transform=None): super().__init__()self.df = dfself.dir = dirself.transform = transformdef __len__(self):return len(self.df)def __getitem__(self, idx):img_id = self.df.iloc[idx,0]img_path = self.dir + img_idimage = cv2.imread(img_path)            //这里用了cv2直接读取图片，避免了转换numpyimage = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)   //opencv里的数据增强label = self.df.iloc[idx,1]if self.transform is not None:image = self.transform(image)return image, label-----------------------图像增强技术------------------------
from torchvision import transforms
transform_train = transforms.Compose([transforms.ToTensor(),transforms.Pad(32, padding_mode='symmetric'),transforms.RandomHorizontalFlip(),transforms.RandomVerticalFlip(),transforms.RandomRotation(10),transforms.Normalize((0.485, 0.456, 0.406),(0.229, 0.224, 0.225))])
transform_test = transforms.Compose([transforms.ToTensor(),transforms.Pad(32, padding_mode='symmetric'),transforms.Normalize((0.485, 0.456, 0.406),(0.229, 0.224, 0.225))])from torch.utils.data import DataLoader
dataset_train = ImageDataset(df=train_df, img_dir='train/',transform=transform_train)
loader_train = DataLoader(dataset=dataset_train, batch_size=32, shuffle=True)

PyTorch 创建数据集

图片数据和标签数据准备 1.本文所用图片数据在同级文件夹中 ,文件路径为train/’ 2.标签数据在同级文件，文件路径为train.csv 3。将标签数据提取 train_csvpd.read_csv(train.csv)创建继承类第一步，首先创建数据类对象此时可以想象为单个数据单元的…...

编程日记 2024/9/9 23:26:57

[Java]SpringBoot登录认证流程详解

登录认证登录接口 1.查看原型 2.查看接口 3.思路分析登录核心就是根据用户名和密码查询用户信息,存在则登录成功, 不存在则登录失败 4.Controller Slf4j RestController public class LoginController {Autowiredprivate EmpService empService;/*** 登录的方法** param …...

编程日记 2024/9/9 23:24:55

【Day08】

目录 MySQL-多表查询-概述 MySQL-多表查询-内连接 MySQL-多表查询-外连接 MySQL-多表查询-[标量、列]子查询 MySQL-多表查询-[行、表]子查询 MySQL-多表查询-案例 MySQL-事务-介绍与操作 MySQL-事务-四大特性 MySQL-索引-介绍 MySQL-索引-结构 MySQL-索引-操作语法 …...

编程日记 2024/9/9 23:22:54

mongodb在Java中条件分组聚合查询并且分页(时间戳，按日期分组，年月日...)

废话不多说，先看效果图： SQL查询结果示例： 多种查询结果示例： 原SQL： db.getCollection("hbdd_order").aggregate([{// 把时间戳格式化$addFields: {orderDate: {"$dateToString": {"for…...

编程日记 2024/9/9 23:21:53

怎么样处理浮毛快捷又高效？霍尼韦尔、希喂、米家宠物空气净化器实测对比

掉毛多？掉毛快？猫毛满天飞对身体有危害吗？多猫家庭经验分享篇： 一个很有趣的现象，很多人在养猫、养狗后耐心都变得更好了。养狗每天得遛，养猫出门前得除毛，日复一日的重复磨练了极好的耐心。我家…...

编程日记 2024/9/9 23:20:52

什么是WebGL技术？有什么特点？应用领域有哪些？

WebGL（Web Graphics Library）技术是一种在Web浏览器中渲染交互式3D和2D图形的JavaScript API。以下是对WebGL技术的详细解析： 一、定义与起源定义： WebGL全称Web Graphics Library，即网络图形库，它允许…...

编程日记 2024/9/9 23:19:51

500W逆变器（一）

EG8015_24V_500W 这款逆变器是基于 EG8015 SPWM 专用芯片而设计的方案。其额定的输出功率为 500 瓦, 最大输出功率为 600 瓦，输出电压为 220V10%，输出频率为 50Hz0.1Hz，额定输出电流为 2.3 安培。穿越机降落的时候不要垂直降落，要…...

编程日记 2024/9/9 23:15:46

ubuntu 22.04 编译安装新内核

1、普通用户登录系统查看当前内核版本 $ uname -r 5.15.0-118-generic 2、下载内核源码 www.kernel.org 用户home目录新建子目录linux，下载并解压 linux-5.15.165.tar.xz 3、创建起始的配置文件.config Configuration targets （见linux kernel i…...

编程日记 2024/9/9 23:14:45

Linux 文件权限与属性管理

概述 Linux 系统是一种典型的多用户系统，不同的用户处于不同的地位，拥有不同的权限。为了保护系统的安全性，Linux 对不同用户访问同一文件（包括目录文件）的权限做了详细的规定。文件属性查看在 Linux 中&#xff0…...

编程日记 2024/9/9 23:13:43

Django学习实战篇三（适合略有基础的新手小白学习）（从0开发项目）

前言： 在上一章中，我们对Django的Model层有了比较全面的认识，本章就来配置Django自带的admin。这里需要认识到，Django的Model层是很重要的一环，无论是对于框架本身还是对于基于Django框架开发的大多数系统而言。因为一…...

编程日记 2024/9/9 23:12:41

【SPIE独立出版，连续2届稳定EI检索！】2024年第三届信息学，网络与计算技术国际学术会议(ICINC2024，10月25-27)

2024年第三届信息学，网络与计算技术国际学术会议(ICINC2024)将于2024年10月25-27日于中国郑州召开。会议将围绕信息技术与通信，网络与计算技术等在相关领域中的最新研究成果，为来自国内外高等院校、科学研究所、企事业单位的专家、教授、学者…...

编程日记 2024/9/9 23:11:40

.NET/C#⾯试题汇总系列：基础语法

1. 字符串中string strnull和string str""和string strstring.Empty的区别？ string str null;：这种方式声明了一个字符串变量str，并将其初始化为null。这意味着str不指向任何实际的字符串对象。如果你试图访问str的属性或方法&…...

编程日记 2024/9/9 23:08:37

【论文阅读】SwiftTheft: A Time-Efficient Model Extraction Attack Framework（2024）

完整标题 SwiftTheft: A Time-Efficient Model Extraction Attack Framework Against Cloud-Based Deep Neural Networks 摘要 With the rise of artificial intelligence（人工智能） and cloud computing（云计算）, machine-learning-as-a-service platforms（机器学习即…...

编程日记 2024/9/9 23:07:36

springcloud间通信的方式

在 Spring Cloud 中，主要有以下几种通信方式： 一、基于 HTTP 的 RESTful API 工作原理： 这是一种常见的通信方式，各个微服务通过发送 HTTP 请求来相互调用。服务提供者暴露 RESTful API 接口，服务消费者通过 HTTP 客户…...

编程日记 2024/9/9 23:06:35

【C++ Qt day9】

2、将day1做的登录界面升级优化【资源文件的添加】 3、使用手动连接，将登录框中的取消按钮使用第2种方式的连接到自定义的槽函数中，在自定义的槽函数中调用关闭函数将登录按钮使用qt4版本的连接到自定义的槽函数中，在槽函数中判断ui界面上…...

编程日记 2024/9/9 23:03:32

中国传媒业人工智能应用发展图谱2024

易观分析：传媒产业是指以传播各类信息、知识为核心，通过多种媒介形式进行内容生产、发布和分发的综合性产业。技术的进步和应用对于传媒产业发展变革起到了核心驱动力的作用，2022年生成式AI进入应用爆发期，不仅带动了人工智能产业…...

编程日记 2024/9/9 22:55:40

RTX3060 FP64测试与猜想

RTX3060 FP64测试与猜想一.小结二.查看FP64的峰值性能三.打满FP64、FP32的利用率,对比差异四.进一步证明pipe_fp64_cycles_active并不是2个fp64 core的metrics RTX3060 FP64测试与猜想一.小结 RTX3060 compute capability为8.6,每个SM有2个FP64 core。每个cycle可输出2个fp…...

编程日记 2024/9/9 22:53:18

uniapp写移动端常见问题汇总

1. 手机顶部状态栏遮挡写在需要的地方 <view class"status_bar" style"height: var(--status-bar-height); width: 100%;">2. 手机顶部状态栏字体颜色 // pages.json "statusBarStyle": "light",3. 背景覆盖全屏 page{widt…...

编程日记 2024/9/9 22:52:13

Linux运维排查常见故障_在tmp目录下有大量包含picture_ 的临时文件,每天晚上2 30需要对一天前的文件进行

echo“”>>/etc/security/limits.conf echo“*softnproc65535″>>/etc/security/limits.conf echo“*hardnproc65535″>>/etc/security/limits.conf echo“*softnofile65535″>>/etc/security/limits.conf echo“*hardnofile65535″>>/etc/secur…...

编程日记 2024/9/9 22:50:50

基于SpringBoot的智能制造云平台系统的设计与实现计算机毕设

一、选题背景与意义（300字左右） 根据工业4.0智能制造生态链中云工厂在实际生产当中的工作流程进行充分调研和整理出来的，描述最终用户在本系统中对于生产订单的处理、排产、以及生产的完整在线处理流程和业务需求的文档。针对制造业而言&a…...

编程日记 2024/9/9 22:49:25

【力扣数据库知识手册笔记】索引

索引索引的优缺点优点1. 通过创建唯一性索引，可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度（创建索引的主要原因）。3. 可以加速表和表之间的连接，实现数据的参考完整性。4. 可以在查询过程中，…...

编程新知 2025/7/7 15:43:36

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

文章目录 1.什么是Redis？2.为什么要使用redis作为mysql的缓存？3.什么是缓存雪崩、缓存穿透、缓存击穿？3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

编程新知 2025/7/7 7:19:12

DAY 47

三、通道注意力 3.1 通道注意力的定义 # 新增：通道注意力模块（SE模块） class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...

编程新知 2025/7/7 15:10:39

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

在建筑行业，项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升，传统的管理模式已经难以满足现代工程的需求。过去，许多企业依赖手工记录、口头沟通和分散的信息管理，导致效率低下、成本失控、风险频发。例如&#…...

编程新知 2025/7/6 22:38:45

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2025/7/7 16:10:59

Spring Boot面试题精选汇总

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

编程新知 2025/7/6 8:41:46

有限自动机到正规文法转换器v1.0

1 项目简介这是一个功能强大的有限自动机（Finite Automaton, FA）到正规文法（Regular Grammar）转换器，它配备了一个直观且完整的图形用户界面，使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...

编程新知 2025/7/7 6:14:27

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型（LLM）参数规模的增长，推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长，而KV缓存的内存消耗可能高达数十GB（例如Llama2-7B处理100K token时需50GB内存&a…...

编程新知 2025/6/16 21:35:46

rnn判断string中第一次出现a的下标

# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写实现一个RNN网络完成多分类任务判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...

编程新知 2025/6/21 7:57:44

Angular微前端架构：Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例，其中使用的是 Module Federation 和 npx-build-plus 实现了主应用（Shell）与子应用（Remote）的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

编程新知 2025/6/15 10:41:11

图片数据和标签数据准备

创建继承类

图像增强技术(降噪，标准化)

相关文章：