当前位置：首页 > news >正文

【PyTorch】（二）加载数据集

news 2026/2/11 1:34:03

文章目录

1. 创建数据集
- 1.1. 直接继承Dataset类
- 1.2. 使用TensorDataset类
2. 加载数据集
3. 将数据转移到GPU

1. 创建数据集

主要是将数据集读入内存，并用Dataset类封装。

1.1. 直接继承Dataset类

必须要重写__getitem__方法，用于根据索引获得相应样本数据。必要时还可以重写__len__方法，用于返回数据集的大小。

from torch.utils.data import Datasetclass BostonHousingDataset(Dataset):"""定义波士顿房价数据集"""def __init__(self):self.data = np.load('../dataset/boston_housing/boston_housing.npz')def __getitem__(self, index):return self.data['x'][index], self.data['y'][index]def __len__(self):return self.data['x'].shape[0]

1.2. 使用TensorDataset类

将多个张量组合成一个数据集，要保证所有张量的第一个维度相等，保证每批样本数据格式相同。

import torch
from torch.utils.data import TensorDatasetdata = np.load('../dataset/boston_housing/boston_housing.npz')
X = torch.tensor(data['x'])
y = torch.tensor(data['y'])
dataset = TensorDataset(X, y)

2. 加载数据集

使用DataLoader类将Dataset封装的数据集分成批次并进行迭代，以便于模型训练。DataLoader常用参数如下：

dataset
要加载的数据集。
batch_size
每个数据批次中包含的样本数。默认为1。
shuffle
是否打乱数据集。默认为False。
num_workers
使用几个进程来加载数据。默认为0，即在主进程中加载数据。
drop_last
当数据集样本数不能被batch_size整除时，是否舍弃最后一个不完整的batch。默认为False。

from torch.utils.data import DataLoaderdataloader = DataLoader(dataset, batch_size=16, shuffle=True)

3. 将数据转移到GPU

一般在要运算时才将数据转移到GPU，有以下两种方法：

var.to(device)
var.cuda()

import torchdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")
for X,y in dataloader:# 将数据转移到GPUX = X.to(device)y = y.to(device)# 也可以X = X.cuda()y = y.cuda()

【PyTorch】（二）加载数据集

文章目录 1. 创建数据集1.1. 直接继承Dataset类1.2. 使用TensorDataset类 2. 加载数据集3. 将数据转移到GPU 1. 创建数据集主要是将数据集读入内存，并用Dataset类封装。 1.1. 直接继承Dataset类必须要重写__getitem__方法，用于根据索引获得相应样本…...

编程日记 2023/12/1 3:38:10

如何提高3D建模技能？

无论是制作影视动画还是视频游戏，提高3D建模技能对于你的工作都至关重要的。那么如何能创建出精美的3D模型呢？本文给大家一些3D建模技能方面的建议。 3D建模通过专门的软件完成，涉及制作三维对象。这项技能在视频游戏开发、建筑、动画和产品…...

编程日记 2023/12/1 3:37:08

【前端开发】Next.js与Nest.js之间的差异2023

在快节奏的网络开发领域，JavaScript已成为构建可靠且引人入胜的在线应用程序的标准语言。然而，随着对适应性强、高效的在线服务的需求不断增加，开发人员通常不得不从广泛的库和框架中进行选择，以满足其项目的要求。Next.js和Nest.…...

编程日记 2023/12/1 3:36:06

目录 1.内容简介 2.CanIf详细设计 2.1 CanIf功能简介 2.2 一些关键概念 2.3依赖的上下层模块 2.4 功能详细设计 2.4.1 Hardware object handles 2.4.2 Static L-PDUs 2.4.3 Dynamic L-PDUs 2.4.4 Dynamic Transmit L-PDUs 2.4.5 Dynamic receive L-PDUs 2.4.6Physi…...

编程日记 2023/12/1 3:34:05

PS最新磨皮软件Portraiture4.1.2

Portraiture是一款好用的PS磨皮滤镜插件，拥有磨皮美白的功能，操作也很简单，一键点击即可实现美白效果，软件还保留了人物的皮肤质感让照片看起来更加真实。portraiture体积小巧，不会占用过多的电脑内存哦。内置了多种…...

编程日记 2023/12/1 3:32:03

旋转框（obb）目标检测计算iou的方法

首先先定义一组多边形，这里的数据来自前后帧的检测结果 pre [[[860.0, 374.0], [823.38, 435.23], [716.38, 371.23], [753.0, 310.0]],[[829.0, 465.0], [826.22, 544.01], [684.0, 539.0], [686.78, 459.99]],[[885.72, 574.95], [891.0, 648.0], [725.0, 660.0]…...

编程日记 2023/12/1 3:31:01

render函数举例

在这段代码中，renderButton是一个对象吗还有render为什么不能写成render() {} 代码原文链接 <template><div><renderButton /></div> </template><script setup> import { h, ref } from "vue"; const renderButt…...

编程日记 2023/12/1 3:26:57

微信小程序文件预览和下载-文件系统

文件预览和下载在下载之前，我们得先调用接口获取文件下载的url 然后通过wx.downloadFile将下载文件资源到本地 wx.downloadFile({url: res.data.url,success: function (res) {console.log(数据,res);} })tempFilePath就是临时临时文件路径。通过wx.openDocume…...

编程日记 2023/12/1 3:25:55

图解Redis适用场景

Redis以其速度而闻名。 1 业务数据缓存 1.1 通用数据缓存 string，int，list，map。Redis 最常见的用例是缓存对象以加速 Web 应用程序。此用例中，Redis 将频繁请求的数据存储在内存。允许 Web 服务器快速返回频繁访问的数据。这…...

编程日记 2023/12/1 3:23:52

掌握Python BentoML：构建、部署和管理机器学习模型

更多资料获取 📚 个人网站：ipengtao.com BentoML是一个开源的Python框架，旨在简化机器学习模型的打包、部署和管理。本文将深入介绍BentoML的功能和用法，提供详细的示例代码和解释，帮助你更好地理解和应用这个强大的工…...

编程日记 2023/12/1 3:22:50

西南科技大学模拟电子技术实验二（二极管特性测试及其应用电路）预习报告

目录一、计算/设计过程二、画出并填写实验指导书上的预表三、画出并填写实验指导书上的虚表四、粘贴原理仿真、工程仿真截图一、计算/设计过程说明：本实验是验证性实验，计算预测验证结果。是设计性实验一定要从系统指标计算出元件参数过程，越详细越好。用公式输入…...

编程日记 2023/12/1 3:20:47

熟悉SVN基本操作-（SVN相关介绍使用以及冲突解决）

一、SVN相关介绍 1、SVN是什么? 代码版本管理工具它能记住你每次的修改查看所有的修改记录恢复到任何历史版本恢复已经删除的文件 2、SVN跟Git比，有什么优势使用简单，上手快目录级权限控制，企业安全必备子目录checkout，减少…...

编程日记 2023/12/1 3:19:44

代码随想录二刷｜字符串｜反转字符串II

代码随想录二刷 ｜字符串 ｜反转字符串II 题目描述解题思路 & 代码实现题目描述 541.反转字符串II 给定一个字符串 s 和一个整数 k，从字符串开头算起，每计数至 2k 个字符，就反转这 2k 字符中的前 k 个字符。如果…...

编程日记 2023/12/1 3:18:43

哪吒汽车拔头筹，造车新势力首家泰国工厂投产

中国造车新势力首家泰国工厂投产！11月30日，哪吒汽车位于泰国的首家海外工厂——泰国生态智慧工厂正式投产下线新车，哪吒汽车联合创始人兼CEO张勇、哪吒汽车泰国合作伙伴BGAC公司首席执行官万查曾颂翁蓬素等出席仪式。首辆“泰国制造”的哪吒汽…...

编程日记 2023/12/1 3:17:42

Redis String类型

String 类型是 Redis 最基本的数据类型，String 类型在 Redis 内部使用动态长度数组实现，Redis 在存储数据时会根据数据的大小动态地调整数组的长度。Redis 中字符串类型的值最大可以达到 512 MB。关于字符串需要特别注意∶ 首先，Redis 中所…...

编程日记 2023/12/1 3:16:41

lxd提权

lxd/lxc提权漏洞介绍 lxd是一个root进程，它可以负责执行任意用户的lxd，unix套接字写入访问操作。而且在一些情况下，lxd不会调用它的用户权限进行检查和匹配原理可以理解为用用户创建一个容器，再用容器挂载宿主机磁盘&#xf…...

编程日记 2023/12/1 3:15:40

Ubuntu+Tesla V100环境配置

系统基本信息 nvidia-smi’ nvidia-smi 470.182.03 driver version:470.182.03 cuda version: 11.4 查看系统体系结构 uname -aUTC 2023 x86_64 x86_64 x86_64 GNU/Linux 下载miniconda https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/?CM&OA https://mi…...

编程日记 2023/12/1 3:13:37

leetcode：用栈实现队列（先进先出）

题目描述题目链接：232. 用栈实现队列 - 力扣（LeetCode） 题目分析我们先把之前写的数组栈的实现代码搬过来用栈实现队列最主要的是实现队列先进先出的特点，而栈的特点是后进先出，那么我们可以用两个栈来实现&…...

编程日记 2023/12/1 3:11:35

＜JavaEE＞什么是进程控制块（PCB Process Control Block）？

目录一、进程控制块的概念二、进程控制块的重要属性 2.1 唯一身份标识（PID） 2.2 内存指针 2.3 文件描述符表 2.4 状态 2.5 优先级 2.6 记账信息 2.7 上下文一、进程控制块的概念进程控制块（Process Control Block, PCB&#xff…...

编程日记 2023/12/1 3:10:34

简历上的工作经历怎么写

通过了简历筛选，后续的面试官会仔细阅读你的简历内容。他们在找什么呢？他们希望搞清楚你在某一段经历中具体干了什么，并且判断你的能力具体达到了什么水平。简历在线制作下载：百度幻主简历面试官喜欢具体的经历越具体&#x…...

编程日记 2023/12/1 3:07:31

Python爬虫实战：研究MechanicalSoup库相关技术

一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库，专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力，提供了直观的 API，让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

编程新知 2025/10/10 18:13:55

华为云AI开发平台ModelArts

华为云ModelArts：重塑AI开发流程的“智能引擎”与“创新加速器”！ 在人工智能浪潮席卷全球的2025年，企业拥抱AI的意愿空前高涨，但技术门槛高、流程复杂、资源投入巨大的现实，却让许多创新构想止步于实验室。数据科学家…...

编程新知 2026/2/10 23:05:30

微信小程序之bind和catch

这两个呢，都是绑定事件用的，具体使用有些小区别。官方文档： 事件冒泡处理不同 bind：绑定的事件会向上冒泡，即触发当前组件的事件后，还会继续触发父组件的相同事件。例如，有一个子视图绑定了b…...

编程新知 2026/2/5 5:05:56

云计算——弹性云计算器（ECS）

弹性云服务器：ECS 概述云计算重构了ICT系统，云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台，包含如下主要概念。 ECS（Elastic Cloud Server）：即弹性云服务器，是云计算…...

编程新知 2025/8/16 21:50:27

什么是库存周转？如何用进销存系统提高库存周转率？

你可能听说过这样一句话： “利润不是赚出来的，是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业，很多企业看着销售不错，账上却没钱、利润也不见了，一翻库存才发现： 一堆卖不动的旧货…...

编程新知 2026/1/26 13:21:10

PL0语法，分析器实现！

简介 PL/0 是一种简单的编程语言，通常用于教学编译原理。它的语法结构清晰，功能包括常量定义、变量声明、过程（子程序）定义以及基本的控制结构（如条件语句和循环语句）。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言，由 Niklaus Wirth 设计，用于展示编译原理的核…...

编程新知 2026/1/29 17:06:33

EtherNet/IP转DeviceNet协议网关详解

一，设备主要功能疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络，本网关连接到EtherNet/IP总线中做为从站使用，连接到DeviceNet总线中做为从站使用。在自动…...

编程新知 2026/1/31 6:53:51

在Ubuntu24上采用Wine打开SourceInsight

1. 安装wine sudo apt install wine 2. 安装32位库支持，SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库（解决显示问题） sudo apt install fonts-wqy…...

编程新知 2025/10/14 0:47:25

Java求职者面试指南：计算机基础与源码原理深度解析

Java求职者面试指南：计算机基础与源码原理深度解析第一轮提问：基础概念问题 1. 请解释什么是进程和线程的区别？ 面试官：进程是程序的一次执行过程，是系统进行资源分配和调度的基本单位；而线程是进程中的…...

编程新知 2025/12/9 14:22:07

Linux nano命令的基本使用

参考资料 GNU nanoを使いこなすnano基础目录一. 简介二. 文件打开2.1 普通方式打开文件2.2 只读方式打开文件三. 文件查看3.1 打开文件时，显示行号3.2 翻页查看四. 文件编辑4.1 Ctrl K 复制和 Ctrl U 粘贴4.2 Alt/Esc U 撤回五. 文件保存与退出5.1 Ctrl …...

编程新知 2026/1/31 2:17:41

【PyTorch】（二）加载数据集

文章目录

1. 创建数据集

1.1. 直接继承Dataset类

1.2. 使用TensorDataset类

2. 加载数据集

3. 将数据转移到GPU

相关文章：

【PyTorch】（二）加载数据集

如何提高3D建模技能？

【前端开发】Next.js与Nest.js之间的差异2023

【CAN通信】CanIf模块详细介绍

PS最新磨皮软件Portraiture4.1.2

旋转框（obb）目标检测计算iou的方法

render函数举例

微信小程序文件预览和下载-文件系统

图解Redis适用场景

掌握Python BentoML：构建、部署和管理机器学习模型

西南科技大学模拟电子技术实验二（二极管特性测试及其应用电路）预习报告

熟悉SVN基本操作-（SVN相关介绍使用以及冲突解决）

代码随想录二刷｜字符串｜反转字符串II

哪吒汽车拔头筹，造车新势力首家泰国工厂投产

Redis String类型

lxd提权

Ubuntu+Tesla V100环境配置

leetcode：用栈实现队列（先进先出）

＜JavaEE＞什么是进程控制块（PCB Process Control Block）？

简历上的工作经历怎么写

Python爬虫实战：研究MechanicalSoup库相关技术

华为云AI开发平台ModelArts

微信小程序之bind和catch

云计算——弹性云计算器（ECS）

什么是库存周转？如何用进销存系统提高库存周转率？

PL0语法，分析器实现！

EtherNet/IP转DeviceNet协议网关详解

在Ubuntu24上采用Wine打开SourceInsight

Java求职者面试指南：计算机基础与源码原理深度解析

Linux nano命令的基本使用