当前位置：首页 > news >正文

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

news 2026/2/10 13:00:38

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

前言
一、TensorDataset、DataLoader的用法？
二、从.csv文件-->tensor张量
总结

前言

简单来说，TensorDataset与DataLoader这两个类的作用，就是将数据读入并做整合，以便交给模型处理。就像石油加工厂一样，你不关心石油是如何采集与加工的，你关心的是自己去哪加油，油价是多少，对于一个模型而言，DataLoader就是这样的一个予取予求的数据服务商。

参考文章或视频链接
[1] How to use TensorDataset, Dataloader (pytorch)

一、TensorDataset、DataLoader的用法？

# coding:utf-8
# @Time: 2024/1/23 上午9:57
# @Author: 键盘国治理专家
# @File: __init__.py.py
# @Description: import numpy as np
import torch
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoaderdef test_TensorDataset():input = np.random.rand(4, 2)  # Input datacorrect = np.random.rand(4, 1)  # Correct answer datainput = torch.FloatTensor(input)  # Change to an array that can be handled by pytorchcorrect = torch.FloatTensor(correct)  # Same as aboveprint(input)print(correct)dataset = TensorDataset(input, correct)  # set the data，注意，是TensorDataset而不是Dataset，Dataset是个abstract class不能实例化print(dataset)  # 打印地址print(vars(dataset))  # vars prints the contents of the objectreturn datasetdef test_DataLoader(dataset):train_load = DataLoader(dataset, batch_size=3, shuffle=False)  # Data shuffle with shuffle=Truefor x, t in train_load:print('x-->', x)print('t-->', t)if __name__ == '__main__':dataset = test_TensorDataset()print("========================================================================================")test_DataLoader(dataset)

二、从.csv文件–>tensor张量

一般说来，大部分Kaggle比赛的数据都是以.csv为格式的，而Pytorch处理的是tensor张量，所以我们要了解如何将.csv文件的数据变成tensor张量数据。

"""
步骤如下
(1) xx.csv --> 经由pandas 变成 numpy 数组
(2) numpy 变成 tensor 张量
(3) tensor张量经过TensorDataset的组合
(4) dataset再经过DataLoader的处理，进而保证数据可用，以上为清洗过程
.csv --> numpy --> tensor --> dataset --> dataloader 四个过程，五个数据中转形式。
"""
# coding:utf-8
# @Time: 2024/1/23 下午1:01
# @Author: 键盘国治理专家
# @File: csv2tensor.py
# @Description:import numpy
import pandas as pd
import numpy as np
import torch
import torch.nn as nn
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoaderdef csv2numpy(csv_path):data = pd.read_csv(csv_path, dtype=np.float64)# numpy_data = data.iloc[:, data.columns != "xx"]  # 另一种用法，data.columns != "xx" 可以过滤掉你不想读入的字段numpy_data = data.iloc[:].valuesreturn numpy_datadef numpy2tensor(numpy_data):tensor_data = torch.from_numpy(numpy_data)return tensor_datadef tensor2DataLoader(tensor_data):  # 一步到位，直接变成DataLoader。最简单的实现方式，这个func还有改进空间，DataSet可以接收多个tensor数据dataset = torch.utils.data.TensorDataset(tensor_data)data_loader = torch.utils.data.DataLoader(dataset, shuffle=False)return data_loader# 你甚至可以直接将.csv处理成DataLoader了，把这几个过程简单组合下形成一个新函数
def csv2DataLoader(csv_path):numpy_data = csv2numpy(csv_path)tensor_data = numpy2tensor(numpy_data)data_loader = tensor2DataLoader(tensor_data)return data_loaderif __name__ == '__main__':numpy_data = csv2numpy("./test.csv")# print(type(numpy_data))# print(numpy_data.shape)# print(numpy_data)tensor_data = numpy2tensor(numpy_data)# print(type(tensor_data))# print(tensor_data.shape)# print(tensor_data)data_loader = tensor2DataLoader(tensor_data)# print(type(data_loader))# print(data_loader)# print(data_loader.dataset)# # 用遍历的方式才能输出data_loader里的数据# for data_item in data_loader:#     print('data_item-->', data_item)# # 把数据的索引也一起输出# for i, data_item in enumerate(data_loader):#     print('i', i)#     print('data_item-->', data_item)

总结

本篇工作虽然简单，但确是进阶的一个不大不小的绊脚石，功夫虽小，也不能不练。

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader 前言一、TensorDataset、DataLoader的用法？二、从.csv文件-->tensor张量总结前言简单来说，TensorDataset与DataLoader这两个类的作用， 就是将数据读入并做整合，以便…...

编程日记 2024/1/24 11:54:26

远程git开发

两种本地与远程仓库同步 """ 1）你作为项目仓库初始化人员：线上要创建空仓库 > 本地初始化好仓库 > 建立remote链接(remote add) > 提交本地仓库到远程(push)2）你作为项目后期开发人员：远程项目仓库已经创…...

编程日记 2024/1/24 11:53:25

Codeforces Round 812 (Div. 2) ---- C. Build Permutation --- 题解

目录 C. Build Permutation 题目描述： 编辑思路解析： 代码实现： C. Build Permutation 题目描述： 思路解析： 先证明在任何情况下答案均存在。假设我们所求的为 m m1 m2.....n 的排列，我们称不小于n…...

编程日记 2024/1/24 11:51:23

语法 1、save(filename) 2、save(filename,variables) 3、save(filename,variables,fmt) 4、save(filename,variables,version) 5、save(filename,variables,version,-nocompression) 6、save(filename,variables,-append) 7、save(filename,variables,-append,-nocompression…...

编程日记 2024/1/24 11:50:22

源码实现简介

本系列所有代码在文章底部，每一章节代码可独立编译运行随着科技的飞速发展，自动驾驶技术正逐渐成为现实。而在自动驾驶技术中，感知是至关重要的一个环节。通过感知，自动驾驶车辆能够识别和理解周围环境，进而做出相应…...

编程日记 2024/1/24 11:46:17

我每天如何使用 ChatGPT

我们都清楚互联网的运作方式——充斥着各种“爆款观点”，极端分裂的意见，恶搞和无知现象屡见不鲜。最近，大家对于人工智能（AI）特别是大语言模型（LLMs）和生成式 AI（GenAI&#xff0…...

编程日记 2024/1/24 11:45:14

MySQL修炼手册14：用户权限管理：安全保障与数据隔离

目录写在开头1 用户与权限的关系1.1 用户的创建与删除1.1.1 创建新用户1.1.2 批量创建用户1.1.3 安全删除用户 1.2 授予与撤销权限1.2.1 授予权限1.2.2 批量授予权限1.2.3 撤销权限 2 角色的应用2.1 创建与管理角色2.1.1 创建角色2.1.2 管理角色 2.2 将权限赋予角色2.2.1 将权…...

编程日记 2024/1/24 11:43:11

动态规划解决马尔可夫决策过程

马尔可夫决策过程是强化学习中的基本问题模型之一，而解决马尔可夫决策过程的方法我们统称为强化学习算法。动态规划（ dynamic programming, DP ）具体指的是在某些复杂问题中，将问题转化为若干个子问题，并在求解每个子…...

编程日记 2024/1/24 11:39:07

ubuntu1604安装及问题解决

虚拟机安装vmbox7 虚拟机操作： 安装增强功能 sudo mkdir /mnt/share sudo mount -t vboxsf sharefolder /mnt/share第一次使用sudo提示is not in the sudoers file. This incident will be reported 你的root需要设置好密码 sudo passwd root 输入如下指令&#x…...

编程日记 2024/1/24 11:29:55

Leetcode—24. 两两交换链表中的节点【中等】

2023每日刷题（八十七） Leetcode—24. 两两交换链表中的节点实现代码 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x),…...

编程日记 2024/1/24 11:27:53

USRP相关报错解决办法

文章目录前言一、本地环境二、相关报错信息二、解决办法1、更换电脑操作系统2、升级最新版固件前言在进行 USRP 开发时遇到了一些报错，这里做个记录解决问题的方法。一、本地环境电脑操作系统：Windows11MATLAB 版本：MATLAB 2021aUSRP …...

编程日记 2024/1/24 11:24:48

【剑指offer】重建二叉树

👑专栏内容：力扣刷题⛪个人主页：子夜的星的主页💕座右铭：前路未远，步履不停目录一、题目描述1、题目2、示例二、题目分析1、递归2、栈一、题目描述 1、题目剑指offer：重建二叉树给定节…...

编程日记 2024/1/24 11:21:44

中仕教育：事业编招考全流程介绍

一、报名阶段 1. 了解查看招聘信息：查看各类事业编岗位的招聘信息，包括岗位职责、招聘条件、报名时间等。 2. 填写报名表：按照要求填写报名表，包括个人信息、教育背景、工作经历等内容。 3. 提交报名材料：将报名表及…...

编程日记 2024/1/24 11:18:41

149. 直线上最多的点数

149. 直线上最多的点数 class MaxPoints:"""149. 直线上最多的点数https://leetcode.cn/problems/max-points-on-a-line/description/?envTypestudy-plan-v2&envIdtop-interview-150"""def solution(self, points: List[List[int]]) ->…...

编程日记 2024/1/24 11:17:40

不合格机器人工程讲师再读《悉达多》-2024-

一次又一次失败的经历，让我对经典书籍的认同感越来越多，越来越觉得原来的自己是多么多么的无知和愚昧。 ----zhangrelay 唯物也好，唯心也罢，我们都要先热爱这个世界，然后才能在其中找到自己所热爱的事业。 ----zh…...

编程日记 2024/1/24 11:14:35

【STM32CubeMX串口通信详解】USART2 -- DMA发送 + DMA空闲中断接收不定长数据

（ 本篇正在编写、更新状态中.....) 文章目录： 前言前言本篇，详细地用截图解释 CubeMX 对 USART2 的配置，HAL函数使用，和收发程序的编写。收、发机制：DMA发送 DAM空闲中断接收。 DMA空…...

编程日记 2024/1/24 11:13:34

Webpack5入门到原理19：React 脚手架搭建

开发模式配置 // webpack.dev.js const path require("path"); const ESLintWebpackPlugin require("eslint-webpack-plugin"); const HtmlWebpackPlugin require("html-webpack-plugin"); const ReactRefreshWebpackPlugin require("…...

编程日记 2024/1/24 11:12:33

苹果眼镜（Vision Pro）的开发者指南（6）-实战应用场景开发 - 游戏、协作、空间音频、WebXR

第一部分：【构建游戏和媒体体验】了解如何使用visionOS在游戏和媒体体验中创建真正身临其境的时刻。游戏和媒体可以利用全方位的沉浸感来讲述令人难以置信的故事，并以一种新的方式与人们联系。将向你展示可供你入门的visionOS游戏和叙事开发途径。了解如何使用RealityKit有…...

编程日记 2024/1/24 11:09:29

flutter底层架构初探

本文出处：Flutter 中文开发者网站架构 embedder嵌入层提供程序入口（其他原生应用也采用此方式），程序由此和底层操作系统协调（surface渲染、辅助功能和输入服务，管理事件循环…...

编程日记 2024/1/24 11:08:28

初识SQL注入

目录注入攻击 SQL注入手工注入 Information_schema数据库自动注入介绍一下这款工具：sqlmap 半自动注入前面给大家通过学习练习的方式将XSS攻击的几种形式和一些简单的靶场和例题的演示，从本篇开始我将和小伙伴们通过边复习、边练习的方式来进…...

编程日记 2024/1/24 11:05:25

Python爬虫实战：研究MechanicalSoup库相关技术

一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库，专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力，提供了直观的 API，让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

编程新知 2025/10/10 18:13:55

铭豹扩展坞 USB转网口突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别，但在其他电脑上正常工作时，问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤，帮助你快速找到故障原因：背景：一个M-pard（铭豹）扩展坞的网卡突然无法识别了，扩展出来的三个USB接口正常。…...

编程新知 2026/2/9 16:05:07

P3 QT项目----记事本（3.8）

3.8 记事本项目总结项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

编程新知 2026/2/1 6:56:36

ETLCloud可能遇到的问题有哪些？常见坑位解析

数据集成平台ETLCloud，主要用于支持数据的抽取（Extract）、转换（Transform）和加载（Load）过程。提供了一个简洁直观的界面，以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

编程新知 2026/2/3 12:56:31

重启Eureka集群中的节点，对已经注册的服务有什么影响

先看答案，如果正确地操作，重启Eureka集群中的节点，对已经注册的服务影响非常小，甚至可以做到无感知。但如果操作不当，可能会引发短暂的服务发现问题。下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

编程新知 2025/9/24 3:38:34

Python 高效图像帧提取与视频编码：实战指南

Python 高效图像帧提取与视频编码：实战指南在音视频处理领域，图像帧提取与视频编码是基础但极具挑战性的任务。Python 结合强大的第三方库（如 OpenCV、FFmpeg、PyAV），可以高效处理视频流，实现快速帧提取、压缩编码等关键功能。本文将深入介绍如何优化这些流程，提高处理…...

编程新知 2025/8/31 18:02:53

C++_哈希表

本篇文章是对C学习的哈希表部分的学习分享相信一定会对你有所帮助~ 那咱们废话不多说，直接开始吧！ 一、基础概念 1. 哈希核心思想： 哈希函数的作用：通过此函数建立一个Key与存储位置之间的映射关系。理想目标：实现…...

编程新知 2026/1/28 11:27:52

怎么开发一个网络协议模块（C语言框架）之(六) ——通用对象池总结(核心)

+---------------------------+ | operEntryTbl[] | ← 操作对象池 (对象数组) +---------------------------+ | 0 | 1 | 2 | ... | N-1 | +---------------------------+↓ 初始化时全部加入 +------------------------+ +-------------------------+ | …...

编程新知 2025/8/28 4:17:05

uni-app学习笔记二十七--设置底部菜单TabBar的样式

官方文档地址：uni.setTabBarItem(OBJECT) | uni-app官网 uni.setTabBarItem(OBJECT) 动态设置 tabBar 某一项的内容，通常写在项目的App.vue的onLaunch方法中，用于项目启动时立即执行重要参数： indexnumber是tabBar 的哪一项&…...

编程新知 2026/2/9 13:55:48

开源项目实战学习之YOLO11：12.6 ultralytics-models-tiny_encoder.py

👉 欢迎关注，了解更多精彩内容 👉 欢迎关注，了解更多精彩内容 👉 欢迎关注，了解更多精彩内容 ultralytics-models-sam 1.sam-modules-tiny_encoder.py2.数据处理流程3.代码架构图（类层次与依赖）blocks.py：定义模型中的各种模块结构，如卷积块、残差块等基础构建…...

编程新知 2026/2/5 9:28:06

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

前言

一、TensorDataset、DataLoader的用法？

二、从.csv文件–>tensor张量

总结

相关文章：

深度学习技术栈 —— Pytorch之TensorDataset、DataLoader

远程git开发

Codeforces Round 812 (Div. 2) ---- C. Build Permutation --- 题解

Matlab 将工作区变量保存到文件中（save）

源码实现简介

我每天如何使用 ChatGPT

MySQL修炼手册14：用户权限管理：安全保障与数据隔离

动态规划解决马尔可夫决策过程

ubuntu1604安装及问题解决

Leetcode—24. 两两交换链表中的节点【中等】

USRP相关报错解决办法

【剑指offer】重建二叉树

中仕教育：事业编招考全流程介绍

149. 直线上最多的点数

不合格机器人工程讲师再读《悉达多》-2024-

【STM32CubeMX串口通信详解】USART2 -- DMA发送 + DMA空闲中断接收不定长数据

Webpack5入门到原理19：React 脚手架搭建

苹果眼镜（Vision Pro）的开发者指南（6）-实战应用场景开发 - 游戏、协作、空间音频、WebXR

flutter底层架构初探

初识SQL注入

Python爬虫实战：研究MechanicalSoup库相关技术

铭豹扩展坞 USB转网口突然无法识别解决方法

P3 QT项目----记事本（3.8）

ETLCloud可能遇到的问题有哪些？常见坑位解析

重启Eureka集群中的节点，对已经注册的服务有什么影响

Python 高效图像帧提取与视频编码：实战指南

C++_哈希表

怎么开发一个网络协议模块（C语言框架）之(六) ——通用对象池总结(核心)

uni-app学习笔记二十七--设置底部菜单TabBar的样式

开源项目实战学习之YOLO11：12.6 ultralytics-models-tiny_encoder.py