当前位置：首页 > news >正文

N——＞BatchSize 数据维度理解和处理(chun, cat, squeeze, unsqueeze)

news 2026/2/10 20:43:58

数据处理之N——>BatchSize

N——>batch_size

train_data = TensorDataset(torch.Tensor(x_train).double(), torch.Tensor(y_train).double())
train_loader = DataLoader(train_data, batch_size=args.bs, shuffle=True, drop_last=True)
for batch_idx, (inputs, results) in enumerate(train_data):print(inputs.shape, results.shape)

不过我得说，train_loader局限于第一维，做的事如下代码：

for i in range(0, num_samples, batch_size):batch = data[i:i + batch_size]yield batch

在这里插入图片描述

维度

分块：iter.chunk(分成几块，dim)
连接：torch.cat( [ tensor1, tensor2 ]（放在列表中），dim)
升维1 / 降维1：squeeze(dim), unsqueeze(dim)

[64, 32, 1, 541]维度互换有影响吗？怎么去想这个事
数据本身并没有改变，只是数据在张量中的排列顺序发生了变化，也就是索引方式变了。
例如，如果你将形状为[5266, 32, 541, 1]的张量的第3和第4维度交换，你得到的张量仍然包含相同的元素，但它们在张量中的排列方式不同，变成了形状为[5266, 32, 1, 541]的张量。这在某些情况下可能对特定的计算或模型操作更有用。
既然要求你按照什么样的维度去排列索引，而且你也知道每个数字代表的对应的是什么意思，你就直接按照他说的顺序去改就是了啊！

只要你给的数据的维度能对得上就没有任何问题，最主要的是首先要搞明白你需要几维的数据，并搞明白每一维的意思，要对上，不然就会出现channel对到T上的尴尬问题。
$seq\_len$ ：序列长度
$input\_size$ ：序列的个体的维度
举一个例子，你的目的是要跑RNN，用RNNCELL，那么首先外部循环的肯定是seq_len，每次输入 $bs, channel, input\_size]$ 的数据到model里面。
那么如果如果提供的数据是 $[5266, 32, 1, 541] ， N = 5266$ $seq\_len = 32, input\_size = 541, channel = 1$
那么每一批次的维度比如是 $[128, 32, 1, 541]$
你的目标也就是得到每次的输入 $[128, 1, 541]$
要按照第二个维度展开，即将第二个维度分成32个块——>pytorch带的chunk函数
用法：iter.chunk(要分的快数量，沿着哪个维度)

seq.chunk(seq.size(1), dim = 1)#传入的是seq.size(1)即要分成每个为1的

然后得到： $[128, 1, 1, 541]$
再使用seq.squeeze(1)

squeeze 函数有一个可选的参数，即 dim，它指定了要挤压的维度。如果指定 dim，则 squeeze
仅删除指定的维度，如果该维度大小为1。如果不指定 dim，则默认情况下会删除所有尺寸为1的维度。

没看懂的深浅拷贝，clone，copy etc.
https://www.jb51.net/article/201724.htm

N——＞BatchSize 数据维度理解和处理(chun, cat, squeeze, unsqueeze)

数据处理之N——>BatchSize

维度

相关文章：

N——＞BatchSize 数据维度理解和处理(chun, cat, squeeze, unsqueeze)

【编解码格式】AV1

SLAM ORB-SLAM2（6）系统对象

03、Python 字符串高级用法

armbian安装gcc、g++

Linux多线程服务端编程：使用muduo C++网络库学习笔记第二章线程同步精要

中间件安全-CVE复现WeblogicJenkinsGlassFish漏洞复现

辅助驾驶功能开发-功能规范篇(16)-2-领航辅助系统NAP-HMI人机交互

[计算机入门] 应用软件介绍(娱乐类)

SL8541 android系统环境+编译

【苍穹外卖 | 项目日记】第八天

概念解析 | 毫米波雷达与计算机视觉的融合

嵌入式硬件中常见的100种硬件选型方式

Kubernetes 通过 Deployment 部署Jupyterlab

【Linux常用命令15】shell脚本

LTE系统TDD无线帧结构特点

微信小程序OA会议系统数据交互

TypeScript环境安装

连接Mumu模拟器使用ADB

springboot缓存篇之mybatis一级缓存和二级缓存

Ubuntu系统下交叉编译openssl

MongoDB学习和应用(高效的非关系型数据库)

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

循环冗余码校验CRC码算法步骤+详细实例计算

基于Flask实现的医疗保险欺诈识别监测模型

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

C++八股 —— 单例模式

.Net Framework 4/C# 关键字（非常用，持续更新...）

如何在网页里填写 PDF 表格？

AI，如何重构理解、匹配与决策？