当前位置：首页 > news >正文

pytorch,tf维度理解RNN

news 2026/2/9 0:37:15

input_t = input_t.squeeze(1) 这行代码用于从 input_t 中去除尺寸为1的维度。在深度学习中，经常会出现具有额外尺寸为1的维度，这些维度通常是为了匹配模型的期望输入维度而添加的。

在这里，input_t可能具有形状 (batch_size, 1, feature_dim)，其中 1 表示时间步维度。在某些情况下，模型可能要求输入不包含时间步维度，而只包含 (batch_size, feature_dim) 的形状。为了适应模型的输入要求，squeeze(1) 被用来删除时间步维度，将 input_t 转换为 (batch_size, feature_dim) 的形状。

输入 (354, 32, 541, 1)
keras.layers.InputLayer(input_shape=(None, N, channels)),
TimeDistributed(Conv1D(18, 5, strides=3, activation=“relu”)), (354, 32, 179, 18) 108
TimeDistributed(Conv1D(20, 5, strides=2, activation=“relu”)), (354, 32, 88, 20) 1820
TimeDistributed(MaxPool1D()) (354, 32, 44, 20) 0
TimeDistributed(Conv1D(22, 5, activation=“relu”)) (354, 32, 40, 22) 2222
TimeDistributed(MaxPool1D()) (354, 32, 20, 22) 0
TimeDistributed(Conv1D(24, 5, activation=“relu”)) (354, 32, 16, 24) 2664
TimeDistributed(Flatten()) (354, 32, 384) 0
卷积层本质上是对一条数据进行各种特征变换（channel），最后经过Flatten降维，从二维的空间变回序列数据，交给RNN处理
TimeDistributed(Dense(32, activation=“relu”) (354, 32, 32) 12320
SimpleRNN(19, return_sequences=True) (354, 32, 19) 988
TimeDistributed(Dense(1)) (354, 32, 1) 20

为什么输入一定是四维的，后面都是四维，why？
这里我把T和channel弄混了，平常所说的Conv1d这种是没有T这个维度的，但是有channel这个维度。即，原本的Conv1d是三维的，现在加上时间T这个维度，一共四维

TimeDistributed输入至少为 3D（bs, time, feature），其中index = 1应该是时间所表示的维度
在这里插入图片描述
所以解释了，这里的None指的是T维度，因为input_shape是不包含batch维度的

对于RNN：如果 return_sequences：返回 3D 张量，尺寸为 (batch_size, timesteps, units)。
否则，返回尺寸为 (batch_size, units) 的 2D 张量

Conv1D的输入输出，pytorch和tf有何区别，维度分别是多少？
卷积是没有时间维度的！即seq_len(T)维度（纵向的），这里的L准确来说是input_size（横向的）
Pytorch Conv1d：
Input:( $N, C_{in},L)$ L是指sequence length, C指channel数量
Output: $N, C_{out}, L_{out})$
like Conv2d：
Input: $N, C_{in}, H, W)$
Onput: $N, C_{out}, H_{out}, W_{out})$

TensorFlow：
Conv1d：(batch_size, seq_len, channels) 受data_format = “channels_last (默认) / first” 参数控制
tf的设计理念是，除了第一个inputlayer，其他层都不需要给出输入的维度，模型会自动算出。且input layer给出的维度是不包含 batch 轴的。
首先在写模型的时候，keras.layers.Conv1D(filters, kernel_size）第一个参数就是outchannel，tf中是缺省了输入维度的，会自动匹配。其中filters的数量你可以想象成你想提取多少个“特征”

RNN和RNNCELL输入
在PyTorch中可以使用下面两种方式去调用，分别是torch.nn.RNNCell()和torch.nn.RNN()，这两种方式的区别在于RNNCell()只能接受序列中单步的输入，且必须传入隐藏状态，而RNN()可以接受一个序列的输入，默认会传入全0的隐藏状态，也可以自己申明隐藏状态传入。
如果用RNNCell()就相当于要必须在外面加个for循环，进行seq_len次forward，显式地将hidden传入给下一次forward。

batch的理解：
大多数情况可以直接忽略batch，因为他就是数据处理的一种并行化方式。但需要知道几个基础知识，比如模型参数是共享的，但是hidden state [bs, hidden state]，这种有bs的肯定不是共享的，hidden state就是记录状态用的。

总结：
RNN关心序列维度，缺省为单通道RNN，[bs, seq_len, input_size, 1]—>[bs,seq_len,input_size]
所以在把数据给RNN之前，都要把数据处理成上述样子。
CNN才关心Channel，而不关心seq_len，所以是[bs, channel, …]
最大的问题在于忽略了Channel这一维度，其实称之为特征维度：无论是1d，2d，3d都是在描述数据的多少，比如一个序列长度为12，比如一个图片的像素点有12 * 12个。
但是如果一个序列被三个传感器x，y，z检测记录，合起来组成这一个数据点，那么描述这一个数据点需要三个“特征”，channel = 3；同样，对于每个像素点的特征数量是3，所以channel = 3.

无论batchsize还是seq_len都是用来方便处理数据的，要区分于数据本身的特征：特征维度，共有多少个特征，每个特征几维

为什么需要TimeDistributed？
首先对于卷积操作来说维度是固定的，就像函数传参一样，不是任意长度的。

pytorch,tf维度理解RNN

input_t input_t.squeeze(1) 这行代码用于从 input_t 中去除尺寸为1的维度。在深度学习中，经常会出现具有额外尺寸为1的维度，这些维度通常是为了匹配模型的期望输入维度而添加的。在这里，input_t可能具有形状 (batch_size, 1, feature_dim…...

编程日记 2023/10/22 19:32:23

算法刷题-数组

算法刷题 209. 长度最小的子数组-二分或者滑动窗口给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其总和大于等于 target 的长度最小的连续子数组 [numsl, numsl1, ..., numsr-1, numsr] ，并返回其长度**。**如果不存在符合条件的子数…...

编程日记 2023/10/22 19:31:21

可视化数学分析软件 MATLAB R2021b mac中文版软件介绍

MATLAB R2021b mac作为数学类科技应用软件中首屈一指的商业数学软件，可以帮助您进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。…...

编程日记 2023/10/22 19:30:20

罗技摄像头左右翻转

需要下载驱动lws（我的是c310） LWS 罗技摄像头驱动下载打开驱动程序，高级设置。有个镜像。...

编程日记 2023/10/22 19:28:17

【Linux】操作系统的认识

操作系统 1. 冯诺依曼体系结构2. 操作系统 1. 冯诺依曼体系结构冯诺依曼体系结构的介绍冯.诺依曼结构消除了原始计算机体系中，只能依靠硬件控制程序的状况（程序作为控制器的一部分，作为硬件存在），将程序编码存储在…...

编程日记 2023/10/22 19:27:16

【论文阅读】(2023TPAMI)PCRLv2

目录 AbstractMethodMethodnsU-Net中的特征金字塔多尺度像素恢复多尺度特征比较从多剪切到下剪切训练目标总结 Abstract 现有方法及其缺点：最近的SSL方法大多是对比学习方法，它的目标是通过比较不同图像视图来保留潜在表示中的不变合判别语义&#xff…...

编程日记 2023/10/22 19:26:14

大数据学习(17)-mapreduce task详解

&&大数据学习&& 🔥系列专栏： 👑哲学语录: 承认自己的无知，乃是开启智慧的大门 💖如果觉得博主的文章还不错的话，请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…...

编程日记 2023/10/22 19:25:13

HCIA --- DHCP服务、路由器、网络部署及基本配置

带宽计算公式： 速率约等于 (带宽/8)*85% 网线分类： RJ-45双绞线非屏蔽线最佳距离100M； 民用 1000M/S 商用100000M/S 数字光纤光信号 RJ-11 电话线模拟信号同轴电缆数字信号光信号数字信号--二进制 …...

编程日记 2023/10/22 19:24:12

手把手入门Node框架Egg.js

0.介绍 Egg.js 是一个面向企业级应用开发的 Node.js 框架，它建立在 Koa.js 之上，提供了一种更简单、灵活的开发方式。Egg.js 提供了一些默认约定和最佳实践，可以帮助开发者快速构建可靠、可扩展的应用程序。基于 Koa.js：Egg.js …...

编程日记 2023/10/22 19:22:09

百度智能云推出，国内首个大模型全链路生态支持体系

在10月17日举行的百度世界2023上，百度智能云宣布，百度智能云千帆大模型服务平台已服务17000多家客户，覆盖近500个场景。同时，新的企业和开发者还正在不断地涌入千帆，大模型调用量高速攀升。平台上既有年龄仅14岁的小…...

编程日记 2023/10/22 19:21:08

CUDA学习笔记（八）Branch Divergence and Unrolling Loop

Avoiding Branch Divergence 有时，控制流依赖于thread索引。同一个warp中，一个条件分支可能导致很差的性能。通过重新组织数据获取模式可以减少或避免warp divergence（该问题的解释请查看warp解析篇）。 The Parallel Reduction …...

编程日记 2023/10/22 19:19:05

Android MQTT连接阿里云使用Json解析数据

Android Studio 连接阿里云订阅主题然后使用JSON解析数据非常好用导入MQTT的JAR包1、在项目中添加依赖然后使用Studio 去下载库2、直接下载JAR包，然后作为库进行导入环境验证：给程序进行联网权限XML布局文件效果如下： MainActitive.java 主…...

编程日记 2023/10/22 19:18:04

生成二维码

Qt本地生成二维码-第三方库Libqrencode Chapter1 Qt本地生成二维码-第三方库Libqrencode一、功能简介二、本地生成二维码三、在线生成二维码 Chapter2 Qt生成二维码图片方法QRCode二维码简介如何选定QR码版本？主要方法(1) 下载qrencode源码(2) 将qrencode源码移植到…...

编程日记 2023/10/22 19:17:03

【C++入门一】学习C++背景、开启C++奇妙之旅

目录 1.什么是C2. C的发展史3. C的重要性3.1 语言的使用广泛度3.2 在工作领域1. 操作系统以及大型系统软件开发2. 服务器端开发3. 游戏开发4. 嵌入式和物联网领域5. 数字图像处理6. 人工智能7. 分布式应用 3.3 在校招领域3.3.1 岗位需求3.3.2 笔试题 4. 如何学习C4.1 别人怎么学…...

编程日记 2023/10/22 19:16:02

oracle 表空间详解以及配置操作

Oracle 数据库是由若干个表空间构成的。任何数据库对象在存储时都必须存储在某个表空间中。表空间对应于若干个数据文件，即表空间是由一个或多个数据文件构成的。 1、常用表空间： 系统表空间 (system tablespace) 是每个 Oracle 数据库都必须具备的。…...

编程日记 2023/10/22 19:15:01

php判断是否是email格式

要判断一个字符串是否是有效的电子邮件地址，你可以使用正则表达式和PHP内置函数来完成。以下是一个示例代码： $email "exampleexample.com"; // 你要检查的电子邮件地址// 使用正则表达式检查电子邮件格式 if (filter_var($email, FILTER_VA…...

编程日记 2023/10/22 19:14:00

AJAX与JSON

1.AJAX 1.AJAX概述 AJAX(Asynchronous JavaScript And XML)：异步的 JavaScript 和 XML 本身不是一种新技术，而是多个技术综合。用于快速创建动态网页的技术一般的网页如果需要更新内容，必需重新加载个页面。而 Ajax通过浏览器与服务器…...

编程日记 2023/10/22 19:13:00

1024常玩到的漏洞(第十六课)

1024常玩到的两个漏洞(第十六课) 漏洞扫描工具 1024渗透OpenVas扫描工具使用(第十四课)-CSDN博客流程一 ms12-020漏洞分析 MS12-020漏洞是一种远程桌面协议（RDP）漏洞。在攻击者利用该漏洞之前，它需要将攻击者的计算机连接到受害者的计算机上。攻击者可以通过向受害者计算…...

编程日记 2023/10/22 19:11:59

【Edabit 算法 ★★★★★★】【两个大整数相加】Recursion: Sum of Two Numbers (With A Twist!)

Recursion: Sum of Two Numbers (With A Twist!) Instructions This is an “expert” challenge!!! Why is a sum of two numbers an “expert” challenge!!! Well, the numbers can have 1000 digits or even beyond such count… So, what’s the twist? You have to do …...

编程日记 2023/10/22 19:10:58

pytorch,tf维度理解RNN

相关文章：

pytorch,tf维度理解RNN

算法刷题-数组

可视化数学分析软件 MATLAB R2021b mac中文版软件介绍

罗技摄像头左右翻转

【Linux】操作系统的认识

【论文阅读】(2023TPAMI)PCRLv2

大数据学习(17)-mapreduce task详解

HCIA --- DHCP服务、路由器、网络部署及基本配置

手把手入门Node框架Egg.js

百度智能云推出，国内首个大模型全链路生态支持体系

CUDA学习笔记（八）Branch Divergence and Unrolling Loop

Android MQTT连接阿里云使用Json解析数据

生成二维码

【C++入门一】学习C++背景、开启C++奇妙之旅

oracle 表空间详解以及配置操作

php判断是否是email格式

AJAX与JSON

1024常玩到的漏洞(第十六课)

【Edabit 算法 ★★★★★★】【两个大整数相加】Recursion: Sum of Two Numbers (With A Twist!)

电容屏物体识别手工制作

挑战杯推荐项目

聊聊 Pulsar：Producer 源码解析

基于数字孪生的水厂可视化平台建设：架构与实践

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

HBuilderX安装（uni-app和小程序开发）

unix/linux，sudo，其发展历程详细时间线、由来、历史背景

React---day11

NPOI操作EXCEL文件 ——CAD C# 二次开发

深入理解Optional：处理空指针异常

Vue3 PC端 UI组件库我更推荐Naive UI