当前位置：首页 > news >正文

pytorch 笔记：GRU

news 2026/2/9 11:13:30

1 介绍

对于输入序列中的每个元素，每一层都计算以下函数：

ht 是t时刻的隐藏状态
xt 是t时刻的输入
ht−1 是 t-1时刻同层的隐藏状态或 0时刻的初始隐藏状态
rt,zt,nt 分别是重置门、更新门和新门。
σ 是 sigmoid 函数
∗ 是 Hadamard 乘积。

在多层GRU中，第 l 层的输入 $x_t^{(l)}$ （对于 l≥2）是前一层的隐藏状态 $h_t^{(l-1)}$ 乘以概率 dropout $\delta_t^{t-1}$ 。

2 基本使用方法

torch.nn.GRU(self, input_size, hidden_size, num_layers=1, bias=True, batch_first=False, dropout=0.0, bidirectional=False,    device=None, dtype=None)

3 参数说明

input_size	输入 x 中预期的特征数
hidden_size	隐藏状态 h 的特征数
num_layers	GRU层数
bias	如果为 False，则该层不使用偏置权重bi,bh
batch_first	如果为 True，则输入和输出张量以（batch, seq, feature）提供，而不是（seq, batch, feature）
dropout	如果非零，则在除最后一层之外的每个 GRU 层的输出上引入一个 Dropout 层，其中 dropout 概率等于 dropout
bidirectional	如果为 True，成为双向 GRU。默认值为 False

输入：input (seq_len,batch,input_size), h_0(D*num_layers,batch,hidden_size) D表示单向还是双向GRU

输出：output（seq_len,D*hidden_size),h_n(D*num_layers,batch,hidden_size)

4 举例

import torch.nn as nnrnn = nn.GRU(input_size=5,hidden_size=10,num_layers=2)input_x = torch.randn(7, 3, 5)
#seq_len,batch,input_sizeh0 = torch.randn(2, 3, 10)
#D*num_layer,batch,hidden_sizeoutput, hn = rnn(input_x, h0)
output.shape, hn.shape,output, hn
#seq_len,batch,input_size D*num_layer,batch,hidden_size
'''
(torch.Size([7, 3, 10]),torch.Size([2, 3, 10]),tensor([[[ 2.3096e-01,  4.7877e-01, -6.0747e-02,  3.1251e-01,  4.4528e-01,-2.6670e-01, -1.1168e+00,  7.3444e-01, -8.5343e-01, -8.6078e-02],[ 1.4765e+00, -4.4738e-01,  2.9812e-01, -6.6684e-01,  4.5928e-01,1.5543e+00, -2.7558e-01, -7.5153e-01,  5.0880e-01,  6.0543e-02],[ 8.9311e-01,  4.0004e-01,  1.6901e-01,  1.5932e-01, -1.2210e-01,3.0321e-01, -2.8612e-01, -1.4686e-01,  2.8579e-01,  1.1582e-02]],[[ 3.2400e-01,  4.1382e-01, -1.6979e-01,  9.6827e-02,  4.6004e-01,-4.7673e-02, -5.0143e-01,  4.6305e-01, -6.7894e-01,  8.7199e-04],[ 1.0779e+00, -1.7995e-02,  1.4842e-01, -4.0097e-01,  2.1145e-01,1.0362e+00, -3.9766e-01, -5.6097e-01,  3.0160e-01,  1.4931e-02],[ 6.1099e-01,  3.5822e-01,  9.1912e-02, -6.6886e-02,  8.1180e-02,2.2922e-01, -1.2506e-01,  2.9601e-02,  2.8049e-02, -1.5160e-02]],[[ 3.4037e-01,  3.0256e-01, -9.5463e-02, -1.0667e-01,  4.1159e-01,-1.7158e-02, -1.6656e-01,  3.3041e-01, -4.9750e-01, -9.4554e-02],[ 7.2198e-01,  1.1721e-01,  5.7578e-02, -1.4264e-01,  4.4159e-02,7.4929e-01, -2.6565e-01, -3.7547e-01,  1.3828e-01,  6.9896e-02],[ 4.5888e-01,  2.9849e-01,  1.1400e-01, -1.4953e-01,  1.8319e-01,1.2005e-01, -1.0588e-01,  1.2678e-01, -9.6599e-02, -6.3649e-02]],[[ 2.6923e-01,  1.9539e-01, -8.3442e-02, -1.0092e-01,  2.9727e-01,5.5752e-02, -1.6502e-01,  1.5522e-01, -3.3283e-01, -1.5289e-02],[ 5.0674e-01,  2.2620e-01, -1.6900e-02, -1.6849e-02,  1.3829e-01,3.0847e-01, -1.6965e-01, -1.9627e-01,  3.3316e-02,  6.3073e-02],[ 3.9663e-01,  3.0165e-01, -1.2318e-02, -1.4176e-01,  2.3552e-01,-3.8588e-02, -8.2455e-03,  1.6961e-01, -1.3624e-01, -7.3225e-03]],[[ 2.4548e-01,  1.7003e-01, -1.9854e-01, -4.2608e-02,  2.2749e-01,6.0757e-02, -7.5942e-02,  1.0205e-01, -2.2418e-01,  1.1453e-01],[ 3.5747e-01,  1.6106e-01, -2.9625e-02,  7.5182e-02,  7.6844e-02,2.4100e-01, -7.6047e-02, -6.7489e-02, -3.3757e-02,  1.1799e-01],[ 3.1698e-01,  1.8008e-01, -5.1838e-02, -9.3295e-02,  1.7627e-01,2.4971e-02, -2.4372e-02,  1.4522e-01, -1.1888e-01,  3.5780e-02]],[[ 1.8998e-01,  9.6675e-02, -9.7632e-02, -8.5483e-02,  1.2471e-01,1.4351e-01, -3.0885e-02,  1.0894e-01, -1.8797e-01,  3.5201e-02],[ 2.8278e-01,  1.7304e-01, -1.9512e-02,  7.8874e-02,  1.4434e-01,1.0537e-01, -8.5619e-02,  2.5765e-02, -9.0284e-02,  9.8876e-02],[ 2.3387e-01,  8.8567e-02, -3.5850e-02, -2.8561e-02,  1.2145e-01,1.1404e-01, -1.1314e-01,  7.1272e-02, -1.0356e-01,  7.2997e-02]],[[ 1.5414e-01,  8.1896e-02, -1.4372e-01, -4.9761e-02,  8.5839e-02,1.7213e-01, -3.9533e-02,  4.7469e-02, -1.3332e-01,  8.3625e-02],[ 2.3274e-01,  1.5516e-01, -4.0695e-02,  3.1735e-02,  1.9340e-01,4.3769e-03, -4.9590e-02,  6.0317e-02, -1.0783e-01,  4.7750e-02],[ 1.3002e-01,  1.2265e-02, -3.3010e-03,  2.6260e-02,  6.5244e-02,2.3599e-01, -2.3918e-01, -4.4371e-02, -9.0464e-02,  1.1589e-01]]],grad_fn=<StackBackward0>),tensor([[[ 0.4118, -0.0513, -0.2540, -0.2115, -0.4503,  0.0357, -0.2615,-0.2243,  0.0580, -0.1405],[ 0.2653,  0.5365, -0.5024, -0.3466, -0.1986,  0.2726, -0.1399,-0.1821, -0.3203,  0.1749],[ 0.6847, -0.2840, -0.1549,  0.3359, -0.0230, -0.0229, -0.2775,-0.1442, -0.1158, -0.2203]],[[ 0.1541,  0.0819, -0.1437, -0.0498,  0.0858,  0.1721, -0.0395,0.0475, -0.1333,  0.0836],[ 0.2327,  0.1552, -0.0407,  0.0317,  0.1934,  0.0044, -0.0496,0.0603, -0.1078,  0.0477],[ 0.1300,  0.0123, -0.0033,  0.0263,  0.0652,  0.2360, -0.2392,-0.0444, -0.0905,  0.1159]]], grad_fn=<StackBackward0>))
'''

pytorch 笔记：GRU

1 介绍对于输入序列中的每个元素，每一层都计算以下函数： ht 是t时刻的隐藏状态xt 是t时刻的输入ht−1 是 t-1时刻同层的隐藏状态或 0时刻的初始隐藏状态rt,zt,nt 分别是重置门、更新门和新门。σ 是 sigmoid 函数∗ 是 Hadamard 乘积。…...

编程日记 2023/11/2 1:46:46

Kubernetes - Ingress HTTP 升级 HTTPS 配置解决方案（新版本v1.21+）

之前我们讲解过 Kubernetes - Ingress HTTP 搭建解决方案，并分别提供了旧版本和新版本。如果连 HTTP 都没搞明白的可以先去过一下这两篇 Kubernetes - Ingress HTTP 负载搭建部署解决方案_放羊的牧码的博客-CSDN博客Kubernetes - Ingress HTTP 负载搭建部署解决方案…...

编程日记 2023/11/2 1:45:44

module flow_led(input sys_clk, //系统时钟50Mhz 周期0.02nsinput sys_rst_n, //系统异步复位，低电平有效output reg [3:0] led ); reg [24:0] cnt;//计数器计时0.5s250000000*0.02ns always(posedge sys_clk or negedge sys_rst_n)beginif(!sys_rst_n)cnt <…...

编程日记 2023/11/2 1:44:42

操作系统第四章-存储器管理

4.1 内存的基本知识 4.1.1 逻辑地址和物理地址逻辑地址又称为相对地址物理地址又称为绝对地址一. 逻辑地址内存中有多个进程,相对地址是相对于进程的起始地址而言的地址. 二.物理地址绝对地址是在整个内存下的地址 4.2 程序的装入和链接引入:用户程序要在系统中运…...

编程日记 2023/11/2 1:43:41

org.springframework.cloud:spring-cloud-starter-openfeign:jar is missing详解

openfeign无法导入的问题我感觉最近带的好几个新人在搭建springCloud基础框架的时候，会犯一个非常小的错误，导致进度卡住了。这个错误就是Feign导入的错误： ‘dependencies.dependency.version’ for org.springframework.cloud:spring-c…...

编程日记 2023/11/2 1:42:40

Netty第一部

一、select和epoll原理分析外设设备网卡、鼠标、键盘等通过总线写到内存中，中间就有DMA拷贝，操作系统怎么知道内存中有数据了，这就需要操作系统通过中断机制确定，如果有中断信号过来，cpu会首先打断用户程序执行&…...

编程日记 2023/11/2 1:41:39

【设计模式】第11节：结构型模式之“装饰器模式”

一、简介装饰器模式主要解决继承关系过于复杂的问题，通过组合来替代继承。它主要的作用是给原始类添加增强功能。这也是判断是否该用装饰器模式的一个重要的依据。除此之外，装饰器模式还有一个特点，那就是可以对原始类嵌套使用多个装饰器。…...

编程日记 2023/11/2 1:40:37

Spire.doc读取模板文档，并在书签处插入内容

在书签位置插入文字 //加载模板文档 Document document new Document(Server.MapPath("~/File/评价结果.doc")); //创建书签导航器 BookmarksNavigator bn new BookmarksNavigator(document); //添加一个section到文档 Section newSec document.AddSection(); …...

编程日记 2023/11/2 1:37:33

性能测试实施流程，5个阶段给老板安排的明明白白！

性能测试分为5个阶段，分别是【需求调研阶段】→【测试准备阶段】→【测试执行阶段】→【测试报告阶段】→【测试总结阶段】。 1、需求调研阶段需求调研分为两个步骤进行：需求调研、需求分析需求调研需求调研工作由性能测试实施人员牵头负责&#…...

编程日记 2023/11/2 1:36:32

【教程】R语言生物群落（生态）数据统计分析与绘图

查看原文>>>R语言生物群落（生态）数据统计分析与绘图实践暨融合《R语言基础》、《tidyverse数据清洗》、《多元统计分析》、《随机森林模型》、《回归及混合效应模型》、《结构方程模型》、《统计结果作图》七合一版本方案 R 语言作的开源、自…...

编程日记 2023/11/2 1:35:31

数据库-用户权限管理

创建用户： create user testlocalhost identified by 123456; create user 创建用户的固定开头 testlocalhost test为用户名， localhost:新建用户可以在哪些主机上登录，即使可以使用IP地址，网段主机名都可以 identified by 1…...

编程日记 2023/11/2 1:34:30

十一、W5100S/W5500+RP2040树莓派Pico＜ARP 地址解析＞

文章目录 1 前言2 简介2 .1 什么是ARP？2.2 ARP的优点2.3 ARP工作原理2.4 ARP应用场景 3 WIZnet以太网芯片4 ARP网络设置示例概述以及使用4.1 流程图4.2 准备工作核心4.3 连接方式4.4 主要代码概述4.5 结果演示 5 注意事项6 相关链接 1 前言随着网络安全越来越受到重…...

编程日记 2023/11/2 1:33:29

可以直接在线制作电子画册的网站

随着互联网技术的发展，越来越多的人开始使用在线工具来制作电子画册。今天，小编就来介绍一款可以直接在线制作电子画册的网站，让你的电子画册更加精美、个性化和实用。 1.首先点击FLBOOK在线制作制作电子杂志平台 2.点击开始制作&#xff0…...

编程日记 2023/11/2 1:32:28

SortableJS：vuedraggable实现元素拖放排序

文档：https://sortablejs.github.io/Sortable/github：https://github.com/SortableJS/SortableVue2: https://github.com/SortableJS/Vue.DraggableVue3: https://github.com/SortableJS/vue.draggable.nextnpm https://www.npmjs.com/package/vuedragga…...

编程日记 2023/11/2 1:31:27

跟着Nature Communications学作图：纹理柱状图+添加显著性标签！

📋文章目录复现图片设置工作路径和加载相关R包读取数据集数据可视化计算均值和标准差方差分析组间t-test 图a可视化过程图b可视化过程合并图ab 跟着「Nature Communications」学作图，今天主要通过复刻NC文章中的一张主图来巩固先前分享过的知识点&#…...

编程日记 2023/11/2 1:29:25

88. 合并两个有序数组、Leetcode的Python实现

博客主页：🏆李歘歘的博客 🏆 🌺每天不定期分享一些包括但不限于计算机基础、算法、后端开发相关的知识点，以及职场小菜鸡的生活。🌺 💗点关注不迷路，总有一些📖知识点&am…...

编程日记 2023/11/2 1:28:24

视频列表：点击某个视频进行播放，其余视频全部暂停（同时只播放一个视频）

目录需求实现原理实现代码页面展示需求视频列表：点击某个视频进行播放，其余视频全部暂停（同时只播放一个视频） 实现原理在 video 标签添加自定义属性 id (必须唯一)给每个 video 标签添加 play 视频播放事件播放视频时&…...

编程日记 2023/11/2 1:27:23

论文-分布式-共识，事务以及两阶段提交的历史描述

这是一段关于一致性，事务以及两阶段提交的历史的描述阅读关于一致性的文献可能会有些困难，因为： 各种用语在不断的演化着(比如一致性<consensus>最初叫做协商<agreement>)； 各种研究成果并不是以一种逻辑性的顺序产生…...

编程日记 2023/11/2 1:26:22

[100天算法】-二叉树剪枝（day 48）

题目描述给定二叉树根结点 root ，此外树的每个结点的值要么是 0，要么是 1。返回移除了所有不包含 1 的子树的原二叉树。( 节点 X 的子树为 X 本身，以及所有 X 的后代。)示例1: 输入: [1,null,0,0,1] 输出: [1,null,0,null,1]示例2: 输入: […...

编程日记 2023/11/2 1:25:21

常用编程语言排行与应用场景汇总（2023.10）

文章目录编程语言排行一、Python二、C三、C四、Java五、C#六、JavaScript七、VB（Visual Basic）八、PHP九、SQL十、ASM（Assembly Language）十一、Go十二、Scratch十三、Delphi/Object Pascal十四、MATLAB十五、Swift十六、Fortran…...

编程日记 2023/11/2 1:24:20

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

生成 Git SSH 证书

🔑 1. 生成 SSH 密钥对在终端（Windows 使用 Git Bash，Mac/Linux 使用 Terminal）执行命令： ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 参数说明： -t rsa&#x…...

编程新知 2025/9/18 11:31:13

HBuilderX安装（uni-app和小程序开发）

下载HBuilderX 访问官方网站：https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本： Windows版（推荐下载标准版） Windows系统安装步骤运行安装程序： 双击下载的.exe安装文件如果出现安全提示&…...

编程新知 2026/1/31 12:52:04

JDK 17 新特性

#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持，不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的&#xff…...

编程新知 2026/1/29 5:34:29

return this；返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请，不同级别的经理有不同的审批权限： // 抽象处理者：审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

编程新知 2026/1/28 21:45:43

快刀集(1): 一刀斩断视频片头广告

一刀流：用一个简单脚本，秒杀视频片头广告，还你清爽观影体验。 1. 引子作为一个爱生活、爱学习、爱收藏高清资源的老码农，平时写代码之余看看电影、补补片，是再正常不过的事。电影嘛，要沉浸，…...

编程新知 2026/1/8 0:40:27

MySQL 索引底层结构揭秘：B-Tree 与 B+Tree 的区别与应用

文章目录一、背景知识：什么是 B-Tree 和 BTree？ B-Tree（平衡多路查找树） BTree（B-Tree 的变种） 二、结构对比：一张图看懂三、为什么 MySQL InnoDB 选择 BTree？ 1. 范围查询更快 2…...

编程新知 2026/2/3 19:38:38

从“安全密码”到测试体系：Gitee Test 赋能关键领域软件质量保障

关键领域软件测试的"安全密码"：Gitee Test如何破解行业痛点在数字化浪潮席卷全球的今天，软件系统已成为国家关键领域的"神经中枢"。从国防军工到能源电力，从金融交易到交通管控，这些关乎国计民生的关键领域…...

编程新知 2026/2/2 20:26:17

Django RBAC项目后端实战 - 03 DRF权限控制实现

项目背景在上一篇文章中，我们完成了JWT认证系统的集成。本篇文章将实现基于Redis的RBAC权限控制系统，为系统提供细粒度的权限控制。开发目标实现基于Redis的权限缓存机制开发DRF权限控制类实现权限管理API配置权限白名单前置配置在开始开发权限…...

编程新知 2025/10/1 4:57:11

pytorch 笔记：GRU

1 介绍

2 基本使用方法

3 参数说明

4 举例

相关文章：

pytorch 笔记：GRU

Kubernetes - Ingress HTTP 升级 HTTPS 配置解决方案（新版本v1.21+）

Verilog：写流水灯时遇到的问题

操作系统第四章-存储器管理

org.springframework.cloud:spring-cloud-starter-openfeign:jar is missing详解

Netty第一部

【设计模式】第11节：结构型模式之“装饰器模式”

Spire.doc读取模板文档，并在书签处插入内容

性能测试实施流程，5个阶段给老板安排的明明白白！

【教程】R语言生物群落（生态）数据统计分析与绘图

数据库-用户权限管理

十一、W5100S/W5500+RP2040树莓派Pico＜ARP 地址解析＞

可以直接在线制作电子画册的网站

SortableJS：vuedraggable实现元素拖放排序

跟着Nature Communications学作图：纹理柱状图+添加显著性标签！

88. 合并两个有序数组、Leetcode的Python实现

视频列表：点击某个视频进行播放，其余视频全部暂停（同时只播放一个视频）

论文-分布式-共识，事务以及两阶段提交的历史描述

[100天算法】-二叉树剪枝（day 48）

常用编程语言排行与应用场景汇总（2023.10）

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

Admin.Net中的消息通信SignalR解释

生成 Git SSH 证书

HBuilderX安装（uni-app和小程序开发）

JDK 17 新特性

return this；返回的是谁

快刀集(1): 一刀斩断视频片头广告

MySQL 索引底层结构揭秘：B-Tree 与 B+Tree 的区别与应用

从“安全密码”到测试体系：Gitee Test 赋能关键领域软件质量保障

Django RBAC项目后端实战 - 03 DRF权限控制实现