当前位置：首页 > news >正文

pytorch实现循环神经网络

news 2026/2/11 1:31:08

人工智能例子汇总：AI常见的算法和例子-CSDN博客

PyTorch 提供三种主要的 RNN 变体：

nn.RNN：最基本的循环神经网络，适用于短时依赖任务。
nn.LSTM：长短时记忆网络，适用于长序列数据，能有效解决梯度消失问题。
nn.GRU：门控循环单元，比 LSTM 计算更高效，适用于大部分任务。

网络类型	优势	适用场景
RNN	计算简单，适用于短时序列	语音、文本处理（短序列）
LSTM	适用于长序列，能记忆长期信息	机器翻译、语音识别、股票预测
GRU	比 LSTM 计算更高效，效果相似	语音处理、文本生成

例子：

import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt# 1. 生成正弦波数据（仅使用 PyTorch）
def generate_sine_wave(seq_length=10, num_samples=1000):x = torch.linspace(0, 100, num_samples)  # 生成 1000 个等间距数据点y = torch.sin(x)  # 计算正弦值X_data, Y_data = [], []for i in range(len(y) - seq_length):X_data.append(y[i:i + seq_length].unsqueeze(-1))  # 过去 seq_length 作为输入Y_data.append(y[i + seq_length])  # 预测下一个点return torch.stack(X_data), torch.tensor(Y_data).unsqueeze(-1)# 生成数据
seq_length = 10  # 序列长度
X, Y = generate_sine_wave(seq_length)# 划分训练集和测试集
train_size = int(0.8 * len(X))
X_train, X_test = X[:train_size], X[train_size:]
Y_train, Y_test = Y[:train_size], Y[train_size:]# 2. 定义 RNN 模型
class SimpleRNN(nn.Module):def __init__(self, input_size, hidden_size, output_size, num_layers=1):super(SimpleRNN, self).__init__()self.hidden_size = hidden_sizeself.num_layers = num_layersself.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True)self.fc = nn.Linear(hidden_size, output_size)def forward(self, x):h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)  # 初始化隐藏状态out, _ = self.rnn(x, h0)out = self.fc(out[:, -1, :])  # 取最后一个时间步的输出return out# 3. 训练模型
# 超参数
input_size = 1
hidden_size = 32
output_size = 1
num_layers = 1
num_epochs = 100
learning_rate = 0.001# 初始化模型
model = SimpleRNN(input_size, hidden_size, output_size, num_layers)
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=learning_rate)# 训练
for epoch in range(num_epochs):model.train()optimizer.zero_grad()outputs = model(X_train)loss = criterion(outputs, Y_train)loss.backward()optimizer.step()if (epoch + 1) % 10 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 4. 评估与绘图
model.eval()
with torch.no_grad():predictions = model(X_test)# 画图
plt.figure(figsize=(10, 5))
plt.plot(Y_test.numpy(), label="Real Data")
plt.plot(predictions.numpy(), label="Predicted Data")
plt.legend()
plt.title("RNN Sine Wave Prediction")
plt.show()

代码解析

数据生成

torch.linspace(0, 100, num_samples) 生成 1000 个均匀分布的数据点。
torch.sin(x) 计算正弦值，形成时间序列数据。
X 为过去 10 个时间步的数据，Y 为下一个时间步的预测目标。

构建 RNN

nn.RNN(input_size, hidden_size, num_layers, batch_first=True) 定义循环神经网络：
- input_size=1：每个时间步只有一个输入值（正弦波）。
- hidden_size=32：隐藏层神经元数目。
- num_layers=1：单层 RNN。
self.fc = nn.Linear(hidden_size, output_size) 负责最终输出。

训练

使用 MSELoss（均方误差损失） 计算预测值与真实值的误差。
使用 Adam 优化器 更新模型参数。
每 10 个 epoch 输出一次损失 loss。

测试 & 绘图

关闭梯度计算 (torch.no_grad())，执行前向传播预测测试数据。
Matplotlib 绘制预测曲线与真实曲线。

运行效果

如果训练成功，预测曲线（橙色）应该与真实曲线（蓝色）非常接近：

pytorch实现循环神经网络

人工智能例子汇总：AI常见的算法和例子-CSDN博客 PyTorch 提供三种主要的 RNN 变体： nn.RNN：最基本的循环神经网络，适用于短时依赖任务。nn.LSTM：长短时记忆网络，适用于长序列数据，能有效解决…...

编程日记 2025/2/1 21:18:32

Java 16进制 10进制 2进制数相互的转换

在 Java 中，进行进制之间的转换时，除了功能的正确性外，效率和安全性也很重要。为了确保高效和相对安全的转换，我们通常需要考虑： 性能：使用内置的转换方法，如 Integer.toHexString()、Integer.…...

编程日记 2025/2/1 21:17:30

力扣动态规划-14【算法学习day.108】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？建议灵神的题单和代码随想录）和记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关…...

编程日记 2025/2/1 21:12:24

数据结构day02

1 线性表的定义和基本操作 1.1 线性表的定义分析： 1.1.1 问题一：我们为什么探讨线性表的定义和基本操作在研究数据结构时，需要重点关注三个方面：逻辑结构、物理结构以及数据的运算。在本节内容里，我们首先来介绍线…...

编程日记 2025/2/1 21:08:13

随笔 | 写在一月的最后一天

. 前言这个月比预想中过的要快更多。突然回看这一个月，还有点不知从何提笔。整个一月可以总结为以下几个关键词： 期许，保持期许出现休息 . 期许关于期许，没有什么时候比一年伊始更适合设立目标和计划的了。但令人惭愧的…...

编程日记 2025/2/1 21:05:09

JVM方法区

一、栈、堆、方法区的交互关系二、方法区的理解: 尽管所有的方法区在逻辑上属于堆的一部分，但是一些简单的实现可能不会去进行垃圾收集或者进行压缩，方法区可以看作是一块独立于Java堆的内存空间。方法区(Method Area)与Java堆一样，是各个…...

编程日记 2025/2/1 21:02:06

一文读懂fgc之cms

一文读懂 fgc之cms-实战篇 1. 前言线上应用运行过程中可能会出现内存使用率较高，甚至达到95仍然不触发fgc的情况，存在内存打满风险，持续触发fgc回收；或者内存占用率较低时触发了fgc，导致某些接口tp99，tp…...

编程日记 2025/2/1 20:59:03

MYSQL 商城系统设计商品数据表的设计商品商品类别商品选项卡多表查询

介绍在开发商品模块时，通常使用分表的方式进行查询以及关联。在通过表连接的方式进行查询。每个商品都有不同的分类，每个不同分类下面都有商品规格可以选择，每个商品分类对应商品规格都有自己的价格和库存。在实际的开发中应该给这些表进行…...

编程日记 2025/2/1 20:58:02

HTB：Administrator[WriteUP]

目录连接至HTB服务器并启动靶机信息收集使用rustscan对靶机TCP端口进行开放扫描将靶机TCP开放端口号提取并保存使用nmap对靶机TCP开放端口进行脚本、服务扫描使用nmap对靶机TCP开放端口进行漏洞、系统扫描使用nmap对靶机常用UDP端口进行开放扫描使用nmap对靶机…...

编程日记 2025/2/1 20:54:56

开源项目Umami网站统计MySQL8.0版本Docker+Linux安装部署教程

Umami是什么？ Umami是一个开源项目，简单、快速、专注用户隐私的网站统计项目。下面来介绍如何本地安装部署Umami项目，进行你的网站统计接入。特别对于首次使用docker的萌新有非常好的指导、参考和帮助作用。 Umami的github和docker镜像地…...

编程日记 2025/2/1 20:49:51

FBX SDK的使用：基础知识

Windows环境配置 FBX SDK安装后，目录下有三个文件夹： include 头文件lib 编译的二进制库，根据你项目的配置去包含相应的库samples 官方使用案列动态链接 libfbxsdk.dll, libfbxsdk.lib是动态库，需要在配置属性->C/C->预…...

编程日记 2025/2/1 20:47:44

1.安装python环境 conda create -n mamba python3.10.13 -y conda activate mamba2.安装torch环境 conda install cudatoolkit11.8 -c nvidia pip install torch2.1.1 torchvision0.16.1 torchaudio2.1.1 --index-url https://download.pytorch.org/whl/cu1183.安装其他包 c…...

编程日记 2025/2/1 20:43:38

h2oGPT

文章目录一、关于 h2oGPT二、现场演示特点三、开始行动安装h2oGPT拼贴画演示资源文档指南开发致谢为什么选择 H2O.ai？免责声明一、关于 h2oGPT 使用文档、图像、视频等与本地GPT进行私人聊天。100%私人，Apache 2.0。支持oLLaMa、Mixtral、llama. cpp…...

编程日记 2025/2/1 20:41:36

Win10安装MySQL、Pycharm连接MySQL，Pycharm中运行Django

一、Windows系统mysql相关操作 1、检查系统是否安装mysql 按住win r （调出运行窗口） 输入service.msc，点击【确定】 image.png 打开服务列表-检查是否有mysql服务 （compmgmt.msc） image.png 2、 Windows安装MySQL …...

编程日记 2025/2/1 20:40:36

使用Pygame制作“俄罗斯方块”游戏

1. 前言俄罗斯方块（Tetris） 是一款由方块下落、行消除等核心规则构成的经典益智游戏： 每次从屏幕顶部出现一个随机的方块（由若干小方格组成），玩家可以左右移动或旋转该方块，让它合适地堆叠在…...

编程日记 2025/2/1 20:39:34

【Block总结】ODConv动态卷积，适用于CV任务|即插即用

一、论文信息论文标题：Omni-Dimensional Dynamic Convolution作者：Chao Li, Aojun Zhou, Anbang Yao发表会议：ICLR 2022论文链接：https://arxiv.org/pdf/2209.07947GitHub链接：https://github.com/OSVAI/ODConv 二…...

编程日记 2025/2/1 20:38:32

RK3568 opencv播放视频

文章目录一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法：主要方法：2. 视频播放基本流程代码示例：3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类在…...

编程日记 2025/2/1 20:37:30

《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》

文章目录 Langchain的定义Langchain的组成三个核心组件实现整个核心组成部分为什么要使用LangchainLangchain的底层原理Langchain实战操作LangSmithLangChain调用LLM安装openAI库-国内镜像源代码运行结果小结使用Langchain的提示模板部署Langchain程序安装langserve代码请求格…...

编程日记 2025/2/1 20:35:25

【搜索回溯算法篇】：拓宽算法视野--BFS如何解决拓扑排序问题

✨感谢您阅读本篇文章，文章内容是个人学习笔记的整理，如果哪里有误的话还请您指正噢✨ ✨ 个人主页：余辉zmh–CSDN博客 ✨ 文章所属专栏：搜索回溯算法篇–CSDN博客文章目录一.广度优先搜索（BFS）解决拓扑排…...

编程日记 2025/2/1 20:34:23

计算机网络（61）移动IP

前言移动IP（Mobile IP）是由Internet工程任务小组（Internet Engineering Task Force，IETF）提出的一个协议，旨在解决移动设备在不同网络间切换时的通信问题，确保移动设备可以在离开原有网络或子网…...

编程日记 2025/2/1 20:29:16

AtCoder 第409场初级竞赛 A~E题解

A Conflict 【题目链接】原题链接：A - Conflict 【考点】枚举【题目大意】找到是否有两人都想要的物品。【解析】遍历两端字符串，只有在同时为 o 时输出 Yes 并结束程序，否则输出 No。【难度】 GESP三级【代码参考】 #i…...

编程新知 2025/12/16 4:45:38

从深圳崛起的“机器之眼”：赴港乐动机器人的万亿赛道赶考路

进入2025年以来，尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断，但全球市场热度依然高涨，入局者持续增加。以国内市场为例，天眼查专业版数据显示，截至5月底，我国现存在业、存续状态的机器人相关企…...

编程新知 2026/2/8 7:23:45

MODBUS TCP转CANopen 技术赋能高效协同作业

在现代工业自动化领域，MODBUS TCP和CANopen两种通讯协议因其稳定性和高效性被广泛应用于各种设备和系统中。而随着科技的不断进步，这两种通讯协议也正在被逐步融合，形成了一种新型的通讯方式——开疆智能MODBUS TCP转CANopen网关KJ-TCPC-CANP…...

编程新知 2026/2/6 9:48:02

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

系列回顾： 在上一篇中，我们成功地为应用集成了数据库，并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了！但是，如果你仔细审视那些 API，会发现它们还很“粗糙”：有…...

编程新知 2026/1/22 20:46:43

汇编常见指令

汇编常见指令一、数据传送指令指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX（不访问内存）XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...

编程新知 2026/1/23 2:04:44

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件本期内容是为了更好的为大家解释木马（服务器方面的）的原理，连接，以及各种木马及连接工具的分享文件木马：https://w…...

编程新知 2026/1/25 10:13:29

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍： img 属性指定分区存放的 image 名称，指定的 image 名称必须是当前工程生成的 binary 。如果 binary 有多个文件，则以 proj_name:binary_name 格式指定文件名， proj_name 为工程名&…...

编程新知 2026/1/23 10:51:19

【Go语言基础【12】】指针：声明、取地址、解引用

文章目录零、概述：指针 vs. 引用（类比其他语言）一、指针基础概念二、指针声明与初始化三、指针操作符1. &：取地址（拿到内存地址）2. *：解引用（拿到值） 四、空指针&am…...

编程新知 2025/6/21 2:18:57

A2A JS SDK 完整教程：快速入门指南

目录什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

编程新知 2025/12/12 8:42:24

Python+ZeroMQ实战：智能车辆状态监控与模拟模式自动切换

目录关键点技术实现1 技术实现2 摘要： 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式（自动驾驶、人工驾驶、远程驾驶、主动安全），并通过实时消息推送更新车…...

编程新知 2025/11/12 0:06:50

pytorch实现循环神经网络

代码解析

数据生成

构建 RNN

训练

测试 & 绘图

运行效果

相关文章：

pytorch实现循环神经网络

Java 16进制 10进制 2进制数相互的转换

力扣动态规划-14【算法学习day.108】

数据结构day02

随笔 | 写在一月的最后一天

JVM方法区

一文读懂fgc之cms

MYSQL 商城系统设计商品数据表的设计商品商品类别商品选项卡多表查询

HTB：Administrator[WriteUP]

开源项目Umami网站统计MySQL8.0版本Docker+Linux安装部署教程

FBX SDK的使用：基础知识

VisionMamba安装

h2oGPT

Win10安装MySQL、Pycharm连接MySQL，Pycharm中运行Django

使用Pygame制作“俄罗斯方块”游戏

【Block总结】ODConv动态卷积，适用于CV任务|即插即用

RK3568 opencv播放视频

《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》

【搜索回溯算法篇】：拓宽算法视野--BFS如何解决拓扑排序问题

计算机网络（61）移动IP

AtCoder 第409场初级竞赛 A~E题解

从深圳崛起的“机器之眼”：赴港乐动机器人的万亿赛道赶考路

MODBUS TCP转CANopen 技术赋能高效协同作业

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

汇编常见指令

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

【Go语言基础【12】】指针：声明、取地址、解引用

A2A JS SDK 完整教程：快速入门指南

Python+ZeroMQ实战：智能车辆状态监控与模拟模式自动切换