当前位置：首页 > news >正文

Pytorch 对比TensorFlow 学习：Day 17-18: 循环神经网络（RNN）和LSTM

news 2025/7/13 4:40:49

Day 17-18: 循环神经网络（RNN）和LSTM

在这两天的学习中，我专注于理解循环神经网络（RNN）和长短期记忆网络（LSTM）的基本概念，并学习了它们在处理序列数据时的应用。

1.RNN和LSTM基础：

RNN：了解了RNN是如何处理序列数据的，特别是它的循环结构可以用于处理时间序列或连续数据。
LSTM：学习了LSTM作为RNN的一种改进，它通过引入遗忘门、输入门和输出门解决了RNN的长期依赖问题。

2.实践应用：

使用这些概念来处理一个简单的序列数据任务，例如时间序列预测或文本数据处理。
构建一个包含RNN或LSTM层的神经网络模型。

3.PyTorch和TensorFlow实现：

在PyTorch中，使用nn.RNN或nn.LSTM来实现这些网络。
在TensorFlow中，使用Keras的SimpleRNN或LSTM层。

PyTorch代码示例：

import torch
import torch.nn as nn
import torch.optim as optim
class SimpleLSTM(nn.Module):#定义一个简单的LSTM模型
def init(self, input_size, hidden_size, num_classes):
super(SimpleLSTM, self).init()
self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)
self.fc = nn.Linear(hidden_size, num_classes)
def forward(self, x):
# 初始隐藏状态和细胞状态
h0 = torch.zeros(1, x.size(0), hidden_size)
c0 = torch.zeros(1, x.size(0), hidden_size)
# 前向传播
out, _ = self.lstm(x, (h0, c0))
out = out[:, -1, :]
out = self.fc(out)
return out
#实例化模型、定义损失函数和优化器
input_size = 10 # 输入数据的特征维度
hidden_size = 20 # 隐藏层特征维度
num_classes = 2 # 输出类别数
model = SimpleLSTM(input_size, hidden_size, num_classes)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

TensorFlow代码示例
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

#定义一个简单的LSTM模型
model = Sequential([
LSTM(20, input_shape=(None, 10)), # 输入序列的长度任意，特征维度为10
Dense(2, activation=‘softmax’) # 假设是二分类问题
])

#编译模型
model.compile(optimizer=‘adam’,
loss=‘sparse_categorical_crossentropy’,
metrics=[‘accuracy’])

#模型概要
model.summary()

Pytorch 对比TensorFlow 学习：Day 17-18: 循环神经网络（RNN）和LSTM

相关文章：

Pytorch 对比TensorFlow 学习：Day 17-18: 循环神经网络（RNN）和LSTM

Java基础 - 07 Set之Set，AbstractSet

C++17新特性（三）新的标准库组件

Spring Boot入门

【LeetCode】数学精选4题

【漏洞复现】Hikvision SPON IP网络对讲广播系统命令执行漏洞(CVE-2023-6895)

IDEA在重启springboot项目时没有自动重新build

华为设备NAT的配置

48-DOM节点，innerHTML,innerText,outerHTML,outerText，静态获取，单机click，cssText

多输入多输出 | Matlab实现基于LightGBM多输入多输出预测

【欢迎您的到来】这里是开源库get_local_info作者的付费专栏

Java SE入门及基础（23）

蓝桥杯回文日期判断

Qt文件和目录相关操作

递归、搜索与回溯算法（专题一：递归）

element-ui 打包流程源码解析（下）

ChatGPT给出的前端面试考点（Vue.js）

ChatGPT 商业提示词攻略书

Notepad++运行C语言输出乱码

深入解析 Java 方法引用：Lambda 表达式的进化之路

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

vscode里如何用git

边缘计算医疗风险自查APP开发方案

用docker来安装部署freeswitch记录

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

GC1808高性能24位立体声音频ADC芯片解析

以光量子为例，详解量子获取方式

Selenium常用函数介绍

数据结构：递归的种类（Types of Recursion）

CSS3相关知识点