当前位置：首页 > news >正文

深度学习4. 循环神经网络 – Recurrent Neural Network | RNN

news 2026/2/10 17:52:33

循环神经网络 – Recurrent Neural Network | RNN

为什么需要 RNN ？独特价值是什么？

RNN 的基本原理

RNN 的优化算法

RNN 到 LSTM – 长短期记忆网络

从 LSTM 到 GRU

RNN 的应用和使用场景

总结

百度百科+维基百科

循环神经网络 – Recurrent Neural Network | RNN

为什么需要 RNN ？独特价值是什么？

卷积神经网络和普通的算法大部分都是输入和输出的一一对应，也就是一个输入得到一个输出。不同的输入之间是没有联系的。

但是在某些场景中，一个输入就不够了！

为了填好下面的空，取前面任何一个词都不合适，我们不但需要知道前面所有的词，还需要知道词之间的顺序。

这种需要处理「序列数据 – 一串相互依赖的数据流」的场景就需要使用 RNN 来解决了。

典型的集中序列数据：

文章里的文字内容
语音里的音频内容
股票市场中的价格走势
……

RNN 之所以能够有效的处理序列数据，主要是基于他的比较特殊的运行原理。下面给大家介绍一下 RNN 的基本运行原理。

RNN 的基本原理

传统神经网络的结构比较简单：输入层 – 隐藏层 – 输出层。如下图所示：

传统神经网络

RNN 跟传统神经网络最大的区别在于每次都会将前一次的输出结果，带到下一次的隐藏层中，一起训练。如下图所示：

RNN区别

下面用一个具体的案例来看看 RNN 是如何工作的：

假如需要判断用户的说话意图（问天气、问时间、设置闹钟…），用户说了一句“what time is it？”我们需要先对这句话进行分词：

对输入进行分词

然后按照顺序输入 RNN ，我们先将 “what”作为 RNN 的输入，得到输出「01」

输入what，得到输出01

然后，我们按照顺序，将“time”输入到 RNN 网络，得到输出「02」。

这个过程我们可以看到，输入 “time” 的时候，前面 “what” 的输出也产生了影响（隐藏层中有一半是黑色的）。

以此类推，前面所有的输入都对未来的输出产生了影响，大家可以看到圆形隐藏层中包含了前面所有的颜色。如下图所示：

RNN 对前面输入有「记忆」作用的体现

当我们判断意图的时候，只需要最后一层的输出「05」，如下图所示：

RNN 最后一层的输出是我们最终想要的

RNN 的缺点也比较明显

隐藏层中的颜色分布

通过上面的例子，我们已经发现，短期的记忆影响较大（如橙色区域），但是长期的记忆影响就很小（如黑色和绿色区域），这就是 RNN 存在的短期记忆问题。

RNN 有短期记忆问题，无法处理很长的输入序列
训练 RNN 需要投入极大的成本

由于 RNN 的短期记忆问题，后来又出现了基于 RNN 的优化算法，下面给大家简单介绍一下。

RNN 的优化算法

RNN 到 LSTM – 长短期记忆网络

RNN 是一种死板的逻辑，越晚的输入影响越大，越早的输入影响越小，且无法改变这个逻辑。

LSTM 做的最大的改变就是打破了这个死板的逻辑，而改用了一套灵活了逻辑——只保留重要的信息。

简单说就是：抓重点！(很多核心算法就是改权重：抓大放小)

举个例子，我们先快速的阅读下面这段话：

当我们快速阅读完之后，可能只会记住下面几个重点：

LSTM 类似上面的划重点，他可以保留较长序列数据中的「重要信息」，忽略不重要的信息。这样就解决了 RNN 短期记忆的问题。

从 LSTM 到 GRU

Gated Recurrent Unit – GRU 是 LSTM 的一个变体。他保留了 LSTM 划重点，遗忘不重要信息的特点，在long-term 传播的时候也不会被丢失。

GRU 主要是在LSTM的模型上做了一些简化和调整

GRU 主要是在 LSTM 的模型上做了一些简化和调整，在训练数据集比较大的情况下可以节省很多时间。

RNN 的应用和使用场景

只要涉及到序列数据的处理问题，都可以使用到，NLP 就是一个典型的应用场景。

RNN的应用和使用场景

文本生成：类似上面的填空题，给出前后文，然后预测空格中的词是什么。

机器翻译：翻译工作也是典型的序列问题，词的顺序直接影响了翻译的结果。

语音识别：根据输入音频判断对应的文字是什么。

生成图像描述：类似看图说话，给一张图，能够描述出图片中的内容。这个往往是 RNN 和 CNN 的结合。

视频标记：他将视频分解为图片，然后用图像描述来描述图片内容。

总结

RNN的独特价值在于：它能有效的处理序列数据。比如：文章内容、语音音频、股票价格走势…

之所以他能处理序列数据，是因为在序列中前面的输入也会影响到后面的输出，相当于有了“记忆功能”。但是 RNN 存在严重的短期记忆问题，长期的数据影响很小（哪怕他是重要的信息）。

于是基于 RNN 出现了 LSTM 和 GRU 等变种算法。这些变种算法主要有几个特点：

长期信息可以有效的保留
挑选重要信息保留，不重要的信息会选择“遗忘”

RNN 几个典型的应用如下：

文本生成
语音识别
机器翻译
生成图像描述
视频标记

循环神经网络（Recurrent Neural Network, RNN）

是一类以序列（sequence）数据为输入，在序列的演进方向进行递归（recursion）且所有节点（循环单元）按链式连接形成闭合回路的递归神经网络（recursive neural network）。

对循环神经网络的研究始于二十世纪80-90年代，并在二十一世纪初发展为重要的深度学习（deep learning）算法，其中双向循环神经网络（Bidirectional RNN, Bi-RNN）和长短期记忆网络（Long Short-Term Memory networks，LSTM）是常见的的循环神经网络。

循环神经网络具有记忆性、参数共享并且图灵完备（Turing completeness），因此能以很高的效率对序列的非线性特征进行学习。循环神经网络在自然语言处理（Natural Language Processing, NLP），例如语音识别、语言建模、机器翻译等领域有重要应用，也被用于各类时间序列预报或与卷积神经网络（Convoutional Neural Network,CNN）相结合处理计算机视觉问题。

循环神经网络（RNN）是一类神经网络，其中节点之间的连接形成一个有向图沿着序列。这允许它展示时间序列的时间动态行为。与前馈神经网络不同，RNN可以使用其内部状态（存储器）来处理输入序列。这使它们适用于诸如未分段，连接手写识别或语音识别等任务。

术语“递归神经网络”被不加选择地用于指代具有类似一般结构的两大类网络，其中一个是有限脉冲而另一个是无限脉冲。两类网络都表现出时间动态行为。有限脉冲递归网络是一种有向无环图，可以展开并用严格的前馈神经网络代替，而无限脉冲循环网络是一种无法展开的有向循环图。

有限脉冲和无限脉冲周期性网络都可以具有额外的存储状态，并且存储可以由神经网络直接控制。如果存储包含时间延迟或具有反馈循环，则存储也可以由另一个网络或图表替换。这种受控状态称为门控状态或门控存储器，并且是长短期存储器网络（LSTM）和门控循环单元的一部分。

深度学习4. 循环神经网络 – Recurrent Neural Network | RNN

目录循环神经网络 – Recurrent Neural Network | RNN 为什么需要 RNN ？独特价值是什么？ RNN 的基本原理 RNN 的优化算法 RNN 到 LSTM – 长短期记忆网络从 LSTM 到 GRU RNN 的应用和使用场景总结百度百科维基百科循环神经网络 – Recurre…...

编程日记 2023/8/26 23:26:06

自动驾驶感知传感器标定安装说明

1. 概述本标定程序为整合现开发的高速车所有标定模块，可实现相机内参标定和激光、相机、前向毫米波至车辆后轴中心标定，标定参数串联传递并提供可视化工具验证各个模块标定精度。整体标定流程如下，标定顺序为下图前标0-->1-->2-->3，相同编号标定顺序没有强制要求…...

编程日记 2023/8/26 23:25:05

基于JAYA算法优化的BP神经网络（预测应用） - 附代码

基于JAYA算法优化的BP神经网络（预测应用） - 附代码文章目录基于JAYA算法优化的BP神经网络（预测应用） - 附代码1.数据介绍2.JAYA优化BP神经网络2.1 BP神经网络参数设置2.2 JAYA算法应用 4.测试结果：5.Matlab代码摘要…...

编程日记 2023/8/26 23:24:04

基于单片机串口控制直流电机调速

一、系统方案 (2)本设计采用STC89C5单片机作为主控器，串口控制直流电机调速，串口助手发送1-8，改变电机速度，数码管显示对应速度。二、硬件设计原理图如下： 三、单片机软件设计 1、首先是系统初始化 TMOD0x21;//定…...

编程日记 2023/8/26 23:23:02

Linux(基础篇一)

Linux基础篇 Linux基础篇一1. Linux文件系统与目录结构1.1 Linux文件系统1.2 Linux目录结构 2. VI/VIM编辑器2.1 vi/vim是什么2.2 模式间的转换2.3 一般模式2.4 插入模式2.4.1 进入编辑模式2.4.2 退出编辑模式 2.5 命令模式 3. 网络配置3.1 网络连接模式3.2 修改静态ip3.3 配置…...

编程日记 2023/8/26 23:22:01

小程序如何手动变更会员卡等级

有时候需要商家手动变更会员卡等级，以让会员获取更多的福利和特权。下面就介绍一些小程序手动变更会员卡等级的常见方法和策略。 1. 找到指定的会员卡。在管理员后台->会员管理处，找到需要更改等级的会员卡。也支持对会员卡按卡号、手机号和等级进行…...

编程日记 2023/8/26 23:21:00

Tensorflow2.0搭建网络八股

目录引言：keras与Tensorflow2.0结合一、六步法 1.导入头文件：import 2.收集处理训练集和测试集：train, test： 3.描述各层网model tf.keras.models.Sequential： 4.描述使用什么优化反向传播：model.c…...

编程日记 2023/8/26 23:19:58

【安装GPU版本pytorch，torch.cuda.is_available()仍然返回False问题】

TOC 第一步检查cuda是否安装，CUDA环境变量是否正确设置，比如linux需要设置在PATH，window下环境变量编辑看看，是否有CUDA 第二步，核查python中torch版本首先查看你环境里的pytorch是否是cuda版本，我这…...

编程日记 2023/8/26 23:18:57

Git 版本控制系统

git相关代码 0、清屏幕：clear 1、查看版本号 git -v2、暂存、更改、提交 3、当前项目下暂存区中有哪些文件 git ls-files4、查看文件状态 git status -s5、暂时存储，可以临时恢复代码内容 git restore 目标文件 //（注意：完全…...

编程日记 2023/8/26 23:17:55

70吨服务区生活污水处理设备加工厂家电话

70吨服务区生活污水处理设备加工厂家电话设备简单说明调节池由于来水标高低，无法直接流入地埋式生活污水处理设备，在生化一体化设备前增加集水调节池一座。集水提升池内装有两台潜水提升泵，将集水提升池内的废水提升至一体化污水处理设备。…...

编程日记 2023/8/26 23:16:54

十一、hadoop应用

1.上传数据集 27.19.74.143,2015/3/30 17:38,/static/image/common/faq.gif 110.52.250.126,2015/3/30 17:38,/data/cache/style_1_widthauto.css?y7a 27.19.74.143,2015/3/30 17:38,/static/image/common/hot_1.gif 27.19.74.143,2015/3/30 17:38,/static/image/common/hot_2…...

编程日记 2023/8/26 23:15:53

循环神经网络 – Recurrent Neural Network | RNN

为什么需要 RNN ？独特价值是什么？

RNN 的基本原理

RNN 的优化算法

RNN 到 LSTM – 长短期记忆网络

从 LSTM 到 GRU

RNN 的应用和使用场景

总结

循环神经网络（Recurrent Neural Network, RNN）

相关文章：