自然语言处理(一):RNN
「循环神经网络」(Recurrent Neural Network,RNN)是一个非常经典的面向序列的模型,可以对自然语言句子或是其他时序信号进行建模。进一步讲,它只有一个物理RNN单元,但是这个RNN单元可以按照时间步骤进行展开,在每个时间步骤接收当前时间步的输入和上一个时间步的输出,然后进行计算得出本时间步的输出。
Why
-
CNN 需要固定长度的输入、输出,RNN 的输入和输出可以是不定长且不等长的 -
CNN 只有 one-to-one 一种结构,而 RNN 有多种结构,如下图:
Model
-
简单模型示例
循环神经网络的隐藏层的值s不仅仅取决于当前这次的输入x,还取决于上一次隐藏层的值s。「权重矩阵」 W就是「隐藏层」上一次的值作为这一次的输入的权重。
-
RNN时间线展开
时刻的输入,不仅是 ,还应该包括上一个时刻所计算的 。
-
使用公式表示
示例
下面我们举个例子来讨论一下,如图所示,假设我们现在有这样一句话:”我爱人工智能”,经过分词之后变成”我,爱,人工,智能”这4个单词,RNN会根据这4个单词的时序关系进行处理,在第1个时刻处理单词”我”,第2个时刻处理单词”爱”,依次类推。
从图上可以看出,RNN在每个时刻 均会接收两个输入,一个是当前时刻的单词 ,一个是来自上一个时刻的输出 ,经过计算后产生当前时刻的输出 。例如在第2个时刻,它的输入是”爱”和 ,它的输出是 ;在第3个时刻,它的输入是”人工”和 , 输出是 ,依次类推,直到处理完最后一个单词。
总结一下,RNN会从左到右逐词阅读这个句子,并不断调用一个相同的RNN Cell来处理时序信息,每阅读一个单词,RNN首先将本时刻 的单词 和这个模型内部记忆的「状态向量」 融合起来,形成一个带有最新记忆的状态向量 。
-
「Tip」:当RNN读完最后一个单词后,那RNN就已经读完了整个句子,一般可认为最后一个单词输出的状态向量能够表示整个句子的语义信息,即它是整个句子的语义向量,这是一个常用的想法。
Code
-
数据准备
import torch
import torch.nn as nn
import numpy as np
torch.manual_seed(0) # 设置随机种子以实现可重复性
seq_length = 5
input_size = 1
hidden_size = 10
output_size = 1
batch_size = 1
time_steps = np.linspace(0, np.pi, 100)
data = np.sin(time_steps)
data.resize((len(time_steps), 1))
# Split data into sequences of length 5
x = []
y = []
for i in range(len(data)-seq_length):
_x = data[i:i+seq_length]
_y = data[i+seq_length]
x.append(_x)
y.append(_y)
x = np.array(x)
y = np.array(y)
-
Model
class RNN(nn.Module):
def __init__(self, input_size, hidden_size, output_size):
super(RNN, self).__init__()
self.hidden_size = hidden_size
self.rnn = nn.RNN(input_size, hidden_size, batch_first=True)
self.fc = nn.Linear(hidden_size, output_size)
def forward(self, x, hidden):
out, hidden = self.rnn(x, hidden)
out = out.view(-1, self.hidden_size)
out = self.fc(out)
return out, hidden
-
Train
model = RNN(input_size, hidden_size, output_size)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
for epoch in range(100):
total_loss = 0
hidden = None
for i in range(len(x)):
optimizer.zero_grad()
input_ = torch.Tensor(x[i]).unsqueeze(0)
target = torch.Tensor(y[i])
output, hidden = model(input_, hidden)
hidden = hidden.detach()
loss = criterion(output, target)
loss.backward()
optimizer.step()
total_loss += loss.item()
if epoch % 10 == 0:
print(f'Epoch {epoch}, Loss: {total_loss}')
缺点
-
当阅读很长的序列时,网络内部的信息会逐渐变得越来越复杂,以至于超过网络的记忆能力,使得最终的输出信息变得混乱无用。
参考
-
https://zhuanlan.zhihu.com/p/30844905 -
https://paddlepedia.readthedocs.io/en/latest/tutorials/sequence_model/rnn.html -
https://saturncloud.io/blog/building-rnn-from-scratch-in-pytorch/ -
https://pytorch.org/docs/stable/generated/torch.nn.RNN.html
本文由 mdnice 多平台发布
相关文章:
自然语言处理(一):RNN
「循环神经网络」(Recurrent Neural Network,RNN)是一个非常经典的面向序列的模型,可以对自然语言句子或是其他时序信号进行建模。进一步讲,它只有一个物理RNN单元,但是这个RNN单元可以按照时间步骤进行展开…...
超全总结!大模型算法面试指南(含答案)
大家好,从 2019 年的谷歌 T5 到 OpenAI GPT 系列,参数量爆炸的大模型不断涌现。可以说,LLMs 的研究在学界和业界都得到了很大的推进,尤其去年 11 月底对话大模型 ChatGPT 的出现更是引起了社会各界的广泛关注。 近些年࿰…...
前端使用C-lodop 实现循环套打小案例
目录 前言引入js文件小案例 前言 lodop是一个很优秀打印插件,具体的大家可以官网了解,先在官网下载插件,安装在本地,并启动,点击官网下载 引入js文件 //本JS是加载Lodop插件或Web打印服务CLodop/Lodop7的综合示例&a…...
基于SpringBoot+Vue+mysql卓越导师双选系统设计与实现
博主介绍:✌Csdn特邀作者、博客专家、博客云专家、B站程序阿龙带小白做毕设系列,项目讲解、B站粉丝排行榜前列、专注于Java技术领域和毕业项目实战✌ 系统说明简介: 如今的信息时代,对信息的共享性,信息的流通性有着较…...
Windows 11系统cmd终端美化、Vscode终端美化
win11美化cmd终端和vscode的终端 1. 修改终端背景2. oh-my-posh2.1 安装oh-my-posh2.2 安装Clink2.3 Clink配置oh-my-posh2.4 下载和配置Nerd字体2.5 修改美化主题 3. vscode终端美化 电脑默认的终端没有语法高亮这些,运行命令和代码输出字体一样,有时会…...
[游戏中的图形学实时渲染技术] Part1 实时阴影技术
原理篇: 常见的渲染方程如下: 在不考虑自发光项与考虑阴影对于着色结果的影响之后可以将方程变化为如下形式: 如果射线在到达光源前击中了其他物体时,就认为这条来自光源的光线对着色点没有贡献。 利用上述渲染方程进行正确的着…...
NtripShare Mos地铁自动化监测终端盒子硬件设计
自动化监测产品到目前为止做了接近一年,在软件层面上,控制终端软件、平台软件、网平差算法都已解决,硬件盒子始终是心里过不去的坎,最终还是没有耐住性子自己做了一把。 选型如下: 1、主板:瑞芯微RK3568主板。 2、外…...
第 117 场 LeetCode 双周赛题解
A 给小朋友们分糖果 I 动态规划:设 p [ k ] [ i ] p[k][i] p[k][i] 为将 i i i 个糖果分给 k k k 个小朋友的方案数,先求 p [ 2 ] [ i ] p[2][i] p[2][i] ,再求 p [ 3 ] [ n ] p[3][n] p[3][n] class Solution { public:using ll long …...
OpenCV C++ 图像处理实战 ——《多二维码识别》
OpenCV C++ 图像处理实战 ——《多二维码识别》 一、结果演示二、zxing库配置2.1下载编译三、多二维码识别3.1 Method one3.1.1 源码3.2 Method two3.2.1 源码四、源码测试图像下载总结一、结果演示 </...
经典算法(查找与排序)
查找 顺序查找 顺序查找(Linear Search)是一种在有序数组中查找目标元素的基本算法。它的时间复杂度为 O(n),适用于查找少量数据。顺序查找的基本思想是从数组的第一个元素开始,逐个与待查找的元素进行比较,直到找到…...
微软和Red Hat合体:帮助企业更方便部署容器
早在2015年,微软就已经和Red Hat达成合作共同为企业市场开发基于云端的解决方案。时隔两年双方在企业市场的多个方面开展更紧密的合作,今天两家公司再次宣布帮助企业更方便地部署容器。 双方所开展的合作包括在微软Azure上部署Red Hat OpenShift…...
ZYNQ_project:IP_ram_pll_test
例化MMCM ip核,产生100Mhz,100Mhz并相位偏移180,50Mhz,25Mhz的时钟信号。 例化单口ram,并编写读写控制器,实现32个数据的写入与读出。 模块框图: 代码: module ip_top(input …...
Leetcode刷题详解——优美的排列
1. 题目链接:526. 优美的排列 2. 题目描述: 假设有从 1 到 n 的 n 个整数。用这些整数构造一个数组 perm(下标从 1 开始),只要满足下述条件 之一 ,该数组就是一个 优美的排列 : perm[i] 能够被…...
[PHP]Kodexplorer可道云 v4.47
KodExplorer可道云,原名芒果云,是基于Web技术的私有云和在线文件管理系统,由上海岱牧网络有限公司开发,发布于2012年6月。致力于为用户提供安全可控、可靠易用、高扩展性的私有云解决方案。 用户只需通过简单环境搭建,…...
C/C++数字判断 2021年9月电子学会青少年软件编程(C/C++)等级考试一级真题答案解析
目录 C/C数字判断 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 C/C数字判断 2021年9月 C/C编程等级考试一级编程题 一、题目要求 1、编程实现 输入一个字符,如何输入的字符是数字&#x…...
云栖大会丨桑文锋:打造云原生数字化客户经营引擎
近日,2023 云栖大会在杭州举办。今年云栖大会回归了 2015 的主题:「计算,为了无法计算的价值」。神策数据创始人 & CEO 桑文锋受邀出席「生态产品与伙伴赋能」技术主题,并以「打造云原生数字化客户经营引擎」为主题进行演讲。…...
如何用java写一个网站:从零搭建个性化网站
随着互联网的迅猛发展,Java作为一种强大而灵活的编程语言,为构建各类网站提供了丰富的解决方案。本文将探讨如何使用Java编写一个个性化网站,并通过具体实例进行深入分析。 第一步:选择适当的技术栈 在着手构建网站之前࿰…...
Easyui DataGrid combobox联动下拉框内容
发票信息下拉框联动,更具不同的发票类型,显示不同的税率 专票 普票 下拉框选择事件 function onSelectType(rec){//选中值if (rec2){//普通发票对应税率pmsPlanList.pmsInvoiceTaxRatepmsPlanList.pmsInvoiceTaxRateT}else {//专用发票对应税率pmsPlan…...
力扣学习笔记——11. 盛最多水的容器
链接:https://leetcode.cn/problems/container-with-most-water/ 11. 盛最多水的容器 给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的…...
Spring Boot: 约定优于配置的软件设计思想
文章目录 传统Spring框架的繁琐配置1. **管理jar包依赖**2. **维护web.xml**3. **维护Dispatch-Servlet.xml配置项**4. **应用部署到Web容器**5. **第三方组件集成到Spring IOC容器中的配置项维护** Spring Boot的简化与自动化1. Spring Boot Starter启动依赖2. 自动装配机制3.…...
5篇2章12节:诊断试验准确性研究与多阈值Meta分析方法(下篇:可视计算)
多阈值 Meta 分析通过整合全阈值范围内的诊断效能数据,为临床实践提供更全面的证据支持,但数据转换的复杂性与结果可视化的直观性一直是技术痛点。本文作为诊断试验准确性研究系列下篇,接着全面讲解可视化绘图和诊断统计量计算 。 一、plot () 函数 diagmeta包的plot()函数…...
Yalmip进阶指南:解锁约束函数在组合优化与逻辑建模中的实战技巧
1. 从数独到排班:alldifferent函数的进阶玩法 第一次接触alldifferent函数时,我和大多数人一样,只把它当作解决数独游戏的工具。直到有次帮朋友设计排班系统,才发现这个函数的真正威力。想象一下医院护士排班场景:每位…...
从开环到闭环:手把手推导典型系统传递函数,彻底搞懂‘1+GH’怎么来的
从开环到闭环:手把手推导典型系统传递函数,彻底搞懂‘1GH’怎么来的 在自动控制原理的学习中,闭环传递函数的分母总是出现"1GH"这个神秘组合,这绝非偶然。本文将带您从零开始,通过典型闭环系统结构图&#x…...
Codex 和 Claude Code 的区别与各自优势:AI 编程助手该怎么选?
Codex 和 Claude Code 的区别与各自优势:AI 编程助手该怎么选? 最近 AI 编程工具发展很快,Codex 和 Claude Code 都已经不只是“代码补全工具”,而是更接近可以理解项目、修改文件、运行命令、执行测试、辅助提交代码的 agentic c…...
**图优化实战:基于Python与NetworkX的高效路径规划与结构优化**在现代软件系统设计中,**图数据结构**已成
图优化实战:基于Python与NetworkX的高效路径规划与结构优化 在现代软件系统设计中,图数据结构已成为解决复杂问题的核心工具之一。无论是社交网络分析、推荐系统建模,还是智能交通调度、任务依赖管理,图优化都扮演着关键角色。本文…...
Java 代码质量与静态分析最佳实践 2027:构建高质量软件
Java 代码质量与静态分析最佳实践 2027:构建高质量软件别叫我大神,叫我 Alex 就好。今天我们来聊聊 Java 代码质量与静态分析的最佳实践 2027,这些实践可以帮助我们构建更可靠、更可维护的软件。一、引言 代码质量是软件开发的核心要素之一&a…...
全球非洲科技展聚焦非洲数字化发展
“2026全球非洲科技展”3月28日在阿尔及利亚首都阿尔及尔开幕,本次展会聚焦推动非洲数字基础设施建设和促进非洲技术主权。 联合国副秘书长、秘书长数字和新兴技术特使阿曼迪普辛格吉尔在开幕致辞中表示,非洲各国应携手合作,制定自己的人工智…...
自动化框架对比:Selenium vs Playwright - 专业深度解析
在快速迭代的软件开发周期中,自动化测试已成为保障产品质量的核心环节。作为软件测试从业者,选择高效的测试框架直接关系到测试效率、维护成本和团队协作。本文将针对两大主流框架——Selenium与Playwright——进行专业对比,涵盖架构设计、性…...
Spring AI RAG实战:从基础问答到高级检索增强生成
1. 为什么需要RAG技术? 最近两年大语言模型(LLM)发展迅猛,但实际应用中经常会遇到三个头疼的问题:模型知识更新不及时、回答缺乏事实依据、对特定领域理解不深。比如你问ChatGPT"今年最新发布的iPhone有什么新功能…...
终极免费音频标注工具:Audio Annotator三步快速上手指南
终极免费音频标注工具:Audio Annotator三步快速上手指南 【免费下载链接】audio-annotator A JavaScript interface for annotating and labeling audio files. 项目地址: https://gitcode.com/gh_mirrors/au/audio-annotator Audio Annotator是一款基于Java…...
