当前位置: 首页 > article >正文

循环神经网络 - 机器学习任务之异步的序列到序列模式

前面我们学习了机器学习任务之同步的序列到序列模式:循环神经网络 - 机器学习任务之同步的序列到序列模式-CSDN博客

本文我们来学习循环神经网络应用中的第三种模式:异步的序列到序列模式!

一、基本概述:

异步的序列到序列模式也称为编码器-解码器(Encoder-Decoder)模型,即 输入序列和输出序列不需要有严格的对应关系,也不需要保持相同的长度。比如在机器翻译中,输入为源语言的单词序列,输出为目标语言的单词序列。

在异步的序列到序列模式中,输入为长度为 𝑇 的序列 𝒙1∶𝑇 = (𝒙1, ⋯ , 𝒙𝑇 ),输出为长度为𝑀的序列𝑦1∶𝑀 =(𝑦1,⋯,𝑦𝑀)。

异步的序列到序列模式一般通过先编码后解码的方式来实现.先将样本 𝒙 按不同时刻输入到一个循环神经网络(编码器 ) 中 ,并得到其编码 𝒉 𝑇 。然后再使用另 一 个循环神经网络 ( 解码器 ),得到 输出序列 𝑦̂1∶𝑀。

为了建立输出序列之间的依赖关系,在解码器中通常使用非线性的自回归模型。令 𝑓1 (⋅) 和 𝑓2 (⋅) 分别为用作编码器和解码器的循环神经网络,则编码器-解码器模型可以写为:

其中𝑔(⋅)为分类器,𝒚̂ 为预测输出𝑦̂ 的向量表示。在解码器通常采用自回归模型,每个时刻的输入为上一时刻的预测结果 𝑦̂𝑡−1。

下图给出了异步的序列到序列模式示例,其中 ⟨𝐸𝑂𝑆⟩ 表示输入序列的结束, 虚线表示将上一个时刻的输出作为下一个时刻的输入。

二、具体案例

循环神经网络(RNN)在异步的序列到序列(Asynchronous Sequence-to-Sequence)模式中的应用,主要解决输入序列和输出序列在时间或长度上不对等的场景。以下是通俗易懂的解释和两个具体案例:

核心概念:异步的序列到序列

  • 同步模式:输入和输出的时间步严格对齐(如视频逐帧分类,每帧对应一个标签)。

  • 异步模式:输入和输出的序列长度不同、时间不对齐,且输出可能滞后于输入。
    典型特征

    • 输入序列:[x₁, x₂, ..., xₘ](长度m

    • 输出序列:[y₁, y₂, ..., yₙ](长度n,且n ≠ m

    • 模型需要动态调整输入与输出的时序关系

案例1:实时语音翻译(同声传译)

场景描述
  • 输入:一段连续的中文语音(如"今天天气很好"),按时间分帧输入。

  • 输出:对应的英文翻译("The weather is nice today"),输出可能比输入延迟几秒。

异步性体现
  • 输入(语音帧)是实时流入的,而输出(翻译结果)需要积累足够上下文后才能生成。

  • 输入序列长度(语音时长)与输出序列长度(英文单词数)不匹配。

RNN处理过程
  1. 编码器(Encoder):使用RNN(如LSTM)逐步处理语音帧,生成隐藏状态。

  2. 解码器(Decoder):在输入未完全接收时,解码器已开始生成部分翻译,但需等待关键信息(如动词位置)后再输出完整句子。

  3. 注意力机制(Attention):动态对齐输入语音帧与输出单词的对应关系。

示例
  • 输入语音帧序列:[今, 天, 天, 气, 很, 好](逐帧输入)

  • 输出翻译序列:[The, weather, is, nice, today](可能在输入到"气"时开始输出"The weather",后续调整)

案例2:股票价格预测(多步预测)

场景描述
  • 输入:过去5天的股票数据(开盘价、成交量等),按时间顺序输入。

  • 输出:未来3天的价格预测,但预测需要在第3天就给出全部3天的结果。

异步性体现
  • 输入是连续的历史数据流,输出需要一次性预测多步未来值。

  • 输入长度(5天)与输出长度(3天)不同,且输出需要提前生成。

RNN处理过程
  1. 编码器:用RNN编码过去5天的数据,生成隐藏状态(包含趋势信息)。

  2. 解码器:从隐藏状态出发,通过自回归(Auto-regressive)方式逐步预测未来3天的值。

    • 第1步预测y₁(第6天价格),将其作为输入预测y₂(第7天),依此类推。

  3. 教师强制(Teacher Forcing):训练时使用真实值作为解码器输入,测试时使用预测值迭代生成。

示例
  • 输入序列:[Day1, Day2, Day3, Day4, Day5](历史数据)

  • 输出序列:[Day6, Day7, Day8](未来预测,需在第5天结束时全部输出)

异步模式的关键技术

  1. 编码器-解码器架构:分离输入处理和输出生成。

  2. 注意力机制:解决长距离依赖和对齐问题。

  3. 自回归生成:解码器逐步生成输出,每一步依赖前一步结果。

  4. 动态长度支持:通过<EOS>(结束符)标记灵活控制输入输出长度。

与传统同步模式对比

任务类型同步模式(如情感分析)异步模式(如机器翻译)
输入输出对齐严格对齐(1输入 → 1输出)动态对齐(多输入 → 多输出)
典型应用视频逐帧分类、实时传感器监测翻译、语音识别、文本摘要
RNN结构单层RNN直接映射编码器-解码器 + 注意力机制

异步的序列到序列模式是RNN在动态时序场景下的核心能力,它允许模型灵活处理输入与输出的复杂对应关系。无论是同声传译中的"边听边译",还是股票预测中的"多步前瞻",都体现了RNN对现实世界异步任务的强大建模能力。

三、上面提到“自回归Auto-regressive”怎么理解?

自回归(Auto-regressive)的核心思想是:用过去的数据预测未来的数据,且每一步的预测都依赖之前的预测结果。这种“逐步生成”的方式就像“自己给自己提供线索”,非常适用于生成序列数据(如文本、语音、时间序列等)。

通俗理解

想象你在写一篇文章:

  1. 你写下第一个词:“今天”。

  2. 根据“今天”,你接着写“天气”。

  3. 根据“今天天气”,你继续写“很好”。

  4. 最终得到完整的句子:“今天天气很好”。

这就是自回归:每一步生成新内容时,都依赖之前生成的所有内容。机器学习的自回归模型和你的思考过程类似,只是用数学方法实现。

自回归的两种场景

1. 时间序列预测(如股票价格)
  • 目标:用历史数据预测未来值。

  • 方法:每一步预测都基于前几步的真实值或预测值。

例子:预测未来3天的温度

  • 输入:过去5天的温度 [20℃, 22℃, 21℃, 23℃, 24℃]

  • 自回归预测过程:

    1. 根据过去5天,预测第6天是 25℃

    2. 用第6天的预测值 25℃ 和之前的数据,预测第7天是 26℃

    3. 再用第6-7天的预测值,预测第8天是 27℃

问题:如果第一步预测错了(比如实际第6天是 23℃),后续预测会越来越偏离真实值。

2. 文本生成(如GPT写文章)
  • 目标:生成连贯的句子或段落。

  • 方法:每生成一个词,都依赖之前生成的词。

例子:生成句子

  • 输入提示:“人工智能”

  • 自回归生成过程:

    1. 模型生成“是” → “人工智能是”;

    2. 基于“人工智能是”,生成“未来” → “人工智能是未来”;

    3. 基于“人工智能是未来”,生成“的” → “人工智能是未来的”;

    4. 继续生成,直到得到完整句子:“人工智能是未来的核心技术”。

关键特点:生成过程像“滚雪球”,每一步都基于前面的结果。

自回归在模型中的实现

以GPT-3生成文本为例:

  1. 输入:用户提供开头(如“人工智能”)。

  2. 第一步:模型计算“人工智能”后面最可能的词(假设是“的”)。

  3. 第二步:将“人工智能的”输入模型,计算下一个词(可能是“发展”)。

  4. 循环:重复此过程,直到生成完整的句子。

数学表达
模型每次预测第t个词的概率:
P(词ₜ | 词₁, 词₂, ..., 词ₜ₋₁)

自回归的优缺点

优点缺点
生成结果连贯,上下文逻辑一致生成速度慢(必须一步步计算)
适合长序列生成(如文章、对话)错误会累积(一步错,步步错)
技术成熟(GPT、LSTM均采用)无法并行计算(依赖前序结果)

自回归 vs 非自回归

对比项自回归(如GPT)非自回归(如BERT填词)
生成方式逐词生成,依赖前文可同时生成所有词
速度
质量更连贯可能逻辑跳跃
典型应用文本生成、翻译文本纠错、摘要

生活中的自回归例子

  1. 导航路线规划

    • 你开车时,每到一个路口都根据当前位置重新规划路线。

    • 类似自回归:每一步决策依赖之前的路径。

  2. 音乐即兴创作

    • 音乐家根据已弹奏的音符决定下一个音符。

    • 自回归模型生成音乐时也是同理。

自回归是机器生成序列数据的核心方法,本质是“用过去推导未来”。无论是让AI写诗、预测股票,还是生成对话,都依赖这种“步步为营”的逻辑。它的缺点(速度慢)和优点(结果连贯)就像硬币的两面,选择使用时需权衡任务需求。

相关文章:

循环神经网络 - 机器学习任务之异步的序列到序列模式

前面我们学习了机器学习任务之同步的序列到序列模式&#xff1a;循环神经网络 - 机器学习任务之同步的序列到序列模式-CSDN博客 本文我们来学习循环神经网络应用中的第三种模式&#xff1a;异步的序列到序列模式&#xff01; 一、基本概述&#xff1a; 异步的序列到序列模式…...

什么是检索增强生成(RAG)

1、什么是检索增强生成&#xff08;RAG&#xff09; 1.1 检索增强生成的概念 检索增强生成&#xff08;Retrieval-Augmented Generation, RAG&#xff09;是一种结合了信息检索和文本生成技术的新型自然语言处理方法。这种方法增强了模型的理解和生成能力。 相较于经典生成…...

MATLAB 控制系统设计与仿真 - 33

状态反馈控制系统 -全维状态观测器的实现 状态观测器的建立解决了受控系统不能测量的状态重构问题&#xff0c;使得状态反馈的工程实现成为可能。 考虑到系统的状态方程表达式&#xff0c;如果{A,B}可控&#xff0c;{A,C}可观&#xff0c;且安装系统的性能指标&#xff0c;可…...

PM2 在 Node.js 项目中的使用与部署指南

一、PM2 简介​ PM2 是一个带有负载均衡功能的 Node.js 应用程序的进程管理器。它可以让你的 Node.js 应用程序始终保持运行状态&#xff0c;即使出现错误或服务器重启也能自动恢复。同时&#xff0c;它还提供了诸如日志管理、性能监控等实用功能&#xff0c;极大地简化了 Nod…...

企业管理系统的功能架构设计与实现

一、企业管理系统的核心功能模块 企业管理系统作为现代企业的中枢神经系统&#xff0c;涵盖了多个核心功能模块&#xff0c;以确保企业运营的顺畅与高效。这些功能模块通常包括&#xff1a; 人力资源管理模块&#xff1a;负责员工信息的录入、维护、查询及统计分析&#xff0c…...

RTOS基础 -- NXP M4小核的RPMsg-lite与端点机制回顾

一、RPMsg-lite与端点机制回顾 在RPMsg协议框架中&#xff1a; Endpoint&#xff08;端点&#xff09; 是一个逻辑通信端口&#xff0c;由本地地址&#xff08;local addr&#xff09;、远程地址&#xff08;remote addr&#xff09;和回调函数组成。每个消息都会发送到特定的…...

Cursor的主要好处

以下是Cursor的主要好处&#xff1a; 代码生成与优化 • 快速生成代码&#xff1a;根据简短描述或部分代码片段&#xff0c;Cursor能快速生成完整代码模块&#xff0c;还能智能预测下一步操作&#xff0c;将光标放在合适位置&#xff0c;让开发者一路Tab键顺滑编写代码。 • …...

覆盖学术、职场、生活的专业计算工具

软件介绍 今天要给大家介绍一款超给力的工具软件——CalcKit 计算器。它就像是你口袋里的智能计算专家&#xff0c;轻松化解日常生活中的各类计算难题。无论是简单的数字加减乘除&#xff0c;还是复杂的专业运算&#xff0c;它都不在话下。 这款软件内置了极为强大的计算功能…...

【大模型系列篇】大模型基建工程:基于 FastAPI 自动构建 SSE MCP 服务器 —— 进阶篇

&#x1f525;&#x1f525;&#x1f525; 上期 《大模型基建工程&#xff1a;基于 FastAPI 自动构建 SSE MCP 服务器》中我们使用fastapi-mcp自动挂载fastapi到mcp工具&#xff0c;通过源码分析和实践&#xff0c;我们发现每次sse请求又转到了内部fastapi RESTful api接口&…...

嵌入式硬件篇---USBUART串口

文章目录 前言一、UART 通信原理1.发送原理2.接收原理二、单片机UART接收十六进制数的处理方式1.数据解析2.数据存储3.执行相应操作三、USB通信原理四、USB 转串口通信1.硬件连接2.驱动程序3.数据传输过程五、通信特点与应用场景1.USB通信特点与应用场景2.串口通过特点与应用场…...

湖南移动广东电信DNS

湖南移动DNS&#xff1a; DNS 1: 111.8.14.18 DNS 2: 211.142.211.124 DNS 3: 2409:8050:2000::1 DNS 4: 2409:8050:2000:1000::1 湖南电信DNS&#xff1a; DNS 1: 59.51.78.210 DNS 2: 222.246.129.80 DNS 3: 240e:50:c800::210 DNS 4: 240e:50:5000::80 广东电信DNS: DNS 1…...

百度查询的ip与命令行输入 ipconfig 显示的IP地址有以下主要区别:

IP类型不同 百度中的IP是公网IP&#xff08;WAN IP&#xff09;&#xff0c;由运营商分配&#xff0c;用于在互联网上标识你的网络出口。 ipconfig 显示的是本地IP&#xff08;LAN IP&#xff09;&#xff0c;通常是路由器分配给设备的私有地址&#xff08;如192.168.x.x、10.…...

【python】Plot a Square

文章目录 1、功能描述2、代码实现3、效果展示4、完整代码5、涉及到的库函数 更多有趣的代码示例&#xff0c;可参考【Programming】 1、功能描述 用 python 实现&#xff0c;以 A和B两个点为边长&#xff0c;方向朝 C 绘制正方形 思路&#xff1a; 计算向量 AB 和 AC。使用向…...

实战打靶集锦-37-Wpwnvm

文章目录 1. 主机发现2. 端口扫描&服务枚举3. 服务探查4. 系统提权 靶机地址&#xff1a;https://download.vulnhub.com/wpwn/wpwnvm.zip 1. 主机发现 目前只知道目标靶机在192.168.37.xx网段&#xff0c;通过如下的命令&#xff0c;看看这个网段上在线的主机。 $ nmap -…...

三、GPIO

一、GPIO简介 GPIO&#xff08;General Purpose Input Output&#xff09;通用输入输出口GPIO引脚电平&#xff1a;0V&#xff08;低电平&#xff09;~3.3V&#xff08;高电平&#xff09;&#xff0c;部分引脚可容忍5V 容忍5V&#xff0c;即部分引脚输入5V的电压&#xff0c;…...

Guava Cache 实战:构建高并发场景下的字典数据缓存

一、场景背景 在系统开发中&#xff0c;字典数据&#xff08;如状态类型、分类数据&#xff09;具有以下特点&#xff1a; 高频读取&#xff08;每个请求都可能涉及&#xff09;低频变化&#xff08;管理员修改后才会变更&#xff09;数据一致性要求适中&#xff08;允许分钟…...

混杂模式(Promiscuous Mode)与 Trunk 端口的区别详解

一、混杂模式&#xff08;Promiscuous Mode&#xff09; 1. 定义与工作原理 定义&#xff1a;混杂模式是网络接口的一种工作模式&#xff0c;允许接口接收通过其物理链路的所有数据包&#xff0c;而不仅是目标地址为本机的数据包。工作层级&#xff1a;OSI 数据链路层&#x…...

rknn_convert的使用方法

rknn_convert是RKNN-Toolkit2提供的一套常用模型转换工具&#xff0c;通过封装上述API接口&#xff0c;用户只需编辑模型对应的yml配置文件&#xff0c;就可以通过指令转换模型。以下是如何使用rknn_convert工具的示例命令以及支持的指令参数&#xff1a; python -m rknn.api.…...

Turtle综合案例实战(绘制复杂图形、小游戏)

在学习了 Turtle 基本的绘图技巧后,我们可以通过结合多个概念和技巧,绘制复杂的图形或实现简单的小游戏。本章将介绍两个实战案例: 绘制复杂图形:结合前面所学的知识,绘制一个精美的多层次复杂图案。简单的游戏:利用 Turtle 实现一个简单的小游戏——蛇形游戏,这是一个经…...

[dp5_多状态dp] 按摩师 | 打家劫舍 II | 删除并获得点数 | 粉刷房子

目录 1.面试题 17.16. 按摩师 题解 2.打家劫舍 II 题解 3.删除并获得点数 题解 4.粉刷房子 题解 一定要有这样的能力&#xff0c;碰到一个新题的时候&#xff0c;可以往之前做过的题方向靠&#xff01; 打家劫舍问题模型: 不能选择相邻的两个数&#xff0c;并且要最终…...

DM数据库配置归档模式的两种方式

归档模式&#xff0c;联机日志文件中的内容保存到硬盘中&#xff0c;形成归档日志文件(REDO日志)。 采用归档模式会对系统的性能产生些许影响&#xff0c;然而系统在归档模式下运行会更安全&#xff0c;当 出现故障时其丢失数据的可能性更小&#xff0c;这是因为一旦出现介质故…...

Leetcode 2440 -- dfs | 枚举

题目描述 创建价值相同的连通块 思路 代码 class Solution { public:int componentValue(vector<int>& nums, vector<vector<int>>& edges) {// get max_val and sum_valint n nums.size();int max_val -1, sum_val 0;for(auto &x : nums) m…...

Vue 中 this.$emit(“update:xx“,value) 和 :xx.sync 实现同步数据的做法

在 Vue 2.x 中&#xff0c;this.$emit(update:xx, value) 和 xx.sync 都是用来实现父子组件之间的数据同步的方式&#xff0c;它们背后的工作原理有些相似&#xff0c;但语法上有所不同。让我们逐个详细解释这两者的使用方式。 xx.sync&#xff08;语法糖&#xff09; xx.syn…...

Agent TARS与Manus的正面竞争

Agent TARS 是 Manus 的直接竞争对手&#xff0c;两者在 AI Agent 领域形成了显著的技术与生态对抗。 一、技术架构与功能定位的竞争 集成化架构 vs 模块化设计 Agent TARS 基于字节跳动的 UI-TARS 视觉语言模型&#xff0c;将视觉感知、推理、接地&#xff08;grounding&#…...

【Tauri2】013——前端Window Event与创建Window

前言 【Tauri2】012——on_window_event函数-CSDN博客https://blog.csdn.net/qq_63401240/article/details/146909801?spm1001.2014.3001.5501 前面介绍了on_window_event&#xff0c;这个在Builder中的方法&#xff0c;里面有许多事件&#xff0c;比如Moved&#xff0c;Res…...

创建Linux虚拟环境并远程连接,finalshell自定义壁纸

安装VMware 这里不多赘述。 挂载Linux系统 1). 打开Vmware虚拟机&#xff0c;打开 编辑 -> 虚拟网络编辑器(N) 选择 NAT模式&#xff0c;然后选择右下角的 更改设置。 设置子网IP为 192.168.100.0&#xff0c;然后选择 应用 -> 确定。 解压 CentOS7-1.zip 到一个比较大…...

DBAPI设置服务器开机自启动

在 /etc/systemd/system 目录下创建一个新的服务文件&#xff0c;例如 dbapi.service [Unit] Descriptiondbapi standalone Service Afternetwork.target[Service] ExecStart/your-path/dbapi-enterprise-4.2.2/bin/dbapi.sh start standalone Restartalways Userroot[Install…...

基于pycharm的YOLOv11模型训练方法

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、前期准备1.1 软件环境配置1.2 训练集参考 二、训练步骤2.1 打开文件夹2.2 打开文件2.3 data.yaml最终代码 三、train.py四、最终结果五、detect.py六、 拓展…...

预测分析(三):基于机器学习的分类预测

文章目录 基于机器学习的分类预测分类任务逻辑回归分类树分类树的工作原理 随机森林多元分类朴素贝叶斯分类器贝叶斯公式回到分类问题**1. 算法原理****2. 主要类型****(1) 高斯朴素贝叶斯****(2) 多项式朴素贝叶斯****(3) 伯努利朴素贝叶斯** **3. 优缺点****4. 应用场景****5…...

基于大模型预测升主动脉瘤的多维度诊疗研究报告

目录 一、引言 1.1 研究背景 1.2 研究目的与意义 二、升主动脉瘤概述 2.1 定义与分类 2.2 发病原因与机制 2.3 流行病学现状 三、大模型技术原理及应用现状 3.1 大模型基本原理 3.2 在医疗领域的应用进展 3.3 针对升主动脉瘤预测的独特价值 四、术前大模型预测方案…...