当前位置：首页 > news >正文

2.11整理（2）（主要关于teacher forcing）

news 2026/2/8 23:22:48

teacher forcing
1. 训练迭代过程早期的RNN预测能力非常弱，几乎不能给出好的生成结果。如果某一个unit产生了垃圾结果，必然会影响后面一片unit的学习。
2. RNN存在着两种训练模式(mode):
  1. free-running mode：就是常见的那种训练网络的方式: 上一个state的输出作为下一个state的输入。而Teacher Forcing是一种快速有效地训练循环神经网络模型的方法，该模型使用来自先验时间步长的输出作为输入。
  2. teacher-forcing mode
    1. Teacher Forcing,是一种网络训练方法,它每次不使用上一个state的输出作为下一个state的输入，而是直接使用训练数据的标准答案(ground truth)的对应上一项作为下一个state的输入。
    2. Teacher Forcing工作原理: 在训练过程的 t 时刻，使用训练数据集的期望输出或实际输出: y(t)，作为下一时间步骤的输入: x(t+1)，而不是使用模型生成的输出h(t)。
    3. Teacher Forcing同样存在缺点: 一直靠老师带的孩子是走不远的。
      1. 因为依赖标签数据，在训练过程中，模型会有较好的效果，但是在测试的时候因为不能得到ground truth的支持，所以如果目前生成的序列在训练过程中有很大不同，模型就会变得脆弱。
      2. 也就是说，这种模型的cross-domain能力会更差，也就是如果测试数据集与训练数据集来自不同的领域，模型的performance就会变差。
3. 有计划地学习(Curriculum Learning)
  1. beam search方法仅适用于具有离散输出值的预测问题，不能用于预测实值（real-valued）输出的问题。
  2. 有计划地学习的意思就是: 使用一个概率p去选择使用ground truth的输出y(t)还是前一个时间步骤模型生成的输出h(t)作为当前时间步骤的输入x(+1)。这个概率p会随着时间的推移而改变，这就是所谓的计划抽样(scheduled sampling，可参考：https://blog.csdn.net/weixin_45647721/article/details/127352875)
  3. 训练过程会从force learning开始，慢慢地降低在训练阶段输入ground truth的频率。
  4. Scheduled Sampling主要应用在序列到序列模型的训练阶段，而生成阶段则不需要使用。
  5. 在解码器的t时刻Scheduled Sampling以概率ϵ_i使用上一时刻的真实元素y_(t−1)作为解码器输入，以概率1−ϵ_i使用上一时刻生成的元素g_(t−1)作为解码器输入。且由上可得随着i的增大ϵ_i会不断减小，解码器将不断倾向于使用生成的元素作为输入，训练阶段和生成阶段的数据分布将变得越来越一致。
不同语言比较：
1. C语言是很多语言的底层实现，执行效率高，需要自己做内存管理，对代码的要求比较高，很多功能需要手动实现。
2. c#：微软开发的编程语言，部署时需要放在windows server上，最大的问题是windows系统花钱。
3. php：一般用于快速搭建网站
4. golang: 语法和c比较接近，处理并发时比较有优势
other：
1. ffmpeg将音频转为单通道16k采样率的音频：ffmpeg -i test.wav -ac 1 -ar 16000 -y 1.wav
2. 16khz对应256kbps的wav文件

2.11整理（2）（主要关于teacher forcing）

teacher forcing 训练迭代过程早期的RNN预测能力非常弱，几乎不能给出好的生成结果。如果某一个unit产生了垃圾结果，必然会影响后面一片unit的学习。RNN存在着两种训练模式(mode): free-running mode：就是常见的那种训练网络的方式: 上一个sta…...

编程日记 2023/2/12 1:10:36

亿级高并发电商项目-- 实战篇 --万达商城项目三（通用模块、商品服务模块、后台API模块、IDEA忽略文件显示等开发工作

专栏：高并发项目 👏作者简介：大家好，我是小童，Java开发工程师，CSDN博客博主，Java领域新星创作者 📕系列专栏：前端、Java、Java中间件大全、微信小程序、微信支付、若依框…...

编程日记 2023/2/12 1:09:27

IDEA下java程序的调试(简易实例图示版)

在线排版不太好看，介意的读者可下载word下来看：https://download.csdn.net/download/xijinno1/87441301IDEA下java程序的简单调试-System.out.println首先本次进行调试的一个程序是实现从1累加到100的功能，是在IDEA下进行编写的。如图所示&am…...

编程日记 2023/2/12 1:08:17

动态规划算法

1.应用场景-背包问题背包问题：有一个背包，容量为 4 磅 ， 现有如下物品要求达到的目标为装入的背包的总价值最大，并且重量不超出要求装入的物品不能重复 2.动态规划算法介绍动态规划(Dynamic Programming)算法的核心思想是&…...

编程日记 2023/2/12 1:07:09

nacos的单机模式和集群模式

文章目录目录文章目录前言一、nacos数据库配置二、单机模式三、集群模式四、使用nginx集群模式的负载均衡总结前言一、nacos数据库配置在数据库中创建nacos_config 编码格式utf8-mb4的数据库把上面的数据库文件导入数据库在配置文件中添加如下 spring.datasour…...

编程日记 2023/2/12 1:06:01

Spring Boot 整合定时任务完成从0 到1

Java 定时任务学习定时任务概述 > 定时任务的应用场景非常广泛, 如果说我们想要在某时某地去尝试的做某件事就需要用到定时任务来通知我们 ，大家可以看下面例子如果需要明天早起，哪我们一般会去定一个闹钟去通知我们, 而在编程中有许许多多的…...

编程日记 2023/2/12 1:04:51

Dialogue Transformers

Abstract 本文介绍了一种基于 Transformer 架构的对话策略，其中自注意力机制被应用于对话轮次（dialogue turns）的序列上。近期的一些工作使用层次化的循环神经网络（hierarchical recurrent neural networks）在对话上下文中对多个话语（utterances）进行编码，但是我们认…...

编程日记 2023/2/12 1:03:41

【遇见青山】项目难点：缓存击穿问题解决方案

【遇见青山】项目难点：缓存击穿问题解决方案1.缓存击穿互斥锁🔒方案逻辑过期方案2.基于互斥锁方案的具体实现3.基于逻辑过期方案的具体实现1.缓存击穿缓存击穿问题也叫热点Key问题，就是一个被高并发访问并且缓存重建业务较复杂的key突然失效…...

编程日记 2023/2/12 1:02:30

2023Flag具体实施计划(短期)

重新看了flag ,要做的事情太多，太杂，上周一周时间都在纠结和琢磨，该怎么下手。如何达成小目标。特别是沟通，汇报，演讲能力， 以及整体体系化的思维能力的训练。如何做到多思考，而不是瞎搞。这边重…...

编程日记 2023/2/12 1:01:21

研一寒假C++复习笔记--左值和右值的理解和使用

目录 1--左值和右值的定义 2--简单理解左值和右值的代码 3--非const引用只能接受左值 1--左值和右值的定义左值：L-Value，L理解为 Location，表示可寻； 右值：R-Value，R理解为 Read，表示可读&a…...

编程日记 2023/2/12 1:00:13

Android 11.0 动态修改SystemProperties中ro开头系统属性的值

需求： 在11.0的产品开发中，对于定制功能的需求很多，有些机型要求可以修改系统属性值，对于系统本身在10.0以后为了系统安全性，不允许修改ro开头的SystemProperties的值，所以如果要求修改ro的相关系统属性&am…...

编程日记 2023/2/12 0:57:51

为什么分库分表

系列文章目录文章目录系列文章目录前言一、什么是分库分表二、分库分表的原因分库分表三、如何分库分表3.1 垂直拆分1.垂直分库2、垂直分表3.2 水平拆分水平分库水平分表水平分库分表的策略hash取模算法range范围rangehash取模混合地理位置分片预定义算法四、分库分表的问题分…...

编程日记 2023/2/12 0:56:41

1625_MIT 6.828 stabs文档信息整理_下

全部学习汇总： GreyZhang/g_unix: some basic learning about unix operating system. (github.com) 继续之前的学习笔记，整理一下最近看过的一点stabs资料。这一页中有一半的信息是Fortran专用的，直接跳过。参数的符号修饰符是p&#xff0c…...

编程日记 2023/2/12 0:55:31

论文阅读 | Rethinking Coarse-to-Fine Approach in Single Image Deblurring

前言：ICCV2021图像单帧运动去糊论文论文地址：【here】代码地址：【here】 Rethinking Coarse-to-Fine Approach in Single Image Deblurring 引言图像去糊来自与物体或相机的运动。现有的deblur领域的深度学习方法大多都是coarse-to-fin…...

编程日记 2023/2/12 0:54:22

Mysql 增删改查（二）—— 增(insert)、删(delete)、改(update)

目录一、插入 1、insert 2、replace（插入否则更新） 二、更新（update） 三、删除 1、delete 2、truncate（截断表，慎用） 一、插入 1、insert (1) 单行 / 多行插入全列插入：…...

编程日记 2023/2/12 0:53:11

JSD2212复习串讲

1. Java语言基础阶段这一部分主要是练，给一些题目还有讲解一些最基础的语法，做一些额外的补充 1.1 基本概念 1.2 变量 1.2.1 数据类型 4类8种基本类型：整形、浮点型、字符型、布尔型整形：byte -》short-》int-》long 浮点…...

编程日记 2023/2/12 0:51:59

sphinx 升级到6.x后的Jquery问题

sphinx 升级到6.0 后，以前对于jquery的默认引用方式发生了改变以前在编译后的html中jquery是如下引用的：<script src"_static/jquery.js"></script>而升级到6.0后，对于jquery 是一个googleapi的远程jquery调用&#xf…...

编程日记 2023/2/12 0:50:50

from:http://v2ish1yan.top MyDoor 使用php伪协议读取index.php的代码 php://filter/readconvert.base64-encode/resourceindex.php<?php error_reporting(0);if (isset($_GET[N_S.S])) {eval($_GET[N_S.S]); }if(!isset($_GET[file])) {header(Location:/index.php?fi…...

编程日记 2023/2/12 0:48:32

多传感器融合定位十二-基于图优化的建图方法其一

多传感器融合定位十二-基于图优化的建图方法其一1. 基于预积分的融合方案流程1.1 优化问题分析1.2 预积分的作用1.3 基于预积分的建图方案流程2. 预积分模型设计3. 预积分在优化中的使用3.1 使用方法3.2 残差设计3.3 残差雅可比的推导3.3.1 姿态残差的雅可比3.3.2 速度残差的雅…...

编程日记 2023/2/12 0:47:17

RockChip MPP编码

概述瑞芯微提供的媒体处理软件平台（Media Process Platform，简称 MPP）是适用于瑞芯微芯片系列的通用媒体处理软件平台。该平台对应用软件屏蔽了芯片相关的复杂底层处理，其目的是为了屏蔽不同芯片的差异，为使用者提供统…...

编程日记 2023/2/12 0:46:09

测试微信模版消息推送

进入“开发接口管理”--“公众平台测试账号”，无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。获取access_token: 自定义模版消息： 关注测试号：扫二维码关注测试号。发送模版消息： import requests da…...

编程新知 2026/2/8 4:37:13

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2026/2/8 4:37:10

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件： 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

编程新知 2026/2/7 19:53:11

【位运算】消失的两个数字（hard）

消失的两个数字（hard） 题⽬描述：解法（位运算）：Java 算法代码：更简便代码题⽬链接：⾯试题 17.19. 消失的两个数字题⽬描述： 给定⼀个数组，包含从 1 到 N 所有…...

编程新知 2025/11/15 16:18:24

屋顶变身“发电站” ，中天合创屋面分布式光伏发电项目顺利并网！

5月28日，中天合创屋面分布式光伏发电项目顺利并网发电，该项目位于内蒙古自治区鄂尔多斯市乌审旗，项目利用中天合创聚乙烯、聚丙烯仓库屋面作为场地建设光伏电站，总装机容量为9.96MWp。项目投运后，每年可节约标煤3670…...

编程新知 2026/1/30 2:45:51

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2026/1/25 9:08:41

Linux 内存管理实战精讲：核心原理与面试常考点全解析

Linux 内存管理实战精讲：核心原理与面试常考点全解析 Linux 内核内存管理是系统设计中最复杂但也最核心的模块之一。它不仅支撑着虚拟内存机制、物理内存分配、进程隔离与资源复用，还直接决定系统运行的性能与稳定性。无论你是嵌入式开发者、内核调试工…...

编程新知 2026/1/25 10:16:57

安卓基础（Java 和 Gradle 版本）

1. 设置项目的 JDK 版本方法1：通过 Project Structure File → Project Structure... (或按 CtrlAltShiftS) 左侧选择 SDK Location 在 Gradle Settings 部分，设置 Gradle JDK 方法2：通过 Settings File → Settings... (或 CtrlAltS)…...

编程新知 2025/7/10 0:32:50

【深度学习新浪潮】什么是credit assignment problem？

Credit Assignment Problem（信用分配问题）是机器学习，尤其是强化学习（RL）中的核心挑战之一，指的是如何将最终的奖励或惩罚准确地分配给导致该结果的各个中间动作或决策。在序列决策任务中，智能体执行一系列动作后获得一个最终奖励，但每个动作对最终结果的贡献程度往往…...

编程新知 2026/1/30 14:23:04

2.11整理（2）（主要关于teacher forcing）

相关文章：

2.11整理（2）（主要关于teacher forcing）

亿级高并发电商项目-- 实战篇 --万达商城项目三（通用模块、商品服务模块、后台API模块、IDEA忽略文件显示等开发工作

IDEA下java程序的调试(简易实例图示版)

动态规划算法

nacos的单机模式和集群模式

Spring Boot 整合定时任务完成从0 到1

Dialogue Transformers

【遇见青山】项目难点：缓存击穿问题解决方案

2023Flag具体实施计划(短期)

研一寒假C++复习笔记--左值和右值的理解和使用

Android 11.0 动态修改SystemProperties中ro开头系统属性的值

为什么分库分表

1625_MIT 6.828 stabs文档信息整理_下

论文阅读 | Rethinking Coarse-to-Fine Approach in Single Image Deblurring

Mysql 增删改查（二）—— 增(insert)、删(delete)、改(update)

JSD2212复习串讲

sphinx 升级到6.x后的Jquery问题

NSSCTF Round#8 Basic

多传感器融合定位十二-基于图优化的建图方法其一

RockChip MPP编码

测试微信模版消息推送

19c补丁后oracle属主变化，导致不能识别磁盘组

shell脚本--常见案例

【位运算】消失的两个数字（hard）

屋顶变身“发电站” ，中天合创屋面分布式光伏发电项目顺利并网！

Swagger和OpenApi的前世今生

Linux 内存管理实战精讲：核心原理与面试常考点全解析

安卓基础（Java 和 Gradle 版本）

【深度学习新浪潮】什么是credit assignment problem？

相关类相关的可视化图像总结