当前位置：首页 > news >正文

正向传播和反向传播

news 2026/2/10 21:06:16

正向传播（Forward Propagation）

正向传播是指将输入数据通过神经网络，计算出预测值的过程。具体步骤如下：

输入层：接受输入数据。
隐藏层：每个隐藏层中的神经元接收上一层的输出，进行加权求和，再经过激活函数得到输出。
输出层：最后一层的神经元将隐藏层的输出再次加权求和并通过激活函数，得到最终的预测结果。

上图是一个简单的二层神经网络

正向传播的公式如下（以简单的单层网络为例）：

$Z= W\cdot x+b$

$y=\sigma (z)$

$W$ 是权重矩阵， $x$ 是输入向量， $b$ 是偏置向量， $\sigma(z)$ 是激活函数， $y$ 是输出结果

反向传播（Backward Propagation）

反向传播是指根据损失函数计算出的误差，通过链式法则（Chain Rule）逐层计算并更新网络中的参数（权重和偏置）以最小化误差的过程。具体步骤如下：

计算损失：使用损失函数计算预测值与真实值之间的误差。例如，使用均方误差（MSE）或交叉熵损失。
误差反向传播：从输出层开始，计算损失相对于每个参数的梯度。通过链式法则，将梯度逐层传递回去。
参数更新：使用优化算法（如梯度下降）更新每个参数，使损失最小化。参数更新公式如下：

$W_{new} = W_{old} - \eta \frac{\partial l}{\partial w}$

$W_{old}$ 是更新前的权重， $W_{new }$ 是更新后的权重， $\eta$ 是学习速率， $\frac{\partial l}{\partial w}$ 是损失函数相对于权重的梯度。

关系与作用

信息传递：正向传播将输入数据的信息从输入层传递到输出层，计算模型的预测结果；反向传播根据损失函数的梯度信息，将误差信号从输出层传递回每一层的参数，用于参数的更新。
依赖关系：反向传播依赖于正向传播的计算结果。只有在进行了正向传播并得到预测结果后，才能计算损失函数并使用链式法则进行梯度计算。
整体学习过程：正向传播和反向传播是神经网络学习过程中不可或缺的两个步骤。正向传播计算预测结果，反向传播根据预测结果与真实标签的差距来调整模型参数，使得模型在训练过程中不断优化。

通过正向传播和反向传播的结合，神经网络能够根据输入数据学习并调整参数，从而实现对复杂问题的有效建模和预测。

示例：神经网络训练过程

假设我们有一个简单的神经网络模型，包含一个输入层、一个隐藏层和一个输出层，具体如下

网络结构：
输入层：2个特征输入
隐藏层：3个神经元，使用ReLU激活函数
输出层：1个神经元，使用sigmoid激活函数

正向传播（Forward Propagation）：

在正向传播过程中，我们将输入数据 $X$ 通过网络层，计算得到模型的预测输出 $\hat{y}$ 。

其中：

正向传播计算出了模型的预测输出 $\hat{y}$ ，即模型对输入数据的预测结果。
- 输入层到隐藏层： $z^{[1]}=W^{[1]}X+b^{[1]}$ $a^{[1]}=ReLU(z^{[1]})$
- 隐藏层到输出层： $z^{[2]} = W^{[2]} a^{[1]} + b^{[2]}$ $\hat{y} = \sigma(z^{[2]})$
- $X$ 是输入特征向量。
- $W^{[1]}, b^{[1]}$ 是隐藏层的权重和偏置。
- $W^{[2]}, b^{[2]}$ 是输出层的权重和偏置。
- $ReLU$ 是激活函数。
- $\sigma$ 是sigmoid激活函数。
损失计算：

使用损失函数 $\mathcal{L}(\hat{y}, y)$ 计算预测输出 $\hat{y}$ 与真实标签 $y$ 之间的差异。
反向传播（Backward Propagation）：

反向传播根据损失函数的梯度，从输出层向隐藏层和输入层传播，计算每个参数的梯度并更新参数。

其中， $\odot$ 表示逐元素相乘， $\text{ReLU}$ 是ReLU激活函数的导数。
- 计算输出层的梯度：
  $\frac{\partial \mathcal{L}}{\partial z^{[2]}} = \hat{y} - y$
- $\frac{\partial \mathcal{L}}{\partial W^{[2]}} = \frac{\partial \mathcal{L}}{\partial z^{[2]}} \cdot a^{[1]T}$
- $\frac{\partial \mathcal{L}}{\partial b^{[2]}} = \frac{\partial \mathcal{L}}{\partial z^{[2]}}$
- 计算隐藏层的梯度：
  $\frac{\partial \mathcal{L}}{\partial z^{[1]}} = (W^{[2]})^T \cdot \frac{\partial \mathcal{L}}{\partial z^{[2]}} \odot \text{ReLU}'(z^{[1]})$
- $\frac{\partial \mathcal{L}}{\partial W^{[1]}} = \frac{\partial \mathcal{L}}{\partial z^{[1]}} \cdot X^T$
- $\frac{\partial \mathcal{L}}{\partial b^{[1]}} = \frac{\partial \mathcal{L}}{\partial z^{[1]}}$

相互依赖性的体现

信息流动：
- 正向传播计算出预测结果 $\hat{y}$ ，反向传播使用 $\hat{y}$ 和真实标签 $y$ 的差异来计算梯度。
- 反向传播的梯度计算依赖于正向传播的预测输出 $\hat{y}$ ，因为梯度是基于损失函数对输出层的输出（即 $\hat{y}$ ）的导数计算的。
参数更新：
- 反向传播计算出的梯度用于更新神经网络的参数（权重和偏置）。
- 更新后的参数影响到下一次的正向传播，从而影响到预测输出 $\hat{y}$ 的计算结果。
迭代优化：
- 每一次迭代中，正向传播计算出新的预测结果，反向传播根据这些预测结果计算出新的梯度，并用于参数更新。
- 这种正向传播和反向传播的迭代过程不断优化模型，使得模型能够逐步逼近最优解。

正向传播和反向传播

正向传播（Forward Propagation） 正向传播是指将输入数据通过神经网络，计算出预测值的过程。具体步骤如下： 输入层：接受输入数据。隐藏层：每个隐藏层中的神经元接收上一层的输出，进行加权求和&…...

编程日记 2024/7/12 9:37:13

前端文件下载的方式

方式一：a标签直接下载 <a href"链接" >下载</a>一个文件链接（一般是服务器上的某个文件），这个链接一般地址栏输入是预览，不是附件下载如果想改成附件下载，以下两种方式任选一个均…...

编程日记 2024/7/12 9:36:11

视图库对接系列(GA-T 1400)十六、视图库对接系列(本级)通知(订阅回调)

说明之前我们实现了订阅接口，其中有一个receiveAddr参数，这个就是对应的回调的地址。一般情况下对应的是同一个服务。我们推荐使用http://xxx:xxx/VIID/SubscribeNotifications接口文档 SubscribeNotificationList对象对象如下: 文档中是xml，但实际上目前使用的都是jso…...

编程日记 2024/7/12 9:35:10

Python | Leetcode Python题解之第230题二叉搜索树中第K小的元素

题目： 题解： class AVL:"""平衡二叉搜索树（AVL树）：允许重复值"""class Node:"""平衡二叉搜索树结点"""__slots__ ("val", "parent&quo…...

编程日记 2024/7/12 9:33:07

Python酷库之旅-第三方库Pandas(018)

目录一、用法精讲 44、pandas.crosstab函数 44-1、语法 44-2、参数 44-3、功能 44-4、返回值 44-5、说明 44-6、用法 44-6-1、数据准备 44-6-2、代码示例 44-6-3、结果输出 45、pandas.cut函数 45-1、语法 45-2、参数 45-3、功能 45-4、返回值 45-5、说明 4…...

编程日记 2024/7/12 9:32:06

九科bit-Worker RPA 内容学习

入门阶段， 花时间学习和记忆细枝末节，可能会反而分散新手去理解核心逻辑的精力，并且不常用的知识也很容易被遗忘。简介： 什么是RPA？ RPA（Robotic Process Automation，机器人流程自动化&#x…...

编程日记 2024/7/12 9:30:04

vscode编译环境配置-golang

1. 支持跳转如果单测函数上方不显示run test | debug test，需要安装Code Debugger（因为以前的go Test Explorer不再被维护了） 2. 单测指定单个用例测试 go test -v run TestXXXdlv 调试需要安装匹配的go版本和delve版本（如…...

编程日记 2024/7/12 9:25:58

【JavaEE】网络编程——UDP

🤡🤡🤡个人主页🤡🤡🤡 🤡🤡🤡JavaEE专栏🤡🤡🤡 文章目录 1.数据报套接字(UDP)1.1特点1.2编码1.2.1DatagramSocket1.2.2DatagramPacket…...

编程日记 2024/7/12 9:24:57

JAVA毕业设计147—基于Java+Springboot的手机维修管理系统(源代码+数据库)

基于JavaSpringboot的手机维修管理系统(源代码数据库)147 一、系统介绍本项目分为用户、管理员、维修员三种角色 1、用户： 注册、登录、新闻公告、售后申请、申请列表、意见反馈、个人信息、密码修改 2、管理员： 用户管理、用户管理、栏目管理、网…...

编程日记 2024/7/12 9:21:54

力扣第228题“汇总区间”

在本篇文章中，我们将详细解读力扣第228题“汇总区间”。通过学习本篇文章，读者将掌握如何遍历和汇总区间，并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释，以便于理解。问题描述力扣第228题“汇总区间”描…...

编程日记 2024/7/12 9:20:52

部署大语言模型并对话

在阿里云的https://developer.aliyun.com/adc/scenario/b105013328814fe995c0f091d708d67d 选择函数计算设置服务器配置复制公网地址这个地址不能直接在返回应用，创建应用LLM 对话页面 Open WebUI 点击下面的创建应用部署完成后访问域名打开访问地址...

编程日记 2024/7/12 9:18:49

WebSocket、socket.io-client

WebSocket WebSocket 是一种网络通信协议，它提供了一个在单个长期持久的 TCP 连接上进行全双工（full-duplex）通信的通道。 WebSocket 允许客户端和服务器之间进行双向的数据交换，这意味着服务器可以主动向客户端推送数据&#x…...

编程日记 2024/7/12 9:16:47

Maven 仓库

在 Maven 世界中，任何一个依赖、插件或者项目构建的输出，都可以称为构件。坐标和依赖是构件在 Maven 世界中的逻辑表示方式，构件的物理表示方式是文件，Maven 通过仓库来统一管理这些文件。任何一个构件都有一组坐标唯一标识。…...

编程日记 2024/7/12 9:15:46

给后台写了一个优雅的自定义风格的数据日志上报页面

highlight: atelier-cave-dark 查看后台数据日志是非常常见的场景，经常看到后台的小伙伴从服务器日志复制一段json数据字符串，然后找一个JSON工具网页打开，在线JSON格式化校验。有的时候，一些业务需要展示mqtt或者socket的实时信息展示，如果不做任何修改直接展示一串字符…...

编程日记 2024/7/12 9:14:44

【React Native优质开源项目】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者，CSDN实力新星，CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共…...

编程日记 2024/7/12 9:13:43

Android 自动更新时间的数字时钟 TextClock

TextClock 继承 TextView ，使用方法和 TextView 一样。它专门用于显示数字时钟，可以自定义显示格式。只要在布局文件里添加，它会自动更新时间，不需要添加刷新逻辑。布局文件， <?xml version"1.0"…...

编程日记 2024/7/12 9:12:41

【Linux Git入门】Git的介绍

文章目录前言git简介git是什么git的作用为什么要学习git安装git总结前言在现代软件开发中，版本控制系统已经成为了不可或缺的工具。其中，Git是最受欢迎的版本控制系统之一。Git是由Linux的创造者Linus Torvalds在2005年创建的，用于管理Linux内核的开发。Git是一个分布式版…...

编程日记 2024/7/12 9:10:39

kafka面试题（基础-进阶-高阶）

目录 Kafka 基础篇 1.Kafka 的用途有哪些？使用场景如何？ 2.Kafka 中的ISR、AR 又代表什么？ISR 的伸缩又指什么 3.Kafka 中的 HW、LEO、LSO、LW 等分别代表什么？ 4.Kafka 中是怎么体现消息顺序性的？ 5.Kafka 中的分区器、序列化器、拦截器是否了解？它们之间的处理顺序…...

编程日记 2024/7/12 9:09:38

《系统架构设计师教程（第2版）》第11章-未来信息综合技术-07-大数据技术概述

文章目录 1. 大数据的定义2. 大数据的研究内容2.1 面临的问题2.2 面临的挑战2.3 分析步骤2.3.1 数据获取和记录2.3.2 信息抽取和清洗2.3.3 数据集成、聚集和表示2.3.4 查询处理、数据建模和分析2.3.5 解释 3.大数据的应用领域3.1 制造业的应用3.2 服务业的应用3.3 交通行业的应…...

编程日记 2024/7/12 9:08:37

前端面试题54（断点续传讲解）

断点续传是一种在上传或下载大文件时，如果因为网络问题中断，可以从已经上传或下载的部分继续，而不是重新开始的技术。这对于提高用户体验和节省带宽非常有帮助。下面我将分别从HTTP协议层面、前端实现思路以及一个简单的前端实现示例来讲解断…...

编程日记 2024/7/12 9:06:34

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...

编程新知 2025/10/25 7:51:48

【C语言练习】080. 使用C语言实现简单的数据库操作

080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码：使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出：5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作在…...

编程新知 2025/9/22 21:37:01

场景结构测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...

编程新知 2026/2/9 18:50:34

Bean 作用域有哪些？如何答出技术深度？

导语： Spring 面试绕不开 Bean 的作用域问题，这是面试官考察候选人对 Spring 框架理解深度的常见方式。本文将围绕“Spring 中的 Bean 作用域”展开，结合典型面试题及实战场景，帮你厘清重点，打破模板式回答&#xff0c…...

编程新知 2025/11/12 21:44:33

MySQL 主从同步异常处理

阅读原文：https://www.xiaozaoshu.top/articles/mysql-m-s-update-pk MySQL 做双主，遇到的这个错误： Could not execute Update_rows event on table ... Error_code: 1032是 MySQL 主从复制时的经典错误之一，通常表示&#xff…...

编程新知 2025/11/7 10:02:17