当前位置：首页 > news >正文

【机器学习：十九、反向传播】

news 2026/2/9 1:25:56

1. 计算图和导数

计算图的概念
计算图（Computation Graph）是一种有向无环图，用于表示数学表达式中的计算过程。每个节点表示一个操作或变量，每条边表示操作的依赖关系。通过计算图，可以轻松理解和实现反向传播。

计算图的意义

直观地展示复杂计算过程。
支持自动微分，通过链式规则计算导数。
应用于神经网络中梯度的高效计算。

例如，对于函数 $\cdot w$ ，其计算图包括三个节点（加法、乘法、输入变量）和两条边。

2. 计算代价函数的偏导 - 单神经元

代价函数的定义
代价函数衡量模型输出与真实值之间的差距，例如平方误差：

$\frac{1}{2} (y - \hat{y})^2$

其中， $\hat{y}$ 是模型输出， $y$ 是目标值。

单神经元的导数推导
假设输出为 $\hat{y} = \sigma(wx + b)$ ，其中 $\sigma$ 是激活函数（如 Sigmoid），导数计算如下：

对于权重 $w$ ：
$\frac{\partial L}{\partial w} = \frac{\partial L}{\partial \hat{y}} \cdot \frac{\partial \hat{y}}{\partial z} \cdot \frac{\partial z}{\partial w}$
对于偏置 $b$ ：
$\frac{\partial L}{\partial b} = \frac{\partial L}{\partial \hat{y}} \cdot \frac{\partial \hat{y}}{\partial z} \cdot \frac{\partial z}{\partial b}$

意义
通过计算偏导数，可以更新参数 $w$ 和 $b$ 以最小化损失函数。

3. 链导法则求导

链导法则是反向传播的核心，其定义如下：

$\frac{\partial L}{\partial x} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial x}$

步骤：

先计算从输出到隐藏层的梯度。
再计算从隐藏层到输入的梯度。

例如，对于两层网络的损失函数 $L = f (g (x))$ ，使用链导法则：

$\frac{\partial L}{\partial x} = \frac{\partial f}{\partial g} \cdot \frac{\partial g}{\partial x}$

4. 过程解释

反向传播过程包括以下步骤：

前向传播：计算网络输出和损失函数。
反向传播：从输出层开始，逐层计算梯度。
更新参数：使用梯度下降或其变体更新参数。

假设两层网络的权重为 $W_1$ 和 $W_2$ ，反向传播过程为：

计算输出层梯度 $\delta_2$ ：
$\delta_2 = \frac{\partial L}{\partial z_2} = \frac{\partial L}{\partial \hat{y}} \cdot \sigma'(z_2)$
计算隐藏层梯度 $\delta_1$ ：
$\delta_1 = (\delta_2 \cdot W_2^T) \cdot \sigma'(z_1)$
更新权重和偏置：
$W_2 = W_2 - \alpha \cdot \delta_2 \cdot h_1^T$

$W_1 = W_1 - \alpha \cdot \delta_1 \cdot x^T$

5. 神经网络中的反向传播

多层网络中的反向传播
多层网络通过将链导法则逐层应用，从输出层反向传播至输入层。每层的梯度依赖于后一层的梯度。

实现代码示例

import numpy as np# 定义激活函数及其导数
def sigmoid(x):return 1 / (1 + np.exp(-x))def sigmoid_derivative(x):return sigmoid(x) * (1 - sigmoid(x))# 前向传播
x = np.array([1, 2])  # 输入
w1 = np.array([[0.1, 0.2], [0.3, 0.4]])  # 权重
b1 = np.array([0.5, 0.5])  # 偏置
z1 = np.dot(w1, x) + b1
a1 = sigmoid(z1)# 反向传播
delta = (a1 - 1) * sigmoid_derivative(z1)
grad_w1 = np.outer(delta, x)

6. 计算代价函数的偏导 - 两层神经网络

两层神经网络的反向传播在单层基础上扩展，每层分别计算：

$\frac{\partial L}{\partial W_1}, \frac{\partial L}{\partial W_2}, \frac{\partial L}{\partial b_1}, \frac{\partial L}{\partial b_2}$

总结与意义
反向传播是神经网络训练的核心，通过计算梯度并更新参数，使得网络能够有效学习复杂的映射关系，从而提高模型的泛化能力。

【机器学习：十九、反向传播】

1. 计算图和导数计算图的概念计算图（Computation Graph）是一种有向无环图，用于表示数学表达式中的计算过程。每个节点表示一个操作或变量，每条边表示操作的依赖关系。通过计算图，可以轻松理解和实现反向传播。计算…...

编程日记 2025/1/14 6:23:26

1、准备数据集 import numpy as np import matplotlib.pyplot as pltfrom torch.utils.data import DataLoader from torch.utils.data import TensorDataset######################################################################### #################准备若干个随机的x和…...

编程日记 2025/1/14 6:22:25

SpringCloud微服务：基于Nacos组件，整合Dubbo框架

dubbo和fegin的差异一、Feign与Dubbo概述 Feign是一个声明式的Web服务客户端，使得编写HTTP客户端变得更简单。通过简单的注解，Feign将自动生成HTTP请求，使得服务调用更加便捷。而Dubbo是一个高性能、轻量级的Java RPC框架，提供了…...

编程日记 2025/1/14 6:19:22

Golang 简要概述

文章目录 1. Golang 的学习方向2. Golang 的应用领域2.1 区块链的应用开发2.2 后台的服务应用2.3 云计算/云服务后台应用 1. Golang 的学习方向 Go 语言，我们可以简单的写成 Golang 2. Golang 的应用领域 2.1 区块链的应用开发 2.2 后台的服务应用 2.3 云计算/云服…...

编程日记 2025/1/14 6:18:21

web前端第三次作业---制作可提交的用户注册表

制作可提交的用户注册表: 代码: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</tit…...

编程日记 2025/1/14 6:17:20

教育邮箱的魔力：免费获取Adobe和JetBrains软件

今天想和大家聊聊一个超级实用的话题——如何利用Edu教育邮箱来免费获取Photoshop等Adobe系列软件，以及JetBrains的各种开发工具。 Edu邮箱的价值首先，Edu邮箱真的是个宝藏！如果你在学校或教育机构注册过，通常会获得一个这样的…...

编程日记 2025/1/14 6:14:17

sympy常用函数与错误笔记

文章目录前言一、sympy基本函数介绍变量定义1. sp.Symbol("x") 或 sp.symbols("m n")2. sp.Function("y")3. func(x).diff(x, n) 定义方程与求解符号1. sp.Eq(lhs, rhs)2. 求解函数（*代表了常用且重要，其他部分作为拓展&…...

编程日记 2025/1/14 6:12:15

47_Lua文件IO操作

文件I/O（Input/Output）操作在Lua中用于与外部文件进行交互，包括读取文件中的数据和将数据写入文件。Lua提供了两种模式来进行文件操作：简单模式和完全模式。下面将详细介绍这两种模式的基本使用。 1.简单模式 1.1 简单模式介绍简单模式提供了基本的文件操作功能，它主要…...

编程日记 2025/1/14 6:11:13

nginx-lua模块处理流程

一. 简述： nginx的模块化设计使得每一个http模块可以只专注于完成一个独立的，简单的功能。一个请求的完整处理过程可以由多个http模块共同协作完成，这种设计具有简单性，测试性，扩展性，灵活性。关于nginx 的…...

编程日记 2025/1/14 6:10:11

【大数据】机器学习-----最开始的引路

以下是关于机器学习的一些基本信息，包括基本术语、假设空间、归纳偏好、发展历程、应用现状和代码示例： 一、基本术语样本（Sample）： 也称为实例（Instance）或数据点（Data Point&…...

编程日记 2025/1/14 6:09:07

【前端】自学基础算法 -- 21.图的广度优先搜索

图的广度优先搜索简介图的广度优先搜索，沿着图的宽度遍历图的节点，先访问离起始节点最近的节点，然后逐渐向外扩展。基本步骤： 选择一个起始节点作为当前节点。将当前节点加入队列。当队列不为空时，重复以下步骤…...

编程日记 2025/1/14 6:05:03

ChatGPT与Claude AI：两大生成式对话模型的比较分析

自ChatGPT推出以来，这款强大的AI聊天机器人迅速吸引了全球的关注。其出色的对话能力和多样化的应用场景，成为许多人初次体验基于大规模语言模型的潜力。然而，在这个快速发展的领域中，另一款AI也在悄然崭露头角，那就是由…...

编程日记 2025/1/14 6:04:02

前端开发：盒子模型、块元素

1.border边框 *{box-sizing:border-box; } //使所有边框不再撑大盒子模型粗细 : border-width 样式 : border-style, 默认没边框 . solid 实线边框 dashed 虚线边框 dotted 点线边框颜色 : border-color div { width : 200px ; height : 200px ; border : …...

编程日记 2025/1/14 6:03:00

升级 CentOS 7.x 系统内核到 4.4 版本

问题描述在 CentOS 7.x 系统中，默认内核版本是 3.10.x，这个版本可能会带来一些与 Docker 和 Kubernetes 兼容性的问题，导致系统性能不稳定或功能异常。为了提高系统的稳定性和兼容性，建议升级到更高版本的内核，例如 …...

编程日记 2025/1/14 6:01:59

播放音频文件同步音频文本

播放音频同步音频文本对应单个文本高亮显示使用audio音频文件对应音频文本资源音频文本内容（Json） [{"end": 4875,"index": 0,"speaker": 0,"start": 30,"text": "70号二啊,","tex…...

编程日记 2025/1/14 6:00:52

springboot使用Easy Excel导出列表数据为Excel

springboot使用Easy Excel导出列表数据为Excel Easy Excel官网：https://easyexcel.opensource.alibaba.com/docs/current/quickstart/write 主要记录一下引入时候的pom，直接引入会依赖冲突解决方法： &l…...

编程日记 2025/1/14 5:59:51

day07_Spark SQL

文章目录 day07_Spark SQL课程笔记一、今日课程内容二、Spark SQL函数定义（掌握）1、窗口函数2、自定义函数背景2.1 回顾函数分类标准:SQL最开始是_内置函数&自定义函数_两种 2.2 自定义函数背景 3、Spark原生自定义UDF函数3.1 自定义函数流程&#x…...

编程日记 2025/1/14 5:58:50

高性能现代PHP全栈框架 Spiral

概述 Spiral Framework 诞生于现实世界的软件开发项目是一个现代 PHP 框架，旨在为更快、更清洁、更卓越的软件开发提供动力。特性高性能由于其设计以及复杂精密的应用服务器，Spiral Framework框架在不影响代码质量以及与常用库的兼容性的情况下&a…...

编程日记 2025/1/14 5:57:48

LeetCode - #182 Swift 实现找出重复的电子邮件

网罗开发 （小红书、快手、视频号同名） 大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等…...

编程日记 2025/1/14 5:56:45

《解锁鸿蒙Next系统人工智能语音助手开发的关键步骤》

在当今数字化时代，鸿蒙Next系统与人工智能的融合为开发者带来了前所未有的机遇，开发一款人工智能语音助手应用更是备受关注。以下是在鸿蒙Next系统上开发人工智能语音助手应用的关键步骤： 环境搭建与权限申请安装开发工具：首先需…...

编程日记 2025/1/14 5:55:43

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章传送阵>> 点我查看说明：假设每台服务器已…...

编程新知 2026/2/8 1:53:29

零门槛NAS搭建：WinNAS如何让普通电脑秒变私有云？

一、核心优势：专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发，是一款收费低廉但功能全面的Windows NAS工具，主打“无学习成本部署” 。与其他NAS软件相比，其优势在于： 无需硬件改造：将任意W…...

编程新知 2026/1/2 23:01:24

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2026/1/14 22:12:47

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

23-Oracle 23 ai 区块链表（Blockchain Table）

小伙伴有没有在金融强合规的领域中遇见，必须要保持数据不可变，管理员都无法修改和留痕的要求。比如医疗的电子病历中，影像检查检验结果不可篡改行的，药品追溯过程中数据只可插入无法删除的特性需求；登录日志、修改日志…...

编程新知 2026/1/27 3:40:30

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

下面是一个完整的 Android 实现，展示如何创建和管理多个 OkHttpClient 实例，分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...

编程新知 2025/12/15 1:34:37

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2026/2/2 7:39:34

基于服务器使用 apt 安装、配置 Nginx

🧾 一、查看可安装的 Nginx 版本首先，你可以运行以下命令查看可用版本： apt-cache madison nginx-core输出示例： nginx-core | 1.18.0-6ubuntu14.6 | http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages ng…...

编程新知 2026/1/9 12:53:59

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

【学习笔记】深入理解Java虚拟机学习笔记——第4章虚拟机性能监控，故障处理工具

第2章虚拟机性能监控，故障处理工具 4.1 概述略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具命令：jps [options] [hostid] 功能：本地虚拟机进程显示进程ID（与ps相同），可同时显示主类&#x…...

编程新知 2026/1/15 1:34:10

【机器学习：十九、反向传播】

1. 计算图和导数

2. 计算代价函数的偏导 - 单神经元

3. 链导法则求导

4. 过程解释

5. 神经网络中的反向传播

6. 计算代价函数的偏导 - 两层神经网络

相关文章：

【机器学习：十九、反向传播】

线形回归与小批量梯度下降实例

SpringCloud微服务：基于Nacos组件，整合Dubbo框架

Golang 简要概述

web前端第三次作业---制作可提交的用户注册表

教育邮箱的魔力：免费获取Adobe和JetBrains软件

sympy常用函数与错误笔记

47_Lua文件IO操作

nginx-lua模块处理流程

【大数据】机器学习-----最开始的引路

【前端】自学基础算法 -- 21.图的广度优先搜索

ChatGPT与Claude AI：两大生成式对话模型的比较分析

前端开发：盒子模型、块元素

升级 CentOS 7.x 系统内核到 4.4 版本

播放音频文件同步音频文本

springboot使用Easy Excel导出列表数据为Excel

day07_Spark SQL

高性能现代PHP全栈框架 Spiral

LeetCode - #182 Swift 实现找出重复的电子邮件

《解锁鸿蒙Next系统人工智能语音助手开发的关键步骤》

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

零门槛NAS搭建：WinNAS如何让普通电脑秒变私有云？

应用升级/灾备测试时使用guarantee 闪回点迅速回退

阿里云ACP云计算备考笔记 (5)——弹性伸缩

23-Oracle 23 ai 区块链表（Blockchain Table）

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

CMake基础：构建流程详解

基于服务器使用 apt 安装、配置 Nginx

04-初识css

【学习笔记】深入理解Java虚拟机学习笔记——第4章虚拟机性能监控，故障处理工具