当前位置：首页 > news >正文

深度学习（斋藤）学习笔记（五）-反向传播2

news 2025/7/9 15:45:06

上一篇关于反向传播的代码仅支持单变量的梯度计算，下面我们将扩展代码使其支持多个输入/输出。增加了对多输入函数（如 Add），以实现的计算。

1.关于前向传播可变长参数的改进-修改Function类

修改方法：

Function用于对输入输出做规定，帮助实现右图的效果（接受inputs 返回outputs）：

2.关于反向传播可变长参数的改进

修改函数类的反向传播

修改Variable类的反向传播

改进前：

获取y.creator,获取输入creator.inputs，根据y.grads计算x.grads:creator.backward(y.grads)

2.3两步的解包和打包操作：

最后修改square方法：

完整代码

import numpy as npclass Variable:def __init__(self, data):if data is not None:if not isinstance(data, np.ndarray):raise TypeError('{} is not supported'.format(type(data)))self.data = dataself.grad = Noneself.creator = Nonedef set_creator(self, func):self.creator = funcdef backward(self):if self.grad is None:self.grad = np.ones_like(self.data)funcs = [self.creator]while funcs:f = funcs.pop()gys = [output.grad for output in f.outputs]  # 获取所有输出的梯度gxs = f.backward(*gys)                       # 调用 backward 方法if not isinstance(gxs, tuple):               # 确保 gxs 是元组gxs = (gxs,)for x, gx in zip(f.inputs, gxs):            # 为每个输入分配梯度x.grad = gxif x.creator is not None:funcs.append(x.creator)class Function:def __call__(self, *inputs):xs = [x.data for x in inputs]               # 提取输入数据ys = self.forward(*xs)                      # 前向传播（解包）if not isinstance(ys, tuple):               # 确保 ys 是元组ys = (ys,)outputs = [Variable(as_array(y)) for y in ys]  # 创建输出变量for output in outputs:output.set_creator(self)self.inputs = inputs                        # 保存输入self.outputs = outputs                      # 保存输出return outputs if len(outputs) > 1 else outputs[0]  # 根据输出数量返回def forward(self, *xs):raise NotImplementedError()def backward(self, *gys):raise NotImplementedError()# 实现具体的函数类
class Square(Function):def forward(self, x):return x ** 2def backward(self, gy):x = self.inputs[0].data                     # 从 inputs 中获取数据gx = 2 * x * gyreturn gxclass Add(Function):def forward(self, x0, x1):y = x0 + x1return ydef backward(self, gy):return gy, gy                               # 对两个输入返回相同的梯度# 定义便捷函数
def square(x):return Square()(x)def add(x0, x1):return Add()(x0, x1)# 定义 as_array 函数
def as_array(x):if np.isscalar(x):return np.array(x)return x# 测试代码
x = Variable(np.array(2.0))
y = Variable(np.array(3.0))
z = add(square(x), square(y))
z.backward()
print(z.data)    # 输出结果: 13.0 (2^2 + 3^2 = 4 + 9 = 13)
print(x.grad)    # 输出梯度: 4.0 (dz/dx = 2 * 2 = 4)
print(y.grad)    # 输出梯度: 6.0 (dz/dy = 2 * 3 = 6)

运行结果：

深度学习（斋藤）学习笔记（五）-反向传播2

上一篇关于反向传播的代码仅支持单变量的梯度计算，下面我们将扩展代码使其支持多个输入/输出。增加了对多输入函数（如 Add），以实现的计算。 1.关于前向传播可变长参数的改进-修改Function类修改方法： Function用于对…...

编程日记 2025/3/8 16:49:26

数据库基础练习1

目录 1.创建数据库和表 2.插入数据创建一个数据库，在数据库种创建一张叫heros的表，在表中插入几个四大名著的角色： 1.创建数据库和表 #创建表 CREATE DATABASE db_test;#查看创建的数据库 show databases; #使用db_test数据库 USE db_te…...

编程日记 2025/3/8 16:46:23

TypeError: Cannot create property ‘xxx‘ on string ‘xxx‘

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》、《前端求职突破计划》 🍚 蓝桥云课签约作者、…...

编程日记 2025/3/8 16:45:22

极狐GitLab 17.9 正式发布，40+ DevSecOps 重点功能解读【三】

GitLab 是一个全球知名的一体化 DevOps 平台，很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。学习极狐GitLab 的相关资料： 极狐GitLab 官网极狐…...

编程日记 2025/3/8 16:41:18

lsblk命令linux查询设备信息

lsblk命令是Linux中用于列出所有可用块设备信息的工具，它能够显示设备之间的依赖关系，但不会列出RAM盘的信息。块设备包括硬盘、闪存盘、CD-ROM等。lsblk命令包含在util-linux包中，该命令的常用参数包括： -d：仅列出磁盘…...

编程日记 2025/3/8 16:39:16

【智能体架构：Agent】LangChain智能体类型ReAct、Self-ASK的区别

1. 什么是智能体将大语言模型作为一个推理引擎。给定一个任务， 智能体自动生成完成任务所需步骤， 执行相应动作（例如选择并调用工具）， 直到任务完成。 2. 先定义工具：Tools 可以是一个函数或三方 API也…...

编程日记 2025/3/8 16:38:14

鸿蒙开发：弹性布局Flex

前言代码案例基于Api13。正在开发一个搜索组件，其中一个功能是针对历史搜索的内容进行展示，由于搜索的内容长度不一，需要进行流式布局展示，效果如下： 以上的效果，相信大家在很多的应用里或多或少都见到过…...

编程日记 2025/3/8 16:28:02

【DeepSeek】5分钟快速实现本地化部署教程

一、快捷部署 （1）下载ds大模型安装助手，下载后直接点击快速安装即可。 https://file-cdn-deepseek.fanqiesoft.cn/deepseek/deepseek_28348_st.exe （2）打开软件，点击立即激活 （3）选…...

编程日记 2025/3/8 16:27:01

易基因特异性R-loop检测整体研究方案

大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。 01.技术简述 R-loop是由DNA:RNA 杂交体和被置换的单链DNA组成的三链核酸结构，广泛参与基因转录、表观遗传调控及DNA修复等关键生物学过程。异常的R-loop积累会导致基因组不稳…...

编程日记 2025/3/8 16:23:57

虚拟系统配置案例

安全策略要求： 1、只存在一个公网IP地址，公司内网所有部门都需要借用同一个接口访问外网 2、财务部禁止访问Internet，研发部门只有部分员工可以访问Internet，行政部门全部可以访问互联网 3、为三个部门的虚拟系统分配相同的资源类…...

编程日记 2025/3/8 16:22:56

C语言【进阶篇】之结构体 —— 从基础声明到复杂应用的进阶之路

目录 🚀前言✍️结构体类型的声明💯结构体定义💯结构的特殊声明 🦜结构的自引用💻结构体内存对齐💯对齐规则💯为什么存在内存对齐💯修改默认对齐数 🐍结构体传参&#x1…...

编程日记 2025/3/8 16:20:54

Python-列表和元组

列表列表是什么, 元组是什么编程中, 经常需要使用变量, 来保存/表示数据. 如果代码中需要表示的数据个数比较少, 我们直接创建多个变量即可. 但是有的时候, 代码中需要表示的数据特别多, 甚至也不知道要表示多少个数据. 这个时候, 就需要用到列表. 列表是一种让程序猿在代…...

编程日记 2025/3/8 16:13:46

PyTorch 中的混合精度训练方法，从 autocast 到 GradScalar

PyTorch 的混合精度训练主要由两个方法实现：amp.autocast 和 amp.GradScalar。在这两个工具的帮助下，可以实现以 torch.float16 的混合精度训练。当然，这两个方法都是模块化并且通常都会一起调用，但并不一定总是需要一起使用。参…...

编程日记 2025/3/8 16:12:45

分享能在线运行C语言的网站

https://www.onlinegdb.com/# 我用vscode运行c语言总是报错，后面找到这个网站，可以在线调试和保存代码。如下图，程序的效果是给变量x，y，z赋值，并打印出来。代码输入以后，右上角选择C语言&…...

编程日记 2025/3/8 16:09:41

AI-Deepseek + PPT

01--Deepseek提问首先去Deepseek问一个问题： Deepseek的回答： 在汽车CAN总线通信中，DBC文件里的信号处理（如初始值、系数、偏移）主要是为了将原始二进制数据转换为实际物理值，确保不同电子控制单元&…...

编程日记 2025/3/8 16:05:37

MacOS Big Sur 11 新机安装brew wget python3.12 exo

MacOS Big Sur 11,算是很老的系统了，所以装起来有点费劲。首先安装brew 按照官网的方法，直接执行下面语句即可安装： export HOMEBREW_BREW_GIT_REMOTE"https://githubfast.com" # put your Git mirror of Homebrew/brew here …...

编程日记 2025/3/8 16:04:33

十大经典排序算法简介

一概述本文对十大经典排序算法做简要的总结（按常用分类方式排列），包含核心思想、时间/空间复杂度及特点。二、比较类排序 1. 冒泡排序 (BUBBLE SORT) 思想：重复交换相邻逆序元素，像气泡上浮复杂度：时间：O(n^2)（最好情况O(n)）空间：O(1) 特点：简单但效率低，稳…...

编程日记 2025/3/8 16:03:31

不小心更改了/etc权限为777导致sudo,ssh等软件都无法使用

修复流程一、进入恢复模式（无网络或无法登录时必选） 1.重启系统，在 GRUB 启动菜单选择 Recovery Mode（按 Shift 或 Esc 呼出菜单）。2.以 root 身份挂载为可读写： bash 复制 mount -o remount,rw /确保文…...

编程日记 2025/3/8 16:02:30

AI档案审核2

以下是一个结合计算机视觉（CV）和自然语言处理（NLP）的智能档案审核系统完整实现方案，包含可落地的代码框架和技术路线： 一、系统架构设计 #mermaid-svg-UhBtIPrNXo5P89Zb {font-family:"trebuchet ms&q…...

编程日记 2025/3/8 15:55:20

【基础1】冒泡排序

核心思想冒泡排序是通过相邻元素的连续比较和交换，使得较大的元素逐渐"浮"到数组的末尾，如同水中气泡上浮的过程特点： 每轮遍历将最大的未排序元素移动到正确位置稳定排序：相等元素的相对位置保持不变原地排序…...

编程日记 2025/3/8 15:49:13

MPNet：旋转机械轻量化故障诊断模型详解python代码复现

目录一、问题背景与挑战二、MPNet核心架构 2.1 多分支特征融合模块（MBFM） 2.2 残差注意力金字塔模块（RAPM） 2.2.1 空间金字塔注意力（SPA） 2.2.2 金字塔残差块（PRBlock） 2.3 分类器设计三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

编程新知 2025/7/8 12:03:28

从WWDC看苹果产品发展的规律

WWDC 是苹果公司一年一度面向全球开发者的盛会，其主题演讲展现了苹果在产品设计、技术路线、用户体验和生态系统构建上的核心理念与演进脉络。我们借助 ChatGPT Deep Research 工具，对过去十年 WWDC 主题演讲内容进行了系统化分析，形成了这份…...

编程新知 2025/7/5 23:44:54

模型参数、模型存储精度、参数与显存

模型参数量衡量单位 M：百万（Million） B：十亿（Billion） 1 B 1000 M 1B 1000M 1B1000M 参数存储精度模型参数是固定的，但是一个参数所表示多少字节不一定，需要看这个参数以什么…...

编程新知 2025/6/18 8:29:05

Swift 协议扩展精进之路：解决 CoreData 托管实体子类的类型不匹配问题（下）

概述在 Swift 开发语言中，各位秃头小码农们可以充分利用语法本身所带来的便利去劈荆斩棘。我们还可以恣意利用泛型、协议关联类型和协议扩展来进一步简化和优化我们复杂的代码需求。不过，在涉及到多个子类派生于基类进行多态模拟的场景下，…...

编程新知 2025/7/7 7:23:14

《Playwright：微软的自动化测试工具详解》

Playwright 简介:声明内容来自网络，将内容拼接整理出来的文档 Playwright 是微软开发的自动化测试工具，支持 Chrome、Firefox、Safari 等主流浏览器，提供多语言 API（Python、JavaScript、Java、.NET）。它的特点包括&a…...

编程新知 2025/7/7 13:52:42

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

可以使用Sqliteviz这个网站免费编写sql语句，它能够让用户直接在浏览器内练习SQL的语法，不需要安装任何软件。链接如下： sqliteviz 注意： 在转写SQL语法时，关键字之间有一个特定的顺序，这个顺序会影响到…...

编程新知 2025/7/8 8:19:32

Axios请求超时重发机制

Axios 超时重新请求实现方案在 Axios 中实现超时重新请求可以通过以下几种方式： 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

编程新知 2025/6/21 10:09:08

Mysql中select查询语句的执行过程

目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析（Parser） 2.4、执行sql 1. 预处理（Preprocessor） 2. 查询优化器（Optimizer） 3. 执行器…...

编程新知 2025/7/9 14:12:42

MySQL 8.0 事务全面讲解

以下是一个结合两次回答的 MySQL 8.0 事务全面讲解，涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容，并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解一、事务的核心概念（ACID） 事务是…...

编程新知 2025/7/8 21:19:20

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

在2025年的AI硬件浪潮中，苹果AI眼镜（Apple Glasses）正在引发一场关于“人机交互形态”的深度思考。它并非简单地替代AirPods或Apple Watch，而是开辟了一个全新的、日常可接受的AI入口。其核心价值不在于功能的堆叠，而在于如何通过形态设计打破社交壁垒，成为用户“全天佩戴…...

编程新知 2025/7/6 5:56:02

1.关于前向传播可变长参数的改进-修改Function类

2.关于反向传播可变长参数的改进

修改函数类的反向传播

修改Variable类的反向传播

完整代码

相关文章：