当前位置：首页 > article >正文

PyTorch_自动微分模块

article 2026/2/8 9:16:39

自动微分 (Autograd) 模块对张量做了进一步的封装，具有自动求导功能。自动微分模块是构成神经网络训练的必要模块，在神经网络的反向传播过程中，Autograd 模块基于正向计算的结果对当前的参数进行微分计算，从而实现网络权重参数的更新。

梯度基本计算

使用 backward 方法，grad 属性来实现梯度的计算和访问。

import torch 
import numpy as np # 标量的梯度计算
def test01():# 对于需要求导的张量，需设置 requires_grad = Truex = torch.tensor(10, requires_grad=True, dtype=torch.float64)# 对 x 的中间计算f = x ** 2 + 20  # 求导获得 2x# 自动微分f.backward()# 访问梯度print(x.grad)# 向量的梯度计算
def test02():x = torch.tensor([10, 20, 30, 40], requires_grad=True, dtype=torch.float64)# 定义变量的计算过程y1 = x ** 2 + 20 # 注意：自动微分的时候，必须是一个标量y2 = y1.mean()  # 对 y1 / 4 的操作# 自动微分，求导y2.backward()print(x.grad)# 多标量梯度计算
def test03():x1 = torch.tensor(10, requires_grad=True, dtype=torch.float64)x2 = torch.tensor(20, requires_grad=True, dtype=torch.float64)# 中间计算过程y = x1 ** 2 + x2 ** 2 + x1 * x2 # 自动微分y.backward()# 打印梯度值print(x1.grad)print(x2.grad)# 多向量的梯度计算
def test04():x1 = torch.tensor([10, 20], requires_grad=True, dtype=torch.float64)x2 = torch.tensor([30, 40], requires_grad=True, dtype=torch.float64)# 定义中间件计算过程y = x1 ** 2 + x2 **2 + x1 * x2 # 将输出结果变为标量y = y.sum()# 自动微分y.backward()# 打印张量的梯度值print(x1.grad)print(x2.grad)if __name__ == "__main__":test04()

控制梯度计算

当 requires_grad = True 时，张量在某些时候计算不进行梯度计算。

import torch 
import numpy as np # 控制梯度计算
# 训练时才用到梯度计算
def test01():x = torch.tensor(10, requires_grad=True, dtype=torch.float64)print(x.requires_grad)# 1. 第一钟方法with torch.no_grad():y = x**2print(y.requires_grad)#2. 针对函数# 第二种方式@torch.no_grad()def my_func(x):return x ** 2 y = my_func(x)print(y.requires_grad)#3. 第三种方式: 全局的方式torch.set_grad_enabled(False)y = x ** 2 print(y.requires_grad)# 梯度累加和梯度清零
def test02():x = torch.tensor([10, 20, 30, 40], requires_grad=True, dtype=torch.float64)# 当我们重复对x进行梯度计算的时候，是会将历史的梯度值累加到 x.grad 属性中# 不要取累加历史梯度for _ in range(3):# 对输入x的计算过程f1 = x ** 2 + 20# 将向量转换为标量f2 = f1.mean()# 梯度清零if x.grad is not None:x.grad.data.zero_()# 自动微分f2.backward()print(x.grad)# 梯度下降优化函数
def test03():x = torch.tensor(10, requires_grad=True, dtype=torch.float64)for _ in range(100):# 正向计算y = x ** 2# 梯度清零if x.grad is not None:x.grad.data.zero_()# 自动微分y.backward()# 更新参数x.data = x.data - 0.001 * x.grad # 打印 x 的值print('%.10f' % x.data)if __name__ == "__main__":test03()

梯度计算注意点

当对设置 requires_grad = True 的张量使用 numpy 函数进行转换时，会出现如下错误：

Can't call numpy()  on Tensor that requires grad. Use tensor.detach().numpy() instead.

此时，需要先使用 detach 函数将张量进行分离，再使用 numpy 函数。

注意：detach 之后会产生一个新的张量，新的张量做为叶子节点并且该张量和原来的张量共享数据，但是分离后的张量不需要计算梯度。

import torch 
import numpy as np # 错误方式
def test01():x = torch.tensor([10, 20], requires_grad=True, dtype=torch.float64)# RuntimeError: Can't call numpy() on Tensor that requires grad. Use tensor.detach().numpy() instead.# print(x.numpy())# 正确的做法print(x.detach().numpy())# 共享数据
def test02():# x 是叶子节点x1 = torch.tensor([10, 20], requires_grad=True, dtype=torch.float64)# 使用 detach 函数来分离出一个新的张量x2 = x1.detach()print(id(x1.data), id(x2.data))# 修改分离后产生的新的张量x2[0] = 100 print(x1)print(x2)# 通过结果我么发现，x2 张量不存在 requires_grad = True # 表示：对 x1 的任何计算都会影响到对 x1 的梯度计算# 但是，对 x2 的任何计算不会影响到 x1 的梯度计算print(x1.requires_grad)print(x2.requires_grad)if __name__ == "__main__":test02()

PyTorch_自动微分模块

自动微分 (Autograd) 模块对张量做了进一步的封装，具有自动求导功能。自动微分模块是构成神经网络训练的必要模块，在神经网络的反向传播过程中，Autograd 模块基于正向计算的结果对当前的参数进行微分计算，从而实现网络权重参数的更…...

编程日记 2026/2/3 21:22:15

【Git】【commit】查看未推送的提交查看指定commit的修改内容合并不连续的commit

文章目录 1. 查看未推送的提交方法一 ：git status方法二：git log方法三：git cherry方法四：git rev-list 2. 查看指定commit的修改方法一：git show方法二：git log方法三：git diff 3. 合并不连续的…...

编程日记 2025/11/27 20:03:56

手写 Vue 源码 === 依赖清理机制详解

目录引言响应式系统基础回顾依赖清理的必要性 ReactiveEffect 类的设计依赖清理的三个关键函数 1. preCleanEffect：执行前的准备 2. trackEffects：依赖收集与 diff 算法 3. postCleanEffect：执行后的清理 4. cleanDepEffect：清理依赖实际案例分析依赖清理算…...

编程日记 2025/11/21 10:43:02

LSB图像信息隐藏系统（MATLAB）

图像信息隐藏系统系统概述图像信息隐藏系统是一个基于MATLAB开发的图像隐写工具，采用自适应LSB（最低有效位）隐写算法，实现了信息在图像中的隐藏与提取功能。系统配备了直观的图形用户界面，支持图像分析、信息隐藏、…...

编程日记 2026/2/6 0:56:12

C++GO语言微服务项目之 go语言基础语法

目录 01 变量定义 02 自增语法 03 指针 04 go不支持的语法 05 string 06 定长数组-forrange 07 动态数组追加元素 08 切片截取-copy-make介绍 09 map介绍 10 函数 11 内存逃逸 12 import 13 命令行参数-switch 14 标签与continue-goto-break配合使用 15 枚举cons…...

编程日记 2026/2/6 0:53:10

DDR在PCB布局布线时的注意事项及设计要点

一、布局注意事项控制器与DDR颗粒的布局靠近原则：控制器与DDR颗粒应尽量靠近，缩短时钟（CLK）、地址/控制线（CA）、数据线（DQ/DQS）的走线长度，减少信号延迟差异。分组隔…...

编程日记 2026/1/10 1:59:27

【每天学习一点点】使用Python的pathlib模块分割文件路径

使用Python的pathlib模块分割文件路径 pathlib模块（Python 3.4）提供了面向对象的文件系统路径操作方式，比传统的os.path更加直观和易用。以下是使用pathlib分割文件路径的几种方法： 基本路径分割 from pathlib import Path# 创…...

编程日记 2026/1/10 1:00:49

Hydra详细教程：入门、入狱，和使用与注意事项

警告：本文档仅供学习和授权测试目的使用。未经授权对计算机系统进行渗透测试是非法行为。请务必在获得明确许可的情况下使用Hydra，并遵守所有适用的法律法规。滥用此工具可能导致严重的法律后果。什么是Hydra？ Hydra是一款非常流行的开源网…...

编程日记 2026/1/7 21:12:15

【C++游戏引擎开发】第32篇：物理引擎（Bullet）—约束系统

一、约束系统基础理论 1.1 物理约束的本质 1.1.1 约束的数学描述在刚体动力学中，约束的本质是通过数学方程限制刚体的运动自由度。对于两个刚体A和B的约束关系，可以用以下方程表示： Φ ( q A , q B , t ) = 0...

编程日记 2026/1/10 2:41:13

理解 Elasticsearch 的评分机制和 Explain API

作者：来自 Elastic Kofi Bartlett 深入了解 Elasticsearch 的评分机制并探索 Explain API。想获得 Elastic 认证吗？查看下一期 Elasticsearch Engineer 培训的时间！ Elasticsearch 拥有大量新功能，帮助你为你的使用场景构建最佳…...

编程日记 2026/2/6 1:15:04

NGINX `ngx_http_charset_module` 字符集声明与编码转换

一、模块定位与功能 ngx_http_charset_module 主要提供两大能力： 响应头声明：在 Content-Type 头部自动添加 ; charsetXXX，告知客户端所用字符集。单向编码转换：在 NGINX 层将一种单字节编码（如 koi8-r、windows-125…...

编程日记 2025/12/2 7:58:08

视频编解码学习三之显示器

整理自：显示器_百度百科，触摸屏_百度百科,百度安全验证分为阴极射线管显示器（CRT），等离子显示器PDP，液晶显示器LCD 液晶显示器的组成。一般来说，液晶显示器由以下几个部分组成： […...

编程日记 2026/2/6 1:46:14

Python中的re库详细用法与代码解析

目录 1. 前言 2. 正则表达式的基本概念 2.1 什么是正则表达式？ 2.2 常用元字符 3. re库的适应场景 3.1 验证用户输入 3.2 从文本中提取信息 3.3 文本替换与格式化 3.4 分割复杂字符串 3.5 数据清洗与预处理 4. re库的核心功能详解 4.1 re.match()&#…...

编程日记 2026/1/10 18:28:25

K8s网络从0到1

K8s网络从0到1 前言 K8s是一个强大的平台，但它的网络比较复杂，涉及很多概念，例如Pod网络，Service网络，Cluster IPs，NodePort，LoadBalancer和Ingress等等。为了帮助大家理解，模仿TC…...

编程日记 2026/2/6 1:35:45

13.Excel：分列

一分列的作用将一个单元格中的内容拆分到两个或多个单元格当中。二如何使用 1.常规分列使用注意：分列功能一次只能拆分一列。长度一致或者数据间有分隔符。补充：快速选择一列。 CTRL shift 向下箭头。补充：中英文逗号不同。可以先通…...

编程日记 2026/2/6 1:16:04

第十六届蓝桥杯大赛软件赛C/C++大学B组部分题解

第十六届蓝桥杯大赛软件赛C/C大学B组题解试题A: 移动距离问题描述小明初始在二维平面的原点，他想前往坐标(233,666)。在移动过程中，他只能采用以下两种移动方式，并且这两种移动方式可以交替、不限次数地使用： 水平向右移动…...

编程日记 2026/1/8 11:15:21

计算机网络应用层（5）-- P2P文件分发视频流和内容分发网

💓个人主页：mooridy 💓专栏地址：《计算机网络：自顶向下方法》大纲式阅读笔记_mooridy的博客-CSDN博客 💓本博客内容为《计算机网络：自顶向下方法》第二章应用层第五、六节知识梳理关注我&…...

编程日记 2026/1/19 6:05:47

Gin优雅关闭 graceful-shutdown

文章目录优雅关闭示例 - Close 方法项目结构使用方法代码如下代码说明如果去掉代码中的数字1，会发生什么优雅关闭示例项目结构使用方法使用上下文通知不使用上下文通知代码 notify-without-context-server.go代码说明代码 notify-with-context-server.go代码说明…...

编程日记 2026/2/8 1:52:04

Android 查看 Logcat (可纯手机方式无需电脑)

安装 Logcat Reader Github Google Play 如果有电脑使用其ADB方式可执行如下命令后续无需安装Termux # 使用 ADB 授予 android.permission.READ_LOGS 权限给 Logcat Reader adb shell "pm grant com.dp.logcatapp android.permission.READ_LOGS && am force-…...

编程日记 2026/1/8 15:48:25

Java 中常见的数据结构及其常用 API

本文总结了 Java 中常见的数据结构及其常用 API，帮助开发者在写算法时能够快速选择合适的数据结构和操作。通过使用合适的 API，可以有效减少计算复杂度，并提高代码的执行效率。 1. 数组数组是 Java 中最常用的数据结构之一，Jav…...

编程日记 2026/2/6 21:02:26

五子棋html

<!DOCTYPE html> <html lang"zh-CN"> <head> <meta charset"UTF-8" /> <meta name"viewport" content"widthdevice-width, initial-scale1" /> <title>五子棋游戏</title> <style>bo…...

编程日记 2026/2/2 17:44:11

在Laravel 12中实现基于parent_id的树状数组

在Laravel中实现基于parent_id的树状数组，可以通过预加载所有节点并在内存中递归构建树结构来完成。以下是具体步骤和代码示例： 1. 创建模型及数据库迁移迁移文件： // 创建节点表 Schema::create(nodes, function (Blueprint $table) {$t…...

编程日记 2026/1/28 23:54:59

JavaWeb：后端web基础（TomcatServletHTTP）

一、今日内容二、Tomcat 介绍与使用介绍基本使用小结配置配置查找进程三、Servlet 什么是Servlet 快速入门需求步骤 1.新建工程-模块（Maven） 2.修改打包方式-war 3.编写代码 /*** 可以选择继承HttpServlet*/ WebServlet("/hello&q…...

编程日记 2026/2/2 17:44:14

C++负载均衡远程调用学习之负载均衡算法与实现

目录 01 lars 系统架构回顾 02 lars-lbAgentV0.4-route_lb处理report业务流程 03 lars-lbAgentV0.4-负责均衡判断参数配置 04 lars-lbAgentV0.4-负载均衡idle节点的失败率判断 05 lars-lbAgentV0.4-负载均衡overload节点的成功率判断 06 lars-lbAgentV0.4-负载均衡上报提交…...

编程日记 2026/1/31 20:04:16

缓存（1）：三级缓存

三级缓存是指什么我们常说的三级缓存如下： CPU三级缓存Spring三级缓存应用架构（JVM、分布式缓存、db）三级缓存 CPU 基本概念 CPU 的访问速度每 18 个月就会翻倍，相当于每年增⻓ 60% 左右，内存的速度当然也会不断…...

编程日记 2026/2/6 22:22:47

Cursor —— AI编辑器使用详解

Cursor - The AI Code Editor 一、Cursor 是什么？ Cursor 是一款优秀的AI代码编辑器，它内置了 Deepseek-R1、GPT-4、Claude等 AI 模型。简单说，就是：Cursor VS Code 编辑器 AI 大模型 Cursor 功能特性（代码补全、…...

编程日记 2026/2/6 10:07:34

Pytorch-CUDA版本环境配置

Pytorch-CUDA版本环境配置电脑如果是Windows平台下的Nvidia GPU的用户，需配置Pytorch的CUDA版本，分为三步： 1. 安装或更新NVIDA显卡驱动官方驱动下载地址： https://www.nvidia.cn/Download/index.aspx?langcn 2. 安装CUDA Too…...

编程日记 2026/2/2 13:11:47

一个完整的神经网络训练流程详解（附 PyTorch 示例）

🧠 一个完整的神经网络训练流程详解（附 PyTorch 示例） 📌 第一部分：神经网络训练流程概览（总） 在深度学习中，构建和训练一个神经网络模型并不是简单的“输入数据、得到结果”这么简…...

编程日记 2025/9/13 0:32:43

OpenCV 图形API（77）图像与通道拼接函数-----对图像进行几何变换函数remap()

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述对图像应用一个通用的几何变换。函数 remap 使用指定的映射对源图像进行变换： dst ( x , y ) src ( m a p x ( x , y ) , m a p y…...

编程日记 2026/2/2 17:44:10

PyTorch_自动微分模块

梯度基本计算

控制梯度计算

梯度计算注意点

相关文章：

PyTorch_自动微分模块

【Git】【commit】查看未推送的提交查看指定commit的修改内容合并不连续的commit

手写 Vue 源码 === 依赖清理机制详解

LSB图像信息隐藏系统（MATLAB）

C++GO语言微服务项目之 go语言基础语法

DDR在PCB布局布线时的注意事项及设计要点

【每天学习一点点】使用Python的pathlib模块分割文件路径

Hydra详细教程：入门、入狱，和使用与注意事项

【C++游戏引擎开发】第32篇：物理引擎（Bullet）—约束系统

最新字节跳动运维云原生面经分享

理解 Elasticsearch 的评分机制和 Explain API

NGINX `ngx_http_charset_module` 字符集声明与编码转换

视频编解码学习三之显示器

Python中的re库详细用法与代码解析

K8s网络从0到1

13.Excel：分列

第十六届蓝桥杯大赛软件赛C/C++大学B组部分题解

计算机网络应用层（5）-- P2P文件分发视频流和内容分发网

Gin优雅关闭 graceful-shutdown

Android 查看 Logcat (可纯手机方式无需电脑)

Java 中常见的数据结构及其常用 API

五子棋html

在Laravel 12中实现基于parent_id的树状数组

JavaWeb：后端web基础（TomcatServletHTTP）

C++负载均衡远程调用学习之负载均衡算法与实现

缓存（1）：三级缓存

Cursor —— AI编辑器使用详解

Pytorch-CUDA版本环境配置

一个完整的神经网络训练流程详解（附 PyTorch 示例）

OpenCV 图形API（77）图像与通道拼接函数-----对图像进行几何变换函数remap()