当前位置：首页 > news >正文

从 X 入门Pytorch——Tensor的自动微分、计算图，常见的with torch.no_grad()机制

news 2026/2/10 12:37:40

这里写目录标题

- 1 Pytorch计算图和自动微分
- 2 将单个数据从计算图中剥离 .detach
- 3 使用with torch.go_grad(): 包含的代码段不会计算微分

1 Pytorch计算图和自动微分

从功能上理解：
计算图就是类似于数据结构中的无环有向图，Pytorch中的计算图就是为了记录一个数据从开始到最后所作的操作和参数，这样在进行反向传播时候(backward)，就会有足够的参数去计算梯度，得到最终值相较于操作过程中数据梯度，之后再通过优化器(optimizer.step())，对目标函数进行优化，就几乎完成了一轮模型训练的目的。

将Tensor的requires_grad属性设置为True时，Pytorch的torch.autograd会自动地追踪它的计算轨迹，当需要计算微分的时候，只需要对最终计算结果的Tensor调用backward方法，中间所有计算节点的微分就会被保存在grad属性中：

import torchx = torch.arange(9, dtype=torch.float).view(3,3)
print("x默认不缓存计算轨迹：",x, x.requires_grad)
y = torch.randn(3,3, requires_grad=True)
print("y设置requires_grad属性：",y, y.requires_grad)
z = torch.sum(torch.mm(x, y))
z.backward()
print("得到Z：", z, z.requires_grad)
print("经过计算，未保留x的梯度：", x.grad)
print("经过计算，保留了y的梯度：", y.grad)out:
x默认不缓存计算轨迹： tensor([[0., 1., 2.],[3., 4., 5.],[6., 7., 8.]]) False
y设置requires_grad属性： tensor([[-0.2810, -2.7142,  1.8053],[-0.6549,  1.0730, -1.9470],[ 0.5629, -0.0692, -0.7376]], requires_grad=True) True
得到Z： tensor(-32.7122, grad_fn=<SumBackward0>) True
经过计算，未保留x的梯度： None
经过计算，保留了y的梯度： tensor([[ 9.,  9.,  9.],[12., 12., 12.],[15., 15., 15.]])

从上面可以看出，y设置了requires_grad为True时，在计算过后，Pytorch会缓存其梯度信息，而x为设置该属性，即未保存该梯度信息。

汇总：

Tensor属性	作用
`针对Tensor构造时的属性`	后期也可以输出查看
device	该节点运行的设备环境，即CPU/GPU
requires_grad	自动微分机是否需要对该节点求导，缺省为False
`针对Tensor输出时的属性，构造时不可指定`	用来输出查看
grad	输出节点对该节点的梯度，缺省为None
grad_fn	中间计算节点关于全体输入节点的映射，记录了前向传播经过的操作。叶节点为None
is_leaf	该节点是否为叶节点

当需要计算中间数据(x)的梯度时，只需要将最后的结果值进行backward()后，再打印x.grad即可

2 将单个数据从计算图中剥离 .detach

一般在模型训练中计算评价指标时，我们需要停止数据的计算轨迹缓存，则可以使用.detach将数据从计算图中剥离出去，这个是针对单个数据的。

import torch
x = torch.rand(3, 3, requires_grad=True)
w = torch.ones(3, 3, requires_grad=True)
print(x)
print(w)
yy = torch.mm(w, x)
print(yy.requires_grad)detach_yy = yy.detach()  #一般模型中使用loss计算评价指标时，都会用类似这样的式子将loss从计算图中剥离备份出去。
y = torch.sum(yy)
y.backward()print("进行剥离后，detach_yy的属性：", detach_yy.grad)
print("x的梯度缓存：", x.grad)
print("w的梯度缓存：", w.grad)out:
tensor([[0.8037, 0.2443, 0.3994],[0.9879, 0.9484, 0.4035],[0.3057, 0.6682, 0.4186]], requires_grad=True)
tensor([[1., 1., 1.],[1., 1., 1.],[1., 1., 1.]], requires_grad=True)
True
进行剥离后，detach_yy的属性： None
x的梯度缓存： tensor([[3., 3., 3.],[3., 3., 3.],[3., 3., 3.]])
w的梯度缓存： tensor([[1.4474, 2.3398, 1.3925],[1.4474, 2.3398, 1.3925],[1.4474, 2.3398, 1.3925]])

3 使用with torch.go_grad(): 包含的代码段不会计算微分

想必这个在模型测试阶段大家都会用，之所以用这个，是将模型测试阶段的微分不计算在模型中，否则模型把测试集都学过了，那以后拿什么进行模型评价呢？

import torch
x = torch.rand(3, 3, requires_grad=True)
w = torch.ones(3, 3, requires_grad=True)
y = torch.sum(torch.mm(w, x))
print("正常缓存梯度信息：", y.requires_grad)with torch.no_grad():y = torch.sum(torch.mm(w, x))print("在with torch.no_grad中：", y.requires_grad)out:
正常缓存梯度信息： True
在with torch.no_grad中： False

从 X 入门Pytorch——Tensor的自动微分、计算图，常见的with torch.no_grad()机制

这里写目录标题1 Pytorch计算图和自动微分2 将单个数据从计算图中剥离 .detach3 使用with torch.go_grad(): 包含的代码段不会计算微分1 Pytorch计算图和自动微分从功能上理解： 计算图就是类似于数据结构中的无环有向图，Pytorch中的计算图就是为了记录…...

编程日记 2023/3/24 4:47:53

三十七、实战演练之接口自动化平台的文件上传

上传文件功能上传文件功能主要针对需要测试上传文件的接口。原理是，把要测试上传的文件先上传到测试平台，然后把路径写入用例中，后台真正测试时再将其进行上传。一、上传文件模型在testplans/models.py 模块中编写如下模型：…...

编程日记 2023/3/24 4:42:51

菜鸟刷题Day1

菜鸟刷题Day1 一.自守数：自守数_牛客题霸_牛客网 (nowcoder.com) 描述自守数是指一个数的平方的尾数等于该数自身的自然数。例如：25^2 625，76^2 5776，9376^2 87909376。请求出n(包括n)以内的自守数的个数解题思路&#x…...

编程日记 2023/3/24 4:37:50

cjson文件格式介绍

cjson是一种轻量级的JSON解析库，它支持将JSON格式的数据转换为C语言中的数据结构，同时也支持将C语言中的数据结构转换为JSON格式的数据。cjson的文件格式是指在使用cjson库时，将JSON格式的数据存储在文件中，然后通过cjson库读取文…...

编程日记 2023/3/24 4:32:48

【Nginx二】——Nginx常用命令配置文件

Nginx常用命令配置文件常用命令启动和重启 Nginx配置文件maineventshttp常用命令安装完成nginx后，输入 nginx -？查询nginx命令行参数 nginx version: nginx/1.22.1 Usage: nginx [-?hvVtTq] [-s signal] [-p prefix][-e filename] [-c filename] [-…...

编程日记 2023/4/12 5:54:56

3月最新！AIGC公司生态地图；开发者实用ChatGPT工具清单；上手必会的SD绘图教程；字幕组全自动化流程大公开 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！ 🤖 『光年之外诚邀产品经理加入』古典产品经理的复兴！ 光年之外创始人王慧文在社交平台发帖，公布联合创始人团队基…...

编程日记 2023/3/24 4:22:43

python - 递归函数

递归函数什么是递归在函数内部，可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数递归函数必须有一个明确的结束条件每进入更深一层的递归时，问题规模相对于上一次递归都应减少相邻两次重复之间有紧密的联系&…...

编程日记 2023/4/12 16:01:54

文章目录log_tools.clog.cspin_lockseq_putsseq_readseq_writesingle_openmakefiletest.sh测试：运行./test.sh读取日志插入日志echo cat测试参考：log_tools.c #include <stdlib.h> #include <stdio.h> #include <sys/types.h> #includ…...

编程日记 2023/4/12 5:56:18

Linux内核进程管理几种CPU调度策略

CPU调度我们知道，程序需要获得CPU的资源才能被调度和执行，那么当一个进程由于某种原因放弃CPU然后进入阻塞状态，下一个获得CPU资源去被调度执行的进程会是谁呢？下图中，进程1因为阻塞放弃CPU资源，此时&#…...

编程日记 2023/3/24 4:07:37

SpringBoot整合Flink（施耐德PLC物联网信息采集）

SpringBoot整合Flink（施耐德PLC物联网信息采集）Linux环境安装kafka前情：施耐德PLC设备（TM200C16R）设置好信息采集程序，连接局域网，SpringBoot订阅MQTT主题，消息转至kafka&#xff0c…...

编程日记 2023/4/12 5:57:32

DFS(深度优先搜索)和BFS(宽度优先搜索)

目录 DFS（深度优先搜索） 全排列的DFS解法利用DFS递归构建二进制串和递归树的结构剖析 DFS--剪枝 DFS例题--整数划分 BFS(宽度优先搜索) 全排列的BFS解法 DFS（深度优先搜索） 深度优先搜索（Depth First Search&…...

编程日记 2023/3/24 3:57:34

Redis缓存穿透、击穿、雪崩问题及解决方法

系列文章目录 Spring Cache的使用–快速上手篇分页查询–Java项目实战篇全局异常处理–Java实战项目篇完善登录功能–过滤器的使用上述只是部分文章，对该系列文章感兴趣的可以查看我的主页哦文章目录系列文章目录前言一、缓存穿透1.1 问题引入1.2 解决方法1.…...

编程日记 2023/3/24 3:52:33

HAL库 STM32 串口通信

一、实验条件将STM32的PA9复用为串口1的TX，PA10复用为串口1的RX。STM32芯片的输出TX和接收RX与CH340的接收RX和发送TX相连（收发交叉且PCB上默认没有相连，所以需要用P3跳线帽进行手动连接），CH340的另一端通过USB口引出与…...

编程日记 2023/3/24 3:47:31

2023-第十四届蓝桥杯冲刺计划！

💬前言 💡本文以目录形式列举大纲,可根据题目点击跳转 🌈冲刺阶段目的：把握高频重点,结合基础算法和常考题型总结,用真题进行模拟练习根据自己的能力熟练目前已掌握的算法，不会的还可以暴力 ⏳最后三个星期大家一起冲…...

编程日记 2023/3/24 3:42:29

内网渗透基础知识

一、内网概述内网也指局域网，是指在某一区域内又多台计算机互联成的计算机组。一般是方圆几千米内，局域网可以实现文件管理，应用软件共享，打印机共享，工作组内的历程安排，电子邮件和传真通信服务等功能。…...

编程日记 2023/4/12 5:59:09

鸟哥的Linux私房菜正则表示法与文件格式化处理

第十一章、正则表示法与文件格式化处理 https://linux.vbird.org/linux_basic/centos7/0330regularex.php 简体版 http://cn.linux.vbird.org/linux_basic/0330regularex.php 11.2.2 grep的一些高级选项例题一、搜索特定字符串例题二、利用中括号 [] 来搜寻集合字符例题四…...

编程日记 2023/3/24 3:32:26

$(nums[j]-min\_num) % d==0$

从 X 入门Pytorch——Tensor的自动微分、计算图，常见的with torch.no_grad()机制

这里写目录标题

1 Pytorch计算图和自动微分

2 将单个数据从计算图中剥离 .detach

3 使用with torch.go_grad(): 包含的代码段不会计算微分

相关文章：

从 X 入门Pytorch——Tensor的自动微分、计算图，常见的with torch.no_grad()机制

三十七、实战演练之接口自动化平台的文件上传

菜鸟刷题Day1

cjson文件格式介绍

【Nginx二】——Nginx常用命令配置文件

3月最新！AIGC公司生态地图；开发者实用ChatGPT工具清单；上手必会的SD绘图教程；字幕组全自动化流程大公开 | ShowMeAI日报

python - 递归函数

ring_log环形日志-6M缓冲区_proc接口

Linux内核进程管理几种CPU调度策略

SpringBoot整合Flink（施耐德PLC物联网信息采集）

DFS(深度优先搜索)和BFS(宽度优先搜索)

Redis缓存穿透、击穿、雪崩问题及解决方法

HAL库 STM32 串口通信

2023-第十四届蓝桥杯冲刺计划！

内网渗透基础知识

鸟哥的Linux私房菜正则表示法与文件格式化处理

1630.等差子数组

CSS 属性计算过程

ThinkPHP02：路由

制作简单进销存管理系统（C#）

生成xcframework

XCTF-web-easyupload

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

P3 QT项目----记事本（3.8）

HBuilderX安装（uni-app和小程序开发）

Spring Boot+Neo4j知识图谱实战：3步搭建智能关系网络！

BCS 2025｜百度副总裁陈洋：智能体在安全领域的应用实践

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪宝可梦GO游戏自组网系统