当前位置：首页 > news >正文

PyTorch 中张量运算广播

news 2026/2/9 23:01:26

TLDR

右对齐，空补一，从左往右依维运算
[m] + [x, y] = [m +x, m + y]

正文

以如下 a b 两个 tensor 计算为例

a = torch.tensor([[1],[2],[3],
])
b = torch.tensor([[[1, 2, 3],],[[4, 5, 6],],[[7, 8, 9],],
])
# a.shape = (3, 1)
# b.shape = (3, 1, 3)

首先将两个 tensor 的 shape 右对齐
a( , 3, 1)
b(3, 1, 3)

判断两个 tensor 是否满足广播规则：

tensor 至少有一个维度（比如 torch.tensor((0,)) 便不符合本要求）
检查上一步对齐的 tensor shape，要求两个 tensor 对应维度的大小：要么相同；要么其中一个为 1；要么其中一个为空
如果满足上述规则，则继续，否则报错

将对齐后空缺的维度设置为 1
a(1, 3, 1)
b(3, 1, 3)
其实就是对 a 进行了扩维，此时两个 tensor 为：

a = torch.tensor([[[1],[2],[3],],
])
b = torch.tensor([[[1, 2, 3],],[[4, 5, 6],],[[7, 8, 9],],
])
# a.shape = (1, 3, 1)
# b.shape = (3, 1, 3)

从左往右对两个 tensor 的每一个维度进行运算，按照以下规则：

如果大小相同，则直接进行运算即可（一一对应）
如果其中一个大小为 1，则使用这个元素与另一个 tensor 当前维度下的每个元素进行运算（本质是一个递归操作）

例如计算 a + b （这两个 tensor 已经经过上述步骤处理，即维度已经相同）

# 1. 因为 a.shape[0] == 1，所以将 a[0] 分别与 b[0]、b[1]、b[2] 相加
[a[0] + b[0],a[0] + b[1],a[0] + b[2],
]# 2. 接下来继续往后计算，以 a[0] + b[0] 为例
#    因为 a[0].shape[0] = 3, b[0].shape[0] = 1，
#    所以将 b[0][0] 分别与 a[0][0]、a[0][1]、a[0][2] 相加
[[	# a[0] + b[0]a[0][0] + b[0][0],a[0][1] + b[0][0],a[0][2] + b[0][0],],[	# a[0] + b[1]a[0][0] + b[1][0],a[0][1] + b[1][0],a[0][2] + b[1][0],],[	# a[0] + b[2]a[0][0] + b[2][0],a[0][1] + b[2][0],a[0][2] + b[2][0],],
]# 3. 继续往后计算，以 a[0][0] + b[0][0] 为例
#    因为 a[0][0].shape[0] == 1，
#    所以将 a[0][0][0] 分别与 b[0][0][0]、b[0][0][1]、b[0][0][2] 相加
[[	# a[0] + b[0][ 	# a[0][0] + b[0][0]a[0][0][0] + b[0][0][0],a[0][0][0] + b[0][0][1],a[0][0][0] + b[0][0][2],],[ 	# a[0][1] + b[0][0]a[0][1][0] + b[0][0][0],a[0][1][0] + b[0][0][1],a[0][1][0] + b[0][0][2],],[ 	# a[0][2] + b[0][0]a[0][2][0] + b[0][0][0],a[0][2][0] + b[0][0][1],a[0][2][0] + b[0][0][2],],],[	# a[0] + b[1][ 	# a[0][0] + b[1][0]a[0][0][0] + b[1][0][0],a[0][0][0] + b[1][0][1],a[0][0][0] + b[1][0][2],],[ 	# a[0][1] + b[1][0]a[0][1][0] + b[1][0][0],a[0][1][0] + b[1][0][1],a[0][1][0] + b[1][0][2],],[ 	# a[0][2] + b[1][0]a[0][2][0] + b[1][0][0],a[0][2][0] + b[1][0][1],a[0][2][0] + b[1][0][2],],],[	# a[0] + b[2][ 	# a[0][0] + b[2][0]a[0][0][0] + b[2][0][0],a[0][0][0] + b[2][0][1],a[0][0][0] + b[2][0][2],],[ 	# a[0][1] + b[2][0]a[0][1][0] + b[2][0][0],a[0][1][0] + b[2][0][1],a[0][1][0] + b[2][0][2],],[ 	# a[0][2] + b[2][0]a[0][2][0] + b[2][0][0],a[0][2][0] + b[2][0][1],a[0][2][0] + b[2][0][2],],],
]

总结

右对齐，空补一，从左往右依维（递归）运算。
一个 tensor 的某个维度大小为 1 时的计算规则：[1] + [2, 3, 4] = [1 + 2, 1 + 3, 1 + 4]。

《PyTorch 官方文档：BROADCASTING SEMANTICS》

PyTorch 中张量运算广播

TLDR 右对齐，空补一，从左往右依维运算 [m] [x, y] [m x, m y] 正文以如下 a b 两个 tensor 计算为例 a torch.tensor([[1],[2],[3], ]) b torch.tensor([[[1, 2, 3],],[[4, 5, 6],],[[7, 8, 9],], ]) # a.shape (3, 1) # b.shape (3, 1, 3)首先…...

编程日记 2023/10/16 23:44:40

Blender：使用立方体制作动漫头像

好久没水文章排名都掉到1w外了 ~_~ 学习一下blender，看能不能学习一点曲面变形的思路一些快捷键 ctrl 空格：区域最大化，就是全屏 ctrl alt 空格：也是区域最大化 shift b：框选区域然后最大化显示该范围 shift 空…...

编程日记 2023/10/16 23:43:39

【ppt技巧】ppt里的图片如何提取出来？

之前分享过如何将PPT文件导出成图片，今天继续分享PPT技巧，如何提取出PPT文件里面的图片。首先，我们将PPT文件的后缀名，修改为rar，将文件改为压缩包文件然后我们将压缩包文件进行解压最好是以文件夹的形式解压出来…...

编程日记 2023/10/16 23:42:36

Python学习基础笔记七十三——调试程序

为什么要调试？ 我们发现程序运行的结果和我们预期的不符。程序运行的错误，我们通常叫做bug。有两种类型的bug：语句错误和逻辑错误。所谓语句错误，就是执行代码的时候，解释器就可以直接发现的代码错误&#xff0c…...

编程日记 2023/10/16 23:41:35

BOSHIDA DC电源模块关于电容器的电解液位置

BOSHIDA DC电源模块关于电容器的电解液位置 DC电源模块中的电容器扮演着一个非常重要的角色，它们能够对电路提供稳定的电源电压，同时也可以作为电路中的滤波器，去除电路中的噪声和纹波。在DC电源模块中使用的电容器通常是电解型电容器&#…...

编程日记 2023/10/16 23:40:34

如何实现 Es 全文检索、高亮文本略缩处理（封装工具接口极致解耦）

如何实现 Es 全文检索、高亮文本略缩处理前言技术选型JAVA 常用语法说明全文检索开发高亮开发Es Map 转对象使用核心代码 Trans 接口（支持父类属性的复杂映射）Trans 接口可优化的点高亮全局配置类如下真实项目落地效果为什么不用 numOfFragments、fragm…...

编程日记 2023/10/16 23:39:33

C++多线程编程（第四章案例1，C++11和C++17 多核并行计算样例）

目录 4.1手动实现多核base16编码4.1.1 实现base16编码4.1.2无多线程代码4.1.3 C 11多线程代码4.1.4 C 17多线程并发4.1.5 所有测试代码汇总 4.1手动实现多核base16编码 4.1.1 实现base16编码二进制转换为字符串一个字节8位，拆分为两个4位字节（最大值…...

编程日记 2023/10/16 23:38:32

获取远程仓库的信息和远程分支的信息

前记： git svn sourcetree gitee github gitlab gitblit gitbucket gitolite gogs 版本控制 | 仓库管理 ---- 系列工程笔记. Platform：Windows 10 Git version：git version 2.32.0.windows.1 Function：获取远程仓库的信息和远…...

编程日记 2023/10/16 23:37:31

QT学习day1

一、思维导图二、作业：实现登录界面 #include "widget.h" #include<QDebug> #include<QIcon>Widget::Widget(QWidget *parent): QWidget(parent) {/**********************窗口******************///设置窗口图标this->setWindowTitle…...

编程日记 2023/10/16 23:36:30

unity面试八股文 - 框架设计与资源管理

Unity项目框架是如何设计的？有哪些原则在设计Unity项目框架时，通常会遵循一些基本的原则和步骤。以下是主要的一些原则： 模块化：每个功能都应该被作为一个独立的模块来处理，这样可以方便修改和维护。低耦合&#x…...

编程日记 2023/10/16 23:34:29

智能网关IOT 2050采集应用

SIMATIC IOT2050 是西门子公司新推出的应用于企业数字化转型的智能边缘计算和云连接网关。它将云、公司内 IT 和生产连接在一起，专为直接在生产环境中获取、处理和传输数据的工业 IT 解决方案而设计。例如，它可用于将生产过程与基于云的机器和生产数据…...

编程日记 2023/10/16 23:33:28

iOS代码混淆-从入门到放弃

目录 1. 什么是iOS代码混淆？ 2. iOS自动代码混淆的方法是什么？ 3. iOS代码混淆的作用是什么？ 4. 怎么样才能做到更好的iOS代码混淆？ 总结参考资料 1. 什么是iOS代码混淆？ 代码混淆是指将程序中的方法名、属…...

编程日记 2023/10/16 23:32:25

基于Eigen的位姿转换

位姿中姿态的表示形式有很多种，比如：旋转矩阵、四元数、欧拉角、旋转向量等等。这里基于Eigen实现四种数学形式的相互转换功能。本文利用Eigen实现上述四种形式的相互转换。我这里给出一个SE3（4*4）(先平移、再旋转)的构建方法&…...

编程日记 2023/10/16 23:31:24

Jmeter之Bean shell使用详解

一、什么是Bean Shell BeanShell是一种完全符合Java语法规范的脚本语言,并且又拥有自己的一些语法和方法;BeanShell是一种松散类型的脚本语言(这点和JS类似); BeanShell是用Java写成的,一个小型的、免费的、可以下载的、嵌入式的Java源代码解释器,具有对象脚本语言特性,非常精…...

编程日记 2023/10/16 23:30:23

TCP/IP(八)TCP的连接管理(五)四次握手

一 tcp连接断开每一个TCP报文的超时重传都由一个特定的内核参数来控制 ① 四次握手的过程遗留： 谁先发送FIN包,一定是client吗? --> upload和download补充： 主动和被动断开连接的场景 "四次握手过程描述" F --> FIN --> F…...

编程日记 2023/10/16 23:29:22

MyBatis-Plus主键生成策略[MyBatis-Plus系列] - 第491篇

历史文章（文章累计490） 《国内最全的Spring Boot系列之一》《国内最全的Spring Boot系列之二》《国内最全的Spring Boot系列之三》《国内最全的Spring Boot系列之四》《国内最全的Spring Boot系列之五》《国内最全的Spring Boot系列之六》 …...

编程日记 2023/10/16 23:28:21

Spring——和IoC相关的特性

目录 IoC中Bean的生命周期实例化（Instantiation） 属性注入（Populate Properties） 初始化（Initialization） 使用（Bean in Use） 销毁（Destruction） Laz…...

编程日记 2023/10/16 23:27:20

在 TensorFlow 中调试

如果调试是消除软件错误的过程，那么编程一定是添加错误的过程。Edsger Dijkstra。来自 https://www.azquotes.com/quote/561997 一、说明在这篇文章中，我想谈谈 TensorFlow 中的调试。在之前的一些帖子（此处、此处和此处）中&…...

编程日记 2023/10/16 23:26:19

想要精通算法和SQL的成长之路 - 连续的子数组和

想要精通算法和SQL的成长之路 - 连续的子数组和前言一. 连续的子数组和1.1 最原始的前缀和1.2 前缀和哈希表前言想要精通算法和SQL的成长之路 - 系列导航一. 连续的子数组和原题链接 1.1 最原始的前缀和如果这道题目，用前缀和来算，我们的思路…...

编程日记 2023/10/16 23:25:17

【C++】头文件chrono

2023年10月16日，周一晚上当前我只是简单的了解了一下chrono 以后可能会深入了解chrono并更新文章目录功能原理头文件chrono中的一些类头文件chrono中的数据类型一个简单的示例程序小实验：证明a的效率比a高功能这个chrono头文件是用来处理时间的…...

编程日记 2023/10/16 23:24:17

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/12/14 22:33:06

Frozen-Flask ：将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是：将一个 Flask Web 应用生成成纯静态 HTML 文件，从而可以部署到静态网站托管服务上，如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

编程新知 2025/12/5 20:57:13

Qwen3-Embedding-0.6B深度解析：多语言语义检索的轻量级利器

第一章引言：语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进在人工智能领域，文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量，支撑着搜索引擎、推荐系统、…...

编程新知 2025/11/6 8:47:31

C++中string流知识详解和示例

一、概览与类体系 C 提供三种基于内存字符串的流，定义在 <sstream> 中： std::istringstream：输入流，从已有字符串中读取并解析。std::ostringstream：输出流，向内部缓冲区写入内容，最终取…...

编程新知 2025/11/30 11:30:47

Axios请求超时重发机制

Axios 超时重新请求实现方案在 Axios 中实现超时重新请求可以通过以下几种方式： 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

编程新知 2025/10/13 2:26:14

CRMEB 框架中 PHP 上传扩展开发：涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展扩展入口文件文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

编程新知 2025/12/30 22:56:56