当前位置: 首页 > article >正文

别再傻傻分不清了!PyTorch中矩阵的⊕、⊙、⊗操作符与*、@、torch.mul()的保姆级对照指南

PyTorch矩阵操作符完全指南从数学符号到代码实现刚接触深度学习时最让人头疼的莫过于论文中那些神秘的数学符号和实际代码之间的对应关系。⊕、⊙、⊗这些看似简单的符号在PyTorch中到底该用、*还是为什么有时候*能得到预期结果有时候却会报错本文将彻底解析这些符号在PyTorch中的实现方式帮助你在阅读论文和编写代码时不再困惑。1. 数学符号与PyTorch操作符对照表在深入探讨之前我们先建立一个清晰的对应关系表数学符号数学含义PyTorch操作符等价函数调用广播支持⊕逐元素加法torch.add()是⊙逐元素乘法*torch.mul()是⊗矩阵乘法torch.matmul()部分注意PyTorch中的*操作符执行的是逐元素乘法(⊙)而不是矩阵乘法(⊗)这是新手最常见的误区之一。2. 逐元素操作⊕和⊙的实现2.1 逐元素加法(⊕)逐元素加法要求两个张量形状相同或者满足广播规则。PyTorch提供了多种实现方式import torch # 创建两个相同形状的矩阵 A torch.tensor([[1, 2], [3, 4]]) B torch.tensor([[5, 6], [7, 8]]) # 三种等价实现方式 result1 A B # 使用运算符 result2 torch.add(A, B) # 使用add函数 result3 A.add(B) # 使用张量的add方法当形状不同但满足广播条件时PyTorch会自动扩展较小的张量# 矩阵与标量相加 C torch.tensor([[1, 2], [3, 4]]) scalar 10 print(C scalar) # 输出: tensor([[11, 12], [13, 14]]) # 矩阵与向量相加 D torch.tensor([[1, 2], [3, 4]]) vector torch.tensor([10, 20]) print(D vector) # 输出: tensor([[11, 22], [13, 24]])2.2 逐元素乘法(⊙)与加法类似逐元素乘法也有多种实现方式# 三种等价实现方式 result1 A * B # 使用*运算符 result2 torch.mul(A, B) # 使用mul函数 result3 A.mul(B) # 使用张量的mul方法广播机制同样适用# 矩阵与标量相乘 print(A * 2) # 输出: tensor([[2, 4], [6, 8]]) # 矩阵与向量相乘 vector torch.tensor([2, 3]) print(A * vector) # 输出: tensor([[2, 6], [6, 12]])3. 矩阵乘法(⊗)的多种实现矩阵乘法是线性代数中的核心操作PyTorch提供了丰富的实现方式3.1 基本矩阵乘法# 创建两个矩阵 E torch.tensor([[1, 2], [3, 4]]) F torch.tensor([[5, 6], [7, 8]]) # 四种等价实现方式 result1 E F # 使用运算符(Python 3.5) result2 torch.matmul(E, F) result3 torch.mm(E, F) # 专门用于2D矩阵 result4 E.mm(F) # 张量方法版本重要区别torch.mm()仅支持2D矩阵而torch.matmul()支持更高维度的张量并实现了广播。3.2 高维张量的矩阵乘法当处理批量矩阵乘法时如在神经网络中处理一批输入matmul会自动应用广播# 批量矩阵乘法示例 batch1 torch.randn(10, 3, 4) # 10个3x4矩阵 batch2 torch.randn(10, 4, 5) # 10个4x5矩阵 result torch.matmul(batch1, batch2) # 结果为10个3x5矩阵3.3 向量与矩阵的乘法PyTorch会自动处理向量和矩阵的乘法无需显式转置matrix torch.tensor([[1, 2], [3, 4]]) vector torch.tensor([5, 6]) # 矩阵乘以向量 print(matrix vector) # 输出: tensor([17, 39]) # 向量乘以矩阵 print(vector matrix) # 输出: tensor([23, 34])4. 广播机制详解广播是PyTorch中强大的特性它允许不同形状的张量进行运算。理解广播规则对正确使用⊕、⊙操作至关重要。4.1 广播规则从最后一个维度开始向前比较维度大小相等或其中一个为1时可以进行广播缺失的维度被视为1# 广播示例1 A torch.ones(3, 1, 4) B torch.ones(2, 1) print((A B).shape) # 输出: torch.Size([3, 2, 4]) # 广播示例2 C torch.ones(5, 3, 4, 1) D torch.ones(3, 1, 2) print((C * D).shape) # 输出: torch.Size([5, 3, 4, 2])4.2 常见广播错误# 不兼容的形状 try: A torch.ones(3, 4) B torch.ones(2, 4) print(A B) except RuntimeError as e: print(f错误: {e}) # 输出: 错误: The size of tensor a (3) must match...5. 实际应用场景与性能考量5.1 计算机视觉中的典型应用在计算机视觉中这些操作符无处不在# 特征图相加(⊕) feature_map1 torch.randn(1, 64, 256, 256) feature_map2 torch.randn(1, 64, 256, 256) combined_features feature_map1 feature_map2 # 注意力权重应用(⊙) attention_weights torch.rand(1, 1, 256, 256) weighted_features feature_map1 * attention_weights # 全连接层计算(⊗) weight_matrix torch.randn(512, 1024) input_features torch.randn(32, 1024) # 批量大小32 output input_features weight_matrix.T5.2 性能优化技巧对于大型矩阵乘法使用torch.matmul而不是多个torch.mm就地操作可以节省内存A.add_(B) # 就地加法比A A B更高效使用torch.einsum表达复杂张量操作# 使用einsum实现批量矩阵乘法 result torch.einsum(bij,bjk-bik, batch1, batch2)6. 常见陷阱与调试技巧6.1 形状不匹配问题# 错误的矩阵乘法 A torch.randn(3, 4) B torch.randn(5, 6) try: C A B except RuntimeError as e: print(f矩阵乘法错误: {e})6.2 自动广播导致的意外结果# 意外的广播行为 A torch.tensor([[1, 2, 3]]) B torch.tensor([[1], [2], [3]]) print(A * B) # 输出3x3矩阵而不是预期的错误6.3 类型不匹配问题# 类型不匹配 A torch.tensor([1, 2, 3], dtypetorch.float32) B torch.tensor([1, 2, 3], dtypetorch.int64) try: print(A B) except RuntimeError as e: print(f类型错误: {e})调试技巧使用.shape检查张量形状使用.dtype检查数据类型对于复杂表达式分步计算并检查中间结果7. 进阶话题自定义操作符行为PyTorch允许通过重载魔术方法来定义自定义张量操作class CustomTensor(torch.Tensor): staticmethod def __add__(self, other): print(自定义加法操作) return super().__add__(other) staticmethod def __matmul__(self, other): print(自定义矩阵乘法) return super().__matmul__(other) A CustomTensor([1, 2, 3]) B CustomTensor([4, 5, 6]) _ A B # 会打印自定义加法操作 _ A B # 会打印自定义矩阵乘法

相关文章:

别再傻傻分不清了!PyTorch中矩阵的⊕、⊙、⊗操作符与*、@、torch.mul()的保姆级对照指南

PyTorch矩阵操作符完全指南:从数学符号到代码实现 刚接触深度学习时,最让人头疼的莫过于论文中那些神秘的数学符号和实际代码之间的对应关系。⊕、⊙、⊗这些看似简单的符号,在PyTorch中到底该用、*还是?为什么有时候*能得到预期结…...

Steam Web API实战:除了查库存,你还能用Python脚本自动追踪好友的游戏成就与时长

Steam Web API实战:用Python构建游戏数据分析系统 Steam平台不仅是全球最大的数字游戏发行平台,更是一个隐藏着海量玩家行为数据的宝库。作为一名资深游戏开发者兼数据分析师,我发现许多技术爱好者仅仅将Steam Web API用于查询好友在线状态这…...

Mac上Python调用Wind量化接口的完整避坑指南

1. Mac上Wind量化接口的特殊性 第一次在Mac上配置Wind量化接口时,我踩了不少坑。和Windows不同,Mac上的Wind生态简直像两个平行世界。Windows用户点几下鼠标就能搞定的事情,在Mac上可能要折腾大半天。最让人崩溃的是,Mac版的Wind…...

为什么顶尖AI实验室连夜调整研发优先级?SITS2026强制要求的4项新评估框架正在重写游戏规则

第一章:SITS2026发布:AGI发展路线图 2026奇点智能技术大会(https://ml-summit.org) 核心目标与战略定位 SITS2026正式确立了“三阶段、五支柱、一验证”的AGI演进框架,聚焦从当前LLM增强系统向具备自主目标建模、跨域因果推理与持续自我重构…...

工程师的桌面瘦身计划:如何为Solidworks 2021 SP5定制最小化安装(仅12G vs 22G全功能)

SolidWorks 2021 SP5精简安装指南:12GB极致瘦身方案 当你的SSD只剩下最后20GB空间,而SolidWorks完整安装需要吃掉22GB时,每个GB都变得弥足珍贵。作为从业十年的机械设计师,我经历过太多因为磁盘空间不足导致的软件崩溃——直到发现…...

别再硬编码了!用FlexSim模拟电商仓库‘多品小单’拣货的柔性配置指南

电商仓库多品小单拣货的FlexSim柔性仿真实战指南 电商仓储的核心痛点之一,就是应对"多品种、小批量"订单的拣选效率问题。传统仓库规划往往依赖经验估算和静态方案,难以适应大促期间订单结构的剧烈波动。本文将带你用FlexSim构建一个可动态调…...

Day03:Function Calling 核心

文章目录一、Function Calling 核心概念与定义1.1 技术本质与原理1.2 与传统 AI 推理的区别1.3 主要技术实现框架二、Function Calling 的核心价值与解决的问题2.1 解决知识截止问题2.2 解决实时数据获取需求2.3 解决外部动作执行问题2.4 安全性与可控性设计三、Function Calli…...

UnSHc深度解析:揭秘SHc加密脚本逆向工程核心技术

UnSHc深度解析:揭秘SHc加密脚本逆向工程核心技术 【免费下载链接】UnSHc UnSHc - How to decrypt SHc *.sh.x encrypted file ? 项目地址: https://gitcode.com/gh_mirrors/un/UnSHc 在Linux系统管理和安全审计领域,Shell脚本的保护与解密始终是…...

如何用Bulk Crap Uninstaller彻底清理Windows软件:免费高效的批量卸载工具指南

如何用Bulk Crap Uninstaller彻底清理Windows软件:免费高效的批量卸载工具指南 【免费下载链接】Bulk-Crap-Uninstaller Remove large amounts of unwanted applications quickly. 项目地址: https://gitcode.com/gh_mirrors/bu/Bulk-Crap-Uninstaller Bulk …...

终极完整指南:5分钟快速部署《Degrees of Lewdity》中文版

终极完整指南:5分钟快速部署《Degrees of Lewdity》中文版 【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本 项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chinese-Localization …...

vue基于springboot成人自考本科远程教育网站设计与实现

目录同行可拿货,招校园代理 ,本人源头供货商功能模块分析考试与评估功能后台管理功能技术实现要点扩展功能建议项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 ,本人源头供货商 功能模块分析 用户模块 …...

ncmdump终极指南:3步轻松解密网易云音乐NCM格式,实现跨平台播放自由

ncmdump终极指南:3步轻松解密网易云音乐NCM格式,实现跨平台播放自由 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM格式文件无法在其他播放器使用而烦恼吗?ncmdump是一…...

ssm社区物业信息管理系统小程序(文档+源码)_kaic

系统实现登录模块的实现系统的登录窗口是用户的入口,用户只有在登录成功后才可以进入访问。通过在登录提交表单,后台处理判断是否为合法用户,进行页面跳转,进入系统中去。登录合法性判断过程:用户输入账号和密码后&…...

BGP选路深度解析:当Next Hop遇上IGP开销,如何避免网络中的“不对称路由”?

BGP选路深度解析:当Next Hop遇上IGP开销,如何避免网络中的“不对称路由”? 在复杂的多自治系统(AS)网络环境中,BGP路由选择往往被视为网络工程师手中的瑞士军刀。但鲜为人知的是,这把"军刀…...

别再死记硬背了!用立创EDA+Excel,手把手教你搭建个人电子元器件库(附避坑清单)

电子工程师的元器件管理革命:从零散笔记到智能数据库 在电子设计领域,元器件管理一直是个令人头疼的问题。打开任何一位硬件工程师的电脑,你可能会发现数十个命名混乱的Excel表格、散落在各处的PDF规格书,以及一堆随手记录的纸质笔…...

Obsidian页面美化全攻略:自定义行间距与页面宽度,打造舒适阅读体验

Obsidian视觉调优实战:从行间距到页面宽度的沉浸式写作体验设计 在数字笔记工具百花齐放的今天,Obsidian凭借其本地优先、双向链接和高度可定制的特性,已经成为知识工作者的首选工具之一。但默认的界面设计往往难以满足长时间写作和阅读的需求…...

从TM1到TM9:手把手教你用Wireshark和商用路测软件分析LTE空口传输模式切换

LTE传输模式深度解析:从TM1到TM9的技术演进与实战应用 引言 在移动通信领域,LTE传输模式(TM)的灵活切换是提升网络性能的关键技术之一。作为网络优化工程师,深入理解不同传输模式的特点及适用场景,能够帮助我们更精准地诊断网络问…...

职业深度解析:Data Alignment Specialist——确保多源数据语义一致性的协调者

一、职业定位(What & Why)1. 一句话定义与通俗类比专业定义:数据对齐专家负责确保来自不同来源、具备不同格式及标注标准的数据在语义、结构及时间维度上保持严格一致,从而避免模型训练过程中因数据冲突而产生学习偏差。类比解…...

职业深度解析:Synthetic Data Engineer——使AI具备“无中生有”学习能力的合成数据构建者

一、职业定位(What & Why)1. 一句话定义与通俗类比专业定义:合成数据工程师通过算法与生成模型构造人工数据,以模拟真实世界的数据分布特征。该类合成数据用于训练、测试或增强AI模型,旨在解决真实数据稀缺、涉及隐…...

职业深度解析:AI/ML Engineer——从模型设计到生产落地

摘要:本文对AI/ML工程师岗位进行系统性解构,涵盖职业定位、工作内容拆解、硬性与软性能力要求、知识体系构建、典型工作场景、就业市场现状、薪酬结构、职业发展路径、适配人群画像、进入门槛路径及常见认知误区。适合机器学习从业者、转行意向者及技术管…...

明日方舟游戏资源库:从数据解包到创意实现的完整技术指南

明日方舟游戏资源库:从数据解包到创意实现的完整技术指南 【免费下载链接】ArknightsGameResource 明日方舟客户端素材 项目地址: https://gitcode.com/gh_mirrors/ar/ArknightsGameResource 在数字内容创作领域,获取高质量游戏素材往往面临版权、…...

BilibiliDown:三步完成B站视频批量下载的完整方案

BilibiliDown:三步完成B站视频批量下载的完整方案 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/Bi…...

基于目标级联分析法的多微网主动配电系统自治优化经济调度算法实践:初级拉格朗日算法应用

GAMS代码:基于目标级联分析法的多微网主动配电系统自治优化经济调度 该代码并非完全复现该文献,而是参照文献 《基于目标级联分析法的多微网主动配电系统自治优化经济调度》 的目标级联分析法(ATC)的算法部分,采用初…...

告别ESP32环境配置噩梦:用Python虚拟环境一劳永逸管理ESP-IDF依赖

ESP32开发者的Python虚拟环境实战指南:彻底解决依赖冲突难题 每次打开ESP-IDF项目时,那些烦人的Python依赖报错是不是让你血压飙升?不同项目间的包版本冲突是否让你在pip install和pip uninstall之间反复横跳?作为一名长期奋战在E…...

别再凭感觉了!用Excel快速搞定外观检验员一致性(Kappa)分析,附免费模板

用Excel实现外观检验一致性分析的实战指南 在制造业的质量控制环节,外观检验的一致性直接影响产品合格率与客户满意度。传统手工计算Kappa值不仅耗时费力,还容易出错。本文将手把手教你如何用Excel搭建自动化分析模板,让质量工程师在10分钟内…...

2026奇点大会闭门报告首曝:AGI训练芯片能效比突破128TOPS/W,但83%的FPGA工程师尚未适配新指令集

第一章:2026奇点智能技术大会:AGI与硬件设计 2026奇点智能技术大会(https://ml-summit.org) AGI架构对芯片微架构的倒逼演进 本届大会首次披露了基于全栈可微分计算范式的AGI参考模型——Singularity-7B,其训练阶段要求硬件具备动态稀疏张量…...

AGI已越过“图灵阈值”?SITS2026圆桌闭门实录:92%专家确认AGI实用化落地在2026–2028年,你缺的不是算力,是认知操作系统

第一章:SITS2026圆桌:AGI与人类未来 2026奇点智能技术大会(https://ml-summit.org) 圆桌共识的核心命题 在SITS2026主会场“AGI与人类未来”圆桌中,来自OpenAI、DeepMind、中科院自动化所及欧盟AI伦理委员会的七位代表达成三项基础共识&…...

别再让NFPP背锅了!结合DHCP Snooping和DAI构建企业网防ARP欺骗完整方案

企业网络防ARP欺骗实战:DHCP Snooping与DAI的黄金组合 当企业网络规模扩大到数千用户时,ARP欺骗攻击就像潜伏在暗处的定时炸弹。许多管理员误以为开启NFPP(网络基础保护策略)就能高枕无忧,殊不知这仅仅是保护设备CPU的…...

Rust的#[repr(transparent)]包装

Rust语言中的#[repr(transparent)]属性是一个强大而低调的工具,它允许开发者在不牺牲性能的前提下,为类型系统增加更强的语义表达。对于追求零成本抽象的Rust程序员来说,这个属性是构建安全且高效代码的关键之一。本文将深入探讨它的核心原理…...

从薛定谔方程到Kohn-Sham方程:DFT核心原理与应用场景解析

1. 量子力学的起点:薛定谔方程与电子结构难题 要理解密度泛函理论(DFT)为何能成为计算材料科学的基石,我们需要回到量子力学的源头——薛定谔方程。这个1926年提出的方程描述了微观粒子的行为规律,其标准形式看起来异常…...