当前位置: 首页 > news >正文

torch.scatter看图理解

torch.Tensor.scatter 有 4 个参数:

scatter(dim, index, src, reduce=None)

先忽略 Reduce,最后再解释。先从最简单的开始。我们有一个 (2,4) 形状的张量,里面填充了 1:

粉红色的符号表示张量结构

并且我们传入相应的参数并得到输出:

注意index张量结构

现在我们增加index张量的第二个值,并比较输出:

观察数字 6 在output张量中的移动情况

好的,数字 6 由index张量内的第二个值控制。但是,如何控制呢?

以下是幕后发生的事情。

首先,我们将index形状扩展为与 src 相同的形状:

它实际上不需要扩展。但这将有助于我们理解

如果 index 中有值,则从 src 中提取相应的值。
如果没有值,则不执行任何操作。

这里有 0 和 3,因此提取 5 和 6:

这意味着index的结构必须是 src 的子结构。否则,你将收到错误:

蓝色数字是提取的数字

你可以从官方文档中找到此属性的介绍:

# scatter
self[index[i][j][k]][j][k] = src[i][j][k]  # if dim == 0
self[i][index[i][j][k]][k] = src[i][j][k]  # if dim == 1
self[i][j][index[i][j][k]] = src[i][j][k]  # if dim == 2

请注意, [i][j][k] 用于对 index 和 src 进行切片。

现在,回到原始示例,我们提取了 5 和 6。5 和 6 放在哪里?答案是:0 和 3。

将 5 放到 0,将 6 放到 3

“放入 0” 和 “放入 3” 是什么意思? dim 参数会告诉我们。 在我们的例子中, dim=1 , 表示索引将用于切分张量的列,即上图中的蓝色箭头。

那么行呢? 与 5 和 6 相同:

你可以这样想:

  • 我们从 src 中得到 5 和 6。
  • 5 在 src 中的位置为 (0,0)。6 在 src 中的位置为 (0,1)。
  • dim=1 ,因此将使用 0 和 3 分别替换 (0,0) 和 (0,1) 的“第零”值。
  • 将 5 的 (0,0) 替换为 (0,0)。将 6 的 (0,1) 替换为 (0,3)。
  • 5 在 tensor 中的位置为 (0,0)。6 在 tensor 中的位置为 (0,3)。
  • tensor[0][0] = src[0][0] , tensor[0][3] = src[0][1]

因此,你可以想象为什么当索引为  [[0,0]] 时我们只得到一个 6。该单元格更新了两次,从 1 到 5,从 5 到 6:

tensor[0][0] = src[0][0] , tensor[0][0] = src[0][1]

如果 dim=0 会怎么样?我们来试试。

  • 我们从 src 中得到 5 和 6。
  • 5 在 src 中的位置为 (0,0)。6 在 src 中的位置为 (0,1)。
  • dim=0,因此 0 和 3(来自索引)将分别用于替换 (0,0) 和 (0,1) 的“第零”值。
  • 将 5 的 (0,0) 替换为 (0,0)。将 6 的 (0,1) 替换为 (3,1)。
  • 5 在张量中位于 (0,0)。6 在张量中位于 (3,1)。
  • tensor[0][0] = src[0][0] , tensor[3][1] = src[0][1]
  • tensor[3][1] 出现越界错误。

看下面的图,提取的箭头解释了它是如何工作的。

1、逆向思维

现在逆向思考,我们只有输入和输出,我们如何设置参数才能得到想要的结果?

这是我们的input张量:

我们希望通过调用 scatter 方法获得以下output张量:

如果 dim=0,我们将沿行方向切片:

输出中的两个 6 来自 src,它们是根据索引中的非空值提取的。因此,src 需要至少包含两个 6:

并且index至少应为:

我们不能将 ? 在index中留空,它们必须是一个值。我们现在只有两个选项:0 和 1,因为输入张量只有两行。如果我们将 ? 放入 src 中,则得到:

如果我们放入 0,我们会得到:

在这两种情况下,src 中的 ? 必须为 1,否则我们将无法获得所需的输出。

如果 dim=1,且输入和输出相同,会怎么样?

我们沿着列进行切片,因此index内的值可以从 0 到 3 变化。我们想要将输入的第 1 列和第 3 列更改为 6,因此index和 src 应该是:

看!多么优雅啊!与 dim=0 的情况相比,这是一个更好的选择。我们不需要将 1 填入 src。

通常,选择一种让我们的参数依赖于输出值的方法不是一个好主意,dim=1 不会使用这种情况。

回想一下,index和 src 之间的关系是提取。PyTorch 将根据索引的结构从 src 中提取值。这意味着,src 有多大并不重要,只要 PyTorch 可以从中提取值即可。也就是说,以下选择也有效:

只有当索引太大时才会出现错误。

2、Reduce

终于到了最后一部分,reduce 参数有三个选项:None、add、multiply,如果是 add,赋值就会变成 add and replace,如果是 multiply,赋值就会变成 multiply and replace,很简单很容易理解吧?


原文链接:torch.scatter 深入理解 - BimAnt

相关文章:

torch.scatter看图理解

torch.Tensor.scatter 有 4 个参数: scatter(dim, index, src, reduceNone) 先忽略 Reduce,最后再解释。先从最简单的开始。我们有一个 (2,4) 形状的张量,里面填充了 1: 粉红色的符号表示张量结构 并且我们传入相应的参数并得到…...

适合学生党的蓝牙耳机有哪些?盘点四大性价比蓝牙耳机品牌

对于追求高品质音乐体验而又预算有限的学生党来说,一款性价比高的蓝牙耳机无疑是最佳选择,在众多品牌和型号中,如何挑选到既适合自己需求又价格亲民的蓝牙耳机,确实是一个值得思考的问题,作为一个蓝牙耳机大户&#xf…...

【ORB_SLAM系列3】—— 如何在Ubuntu18.04中使用自己的单目摄像头运行ORB_SLAM3(亲测有效,踩坑记录)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、ORB_SLAM3源码编译二、ORB_SLAM3实时单目相机测试1. 查看摄像头的话题2. 运行测试 三. 运行测试可能的报错1. 报错一(1) 问题描述(2) 原因分析(3) 解决 2. …...

Science Advances|柔性超韧半导体纤维的大规模制备(柔性半导体器件/可穿戴电子/纤维器件/柔性电子)

北京大学 雷霆(Ting Lei)团队,在《Science Advances》上发布了一篇题为“Continuous production of ultratough semiconducting polymer fibers with high electronic performance”的论文。论文内容如下: 一、 摘要 共轭聚合物具有良好的光电特性,但其脆性和机械特性差,…...

VirtualBox虚拟机与bhyve虚拟机冲突问题解决@FreeBSD

问题 在安装完bhyve虚拟系统的主机上启动VirtualBox虚拟机的时候,报错:不能为虚拟电脑 debian 打开一个新任务. VirtualBox cant operate in VMX root mode. Please close all other virtualization programs. (VERR_VMX_IN_VMX_ROOT_MODE). 返回 代码…...

【网络层】ICMP 因特网控制协议

文章目录 ICMP 含义以及作用ICMP协议解析结合ICMP协议和ping常见问题 ICMP 含义以及作用 ICMP:Internet control massage protocol 因特网控制协议 Internet控制报文协议ICMP是网络层的一个重要协议。 ICMP协议用来在网络设备间传递各种差错和控制信息,…...

汇编原理(四)[BX]和loop指令

loop:循环 误区:在编译器里写代码和在debug里写代码是不一样的,此时,对于编译器来说,就需要用到[bx] [bx]: [bx]同样表示一个内存单元,他的偏移地址在bx中,比如下面的指令 move bx, 0 move ax,…...

Linux查看设备信息命令

dmidecode | grep Product Name 查看grub版本号:rpm -qa | grep -i "grub" 客户端操作系统版本: cat /etc/issue cat /etc/redhat-release 处理器品牌及型号: less /proc/cpuinfo |grep model...

transformer的特点

Transformers是一种用于处理序列数据的神经网络架构,最初由Vaswani等人在2017年提出,主要用于自然语言处理任务。与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同,Transformers采用了一种全新…...

27快28了,想转行JAVA或者大数据,还来得及吗?

转行到JAVA或者大数据领域,27岁快28岁的年龄完全来得及。我这里有一套编程入门教程,不仅包含了详细的视频讲解,项目实战。如果你渴望学习编程,不妨点个关注,给个评论222,私信22,我在后台发给你。…...

英飞凌 AURIX TriCore 单片机开发入门

文章目录 目的硬件准备AURIX™ Development StudioInfineon MemtoolAURIX™ iLLD Drivers总结 目的 英飞凌的32位 AURIX™ TriCore™ 系列单片机 经常用于汽车和工业领域。开发该系列单片机比较常用的开发环境有 HighTec 和 AURIX™ Development Studio 。本文将基于后者&…...

Centos安装,window、ubuntus双系统基础上安装Centos安装

文章目录 前言一、准备工作二、开始安装1、2、首先选择DATE&TIME2、选择最小安装3、 选择安装位置 总结 前言 因工作需要,我需要在工控机上额外装Centos7系统,不过我是装在机械硬盘上了不知道对性能是否有影响,若有影响,后面…...

2023年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷6(容器云)

#需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包…...

第13章 常用类

一、包装类 二、String String的常用方法: equals:判断内容是否相等,区分大小写。 String str1 "hello";String str2 "Hello";System.out.println(str1.equals(str2));//false equalsIgnoreCase:判断内容…...

15.数组的方法(改变原数组和不改变原数组)

改变原数组 (1)pop 语法:数组名.pop() 作用:删除数组最后一项 返回值:返回被删除的那一项 var arr=["zhangsna","lisi","wanger","mazi"] var res=arr.pop() console.log(arr) //[zhangsna, lisi, wange…...

随后记: uniapp uview u-dropdown 下拉菜单固定高度滑动不生效

使用u-dropdown 下拉组件 按照uview官网讲解使用 配置根本不生效 scroll-y"true" style"height: 200rpx;" 但是在下拉的时候,不能上下滑动 ,原因是自带的遮罩层挡住了 解决办法:在下拉菜单打开和关闭的时候&#xff0c…...

一文梭哈动态代理

大家好,这里是教授.F 引入: 先看一个生活化的例子,如果一个明星他会唱歌,会跳舞。但是自己太忙了,没时间去宣传自己和去找工作,所以他需要有人帮他代理。然后呢这个代理者也需要知道他会什么,什…...

如何查询Windows 10电脑的IP地址

如何查询Windows 10电脑的IP地址 引言 在Windows 10操作系统中,查询电脑的IP地址是一项基本而重要的任务,无论是为了配置网络、解决连接问题,还是进行远程访问。 基础知识 IP地址:互联网协议地址,用于标识网络中的…...

java: 警告: 源发行版 8 需要目标发行版 8

前言 该文章中项目背景是:IDEA与设置的版本与实际电脑配置的不一致。也就是说只改了这个团队项目的JDK版本,IDEA上其它项目JDK版本未更改。 提示: IDEA警告:javaX:警告:源发行版 需要目标发行版 简略步…...

CCF-CSP认证 2023年12月 2.因子化简

题解&#xff1a; 通过质数筛法&#xff0c;用个板子函数就行了&#xff0c;计算出质数系数就行了 #pragma GCC optimize(2, 3, "Ofast", "inline") #include <bits/stdc.h> #define endl \n using namespace std; long long int num; const int M…...

实战演练:基于快马平台codex构建可一键部署的智能api接口生成器

今天想和大家分享一个特别实用的开发技巧——如何用AI快速生成可用的API接口代码。这个项目我是在InsCode(快马)平台上完成的&#xff0c;整个过程非常顺畅&#xff0c;尤其是最后的一键部署功能&#xff0c;让我省去了很多配置环境的麻烦。 项目背景与需求 最近在做一个内部…...

用STM32F4做个PWM信号发生器:按键调参+OLED显示,示波器实测验证

用STM32F4打造高精度PWM信号发生器&#xff1a;从原理到实战 在电子开发与测试中&#xff0c;PWM信号发生器是不可或缺的工具。专业信号源价格昂贵&#xff0c;而基于STM32F4的开发板却能以极低成本实现类似功能。本文将带你从零构建一个带OLED显示和按键控制的PWM信号发生器&…...

测试文章标题最终版

测试文章内容这是一篇测试文章...

Ostrakon-VL扫描终端部署案例:单卡A10G跑通全任务链(上传→推理→终端输出)

Ostrakon-VL扫描终端部署案例&#xff1a;单卡A10G跑通全任务链&#xff08;上传→推理→终端输出&#xff09; 1. 项目背景与价值 在零售与餐饮行业&#xff0c;每天需要处理大量商品识别、货架巡检等重复性视觉任务。传统方案通常面临两个痛点&#xff1a;一是专业级识别系…...

如何用PlugY实现暗黑破坏神2单机体验增强

如何用PlugY实现暗黑破坏神2单机体验增强 【免费下载链接】PlugY PlugY, The Survival Kit - Plug-in for Diablo II Lord of Destruction 项目地址: https://gitcode.com/gh_mirrors/pl/PlugY 在暗黑破坏神2的单机冒险中&#xff0c;玩家常常面临储物空间不足、角色加点…...

Omni-Vision Sanctuary 集成 MySQL 数据库:自动化图像元数据管理与检索方案

Omni-Vision Sanctuary 集成 MySQL 数据库&#xff1a;自动化图像元数据管理与检索方案 1. 场景痛点与解决方案 数字内容创作领域正面临一个普遍挑战&#xff1a;随着AI生成图像的爆发式增长&#xff0c;如何高效管理海量图片资产成为棘手问题。某电商设计团队负责人曾向我们…...

Wan2.1-UMT5与Python入门:零基础学会用AI生成你的第一个视频

Wan2.1-UMT5与Python入门&#xff1a;零基础学会用AI生成你的第一个视频 你是不是也刷到过那些由AI生成的酷炫短视频&#xff0c;心里痒痒的&#xff0c;觉得这技术真神奇&#xff1f;但一想到要学复杂的编程和模型部署&#xff0c;就觉得头大&#xff0c;感觉离自己很远。 别…...

Youtu-VL-4B-Instruct效果展示:高清OCR+精准Box定位+多轮图文对话作品集

Youtu-VL-4B-Instruct效果展示&#xff1a;高清OCR精准Box定位多轮图文对话作品集 1. 引言&#xff1a;当“看图说话”进化成“看图办事” 你有没有遇到过这种情况&#xff1f;看到一张复杂的图表&#xff0c;想快速提取里面的数据&#xff0c;却要手动一个个去数&#xff1b…...

Qwen2.5-14B-Instruct入门指南:像素剧本圣殿UI组件与剧本结构映射关系解析

Qwen2.5-14B-Instruct入门指南&#xff1a;像素剧本圣殿UI组件与剧本结构映射关系解析 1. 工具概览与核心价值 像素剧本圣殿&#xff08;Pixel Script Temple&#xff09;是一款基于Qwen2.5-14B-Instruct大模型深度优化的专业剧本创作工具。它将AI强大的文本生成能力与独特的…...

Pixel Fashion Atelier新手教程:RPG式交互界面操作全图解

Pixel Fashion Atelier新手教程&#xff1a;RPG式交互界面操作全图解 1. 认识像素时装锻造坊 Pixel Fashion Atelier是一款独特的AI图像生成工具&#xff0c;它将传统的AI绘图技术与复古日系RPG游戏界面完美融合。不同于市面上常见的暗色调AI工具&#xff0c;这款应用采用了明…...