当前位置: 首页 > news >正文

【深度学习】NestedTensors

文章目录

  • NestedTensors
  • Why NestedTensor
  • 初始化 NestedTensor
  • NestedTensor 操作
    • reshape
    • 转置
    • 查看维度
    • 其他

NestedTensors

DETR 中常见的数据格式为 NestedTensors,那么什么是 NestedTensors 呢?
NestedTensor,包括 tensormask 两个成员,tensor 就是输入的图像。mask 跟 tensor 同高宽但是单通道。比如 masks 大小为 (1, 800, 1440),tensor 大小为 (1, 3, 800, 1440)。

Why NestedTensor

当数据是连续的时,通常情况下每个样本都有不同的长度。
例如,在一批句子中,每个句子都有不同数量的单词。处理变化序列的一种常见技术是手动将每个数据张量填充到相同的形状,以形成一个批。
例如,我们有两个不同长度的句子和一个词汇表。为了将其表示为单个张量,我们将 0 填充到批中的最大长度。
简单说就是把图片都 padding 成最大的尺寸,padding 的方式就是补零,那么 batch 中的每一张图都有一个 mask 矩阵,在 img 有值的地方是 1,补零的地方是 0。

举个例子,下面两种构造方式其实是等价的,

padded_sentences = torch.tensor([[1.0, 2.0, 0.0],[3.0, 4.0, 5.0]])
nested_sentences = torch.nested.nested_tensor([torch.tensor([1.0, 2.0]),torch.tensor([3.0, 4.0, 5.0])])

初始化 NestedTensor

我们可以从张量列表中创建 nestedtensor。我们将 nt[i] 表示为nestedtensor的第 i 个张量分量。

nt = torch.nested.nested_tensor([torch.arange(12).reshape(2, 6), torch.arange(18).reshape(3, 6)], dtype=torch.float, device=device)

NestedTensor 操作

reshape

nt_reshaped = nt.reshape(2, -1, 2, 3)

转置

nt_transposed = nt_reshaped.transpose(1, 2)

查看维度

假设 features 为 NestedTensor 格式,直接运行 features[-1]. shape 则会报错 AttributeError: ‘NestedTensor’ object has no attribute ‘Nested_Tensor’,应该使用 features[-1]. tensors. shape

其他

其他操作具有与常规张量相同的语法。

nt_mm = torch.nested.nested_tensor([torch.randn((2, 3, 4)), torch.randn((2, 3, 5))], device=device)
nt3 = torch.matmul(nt_transposed, nt_mm)
print(f"Result of Matmul:\n {nt3}")nt4 = F.dropout(nt3, 0.1)
print(f"Result of Dropout:\n {nt4}")nt5 = F.softmax(nt4, -1)
print(f"Result of Softmax:\n {nt5}")

相关文章:

【深度学习】NestedTensors

文章目录 NestedTensorsWhy NestedTensor初始化 NestedTensorNestedTensor 操作reshape转置查看维度其他 NestedTensors DETR 中常见的数据格式为 NestedTensors,那么什么是 NestedTensors 呢? NestedTensor,包括 tensor 和 mask 两个成员&a…...

【网络】负载均衡

OSI模型每一层的负载均衡 在OSI模型中,每一层的负载均衡具体如下: 1. 第二层(数据链路层):数据链路层的负载均衡通常涉及对MAC地址的操作。在这一层,可以使用虚拟MAC地址技术,外部设备对虚拟MA…...

dataGridView 绑定List 显示内容不刷新

绑定后,原list值变动,显示内容会刷新 绑定后,list新添加的值时不会显示到界面,需要重新绑定list 微软的Bug 参考代码 public class Student{public string Name { get; set; }}List<Student> list new List<Student>();private void Form2_Load(object sender,…...

VR历史建筑漫游介绍|虚拟现实体验店|VR设备购买

VR历史建筑漫游是一种利用虚拟现实技术&#xff0c;让用户可以身临其境地参观和探索历史建筑的体验。通过VR头显和相关设备&#xff0c;用户可以在虚拟环境中自由移动和互动&#xff0c;感受历史建筑的真实氛围和文化内涵。 在VR历史建筑漫游中&#xff0c;您可以选择不同的历史…...

Linux查看硬件型号详细信息

1.查看CPU &#xff08;1&#xff09;使用cat /proc/cpuinfo或lscpu &#xff08;2&#xff09;使用dmidecode -i processor Dmidecode 这款软件允许你在 Linux 系统下获取有关硬件方面的信息。Dmidecode 遵循 SMBIOS/DMI 标准&#xff0c;其输出的信息包括 BIOS、系统、主板、…...

【鸿蒙HarmonyOS开发笔记】通知模块之发布基础类型通知,内含如何将图片变成PixelMap对象

通知简介 应用可以通过通知接口发送通知消息&#xff0c;终端用户可以通过通知栏查看通知内容&#xff0c;也可以点击通知来打开应用。 通知常见的使用场景&#xff1a; 显示接收到的短消息、即时消息等。 显示应用的推送消息&#xff0c;如广告、版本更新等。 显示当前正…...

外包干了1个月,技术明显进步。。。

我是一名大专生&#xff0c;自19年通过校招进入湖南某软件公司以来&#xff0c;便扎根于功能测试岗位&#xff0c;一晃便是近四年的光阴。今年8月&#xff0c;我如梦初醒&#xff0c;意识到长时间待在舒适的环境中&#xff0c;已让我变得不思进取&#xff0c;技术停滞不前。更令…...

鸿蒙开发实战:【Faultloggerd部件】

theme: z-blue 简介 Faultloggerd部件是OpenHarmony中C/C运行时崩溃临时日志的生成及管理模块。面向基于 Rust 开发的部件&#xff0c;Faultloggerd 提供了Rust Panic故障日志生成能力。系统开发者可以在预设的路径下找到故障日志&#xff0c;定位相关问题。 架构 Native In…...

蓝桥杯刷题|03普及-真题

[蓝桥杯 2017 省 B] k 倍区间 题目描述 给定一个长度为 N 的数列&#xff0c;​,,⋯&#xff0c;如果其中一段连续的子序列 ​,,⋯ (i≤j) 之和是 K 的倍数&#xff0c;我们就称这个区间 [i,j] 是 K 倍区间。 你能求出数列中总共有多少个 K 倍区间吗&#xff1f; 输入格式 …...

【动态三维重建】Deformable 3D Gaussians 可变形3D GS用于单目动态场景重建(CVPR 2024)

主页&#xff1a;https://ingra14m.github.io/Deformable-Gaussians/ 代码&#xff1a;https://github.com/ingra14m/Deformable-3D-Gaussians 论文&#xff1a;https://arxiv.org/abs/2309.13101 文章目录 摘要一、前言二、相关工作2.1 动态场景的神经渲染2.2 神经渲染加速 三…...

智能驾驶域控制器行业介绍

汽车智能驾驶功能持续高速渗透&#xff0c;带来智能驾驶域控制器市场空间快速增 长。智驾域控制器是智能驾驶决策环节的重要零部件&#xff0c;主要功能为处理感知 信息、进行规划决策等。其核心部件主要为计算芯片&#xff0c;英伟达、地平线等芯 片厂商市场地位突出。随着消费…...

[数据集][目标检测]焊接件表面缺陷检测数据集VOC+YOLO格式2292张10类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;2292 标注数量(xml文件个数)&#xff1a;2292 标注数量(txt文件个数)&#xff1a;2292 标注…...

微信小程序的页面制作---常用组件及其属性

微信小程序里的组件就是html里的标签&#xff0c;但其组件都自带UI风格和特定的功能效果 一、常用组件 view&#xff08;视图容器&#xff09;、text&#xff08;文本&#xff09;、button&#xff08;按钮&#xff09;、image&#xff08;图片&#xff09;、form&#xff08…...

什么样的网站不适合使用WordPress?

WordPress作为全球应用最广泛的CMS系统&#xff0c;很好很强大&#xff0c;被从多的网站使用。但是&#xff0c;也不是所有的网站。下面简站WP小编从自己多年WordPress建站经验的角度&#xff0c;给大家讲讲&#xff0c;有哪些网站不适合使用WordPress搭建。 1、功能特别多的功…...

vulhub中GitLab 任意文件读取漏洞复现(CVE-2016-9086)

GitLab是一款Ruby开发的Git项目管理平台。在8.9版本后添加的“导出、导入项目”功能&#xff0c;因为没有处理好压缩包中的软连接&#xff0c;已登录用户可以利用这个功能读取服务器上的任意文件。 环境运行后&#xff0c;访问http://your-ip:8080即可查看GitLab主页&#xff0…...

【爬虫】web自动化和接口自动化

专栏文章索引&#xff1a;爬虫 目录 一、介绍 二、推荐 1.接口自动化 2.Web自动化 一、介绍 爬虫技术一般可以分为两种类型&#xff1a;接口自动化和web自动化。下面是它们的简要介绍&#xff1a; 1.接口自动化 接口自动化技术的主要目的是通过模拟HTTP请求来实现自动化…...

哔哩哔哩后端Java一面

前言 作者&#xff1a;晓宜 个人简介&#xff1a;互联网大厂Java准入职&#xff0c;阿里云专家博主&#xff0c;csdn后端优质创作者&#xff0c;算法爱好者 最近各大公司的春招和实习招聘都开始了&#xff0c;这里分享下去年面试B站的的一些问题&#xff0c;希望对大家有所帮助…...

Vue.js前端开发零基础教学(二)

目录 前言 2.1 单文件组件 2.2 数据绑定 2.2.2 响应式数据绑定 2.3 指令 2.3.1 内容渲染指令 2.3.2 属性绑定指令 ​编辑 2.3.3 事件绑定指令 2.3.4 双向数据绑定指令 2.3.5 条件渲染指令 2.3.6 列表渲染指令 2.4 事件对象 2.5 事件修饰符 学习目标&am…...

Bert模型输出:last_hidden_state转换为pooler_output

1. BERT模型的输出 在BERT模型中&#xff0c;last_hidden_state和pooler_output是两个不同的输出。 (1) last_hidden_state: last_hidden_state是指BERT模型中最后一个隐藏层的隐藏状态。它是一个三维张量&#xff0c;其形状为[batch_size, sequence_length, hidden_size]。其…...

Docker Compose 基本语法

services 是顶级节点&#xff0c;也就是你要启动的服务全部放在这里。 MySOL就是我们预期中的一个服务。 mysql8:指的是我们这个服务叫 mysql8. image:我们这个服务里运行的是什么镜像&#xff0c;或者说跑的是什么。这里指定了使用 mysql:8.0.29 这个版本。 command:启动命令&…...

青岛做人流术前有什么注意事项

在进行人流手术前&#xff0c;为了确保手术的安全性和有效性&#xff0c;有一些重要的注意事项需要您了解和遵守。以下是一些关键的术前准备事项&#xff0c;帮助您更好地为手术做好准备。1. 选择正规医院选择一家具备合法资质的正规妇产医院至关重要。青岛新阳光妇产医院是经青…...

洛谷 P1381 单词背诵

题目描述灵梦有 n 个单词想要背&#xff0c;但她想通过一篇文章中的一段来记住这些单词。文章由 m 个单词构成&#xff0c;她想在文章中找出连续的一段&#xff0c;其中包含最多的她想要背的单词&#xff08;重复的只算一个&#xff09;。并且在背诵的单词量尽量多的情况下&…...

RDMA不只是‘快’:深入聊聊它在Spark、MySQL等真实业务场景下的性能陷阱与优化实践

RDMA不只是‘快’&#xff1a;深入聊聊它在Spark、MySQL等真实业务场景下的性能陷阱与优化实践 当技术团队第一次接触RDMA&#xff08;远程直接内存访问&#xff09;时&#xff0c;往往会被其宣传的"零拷贝"、"低延迟"特性所吸引。然而在实际部署到Spark S…...

别再一上来就关SELinux了!搞懂Permissive、Enforcing、Disabled三种模式,让你的Linux服务器更安全

别再一上来就关SELinux了&#xff01;搞懂Permissive、Enforcing、Disabled三种模式&#xff0c;让你的Linux服务器更安全 第一次在服务器上部署Web应用时&#xff0c;我遇到了一个诡异的权限问题&#xff1a;Nginx明明以root身份运行&#xff0c;却无法读取我新上传的静态文件…...

Qwen3-ASR-0.6B效果展示:粤语普通话混合语音识别能力边界测试报告

Qwen3-ASR-0.6B效果展示&#xff1a;粤语普通话混合语音识别能力边界测试报告 1. 引言&#xff1a;为什么这次测试不一样&#xff1f; 市面上大多数轻量级语音识别工具&#xff0c;标称支持“中文识别”&#xff0c;实际只认普通话&#xff1b;标榜“中英文混合”&#xff0c…...

Mind+学习和项目栈1

提示&#xff1a;本内容仅供自己学习使用&#xff0c;以免长时间后&#xff0c;记忆检索困难&#xff0c;特此简单梳理操作思路和具体案例。安装包啥的官网就有&#xff0c;Mind官网 - 一站式满足程序设计、模型训练、界面设计。 0.认识工具了解功能&#xff1a;我觉得没有项目…...

AI建站工具选型指南:企业级用户的五大核心标准与对比

AI建站工具选型指南&#xff1a;企业级用户的五大核心标准与对比面对市场上五花八门的建站工具&#xff0c;企业采购团队往往陷入选择困难。有的号称AI驱动&#xff0c;实际只能改改文案&#xff1b;有的强调零代码&#xff0c;但复杂的后台逻辑仍需IT介入。要避开这些坑&#…...

g4f提供的模型调用:python JavaScript和curl

g4f提供模型的使用&#xff0c;例子页面&#xff1a;G4F - Providers and Models 可以这样&#xff1a; python from g4f.client import Clientclient Client() response client.chat.completions.create(model"",messages[{"role": "user"…...

8G显存就能跑的视频抠图工具,发丝级精度,免费开源 | MatAnyone2 完整安装使用教程

做视频剪辑的朋友应该都碰到过这个问题——想换背景&#xff0c;但没有绿幕&#xff0c;手动逐帧抠图累死人&#xff0c;用软件自动抠效果又一言难尽&#xff0c;头发边缘一塌糊涂。 直到 MatAnyone2 出现&#xff0c;这个问题算是有了一个比较靠谱的答案。 一、MatAnyone2 是…...

安装宝塔面板提示权限不足_使用root用户进行规范安装

...