当前位置：首页 > news >正文

【torch.nn.PixelShuffle】和【torch.nn.UnpixelShuffle】

news 2026/2/9 9:54:43

文章目录

torch.nn.PixelShuffle
- 直观解释
- 官方文档
torch.nn.PixelUnshuffle
- 直观解释
- 官方文档

torch.nn.PixelShuffle

直观解释

PixelShuffle是一种上采样方法，它将形状为 $C\times r^2, H, W)$ 的张量重新排列转换为形状为 $H\times r, W\times r)$ 的张量：
在这里插入图片描述

举个例子
输入的张量大小是(1,8,2,3)，PixelShuffle的缩放因子是r=2。

import torch
ps=torch.nn.PixelShuffle(2)
input=torch.arange(0,48).view(1,8,2,3)
print(input)
output=ps(input)
print(output)
print(output.shape)

如下图可以看到，PixelShuffle是把输入通道按照缩放因子r^2进行划分成8/(2^2)=2 组。
也就是输入的第一组（前4个通道）中的元素，每次间隔r=2 交错排列，合并成输出的第一个通道维度。
输入的第二组（后4个通道）中的元素，每次间隔r=2交错排列，合并成输出通道的第二个维度。
输入的大小为(batchsize,in_channel,in_height,in_width)=(1,8,2,3)
输出的大小为(batchsize,out_channel,out_height,out_width)(1,2,4,6)

各个维度的变化规律如下：
batchsize 不变;
out_channel=in_channel/(r^2)
out_height=in_height*r
out_width=in_width*r
在这里插入图片描述

官方文档

CLASS
torch.nn.PixelShuffle(upscale_factor)

功能：把大小为 $(*,C\times r^2,H,W)$ 的张量重新排列为大小为 $(*,C,H\times r,W\times r)$ , 其中 $r$ 是 upscale factor 。

这个操作对于实现步长为 $\frac {1}{r}$ 的efficient sub-pixel convolution有用。
参数
- upscale_factor(int) : 增加空间分辨率的因子
形状
- 输入： $C_{in},H_{in},W_{in})$ ，其中 $*$ 是 0 或者batch大小
- 输出： $C_{out},H_{out},W_{out})$ , 其中
  
  $C_{\text {out }}=C_{\text {in }} \div upscale\_factor ^2 \\ H_{\text {out }}=H_{\text {in }} \times upscale\_factor \\ W_{\text {out }}=W_{\text {in }} \times upscale\_factor$
例子

>>> pixel_shuffle = nn.PixelShuffle(3)
>>> input = torch.randn(1, 9, 4, 4)
>>> output = pixel_shuffle(input)
>>> print(output.size())
torch.Size([1, 1, 12, 12])

torch.nn.PixelUnshuffle

直观解释

PixelUnshuffle就是PixelShuffle的逆操作。

import torch
pus=torch.nn.PixelUnshuffle(2)
input_restore=pus(putput)
print(input_restore)
print(input_restore.shape)
print(input_restore==input) # input_restore和input一样

官方文档

CLASS
torch.nn.PixelUnshuffle(downscale_factor)

功能：是PixelShuffle的逆操作，把大小为 $(*,C,H\times r,W\times r)$ 的张量重组成大小为 $(*,C\times r,H,W)$ 的张量。其中 $r$ 是downscale factor。
参数：
- downscale_factor (int) : 降低空间分辨率的因子。
形状：
- 输入： $C_{in},H_{in},W_{in})$ , 其中 $*$ 是 0 或者batch大小
- 输出： $C_{out},H_{out},W_{out})$ , 其中
  
  $\begin{aligned}& C_{\text {out }}=C_{\text {in }} \times \text { downscale } \_ \text {factor }{ }^2 \\& H_{\text {out }}=H_{\text {in }} \div \text { downscale } \_ \text {factor } \\& W_{\text {out }}=W_{\text {in }} \div \text { downscale } \_ \text {factor }\end{aligned}$
例子

>>> pixel_unshuffle = nn.PixelUnshuffle(3)
>>> input = torch.randn(1, 1, 12, 12)
>>> output = pixel_unshuffle(input)
>>> print(output.size())
torch.Size([1, 9, 4, 4])

【torch.nn.PixelShuffle】和【torch.nn.UnpixelShuffle】

文章目录

torch.nn.PixelShuffle

直观解释

官方文档

torch.nn.PixelUnshuffle

直观解释

官方文档

相关文章：

【torch.nn.PixelShuffle】和【torch.nn.UnpixelShuffle】

Rocky9 KVM网桥的配置

爬虫013_函数的定义_调用_参数_返回值_局部变量_全局变量---python工作笔记032

将.doc文档的默认打开方式从WPS修改为word office打开方式的具体方法（以win 10 操作系统为例）

如何搭建个人的GPT网页服务

[QCM6125][Android13] 默认关闭SELinux权限

【jvm】jvm发展历程

Dubbo3.0 Demo

源码分析——ConcurrentHashMap源码+底层数据结构分析

R语言中的函数25：paste,paste0

（八）穿越多媒体奇境：探索Streamlit的图像、音频与视频魔法

CAD练习——绘制房子平面图

spring 面试题

Springboot项目集成Durid数据源和P6Spy以及dbType not support问题

安卓如何卸载应用

【云原生|Kubernetes】14-DaemonSet资源控制器详解

基于 Guava Retry 在Spring封装一个重试功能

适用HarmonyOS 3.1版本及以上的应用及服务开发工具 DevEco Studio 3.1.1 Release 安装

[信号与系统系列] 正弦振幅调制之差拍信号

vb+SQL航空公司管理系统设计与实现

第19节 Node.js Express 框架

R语言AI模型部署方案：精准离线运行详解

DockerHub与私有镜像仓库在容器化中的应用与管理

Cesium1.95中高性能加载1500个点

ESP32读取DHT11温湿度数据

Qt Http Server模块功能及架构

【git】把本地更改提交远程新分支feature_g

HTML前端开发：JavaScript 常用事件详解

Java 二维码

JVM 内存结构详解