当前位置：首页 > news >正文

PyTorch Tensor 形状变化操作详解

news 2026/2/10 21:27:29

PyTorch Tensor 形状变化操作详解

在深度学习中，Tensor 的形状变换是非常常见的操作。PyTorch 提供了丰富的 API 来帮助我们调整 Tensor 的形状，以满足模型输入、计算或数据处理的需求。本文将详细介绍 PyTorch 中常见的 Tensor 形状变换操作，并通过示例代码进行说明。

1. 基础形状操作

1.1 `view` 和 `reshape`

功能：改变 Tensor 的形状而不改变其数据。
区别：
- view 要求新形状的总元素数与原形状一致，否则会报错。
- reshape 更灵活，如果无法直接改变形状，会尝试创建一个新的 Tensor。
示例：

tensor = torch.randn(2, 3, 4)  # 原形状为 (2, 3, 4)
reshaped_tensor = tensor.view(2, 12)  # 改变形状为 (2, 12)
print(reshaped_tensor.shape)  # 输出: torch.Size([2, 12])

1.2 `squeeze` 和 `unsqueeze`

功能：
- squeeze：移除大小为 1 的维度。
- unsqueeze：在指定位置插入大小为 1 的维度。
示例：

tensor = torch.randn(1, 3, 1, 4)  # 原形状为 (1, 3, 1, 4)
squeezed_tensor = tensor.squeeze()  # 移除所有大小为 1 的维度
print(squeezed_tensor.shape)  # 输出: torch.Size([3, 4])unsqueezed_tensor = squeezed_tensor.unsqueeze(0)  # 在第 0 维插入大小为 1 的维度
print(unsqueezed_tensor.shape)  # 输出: torch.Size([1, 3, 4])

2. 高级形状操作

2.1 `permute`

功能：重新排列 Tensor 的维度顺序。
示例：

tensor = torch.randn(2, 3, 4)  # 原形状为 (2, 3, 4)
permuted_tensor = tensor.permute(2, 0, 1)  # 调整为 (4, 2, 3)
print(permuted_tensor.shape)  # 输出: torch.Size([4, 2, 3])

2.2 `transpose`

功能：交换指定的两个维度。
示例：

tensor = torch.randn(3, 4)  # 原形状为 (3, 4)
transposed_tensor = tensor.transpose(0, 1)  # 交换第 0 和第 1 维度
print(transposed_tensor.shape)  # 输出: torch.Size([4, 3])

2.3 `flatten`

功能：将指定范围内的维度展平为一维。
示例：

tensor = torch.randn(2, 3, 4)  # 原形状为 (2, 3, 4)
flattened_tensor = tensor.flatten(start_dim=1)  # 展平从第 1 维开始
print(flattened_tensor.shape)  # 输出: torch.Size([2, 12])

2.4 `repeat`

功能：沿指定维度重复 Tensor。
示例：

tensor = torch.tensor([[1, 2], [3, 4]])  # 原形状为 (2, 2)
repeated_tensor = tensor.repeat(2, 3)  # 在第 0 维重复 2 次，在第 1 维重复 3 次
print(repeated_tensor.shape)  # 输出: torch.Size([4, 6])

2.5 `expand`

功能：在不复制数据的情况下扩展 Tensor 的形状（仅适用于大小为 1 的维度）。
示例：

tensor = torch.tensor([[1], [2], [3]])  # 原形状为 (3, 1)
expanded_tensor = tensor.expand(3, 4)  # 扩展为 (3, 4)
print(expanded_tensor)
# 输出:
# tensor([[1, 1, 1, 1],
#         [2, 2, 2, 2],
#         [3, 3, 3, 3]])

3. 数据提取与分散

3.1 `narrow`

功能：按指定维度和范围提取部分 Tensor。
示例：

tensor = torch.arange(10)  # 原形状为 (10,)
narrowed_tensor = tensor.narrow(0, 2, 4)  # 从第 0 维索引 2 开始提取长度为 4 的部分
print(narrowed_tensor)  # 输出: tensor([2, 3, 4, 5])

3.2 `gather`

功能：根据索引从指定维度收集元素。
示例：

tensor = torch.tensor([[1, 2], [3, 4]])  # 原形状为 (2, 2)
indices = torch.tensor([[0, 1], [1, 0]])  # 索引矩阵
gathered_tensor = torch.gather(tensor, 1, indices)  # 按列索引收集
print(gathered_tensor)
# 输出:
# tensor([[1, 2],
#         [4, 3]])

3.3 `scatter`

功能：根据索引将值分散到目标 Tensor 中。
示例：

tensor = torch.zeros(2, 3)  # 目标 Tensor，初始为零
indices = torch.tensor([[0, 1, 2], [2, 0, 1]])  # 索引矩阵
values = torch.tensor([[5, 6, 7], [8, 9, 10]])  # 值矩阵
scattered_tensor = tensor.scatter(1, indices, values)  # 按列分散赋值
print(scattered_tensor)
# 输出:
# tensor([[5., 6., 7.],
#         [0., 9., 8.]])

4. 对角操作

4.1 `diag`

功能：提取对角线元素或将一维 Tensor 转换为对角矩阵。
示例：

tensor = torch.tensor([1, 2, 3])  # 一维 Tensor
diag_tensor = torch.diag(tensor)  # 创建对角矩阵
print(diag_tensor)
# 输出:
# tensor([[1, 0, 0],
#         [0, 2, 0],
#         [0, 0, 3]])

PyTorch Tensor 形状变化操作详解

PyTorch Tensor 形状变化操作详解在深度学习中，Tensor 的形状变换是非常常见的操作。PyTorch 提供了丰富的 API 来帮助我们调整 Tensor 的形状，以满足模型输入、计算或数据处理的需求。本文将详细介绍 PyTorch 中常见的 Tensor 形状变换操作&#xff0…...

编程日记 2025/2/22 1:06:39

文字识别软件cnocr学习笔记

• 安装 pip install cnocr • 基础的使用方法首次运行会下载安装模型，如果没有梯子，会报错： 在网络上查找cnocr的模型资源，并下载到本地。https://download.csdn.net/download/qq_33464428/89514689?ops_request_misc%257B%2…...

编程日记 2025/2/22 1:05:38

本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】

本地部署DeepSeek R1 界面可视化open-webui 本文主要讲述如何用ollama镜像和open-webui镜像部署DeepSeek R1， 镜像比较方便我们在各个机器之间快速部署。显卡推荐模型版本CPU内存GPU显卡推荐1.5B4核8GB非必需4GBRTX1650、RTX20607B、8B8核16GB8GBRTX3070、RTX…...

编程日记 2025/2/22 1:02:34

macOS部署DeepSeek-r1

好奇，跟着网友们的操作试了一下网上方案很多，主要参考的是这篇 DeepSeek 接入 PyCharm，轻松助力编程_pycharm deepseek-CSDN博客方案是：PyCharm CodeGPT插件 DeepSeek-r1:1.5b 假设已经安装好了PyCharm PyCharm: the Pyth…...

编程日记 2025/2/22 1:01:33

基于STM32与BD623x的电机控制实战——从零搭建无人机/机器人驱动系统

系列文章目录 1.元件基础 2.电路设计 3.PCB设计 4.元件焊接 5.板子调试 6.程序设计 7.算法学习 8.编写exe 9.检测标准 10.项目举例 11.职业规划文章目录一、为什么选择这两个芯片？1.1 STM32微控制器1.2 ROHM BD623x电机驱动二、核心控制原理详解2.1 H桥驱动奥…...

编程日记 2025/2/22 1:00:32

基于ffmpeg+openGL ES实现的视频编辑工具-字幕添加（六）

在视频编辑领域，字幕的添加是一项极为重要的功能，它能够极大地丰富视频内容，提升观众的观看体验。当我们深入探究如何实现这一功能时，FreeType 开源库成为了强大助力。本文将详细阐述借助 FreeType 库生成字幕数据的过程，以及如何实现字幕的缩放、移动、旋转、颜色修改、对…...

编程日记 2025/2/22 0:51:22

C++中const T为什么少见？它有什么用途？

在C中，右值引用（T&&）是移动语义和完美转发的核心特性之一，但你是否注意到，const T&&（const右值引用）却很少被使用？它到底有什么用途？ 今天我们就来深入…...

编程日记 2025/2/22 0:46:14

3095. 或值至少 K 的最短子数组 I 3097. Shortest Subarray With OR at Least K II class Solution:def minimumSubarrayLength(self, nums: List[int], k: int) -> int:n len(nums)bits [0] * 30res infdef calc(bits):return sum(1 << i for i in range(30) if…...

编程日记 2025/2/22 0:44:12

SpringBoot3.x整合WebSocket

SpringBoot3.x整合WebSocket 本文主要介绍最新springboot3.x下如何整合WebSocket. WebSocket简述 WebSocket 是一种在单个 TCP 连接上进行全双工通信的协议，它允许在浏览器和服务器之间进行实时的、双向的通信。相对于传统的基于请求和响应的 HTTP 协议&#xff…...

编程日记 2025/2/22 0:38:05

猿大师办公助手对比其他WebOffice在线编辑Office插件有什么优势

1. 原生Office功能完整嵌入，排版一致性保障猿大师办公助手直接调用本地安装的微软Office、金山WPS或永中Office，支持所有原生功能（如复杂公式、VBA宏等），确保网页编辑与本地打开的文档排版完全一致。提供OLE嵌入和完…...

编程日记 2025/2/22 0:36:02

STM32创建静态库lib

创建静态库lib 1. 新建工程1.1 创建工程文件夹1.2 编写用户相关代码1.2.1 stm32f4xx_it.h1.2.2 stm32f4xx_it.c1.2.3 标准库配置：stm32f4xx_conf.h1.2.4 HAL库的配置：stm32f4xx_hal_conf.h1.2.5 LL库配置：stm32f4xx_ll_conf.h 1.3 移植通用文…...

编程日记 2025/2/22 0:32:59

Hive JOIN过滤条件位置玄学：ON vs WHERE的量子纠缠

Hive JOIN过滤条件位置玄学：ON vs WHERE的量子纠缠作为数据工程师，Hive JOIN就像吃火锅选蘸料——放错位置味道全变！今天带你破解字节/阿里等大厂高频面试题：ON和WHERE后的过滤条件究竟有什么不同？一、核心差异对比表特性ON子句WHERE子句执行时机JOIN操作时JOIN完成后…...

编程日记 2025/2/22 0:29:55

MAC快速本地部署Deepseek (win也可以)

MAC快速本地部署Deepseek (win也可以) 下载安装ollama 地址: https://ollama.com/ Ollama 是一个开源的大型语言模型（LLM）本地运行框架，旨在简化大模型的部署和管理流程，使开发者、研究人员及爱好者能够高效地在本地环境中实验和…...

编程日记 2025/2/22 0:28:54

javaEE-13.spring MVC

目录什么是spring web mvc: 什么是MVC: 一.创建一个spring项目二.实现功能: 创建helloController.java项目: 建立连接： RequestMapping注解: 1.RequestMapping注解的使用： 2. RequestMapping 是GET还是POST请求 3.指定请求方法 RestControll…...

编程日记 2025/2/22 0:26:50

C/C++ | 每日一练 (2)

💢欢迎来到张胤尘的技术站 💥技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌💥 文章目录 C/C | 每日一练 (2)题目参考答案封装继承多态虚函数底…...

编程日记 2025/2/22 0:24:48

Nginx 常用命令和部署详解及案例示范

一、Nginx常用命令 1.1 启动 Nginx 要启动 Nginx 服务，可以使用以下命令： sudo systemctl start nginx1.2 停止 Nginx 如果需要停止 Nginx 服务，可以使用以下命令： sudo systemctl stop nginx1.3 重启 Nginx 在修改了 Nginx…...

编程日记 2025/2/22 0:23:47

GO大模型应用开发框架-

Eino 旨在提供基于 Golang 语言的终极大模型应用开发框架。它从开源社区中的诸多优秀 LLM 应用开发框架，如 LangChain 和 LlamaIndex 等获取灵感，同时借鉴前沿研究成果与实际应用，提供了一个强调简洁性、可扩展性、可靠性与有效性&#xff0…...

编程日记 2025/2/22 0:21:45

保姆级！springboot访问Ollama API并调用DeepSeek模型 Api

要在springboot中访问Ollama API并调用DeepSeek模型，你需要遵循以下步骤。首先，确保你有一个有效的Ollama服务器实例运行中，并且DeepSeek模型已经被加载。可以参考我的这篇博客保姆级！使用Ollama本地部署DeepSeek-R1大模型并java通过api 调用使用Spring Boot + Sprin…...

编程日记 2025/2/22 0:15:40

力扣hot100 ——搜索二维矩阵 || m+n复杂度优化解法

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性： 每行的元素从左到右升序排列。每列的元素从上到下升序排列。解题思路： 借助行和列有序特性，不断按行或者列缩小范围；途中数字表示每…...

编程日记 2025/2/22 0:13:37

娱乐使用，可以生成转账、图片、聊天等对话内容

软件介绍今天要给大家介绍一款由吾爱大佬 lifeixue 开发的趣味软件。它的玩法超丰富，能够生成各式各样的角色，支持文字聊天、发红包、转账、发语音以及分享图片等多种互动形式，不过在分享前得着重提醒，此软件仅供娱乐&#xff0…...

编程日记 2025/2/22 0:11:35

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

FastAPI 教程：从入门到实践

FastAPI 是一个现代、快速（高性能）的 Web 框架，用于构建 API，支持 Python 3.6。它基于标准 Python 类型提示，易于学习且功能强大。以下是一个完整的 FastAPI 入门教程，涵盖从环境搭建到创建并运行一个简单的…...

编程新知 2025/10/16 7:51:26

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2026/1/4 3:47:09

Robots.txt 文件

什么是robots.txt？ robots.txt 是一个位于网站根目录下的文本文件（如：https://example.com/robots.txt），它用于指导网络爬虫（如搜索引擎的蜘蛛程序）如何抓取该网站的内容。这个文件遵循 Robots…...

编程新知 2025/9/9 5:38:23

Angular微前端架构：Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例，其中使用的是 Module Federation 和 npx-build-plus 实现了主应用（Shell）与子应用（Remote）的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

编程新知 2025/12/3 10:52:37

JS手写代码篇----使用Promise封装AJAX请求

15、使用Promise封装AJAX请求 promise就有reject和resolve了，就不必写成功和失败的回调函数了 const BASEURL ./手写ajax/test.jsonfunction promiseAjax() {return new Promise((resolve, reject) > {const xhr new XMLHttpRequest();xhr.open("get&quo…...

编程新知 2025/12/16 3:15:21

Redis：现代应用开发的高效内存数据存储利器

一、Redis的起源与发展 Redis最初由意大利程序员Salvatore Sanfilippo在2009年开发，其初衷是为了满足他自己的一个项目需求，即需要一个高性能的键值存储系统来解决传统数据库在高并发场景下的性能瓶颈。随着项目的开源，Redis凭借其简单易用、…...

编程新知 2025/11/15 1:41:43

探索Selenium：自动化测试的神奇钥匙

目录一、Selenium 是什么1.1 定义与概念1.2 发展历程1.3 功能概述二、Selenium 工作原理剖析2.1 架构组成2.2 工作流程2.3 通信机制三、Selenium 的优势3.1 跨浏览器与平台支持3.2 丰富的语言支持3.3 强大的社区支持四、Selenium 的应用场景4.1 Web 应用自动化测试4.2 数据…...

编程新知 2025/11/19 18:06:51

【p2p、分布式，区块链笔记 MESH】Bluetooth蓝牙通信 BLE Mesh协议的拓扑结构定向转发机制

目录节点的功能承载层（GATT/Adv）局限性： 拓扑关系定向转发机制定向转发意义 CG 节点的功能节点的功能由节点支持的特性和功能决定。所有节点都能够发送和接收网格消息。节点还可以选择支持一个或多个附加功能，如 Configuration …...

编程新知 2026/2/4 22:41:52

Android写一个捕获全局异常的工具类

项目开发和实际运行过程中难免会遇到异常发生，系统提供了一个可以捕获全局异常的工具Uncaughtexceptionhandler，它是Thread的子类（就是package java.lang;里线程的Thread）。本文将利用它将设备信息、报错信息以及错误的发生时间都…...

编程新知 2026/2/9 23:02:28

PyTorch Tensor 形状变化操作详解

1. 基础形状操作

1.1 view 和 reshape

1.2 squeeze 和 unsqueeze

2. 高级形状操作

2.1 permute

2.2 transpose

2.3 flatten

2.4 repeat

2.5 expand

3. 数据提取与分散

3.1 narrow

3.2 gather

3.3 scatter

4. 对角操作

4.1 diag

相关文章：

1.1 `view` 和 `reshape`

1.2 `squeeze` 和 `unsqueeze`

2.1 `permute`

2.2 `transpose`

2.3 `flatten`

2.4 `repeat`

2.5 `expand`

3.1 `narrow`

3.2 `gather`

3.3 `scatter`

4.1 `diag`