当前位置：首页 > news >正文

理解张量拼接（torch.cat）

news 2025/11/15 11:50:34

拼接

维度顺序：对于 3D 张量，通常可以理解为 (深度, 行, 列) 或 (批次, 行, 列)。选择一个dim进行拼接的时候其他两个维度大小要相等
![[Pasted image 20240808214248.png]]

对于三维张量，理解 torch.cat 的 dim 参数确实变得更加抽象，但原理是相同的。让我们通过一个具体的例子来说明这一点。

import torch# 创建两个 3D 张量
a = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
b = torch.tensor([[[9, 10], [11, 12]], [[13, 14], [15, 16]]])print("Tensor a shape:", a.shape)
print(a)
print("\nTensor b shape:", b.shape)
print(b)# dim=0 连接
c_dim0 = torch.cat([a, b], dim=0)
print("\nResult of torch.cat([a, b], dim=0):")
print("Shape:", c_dim0.shape)
print(c_dim0)# dim=1 连接
c_dim1 = torch.cat([a, b], dim=1)
print("\nResult of torch.cat([a, b], dim=1):")
print("Shape:", c_dim1.shape)
print(c_dim1)# dim=2 连接
c_dim2 = torch.cat([a, b], dim=2)
print("\nResult of torch.cat([a, b], dim=2):")
print("Shape:", c_dim2.shape)
print(c_dim2)

现在让我们详细解释这个三维张量的例子：

初始张量：
- a 和 b 都是形状为 (2, 2, 2) 的 3D 张量。
- 可以将它们想象成两个 2x2 的矩阵堆叠在一起。
dim=0 连接：
- 结果形状：(4, 2, 2)
- 这相当于在第一个维度上堆叠张量。
- 可以理解为将 b 放在 a 的"下面"，增加了第一个维度的大小。
dim=1 连接：
- 结果形状：(2, 4, 2)
- 这相当于在第二个维度上堆叠张量。
- 可以理解为在每个 2x2 矩阵的"行"方向上扩展，将 b 的行添加到 a 的每个对应部分的下方。
dim=2 连接：
- 结果形状：(2, 2, 4)
- 这相当于在第三个维度（最内层）上堆叠张量。
- 可以理解为在每个 2x2 矩阵的"列"方向上扩展，将 b 的列添加到 a 的每个对应部分的右侧。

理解三维张量 torch.cat 的关键点：

维度顺序：对于 3D 张量，通常可以理解为 (深度, 行, 列) 或 (批次, 行, 列)。
dim=0：增加"深度"或"批次"的数量。
dim=1：增加每个"深度"层或"批次"中的行数。
dim=2：增加每行中的元素数量（列数）。
保持其他维度：除了被连接的维度，其他维度的大小保持不变。
形状变化：只有指定的 dim 对应的维度大小会改变（增加），其他维度大小保持不变。
一致性：要连接的张量在非连接维度上的大小必须相同。

3D Matrix Visualization

Let’s visualize the 3D matrices a and b, and their concatenation results.

Matrix a (2x2x2):

Depth 0:    Depth 1:
+---+---+   +---+---+
| 1 | 2 |   | 5 | 6 |
+---+---+   +---+---+
| 3 | 4 |   | 7 | 8 |
+---+---+   +---+---+

Matrix b (2x2x2):

Depth 0:    Depth 1:
+----+----+ +----+----+
| 9  | 10 | | 13 | 14 |
+----+----+ +----+----+
| 11 | 12 | | 15 | 16 |
+----+----+ +----+----+

Concatenation Results:

dim=0 (4x2x2):

Depth 0:    Depth 1:    Depth 2:    Depth 3:
+---+---+   +---+---+   +----+----+ +----+----+
| 1 | 2 |   | 5 | 6 |   | 9  | 10 | | 13 | 14 |
+---+---+   +---+---+   +----+----+ +----+----+
| 3 | 4 |   | 7 | 8 |   | 11 | 12 | | 15 | 16 |
+---+---+   +---+---+   +----+----+ +----+----+

dim=1 (2x4x2):

Depth 0:        Depth 1:
+---+---+       +---+---+
| 1 | 2 |       | 5 | 6 |
+---+---+       +---+---+
| 3 | 4 |       | 7 | 8 |
+---+---+       +---+---+
| 9 | 10 |      | 13| 14|
+---+---+       +---+---+
| 11| 12 |      | 15| 16|
+---+---+       +---+---+

dim=2 (2x2x4):

Depth 0:        Depth 1:
+---+---+---+---+   +---+---+---+---+
| 1 | 2 | 9 | 10|   | 5 | 6 | 13| 14|
+---+---+---+---+   +---+---+---+---+
| 3 | 4 | 11| 12|   | 7 | 8 | 15| 16|
+---+---+---+---+   +---+---+---+---+

当然可以！让我们通过具体的例子来形象地解释不同维度上的拼接。

定义张量

首先，定义三个张量 x, y, z，它们分别具有如下形状：

x 的形状是 [2, 1, 3]
y 的形状是 [2, 3, 3]
z 的形状是 [2, 2, 3]

import torchx = torch.tensor([[[0, 0, 0]], [[0, 0, 0]]])
y = torch.tensor([[[0, 0, 0], [0, 0, 0], [0, 0, 0]],[[0, 0, 0], [0, 0, 0], [0, 0, 0]]
])
z = torch.tensor([[[0, 0, 0], [0, 0, 0]],[[0, 0, 0], [0, 0, 0]]
])

（1）在 dim=0 上拼接

在 dim=0 上拼接，相当于增加“深度”或“批次”的数量。每个张量的“深度”都会堆叠起来。

w_dim0 = torch.cat([x, y, z], dim=0)
print(w_dim0.shape)

形象解释：

x:
[[[0, 0, 0]],  # 第一层深度[[0, 0, 0]]   # 第二层深度
]y:
[[[0, 0, 0], [0, 0, 0], [0, 0, 0]],  # 第一层深度[[0, 0, 0], [0, 0, 0], [0, 0, 0]]   # 第二层深度
]z:
[[[0, 0, 0], [0, 0, 0]],  # 第一层深度[[0, 0, 0], [0, 0, 0]]   # 第二层深度
]拼接结果 w_dim0:
[[[0, 0, 0]],  # x 第一层深度[[0, 0, 0]],  # x 第二层深度[[0, 0, 0], [0, 0, 0], [0, 0, 0]],  # y 第一层深度[[0, 0, 0], [0, 0, 0], [0, 0, 0]],  # y 第二层深度[[0, 0, 0], [0, 0, 0]],  # z 第一层深度[[0, 0, 0], [0, 0, 0]]   # z 第二层深度
]

形状：[6, 3, 3]

（2）dim=1 上拼接

在 dim=1 上拼接，相当于增加每个“深度”层中的行数。每个深度层的行数会拼接起来。

w_dim1 = torch.cat([x, y, z], dim=1)
print(w_dim1.shape)

形象解释：

x:
[[[0, 0, 0]],  # 第一层深度的第一行[[0, 0, 0]]   # 第二层深度的第一行
]y:
[[[0, 0, 0], [0, 0, 0], [0, 0, 0]],  # 第一层深度的三行[[0, 0, 0], [0, 0, 0], [0, 0, 0]]   # 第二层深度的三行
]z:
[[[0, 0, 0], [0, 0, 0]],  # 第一层深度的两行[[0, 0, 0], [0, 0, 0]]   # 第二层深度的两行
]拼接结果 w_dim1:
[[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]],  # 第一层深度的六行[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]   # 第二层深度的六行
]

形状：[2, 6, 3]

当然可以！为了展示如何在 dim=2（第三个维度）上拼接张量，我们需要确保这些张量在前两个维度上的大小是相同的，而在第三个维度上的大小可以不同。

假设我们定义三个张量 a, b, c，它们分别具有如下形状：

a 的形状是 [2, 2, 2]
b 的形状是 [2, 2, 3]
c 的形状是 [2, 2, 1]

import torcha = torch.tensor([[[1, 2], [3, 4]],[[5, 6], [7, 8]]
])b = torch.tensor([[[9, 10, 11], [12, 13, 14]],[[15, 16, 17], [18, 19, 20]]
])c = torch.tensor([[[21], [22]],[[23], [24]]
])

（3）在 dim=2 上拼接

在 dim=2 上拼接，相当于增加每行中的元素数量（列数）。每个深度层中的列数会拼接起来：

w_dim2 = torch.cat([a, b, c], dim=2)
print(w_dim2)
print(w_dim2.shape)

形象解释：

a:
[[[1, 2],      [3, 4]],     # 第一层深度的两行两列[[5, 6],      [7, 8]]      # 第二层深度的两行两列
]b:
[[[9, 10, 11], [12, 13, 14]], # 第一层深度的两行三列[[15, 16, 17], [18, 19, 20]] # 第二层深度的两行三列
]c:
[[[21],        [22]],       # 第一层深度的两行一列[[23],        [24]]        # 第二层深度的两行一列
]拼接结果 w_dim2:
[[[1, 2, 9, 10, 11, 21], [3, 4, 12, 13, 14, 22]],       # 第一层深度的两行六列[[5, 6, 15, 16, 17, 23], [7, 8, 18, 19, 20, 24]]       # 第二层深度的两行六列
]w_dim2 的形状为：[2, 2, 6]

通过在 dim=2 上拼接，结果张量 w_dim2 的第三个维度是各个张量第三个维度的和：2 + 3 + 1 = 6。

# 代码输出：
# tensor([[[ 1,  2,  9, 10, 11, 21],
#          [ 3,  4, 12, 13, 14, 22]],
# 
#         [[ 5,  6, 15, 16, 17, 23],
#          [ 7,  8, 18, 19, 20, 24]]])
# 
# 形状: torch.Size([2, 2, 6])

希望这个例子能帮助你更好地理解如何在 dim=2 上拼接张量。
非常好的问题！让我们用书架的比喻来解释这个例子，这将有助于更直观地理解张量的维度。

在这个比喻中：

dim=0（第一个维度）代表书架的数量
dim=1（第二个维度）代表每个书架的层板数
dim=2（第三个维度）代表每个层板可以放置的书本数量（即层板的宽度）

让我们用这个比喻来解释 a, b, 和 c 这三个张量：

张量 a [2, 2, 2]:
- 2个书架
- 每个书架有2层层板
- 每个层板可以放2本书
张量 b [2, 2, 3]:
- 2个书架
- 每个书架有2层层板
- 每个层板可以放3本书
张量 c [2, 2, 1]:
- 2个书架
- 每个书架有2层层板
- 每个层板可以放1本书

当我们在 dim=2 上拼接这些张量时，相当于我们在不改变书架数量和层板数量的情况下，将每个层板变宽，使其可以容纳更多的书。

拼接后的结果 w_dim2 [2, 2, 6]:

仍然是2个书架（dim=0 没变）
每个书架仍然有2层层板（dim=1 没变）
但是现在每个层板可以放6本书了（dim=2 变成了 2+3+1=6）

形象地说：

原来的书架 a:    原来的书架 b:    原来的书架 c:
[□□]            [□□□]           [□]
[□□]            [□□□]           [□][□□]            [□□□]           [□]
[□□]            [□□□]           [□]拼接后的新书架 w_dim2:
[□□□□□□]  (2+3+1 = 6本书)
[□□□□□□][□□□□□□]
[□□□□□□]

每个 □ 代表一本书（或者说张量中的一个元素）。

这个比喻展示了我们如何在不增加书架数量（dim=0）或层板数量（dim=1）的情况下，通过拼接来增加每个层板可以放置的书本数量（dim=2）。这就是在 dim=2 上进行张量拼接的直观理解。

理解张量拼接（torch.cat）

拼接维度顺序：对于 3D 张量，通常可以理解为 (深度, 行, 列) 或 (批次, 行, 列)。选择一个dim进行拼接的时候其他两个维度大小要相等对于三维张量，理解 torch.cat 的 dim 参数确实变得更加抽象，但原理是相同的。让我们通过一…...

编程日记 2024/8/9 3:03:40

指针基础知识(笔记)

文章目录 1. 概念理解2. 空指针和野指针3. 计算4. 小结5. size_t6. 案例一: 指针查找并返回指定元素索引7. 指针访问多维数组(涉及 int (*ptr)[3]解析)8. 指针数组9. 函数的值传递与地址引用传递① 函数的值传递(pass by value)② 地址传递(pass by reference) 10. 案例二&…...

编程日记 2024/8/9 3:02:39

[Python学习日记-3] 编程前选择一个好用的编程工具

[Python学习日记-3] 编程前选择一个好用的编程工具简介 PyCharm IDE的安装 PyCharm IDE安装后的一些常规使用简介在踏上 Python 编程的精彩旅程之前，选择一款得心应手的编程工具无疑是至关重要的一步。这就如同战士在出征前精心挑选趁手的武器，它将…...

编程日记 2024/8/9 3:00:36

智能化的Facebook未来：AI如何重塑社交网络的面貌？

随着人工智能（AI）技术的飞速发展，社交网络的面貌正在经历深刻的变革。Facebook（现Meta Platforms）作为全球最大的社交媒体平台之一，正积极探索如何利用AI技术来提升用户体验、优化内容管理并推动平台创新。…...

编程日记 2024/8/9 2:59:35

安全启动的原理

安全启动（Secure Boot）是一种用于确保设备只运行经过认证的软件的安全机制。其核心原理和步骤如下： 1. **硬件信任根（Root of Trust, RoT）**： - 安全启动过程始于硬件信任根，通常是设备上的…...

编程日记 2024/8/9 2:57:32

【ML】pre-train model 是什么如何微调它，如何预训练

【ML】pre-train model 是什么如何微调它，如何预训练 0. 预训练模型（Pre-trained Model）0.1 预训练模型的预训练过程0.2 如何微调预训练模型0.3 总结 1. Contextualized word Embedding2. 怎么让 bert 模型变小3. 如何微调模型 0. 预训练模型…...

编程日记 2024/8/9 2:56:31

leetcode代码练习——Java的数据结构（具体使用）

注：Java中所有的泛型必须是引用类型如<Integer>而不是<int> java提供的数学方法： 求最大值Math.max(10,15)，最小值Math.min(10,15) 看取值范围： int范围:-2^31-2^31-1 double范围:-2^63-2^63-1 long范围:-2^63-2…...

编程日记 2024/8/9 2:54:28

sqlserver导出数据脚本

文章目录 sqlserver导出数据脚本任务-生成脚本 sqlserver导出数据脚本任务-生成脚本...

编程日记 2024/8/9 2:53:27

html+css 实现hover中间展开背景

前言：哈喽，大家好，今天给大家分享htmlcss 绚丽效果！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏关注哦 💕 目…...

编程日记 2024/8/9 2:51:24

Java 怎么获取支付宝Open ID

在Java中获取支付宝用户的OpenID，通常是通过支付宝的开放平台API来完成的。OpenID是支付宝用于唯一标识一个支付宝用户的字符串，它在OAuth授权流程中被用来获取用户的身份和权限。下面我将给出一个基于Java使用Spring Boot框架和支付宝开放平台SDK来获…...

编程日记 2024/8/9 2:50:22

https://gist.github.com/hvelarde/ceac345c662429447959625e6feb2b47 通过状态码获取请求总数 awk {print $9} /var/log/apache2/access.log | sort | uniq -c | sort –rn按照IP的请求数量排序 awk {print $1} /var/log/apache2/access.log | sort | uniq -c | sort -rn |…...

编程日记 2024/8/9 2:49:18

Typora的markdown笔记使用说明

个人感觉Typora是一款很适合记录编程学习的软件目录个人感觉Typora是一款很适合记录编程学习的软件一、标题二、段落 1、换行 2、分割线三、文字显示 1、字体 2、上下标四、列表 1、无序列表 2、有序列表 3、任务列表五、区块显示六、代码显示 1、行内…...

编程日记 2024/8/9 2:48:17

前端如何做单元测试? 看这篇就入门了

前言对于现在的前端工程，一个标准完整的项目，通常情况单元测试是非常必要的。但很多时候我们只是完成了项目而忽略了项目测试。我认为其中一个很大的原因是很多人对单元测试认知不够，因此我写了这边文章，一方面期望通过这篇文章…...

编程日记 2024/8/9 2:46:14

Chainlit快速实现AI对话应用的聊天记录如何持久性保存

前言 Chainlit 可以设置聊天记录用户搜索和浏览过去的对话。如何实现要启用聊天历史记录，您需要启用：数据持久性身份验证恢复对话为了让用户继续持久对话，请使用cl.on_chat_resume 生命周期钩子装饰器使用户能够继续对话。需要同时启用数据持久性和身份验证。该…...

编程日记 2024/8/9 2:44:11

【探索数据结构与算法】——深入了解双向链表（图文详解）

目录一、双向链表的基本概念二、双向链表的结构三、双向链表的基本操作实现方法 1.双向链表的初始化 2.双向链表的头插 3.双向链表的尾插 6.查找节点 7.在指定位置之前插入节点 8.删除指定位置节点 9.打印链表数据 10.双向链表销毁四、完整代码实现 …...

编程日记 2024/8/9 2:42:09

linux常用命令备忘录

一、常用命令查看被占用进程：ps ef|grep 11612 查看当前目录：pwd 查看文件的md5： （linux）md5sum 文件名 （windows）certutil -hashfile some_file MD5 查看当前目录的文件大小&#xff1a…...

编程日记 2024/8/9 2:39:05

【C++进阶学习】第十二弹——C++ 异常处理：深入解析与实践应用

前言： 在C编程语言中，异常处理是一种重要的机制，它允许程序员在运行时捕获和处理错误或异常情况。本文将详细介绍C异常处理的相关知识点，包括异常的定义、抛出与捕获、异常处理的原则、以及在实际编程中的应用。目录 1. 异常处理…...

编程日记 2024/8/9 2:36:01

《算法竞赛进阶指南》0x23剪枝

剪枝，就是减少搜索树的规模、尽可能排除搜索书中不必要的分支的一种手段。形象地看，就好像剪掉了搜索树的枝条，故被称为“剪枝”。在深度优先搜索中，有以下常见的剪枝方法。 1.优化搜索顺序在一些搜索问题中，搜索树的…...

编程日记 2024/8/9 2:35:00

同态加密和SEAL库的介绍（三）BFV - Batch Encoder

写在前面： 在上一篇中展示了如何使用 BFV 方案执行一个非常简单的计算。该计算在 plain_modulus 参数下进行，并且仅使用了 BFV 明文多项式中的一个系数。这种方法有两个显著的问题： 实际应用通常使用整数或实数运算，而不是模运算…...

编程日记 2024/8/9 2:32:57

Docker 环境下使用 Traefik v3 和 MinIO 快速搭建私有化对象存储服务

上一篇文章中，我们使用 Traefik 新版本完成了本地服务网关的搭建。接下来，来使用 Traefik 的能力，进行一系列相关的基础设施搭建吧。本篇文章，聊聊 MinIO 的单独使用，以及结合 Traefik 完成私有化 S3 服务的基础搭建…...

编程日记 2024/8/9 2:30:54

后进先出（LIFO）详解

LIFO 是 Last In, First Out 的缩写，中文译为后进先出。这是一种数据结构的工作原则，类似于一摞盘子或一叠书本： 最后放进去的元素最先出来 -想象往筒状容器里放盘子： （1）你放进的最后一个盘子&#xff08…...

编程新知 2025/11/15 3:49:05

[特殊字符] 智能合约中的数据是如何在区块链中保持一致的？

🧠 智能合约中的数据是如何在区块链中保持一致的？ 为什么所有区块链节点都能得出相同结果？合约调用这么复杂，状态真能保持一致吗？本篇带你从底层视角理解“状态一致性”的真相。一、智能合约的数据存储在哪里&#xf…...

编程新知 2025/10/25 17:23:41

谷歌浏览器插件

项目中有时候会用到插件 sync-cookie-extension1.0.0：开发环境同步测试 cookie 至 localhost，便于本地请求服务携带 cookie 参考地址：https://juejin.cn/post/7139354571712757767 里面有源码下载下来，加在到扩展即可使用FeHelp…...

编程新知 2025/8/16 3:55:30

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

文章目录 1.什么是Redis？2.为什么要使用redis作为mysql的缓存？3.什么是缓存雪崩、缓存穿透、缓存击穿？3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

编程新知 2025/11/7 13:08:40

SCAU期末笔记 - 数据分析与数据挖掘题库解析

这门怎么题库答案不全啊日来简单学一下子来一、选择题（可多选） 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 A. 频繁模式挖掘：专注于发现数据中…...

编程新知 2025/11/7 21:03:30

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2025/11/7 21:04:12

可靠性+灵活性：电力载波技术在楼宇自控中的核心价值

可靠性灵活性：电力载波技术在楼宇自控中的核心价值在智能楼宇的自动化控制中，电力载波技术（PLC）凭借其独特的优势，正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据，无需额外布…...

编程新知 2025/9/27 2:43:26

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义，在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容，其实不管是方块还是方块实体，都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器，用于动态创…...

编程新知 2025/10/28 1:35:57

华为OD机试-食堂供餐-二分法

import java.util.Arrays; import java.util.Scanner;public class DemoTest3 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseint a in.nextIn…...

编程新知 2025/11/8 5:57:07

leetcodeSQL解题：3564. 季节性销售分析

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2025/10/5 19:58:27

拼接

3D Matrix Visualization

Matrix a (2x2x2):

Matrix b (2x2x2):

Concatenation Results:

dim=0 (4x2x2):

dim=1 (2x4x2):

dim=2 (2x2x4):

定义张量

相关文章：