当前位置：首页 > news >正文

PyTorch张量运算与自动微分

news 2026/2/8 21:26:52

PyTorch张量运算与自动微分

PyTorch由Facebook人工智能研究院于2017年推出，具有强大的GPU加速张量计算功能，并且能够自动进行微分计算，从而可以使用基于梯度的方法对模型参数进行优化，大部分研究人员、公司机构、数据比赛都使用PyTorch。

张量创建

在深度学习领域你会经常看到张量（Tensor）的表述，张量是深度学习的基础，所以谷歌会把他的深度学习框架叫做TensorFlow。深度学习中的张量可以理解成数组，类似numpy的array。例如：

单个数字就是0维张量，称为标量（scalar）；
1维张量称为向量（vector）；
2维张量称为矩阵（matrix）；
再多点维度就统一称作张量了。

高等代数中学习过矩阵运算，就是最基本的张量运算。

在用Transformers时最常见的是二维和三维张量。二维张量一般是权重矩阵W等，三维张量一般是原数据处理成序列长度模型维度batchsize×序列长度×模型维度。

在描述张量维度时，或者创建多维张量时，你会经常看到 $W\in\mathbb{R}^{d_m \times d_k \times d_h}$ 这种类似表述，用几行几列这样的方式去理解的话，相当不直观。

一种直观理解就是用类似多维数组的思想，用“框的数量”来理解。

$d_m \times d_k \times d_h$ 代表最大一个框包着m个框、再下一层有k个，最里层有h个。

第零维m个框：

$\begin{array}{c} m个 \\ [\overbrace{[...],[...],...,[...]}] \end{array}$

第一维k个框

$\begin{array}{} k个 \\ [[\overbrace{[...],...,[...]}],...,] \end{array}$

第二维h个框

$\begin{array}{} h个 \\ [[[\overbrace{[...],...,[...]}],...],...] \end{array}$

Pytorch张量操作

PyTorch提供了多种方式来创建张量，以创建一个2×3的矩阵为例：

import torch
# empty作用就是初始化一块内存放着，里面数据不重要，根本不会用
t = torch.empty(2, 3)
# 随机初始化张量，范围是[0,1)
t = torch.rand(2, 3)
# 随机初始化张量，服从标准正态分布
t = torch.randn(2, 3)
# 全0矩阵，其中的0是长整型，也可以换成torch.double、torch.float64
t = torch.zeros(2, 3, dtype=torch.long)
# 同理有全1矩阵
t = torch.ones(2, 3, dtype=torch.long)

上面比较常用的是全0和全1，对判断真假很有用。也可以从一个张量创造维度相同的张量：

import torch
t = torch.empty(2, 3)
x = torch.rand_like(a)
x = torch.randn_like(a)
x = torch.zeros_like(a)
x = torch.ones_like(a)

也可以通过基于已有的数组创建张量：

# 从列表
_list = [[1.0, 3.8, 2.1], [8.6, 4.0, 2.4]]
t = torch.tensor(_list)
# 从ndarray
import numpy as np
array = np.array([[1.0, 3.8, 2.1], [8.6, 4.0, 2.4]])
t = torch.from_numpy(array)

这样创建的张量默认在CPU，将其调入GPU有如下方式：

t = torch.empty(2, 3).cuda()
t = torch.empty(2, 3, device="cuda")
t = torch.empty(2, 3).to("cuda")

默认是使用当前第0张卡，指定用第1张卡：

t= torch.empty(2, 3).cuda(1)
t= torch.empty(2, 3, device="cuda:1")
t= torch.empty(2, 3).to("cuda:1")

对应的可以调入CPU：

t = torch.empty(2, 3).cpu()
t = torch.empty(2, 3, device="cpu")
t = torch.empty(2, 3).to("cpu")

张量运算

张量的加减乘除、拆拼换调、特殊函数，都能在PyTorch找到快速方法。

加减乘除

x = torch.rand(2, 3)
y = torch.rand(2, 3)
# 等价于x + y
z = torch.add(x, y)
# torch没有减方法，但是可以x - y
# 矩阵点乘，multiplication，Hadamard积，等价于x * y
z = torch.mul(x, y)
# 矩阵叉乘，矩阵乘法，matrix multiplication，等价于x @ y
z = torch.mm(x, y)
# 会报错，因为两者的维度不能做叉乘，需要如下转置
z = torch.mm(x, y.T)
# 三维对应矩阵乘法，batch matrix multiplication
x = torch.rand(2, 3, 4)
y = torch.rand(2, 4, 3)
z = torch.bmm(x, y)
# 更普遍的矩阵叉乘
z = torch.matmul(x, y)
# 除法不常用，但也可以x / y

广播机制

前面我们都是假设参与运算的两个张量形状相同，但是PyTorch同样可以处理不相同形状的张量。

x = torch.ones(2, 3, 4)
y = torch.ones(1, 3, 4)
z = x + y

PyTorch会使得最外面的框维度相同，做法是复制，如上例的y复制一份变成2×3×4，然后以此类推使得前面的框框都相同，最后可以做相同维度运算。再来个更极端的例子：

import torch
x = torch.ones(2, 1, 3, 4)
y = torch.ones(5, 4, 3)
z = torch.matmul(x, y)
print(z)

这么乱都能乘？耶斯。

首先来看，不乱的是最后两位的3×4和4×3和，刚好能做叉乘，好，所以结果的最后两位是3×3。
再看前面的维度，y少了框，先补最外面y变成2×5×4×3
这时第二维1的少了，复制成2×5×3×4，这样就可以乘了。

聪明的你要问，如果x第二维是3，复制不成5啊，那怎么办？怎么办？难办就别办了！答案就是会报错。

拆拼换调

这些方法几乎是最常用的，跟着我好好理解一遍哦。首先是拼接的cat方法：

x = torch.tensor([[1, 2, 3], [ 4,  5,  6]], dtype=torch.double)
y = torch.tensor([[7, 8, 9], [10, 11, 12]], dtype=torch.double)
z = torch.cat((x, y), dim=0)

看到dim=0了吗，根据框框理论，这是把第0维的几个框框拼起来，得到：

tensor([[ 1.,  2.,  3.],[ 4.,  5.,  6.],[ 7.,  8.,  9.],[10., 11., 12.]], dtype=torch.float64)

当dim=1，则是把第一个框框里的拼起来，得到：

tensor([[ 1.,  2.,  3.,  7.,  8.,  9.],[ 4.,  5.,  6., 10., 11., 12.]], dtype=torch.float64)

拆分就用索引与切片，操作如同list。

# 取第0维第1个框里的第2位，注意第X是从0开始
t = torch.randn(3, 4)
x = t[1, 2]
# 取第0维的前两项
x = t[0:2]

PyTorch张量运算与自动微分

PyTorch张量运算与自动微分 PyTorch由Facebook人工智能研究院于2017年推出，具有强大的GPU加速张量计算功能，并且能够自动进行微分计算，从而可以使用基于梯度的方法对模型参数进行优化，大部分研究人员、公司机构、数据比赛都使用P…...

编程日记 2024/12/2 20:08:22

【从零开始的LeetCode-算法】3264. K 次乘运算后的最终数组 I

给你一个整数数组 nums ，一个整数 k 和一个整数 multiplier 。你需要对 nums 执行 k 次操作，每次操作中： 找到 nums 中的最小值 x ，如果存在多个最小值，选择最前面的一个。将 x 替换为 x * multiplier 。请你…...

编程日记 2024/12/2 20:03:14

【Linux】gdb / cgdb 调试 + 进度条

🌻个人主页：路飞雪吖~ 🌠专栏：Linux 目录一、Linux调试器-gdb 🌟开始使用 🌠小贴士： 🌟gdb指令 🌠小贴士： ✨watch 监视 ✨打条件断点二、小程序----进…...

编程日记 2024/12/2 20:01:11

Jenkins Nginx Vue项目自动化部署

目录一、环境准备 1.1 Jenkins搭建 1.2 NVM和Nodejs安装 1.3 Nginx安装二、Jenkins配置 2.1 相关插件安装 2.2 全局工具安装 2.3 环境变量配置 2.4 邮箱配置（构建后发送邮件） 2.5 任务配置三、Nginx配置 3.1 配置路由转发四、部署项目 …...

编程日记 2024/12/2 20:00:10

视频汇聚平台Liveweb国标GB28181视频平台监控中心设计

在现代安防视频监控领域，Liveweb视频汇聚平台以其卓越的兼容性和灵活的拓展能力，为用户提供了一套全面的解决方案。该平台不仅能够实现视频的远程监控、录像、存储与回放等基础功能，还涵盖了视频转码、视频快照、告警、云台控制、语音对讲以及…...

编程日记 2024/12/2 19:53:03

文件比较和文件流

文件比较和文件流一、文本比较工具 diff1.基本用法1.1输出格式 2.常用选项二、文件流1.文件的打开模式2.文件流的分类ifstreamofstreamfstrem区别 3.文件流的函数1. 构造函数2. is_open 用于判断文件是否打开3. open4. getline5. close6. get()7. read8. write9. put10. gcou…...

编程日记 2024/12/2 19:50:00

【2024最新】基于Springboot+Vue的就业信息管理系统Lw+PPT

作者：计算机搬砖家开发技术：SpringBoot、php、Python、小程序、SSM、Vue、MySQL、JSP、ElementUI等，“文末源码”。专栏推荐：SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项…...

编程日记 2024/12/2 19:48:57

PySide6 QSS(Qt Style Sheets) Reference: PySide6 QSS参考指南

Qt官网参考资料： QSS介绍： Styling the Widgets Application - Qt for Pythonhttps://doc.qt.io/qtforpython-6/tutorials/basictutorial/widgetstyling.html#tutorial-widgetstyling QSS 参考手册： Qt Style Sheets Reference | Qt Widge…...

编程日记 2024/12/2 19:46:55

【笔记】成为雍正

观古代历史，不过帝王一家一姓之家史时间 1662年，田文镜出生。1672年，张廷玉出生。1674年，胤礽出生。1678年，胤禛出生。1679年，年羹尧出生。1680年，鄂尔泰出生。1700年，索额图被赐死…...

编程日记 2024/12/2 19:45:54

Codeforces Round 913 (Div. 3)

题目链接 B. YetnotherrokenKeoard 题意输入输出思路用两个栈分别维护小写字母下标和大写字母下标，用一个vis数组标记字母是否删除示例代码 void solve() {string s;cin >> s;int n s.size();vector<bool> vis(n, false);stack<int>sk…...

编程日记 2024/12/2 19:44:53

斐波那契数

C语言实现斐波那契数列的多种方法_斐波那契数列c语言-CSDN博客题目描述斐波那契数列为：1,1,2,3,5,8,13.....，常规递推公式f(n)f(n-1)f(n-2); 输入描述输入一个整数n(0<n<50),为多组数据。输出描述输出第n个斐波那契数样例输入 1 2 4样例输出…...

编程日记 2024/12/2 19:42:51

Redis高阶集群搭建+集群读写

问题容量不够，redis 如何进行扩容？并发写操作， redis 如何分摊？另外，主从模式，薪火相传模式，主机宕机，导致 ip 地址发生变化，应用程序中配置需要修改对应的主机地址、端…...

编程日记 2024/12/2 19:41:49

Vision Transformer（vit）的主干

图解： 代码： class VisionTransformer(nn.Module):def __init__(self, img_size224, patch_size16, in_c3, num_classes1000,embed_dim768, depth12, num_heads12, mlp_ratio4.0, qkv_biasTrue,qk_scaleNone, representation_sizeNone, distilledFalse,…...

编程日记 2024/12/2 19:39:47

手撸了一个文件传输工具

在日常的开发与运维中，文件传输工具是不可或缺的利器。无论是跨服务器传递配置文件，还是快速从一台机器下载日志文件，一个高效、可靠且简单的文件传输工具能够显著提高工作效率。今天，我想分享我自己手撸一个文件传输工具的全过程…...

编程日记 2024/12/2 19:33:35

Java程序调kubernetes(k8s1.30.7)core API简单示例，并解决403权限验证问题，即何进行进行权限授权以及验证

简单记录问题一、问题描述希望通过Java程序使用Kubernetes提供的工具包实现对Kubernetes集群core API的调用，但是在高版本上遇见权限验证问题4xx。 <dependency><groupId>io.kubernetes</groupId><artifactId>client-java</artifact…...

编程日记 2024/12/2 19:30:32

java八股-Redis Stream和RocketMQ实现的解决方案

文章目录 Redis Stream方案：ShortLinkStatsSaveProducer.javaShortLinkStatsSaveConsumer.java RocketMQ方案ShortLinkStatsSaveProducer.javaShortLinkStatsSaveConsumer.java Redis Stream方案： ShortLinkStatsSaveProducer.java package com.nageoff…...

编程日记 2024/12/2 19:28:30

第29天 MCU入门

目录 MCU介绍 MCU的组成与作用电子产品项目开发流程硬件开发流程常用元器件初步了解硬件原理图与PCB板常见电源符号和名称电阻电阻的分类贴片电阻的封装说明： 色环电阻的计算贴片电阻阻值计算上拉电阻与下拉电阻电容电容的读数二极管 LED 灯电路钳位作…...

编程日记 2024/12/2 19:25:25

【Python网络爬虫笔记】6- 网络爬虫中的Requests库

一、概述 Requests 是一个用 Python 语言编写的、简洁且功能强大的 HTTP 库。它允许开发者方便地发送各种 HTTP 请求，如 GET、POST、PUT、DELETE 等，并且可以轻松地处理请求的响应。这个库在 Python 生态系统中被广泛使用，无论是简单的网页数…...

编程日记 2024/12/2 19:20:20

Linux网络_网络协议_网络传输_网络字节序

一.协议 1.概念协议（Protocol） 是一组规则和约定，用于定义计算机网络中不同设备之间如何进行通信和数据交换。协议规定了数据的格式、传输方式、传输顺序等详细规则，确保不同设备和系统能够有效地互联互通。在网络通信中&#…...

编程日记 2024/12/2 19:08:07

浅谈网络 | 应用层之流媒体与P2P协议

目录流媒体名词系列视频的本质视频压缩编码过程如何在直播中看到帅哥美女？RTMP 协议 P2PP2P 文件下载种子文件 (.torrent)去中心化网络（DHT）哈希值与 DHT 网络DHT 网络是如何查找流媒体直播系统组成与协议近几年直播比较火，…...

编程日记 2024/12/2 19:06:02

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/8 1:14:13

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

编程新知 2025/11/8 0:24:13

C++中string流知识详解和示例

一、概览与类体系 C 提供三种基于内存字符串的流，定义在 <sstream> 中： std::istringstream：输入流，从已有字符串中读取并解析。std::ostringstream：输出流，向内部缓冲区写入内容，最终取…...

编程新知 2025/11/30 11:30:47

如何在最短时间内提升打ctf（web)的水平？

刚刚刷完2遍 bugku 的 web 题，前来答题。每个人对刷题理解是不同，有的人是看了writeup就等于刷了，有的人是收藏了writeup就等于刷了，有的人是跟着writeup做了一遍就等于刷了，还有的人是独立思考做了一遍就等于刷了。…...

编程新知 2026/1/28 5:55:15

springboot 日志类切面，接口成功记录日志，失败不记录

springboot 日志类切面，接口成功记录日志，失败不记录自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...

编程新知 2026/2/1 13:59:09

Ubuntu系统复制（U盘-电脑硬盘）

所需环境电脑自带硬盘：1块 (1T) U盘1：Ubuntu系统引导盘（用于“U盘2”复制到“电脑自带硬盘”） U盘2：Ubuntu系统盘（1T，用于被复制） ！！！建议“电脑…...

编程新知 2026/2/7 17:43:28

Sklearn 机器学习缺失值处理获取填充失值的统计值

💖亲爱的技术爱好者们，热烈欢迎来到 Kant2048 的博客！我是 Thomas Kant，很开心能在CSDN上与你们相遇～💖 本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】使用 Scikit-learn 处理缺失值并提取填充统计信息的完整指南在机器学习项目中，数据清…...

编程新知 2026/1/20 10:06:51