当前位置：首页 > news >正文

32- PyTorch基础 (PyTorch系列) (深度学习)

news 2026/2/10 12:08:07

知识要点

PyTorch可以说是现阶段主流的深度学习框架 .

1 PyTorch入门

1.1 PyTorch概述

Torch是什么？一个火炬！其实跟Tensorflow中Tensor是一个意思，可以当做是能在GPU中计算的矩阵.，也可以当做是ndarray的GPU版！

PyTorch可以说是现阶段主流的深度学习框架了，武林盟主之争大概是这个历史。15年底之前Caffe是老大哥，随着Tensorflow的诞生，霸占江湖数载，19年起无论从学术界还是工程界PyTorch已经霸占了半壁江山！

1.2 PyTorch安装

打开PyTorch 官网, 根据官网的安装提示选择符合自己情况的选项, 生成安装语句, 拷贝安装语句进行安装.

2. PyTorch张量

Pytorch最基本的操作对象是Tensor（张量），它表示一个多维矩阵.

张量类似于NumPy的ndarrays，张量可以在GPU上使用以加速计算。

2.1 张量与数据类型

import torch
import numpy as np
import pandas as pd

创建tensor: 可以直接使用python列表或者ndarray创建tensor

x = torch.tensor([6, 2])
x = torch.tensor(np.array([1, 2, 3]))

与ndarray类似, pytorch也有很多快捷的方法用来创建张量.

import torch# 创建一个[0, 1)之间的随机均匀分布
x = torch.rand(2, 3)
print(x)# 创建一个标准正态分布
x = torch.randn(2, 3)
print(x)# 创建全是0的tensor
x = torch.zeros(2, 3)
print(x)# 创建全是1的tensor
x = torch.ones(2, 3)
print(x)

类似的可以通过shape或size获取tensor的形状, size可以具体制定获取哪一个维度的形状大小:

x = torch.ones(2, 3, 4)
x.shape
# 输出 torch.Size([2, 3, 4])
x.size()
# 输出 torch.Size([2, 3, 4])
x.size(0)
# 输出 2

2.2 Tensor基本数据类型

pytorch中的tensor有以下基本数据类型

32位浮点型： torch.float32
64位浮点型： torch.float64
32位整型： torch.int32
16位整型： torch.int16
64位整型： torch.int64

我们可以在创建tensor的时候通过dtype指定数据类型:

x = torch.tensor([6, 2], dtype=torch.float32)# 通过.type转换数据类型
x.type(torch.int64)    # tensor([6, 2])

2.3 与ndarray数据类型的转换

ndarray可以和tensor进行转换

import numpy as np# 标准正太分布
a = np.random.randn(2, 3)
# 通过from_numpy可以把ndarray转化为tensor
x1 = torch.from_numpy(a)
# tensor通过numpy也可以转化为ndarray
x1.numpy()
'''array([[ 0.00346987,  0.49298463,  0.8929266 ],[-1.21628393, -0.93081964, -0.16680752]])'''

2.4 张量运算

tensor的运算规则和numpy的运算规则很类似:

import numpy as npa = np.random.randn(2, 3)
# 通过from_numpy可以把ndarray转化为tensor
x1 = torch.from_numpy(a)
x = torch.ones(2, 3)# 和单个数字运算, tensor中每个元素分别和这个数字运算
x + 3
'''输出:tensor([[4., 4., 4.],[4., 4., 4.]], dtype=torch.float64)'''# 两个形状相同的tensor进行运算, 对应位置元素分别运算.
x + x1# 也可以调用pytorch的运算方法, 结果是一样的
x.add(x1)# 加了下划线表示对x本来的值进行修改
x.add_(x1)# 改变tensor的形状, 使用.view, 相当于numpy中的reshape
x.view(3, 2)
x.view(-1, 1)
print(x)
'''tensor([[-0.7429,  0.5438, -0.0259],[ 0.8848, -0.0550,  2.7443]])'''# 单个元素的张量使用.item()转化为python数据
x = x.mean()   # tensor(0.5582)
x.item()    # 0.5581828951835632

2.5 张量的自动微分

将Torch.Tensor属性 .requires_grad 设置为True，

pytorch将开始跟踪对此张量的所有操作。

完成计算后，可以调用 .backward() 并自动计算所有梯度。

该张量的梯度将累加到.grad属性中。

x = torch.ones(2, 2, requires_grad=True)
x.requires_grad    # 输出 True# 进行张量运算
y = x + 2# y是由于运算而创建的，因此具有grad_fn属性
print(y.grad_fn)
# 输出: <AddBackward0 object at 0x00000096768B1708># 进行更多操作
z = y * y * 3
out = z.mean()print(z, out)
# 输出
#tensor([[27., 27.],#[27., 27.]], grad_fn=<MulBackward0>) tensor(27., grad_fn=<MeanBackward0>)

2.6 计算梯度

out.backward()    # 自动微分运算, 注意 out 是标量值
# 打印梯度 d（out）/ dx out = f(x)
print(x.grad)
# tensor([[4.5000, 4.5000],# [4.5000, 4.5000]])

当张量的 requires_grad 属性为 True 时，

pytorch会一直跟踪记录此张量的运算

当不需要跟踪计算时，可以通过将代码块包装在 with torch.no_grad(): 上下文中

print(x.requires_grad)    # True
print((x ** 2).requires_grad)    # Truewith torch.no_grad():print((x ** 2).requires_grad)    # False

也可使用 .detach() 来获得具有相同内容但不需要跟踪运算的新Tensor ：

print(x.requires_grad)    # True
y = x.detach()
print(y.requires_grad)    # False

使用 requires_grad_ 就地改变张量此属性:

a = torch.randn(2, 2)
a = a*3 + 2
print(a.requires_grad)
# 输出 False
a.requires_grad_(True)
print(a.requires_grad)
# 输出True

32- PyTorch基础 (PyTorch系列) (深度学习)

知识要点 PyTorch可以说是现阶段主流的深度学习框架 . 1 PyTorch入门 1.1 PyTorch概述 Torch是什么？一个火炬！其实跟Tensorflow中Tensor是一个意思，可以当做是能在GPU中计算的矩阵.，也可以当做是ndarray的GPU版！ PyT…...

编程日记 2023/5/13 2:26:35

用gdb.attach()在gdb下断点但没停下的情况及解决办法

在python中，如果导入了pwntools，就可以使用里面的gdb.attach(io)的命令来下断点。但是这一次鼠鼠遇到了一个情况就是下了断点，但是仍然无法在断点处开始运行，奇奇怪怪。这是我的攻击脚本我们运行一下。可以看到其实已经运行起…...

编程日记 2023/5/13 2:26:33

Linux入门篇-作业（jobs）调度（本质仍然是进程）

简介之所以叫做作业调度，作业是以shell为单位的，一个shell建立的作业，不会被另外一个shell看到（包括root），但是仍然可以看到作业对应的进程。①前台进程（front process） 运行在用户…...

编程日记 2023/5/13 2:26:31

vue 监听取消监听

vue 的 watch 除了可以使用声明式的配置项以外，还可以通过命令式 this.$watch 方法。如下是我们比较少用的命令式（想要初始只监听一次，必须命令式写法）： 监听只运行一次声明式 export default{data: {showType: fa…...

编程日记 2023/5/13 2:26:28

0103深度优先搜索和单点连通-无向图-数据结构和算法(Java)

文章目录1.1 走迷宫1.2 图的深度优先搜索实现1.3 算法分析及性能1. 4 单点连通性后记1.1 走迷宫简单的迷宫，如下图1.1-1所示： 探索迷宫而不迷路，我们需要： 选择一条没有标记过的通道，在你走过的路上铺一条绳子&…...

编程日记 2023/5/13 2:26:25

进销存管理系统

技术：Java等摘要：进销存管理系统是为了实现企业仓库商品管理的系统化、规范化和自动化，从而提高企业管理效率而设计开发的管理信息系统。它完全取代了过去一直用人工管理的工作方式，避免了由于管理人员手工操作上的疏忽以及管理质…...

编程日记 2023/5/13 2:26:23

Sonar：VSCode配置SonarLint/SonarLint连接SonarQube

需求描述公司为项目代码配置了Sonar检测，希望在VSCode中开发项目时能够同步检测结果。注意事项 SonarQube版本必须为7.9，否则SonarLint无法连接（GitHub-SonarLint-Wiki第一行就有说明）！！！S…...

编程日记 2023/5/13 2:26:21

陀螺仪小车（Forerake-Car）

项目简介：搭建一辆有arduino UNO 与rnf24l01组成的小车；手部安装由arduino nano开发板、nrf24l01、imu构成的手势控制器，利用手势控制器检测手部状态、发送信号对小车进行前进，实现基于卡尔曼滤波的MPU6050姿态结算。准备工作&am…...

编程日记 2023/5/13 2:26:18

Leetcode Day5 含有重复元素集合的组合+

1、含有重复元素集合的组合给定一个可能有重复数字的整数数组 candidates 和一个目标数 target ，找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的每个数字在每个组合中只能使用一次，解集不能包含重复的组合。【题目传送门】思…...

编程日记 2023/5/13 2:26:16

Mac Book pro（M1）使用总结

1、拿到电脑激活的时候，一定要记住账号密码及安全问题的答案。 2、显示隐藏文件夹： 3、显示.git或者gitignore等隐藏后缀的文件： 打开终端 defaults write com.apple.finder AppleShowAllFiles TRUE重启Finder在终端输入 killall Finder …...

编程日记 2023/5/13 2:26:14

QML集成JavaScript

在QML中可以使用现有的QML元素来创建页面，但QML紧密的集成了必要的JavaScript。但QML中使用JavaScript比较严格，在QML中不可以添加或修改JavaScript全局对象成员，这样可能会使用一个未经声明的变量。内联JavaScript 一些小型的JavaScript函…...

编程日记 2023/5/13 2:26:12

学习周报3.5

文章目录前言文献阅读摘要介绍方法总结相关性总结前言本周阅读文献《Multi-step ahead probabilistic forecasting of multiple hydrological》，文献主要提出一种基于三维卷积神经网络、卷积最小门记忆神经网络和变分贝叶斯神经网络的混合深度学习模型&#xff08…...

编程日记 2023/5/13 2:26:09

java基础学习篇

java学习多写（代码、笔记、文章），多练（交流、思维、技能），多分享，多提问、多思考什么是计算机由硬件和软件组成，广泛应用在科学计算、数据处理、自动控制，计算机辅…...

编程日记 2023/5/13 2:26:06

Go 语言基础语法及应用实践

Go语言是一门由Google开发的静态类型、编译型的开源编程语言，被设计成简单、高效、安全的语言。作为一门相对年轻的语言，Go语言的使用范围正在不断扩大，特别是在Web开发、云计算、容器化和分布式系统等领域越来越受到欢迎。在本篇文章中，我们将探讨Go语言的基础语法及应用…...

编程日记 2023/5/13 2:26:04

C语言自定义类型---进阶

之前的文章中有结构体初阶知识的讲解，对结构体不是很了解的小伙伴可以先去去看一下结构体初阶结构体，枚举，联合结构体结构体类型的声明特殊的声明结构的自引用结构体变量的定义和初始化结构体内存对齐 <3 <3 <3(重点)那为什么存在内…...

编程日记 2023/5/13 2:26:02

85.链表总结

链表总结链表总结与进阶抽象数据类型（ADT abstract data type）与抽象数据接口（ADI abstract data Interface） 链表实际上就是对于结构体、结构体指针和结构体内可以包含指向同类型的结构体指针不可以包含指向同类型的结构体的应…...

编程日记 2023/5/13 2:26:00

【博学谷学习记录】超强总结，用心分享|狂野大数据课程【DataFrame的相关API】的总结分析

操作dataFrame一般有二种操作的方式, 一种为SQL方式, 另一种为DSL方式 SQL方式: 通过编写SQL语句完成统计分析操作DSL方式: 领域特定语言指的通过DF的特有API完成计算操作(通过代码形式)从使用角度来说: SQL可能更加的方便一些, 当适应了DSL写法后, 你会发现DSL要比SQL更加…...

编程日记 2023/5/13 2:25:57

粒子群优化最小二乘支持向量机SVM回归分析，pso-lssvm回归预测

目录支持向量机SVM的详细原理 SVM的定义 SVM理论 SVM应用实例，粒子群优化最小二乘支持向量机SVM回归分析代码结果分析展望支持向量机SVM的详细原理 SVM的定义支持向量机（support vector machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大…...

编程日记 2023/5/13 2:25:55

lavis多模态开源框架学习--安装

安装lavis安装lavis测试安装问题过程中的其他操作安装lavis 因为lavis已经发布在pypi中，所以可以直接利用pip安装 pip install salesforce-lavis测试安装 from lavis.models import model_zoo print(model_zoo) # # Architectures Types # # …...

编程日记 2023/5/13 2:25:53

【IDEA】如何在Tomcat上创建部署第一个Web项目？

看了网上很多教程，发现或多或都缺失了一些关键步骤信息，对于新手小白很不友好，那么今天就教大家如何在Tomcat服务器（本地）上部署我们的第一个Web项目： 共分为三个部分： 1. IDEA创建Web项目&am…...

编程日记 2023/5/13 2:25:50

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

连锁超市冷库节能解决方案：如何实现超市降本增效

在连锁超市冷库运营中，高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术，实现年省电费15%-60%，且不改动原有装备、安装快捷、…...

编程新知 2025/11/30 16:55:29

均衡后的SNRSINR

本文主要摘自参考文献中的前两篇，相关文献中经常会出现MIMO检测后的SINR不过一直没有找到相关数学推到过程，其中文献[1]中给出了相关原理在此仅做记录。 1. 系统模型复信道模型 n t n_t nt 根发送天线， n r n_r nr 根接收天线的 MIMO 系…...

编程新知 2026/1/30 4:47:24

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2026/2/2 18:33:19

GitFlow 工作模式（详解）

今天再学项目的过程中遇到使用gitflow模式管理代码，因此进行学习并且发布关于gitflow的一些思考 Git与GitFlow模式我们在写代码的时候通常会进行网上保存，无论是github还是gittee，都是一种基于git去保存代码的形式，这样保存代码…...

编程新知 2026/1/26 12:37:40

C# 表达式和运算符(求值顺序)

求值顺序表达式可以由许多嵌套的子表达式构成。子表达式的求值顺序可以使表达式的最终值发生变化。例如，已知表达式3*52，依照子表达式的求值顺序，有两种可能的结果，如图9-3所示。如果乘法先执行，结果是17。如果5…...

编程新知 2026/1/31 13:13:28

【LeetCode】3309. 连接二进制表示可形成的最大数值（递归|回溯|位运算）

LeetCode 3309. 连接二进制表示可形成的最大数值（中等） 题目描述解题思路Java代码题目描述题目链接：LeetCode 3309. 连接二进制表示可形成的最大数值（中等） 给你一个长度为 3 的整数数组 nums。现以某种顺序连接…...

编程新知 2025/7/5 18:01:05

MySQL的pymysql操作

本章是MySQL的最后一章，MySQL到此完结，下一站Hadoop！！！ 这章很简单，完整代码在最后，详细讲解之前python课程里面也有，感兴趣的可以往前找一下一、查询操作我们需要打开pycharm …...

编程新知 2026/1/20 12:20:43

书籍“之“字形打印矩阵(8)0609

题目给定一个矩阵matrix，按照"之"字形的方式打印这个矩阵，例如： 1 2 3 4 5 6 7 8 9 10 11 12 ”之“字形打印的结果为：1，…...

编程新知 2025/12/6 11:14:42

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究

摘要：在消费市场竞争日益激烈的当下，传统体验营销方式存在诸多局限。本文聚焦开源AI智能名片链动2 1模式S2B2C商城小程序，探讨其在沉浸式体验营销中的应用。通过对比传统品鉴、工厂参观等初级体验方式，分析沉浸式体验的优势与价值…...

编程新知 2026/2/2 21:52:42