当前位置：首页 > news >正文

深度学习 - PyTorch简介

news 2025/7/8 14:00:54

基础知识

1. PyTorch简介

PyTorch的特点和优势：
- 动态计算图、易用性、强大的社区支持、与NumPy兼容。

安装和环境配置：
安装和验证PyTorch：

pip install torch torchvision

验证安装：

import torch
print(torch.__version__)

运行结果：

1.9.0  # 具体版本可能不同

配置虚拟环境（推荐使用venv或conda）：

# 创建虚拟环境
python -m venv myenv
# 激活虚拟环境
source myenv/bin/activate  # on macOS/Linux
myenv\Scripts\activate  # on Windows

基本数据类型和张量操作：

import torch# 从列表创建张量
a = torch.tensor([1, 2, 3], dtype=torch.int32)
print(a)

运行结果：

tensor([1, 2, 3], dtype=torch.int32)

2. 张量操作

创建张量：

import torch# 创建全零张量
b = torch.zeros(2, 3)
print(b)# 创建全一张量
c = torch.ones(2, 3)
print(c)# 创建随机张量
d = torch.rand(2, 3)
print(d)# 从NumPy数组创建张量
import numpy as np
e = torch.tensor(np.array([1, 2, 3]), dtype=torch.float32)
print(e)

运行结果：

tensor([[0., 0., 0.],[0., 0., 0.]])
tensor([[1., 1., 1.],[1., 1., 1.]])
tensor([[0.4387, 0.4984, 0.5247],[0.2885, 0.3548, 0.9963]])
tensor([1., 2., 3.])

基本张量操作：

# 张量加法
f = a + torch.tensor([4, 5, 6], dtype=torch.int32)
print(f)# 张量乘法
g = b * 3
print(g)# 索引
h = d[1, 2]
print(h)# 切片
i = d[:, 1]
print(i)# 张量形状
shape = d.shape
print(shape)# 重新调整张量形状
j = d.view(3, 2)
print(j)

运行结果：

tensor([5, 7, 9], dtype=torch.int32)
tensor([[0., 0., 0.],[0., 0., 0.]])
tensor(0.9963)
tensor([0.4984, 0.3548])
torch.Size([2, 3])
tensor([[0.4387, 0.4984],[0.5247, 0.2885],[0.3548, 0.9963]])

广播机制：

a = torch.tensor([1, 2, 3])
b = torch.tensor([[1], [2], [3]])
c = a + b
print(c)

运行结果：

tensor([[2, 3, 4],[3, 4, 5],[4, 5, 6]])

GPU支持与CUDA：

# 检查GPU是否可用
if torch.cuda.is_available():device = torch.device("cuda")
else:device = torch.device("cpu")# 将张量移动到GPU
a = a.to(device)
print(a)
print(a.device)

运行结果：

tensor([1, 2, 3], device='cuda:0')  # 如果有GPU
cuda:0
# 或者
tensor([1, 2, 3])  # 如果没有GPU
cpu

常见问题及解决方案

安装问题：无法安装PyTorch。
- 解决方案：确保你使用的Python版本兼容PyTorch，并且已更新pip。尝试使用官方推荐的安装命令。
```
pip install torch torchvision
```
CUDA不可用：无法检测到GPU。
- 解决方案：检查CUDA和cuDNN的安装。确保你的PyTorch版本与CUDA版本兼容。
```
import torch
print(torch.cuda.is_available())  # 应该返回True
```
运行结果：
```
True  # 表示CUDA可用
False  # 表示CUDA不可用
```
张量形状不匹配：操作中的张量形状不匹配。
- 解决方案：使用.view()或.reshape()调整张量形状，使其匹配。
```
a = torch.rand(2, 3)
b = a.view(3, 2)
print(b)
```
运行结果：
```
tensor([[0.9500, 0.2225],[0.6182, 0.6810],[0.5123, 0.9282]])
```
内存不足：在GPU上运行大模型时，内存不足。
- 解决方案：尝试减少批量大小，或者使用分布式训练。
```
batch_size = 16  # 尝试减少批量大小
```
梯度计算问题：梯度爆炸或消失。
- 解决方案：使用梯度裁剪技术，或者尝试不同的优化器。
```
torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=2.0)
```
模型过拟合：训练误差低，但验证误差高。
- 解决方案：增加正则化（如Dropout），或者使用数据增强技术。
```
model = torch.nn.Sequential(torch.nn.Linear(784, 256),torch.nn.ReLU(),torch.nn.Dropout(0.5),torch.nn.Linear(256, 10)
)
```
训练速度慢：模型训练速度慢。
- 解决方案：确保使用了GPU，加大批量大小，或者使用混合精度训练。
```
scaler = torch.cuda.amp.GradScaler()
```
数据加载缓慢：数据加载成为瓶颈。
- 解决方案：使用多线程数据加载器，并确保数据已预处理好。
```
train_loader = torch.utils.data.DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4
)
```
张量转换问题：从NumPy到张量转换时出现问题。
- 解决方案：确保数据类型一致，并使用.astype()方法进行类型转换。
```
import numpy as np
a = np.array([1, 2, 3], dtype=np.float32)
b = torch.from_numpy(a)
print(b)
```
运行结果：
```
tensor([1., 2., 3.])
```
模型保存与加载问题：模型保存后加载失败。
- 解决方案：使用torch.save和torch.load进行模型保存和加载，确保路径正确。
```
torch.save(model.state_dict(), 'model.pth')
model.load_state_dict(torch.load('model.pth'))
```

深度学习 - PyTorch简介

基础知识 1. PyTorch简介 PyTorch的特点和优势： 动态计算图、易用性、强大的社区支持、与NumPy兼容。安装和环境配置： 安装和验证PyTorch： pip install torch torchvision验证安装： import torch print(torch.__version__)运行…...

编程日记 2024/6/4 23:25:54

MySQL：CRUD进阶(七千五百字)

文章目录前置文章：📑1. 数据库约束🌤️1.1 约束类型🌤️1.2 NULL约束🌤️1.3 Unique：唯一约束🌤️1.4 Default：默认值约束🌤️1.5 Primary key：主键约束&…...

编程日记 2024/6/4 23:24:53

与C共舞：让编译更顺滑（2）

1.6 Packed结构体默认情况下，Zig中的所有结构体字段自然对齐到@alignOf(FieldType)（ABI大小），但没有定义布局。有时，您可能希望具有不符合您的C ABI的定义布局的结构体字段。packed结构体允许您对结构体字段进行极其精确的控制，允许您逐位放置字段。在packed结构体内…...

编程日记 2024/6/4 23:23:52

一、安装 go get github.com/go-redis/redis/v8 go get gopkg.in/gomail.v2 二、使用"gopkg.in/gomail.v2"群发 package mainimport (gomail "gopkg.in/gomail.v2" )func main() {// 邮件内容m : gomail.NewMessage()m.SetHeader("From", &qu…...

编程日记 2024/6/4 23:22:51

夕小瑶：资本寒冬下的AI创业一年

几天前我和几位前大厂朋友约了个饭，朋友纷纷向我透露出一种纠结： “GPT-4o将催生一大波创业机会啊，想离职” “但是现在是资本寒冬啊” “好想像你一样勇敢啊” 说起来这两年的大厂打工人确实比较难，受经济大环境影响&#xff0…...

编程日记 2024/6/4 23:18:46

[JAVASE] 异常与 SE阶段知识点补充

目录一. 异常 1.1 什么是异常? 1.2 异常的本质 1.3 异常的分类 1.4 如何处理异常? 1.5 自定义异常 1.6 受查异常与非受查异常与 Error(重要) 二. Object类三. 内部类 2.1 什么是内部类? 2.2 内部类的分类 2.3 常用内部类的使用四. 总结一. 异常 1.1 什么是异…...

编程日记 2024/6/4 23:17:45

可视化数据科学平台在信贷领域应用系列一：数据探索

引言信贷风险数据建模是金融机构在数据量日益庞杂的时代进行信贷业务风控的关键技术。它能够帮助机构更好地控制风险、减少违约损失，并提高业务效率。通过不断优化建模方法和利用建模工具，金融机构的风险控制能力得到了显著提升。在本文中，…...

编程日记 2024/6/4 23:13:41

SpringBoot发送Gmail邮件

1. 登录Gmail Gmail网址点击右上角“小齿轮”，然后点击"查看所有设置" 点击“转发和 POP/IMAP”，按图中设置，然后点击保存： 2. 启用两步验证(https://myaccount.google.com/security) 登录上述网址，找…...

编程日记 2024/6/4 23:11:39

【小海实习日记】金融-现货以及合约理解

在股票和金融市场中，“单项持仓”和“双向持仓”是两个常见的概念，主要用于描述投资者在市场中的头寸及其策略。单项持仓（单向持仓） 单项持仓是指投资者在市场中只持有一种方向的头寸（多头或空头）&#…...

编程日记 2024/6/4 23:10:38

html 添加元素如何能提升速度

在 HTML 中，如果你需要频繁地添加大量元素，需要确保你的操作能够以最佳性能进行。以下是一些有助于提高添加元素速度的方法： 综上所述，通过使用文档片段、innerHTML、虚拟滚动以及避免频繁的重排和重绘，你可以提高在 H…...

编程日记 2024/6/4 23:08:36

人工智能大模型的进化之路：探索如何让它们变得更“聪明”

一、引言在人工智能（AI）领域，大模型凭借其强大的处理能力和广泛的应用前景，已经成为研究的热点。然而，尽管这些模型在多个领域展现出了惊人的能力，但它们仍然面临着理解力、泛化能力和适应性等方面的挑战…...

编程日记 2024/6/4 23:07:36

【设计模式深度剖析】【6】【结构型】【外观模式】| 以电脑开关按钮为例，并结合微服务架构的API网关加深理解

👈️上一篇:桥接模式 | 下一篇:享元模式👉️ 设计模式-专栏👈️ 目录外观模式（Facade Pattern）定义英文原文直译如何理解呢？字面理解代码实现中的理解生活案例：操作多功能料理机典型案例…...

编程日记 2024/6/4 23:06:34

2024拼多多最新理论+实战干货，从入门到精通全链路多角度学习-7节课

基于最新规则理论结合实际的干货课程内容： 01 2024年多多防比价新规则破局理论课与实操课.mp4 02 24年多多强付费第二节课基础内功.mp4 03 24年多多强付费第三节课直通车实操 .mp4 04 24年多多强付费第一节课市场定价格段,mp4 05 24年多多自然流第一节课市场…...

编程日记 2024/6/4 23:05:33

在Three.js中实现模型点击高亮：整合EffectComposer与OutlinePass的终极指南

效果【后期实现鼠标点击选中轮廓后给出一个弹窗显示相应的模型信息】标签指示线参考我的上一篇文章引言 Three.js不仅让WebGL的3D图形编程变得简单易懂，还通过其强大的扩展库支持丰富的后期处理效果，为3D场景增添无限魅力。本篇文章将引导您深入了…...

编程日记 2024/6/4 23:01:29

Webrtc支持HEVC之FFMPEG支持HEVC编解码(一)

一、前言 Webrtc使用的FFMPEG(webrtc\src\third_party\ffmpeg)和官方的不太一样，使用GN编译，各个平台使用了不一样的配置文件以Windows为例，Chrome浏览器也类似二、修改配置文件 windows：chromium\config\Chrome\win\x64 其他平台: chromium\config\Chrome\YOUR_SYS…...

编程日记 2024/6/4 22:59:27

高校实验室危险化学品及重大危险源安全管理系统

高校实验室危险化学品及重大危险源安全管理的重要性： 保障师生安全：通过严格管理，可以有效地降低这些风险，确保师生在实验室内的安全。确保实验教学质量：良好的危化品管理能够确保实验材料的准确性和可靠性&#xff0…...

编程日记 2024/6/4 22:58:25

【Godot4自学手册】第四十一节背包系统（一）UI设置

各位同学，好久没有更新笔记了，今天开始，我准备自学背包系统。今天先学习下UI界面设置。一、新建场景和结点 1.新建Node2D场景，命名为Inventory，保存到Scenes目录下，inventory.tscn。 2.新建TextureRect子…...

编程日记 2024/6/4 22:56:23

JS继承的方式

目录原型链继承构造函数继承组合继承寄生组合继承ES6 Class 继承原型链继承原理：通过将子类的原型（prototype）设置为父类的一个实例，使得子类实例能够沿着原型链访问到父类的属性和方法。 function Parent() {this.parentProperty...

编程日记 2024/6/4 22:55:22

拓展虚拟世界边界，云手机可以做到吗

虚拟世界，AI，VR等词汇是21世纪最为流行的词汇，在科技背后，这些词汇的影响变得越来越大，已经走进了人们的世界，比如之前APPLE发布的vision pro，使人们能够更加身临其境的体验到原生os系统&#x…...

编程日记 2024/6/4 22:53:19

网络的功能和实现方法简介

网络的功能： 计算机网络是研究怎么样在两个端用户之间提供访问通路的。所以网络的功能是为网络上的任意两个端用户之间提供访问通路。计算机通信的特点： 间歇性和突发性。即时而线路中没有信息流过，时而突来的大量数据需要迅速传输。为此计…...

编程日记 2024/6/4 22:51:17

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2025/7/6 17:08:17

Python如何给视频添加音频和字幕

在Python中，给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加，包括必要的代码示例和详细解释。环境准备在开始之前，需要安装以下Python库：…...

编程新知 2025/6/20 22:43:59

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题：docker pull 失败网络不同，需要使用镜像源按照如下步骤操作 sudo vi /etc/docker/dae…...

编程新知 2025/7/8 7:13:34

MySQL账号权限管理指南：安全创建账户与精细授权技巧

在MySQL数据库管理中，合理创建用户账号并分配精确权限是保障数据安全的核心环节。直接使用root账号进行所有操作不仅危险且难以审计操作行为。今天我们来全面解析MySQL账号创建与权限分配的专业方法。一、为何需要创建独立账号？ 最小权限原则&#xf…...

编程新知 2025/6/21 13:00:47

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍： img 属性指定分区存放的 image 名称，指定的 image 名称必须是当前工程生成的 binary 。如果 binary 有多个文件，则以 proj_name:binary_name 格式指定文件名， proj_name 为工程名&…...

编程新知 2025/7/7 16:05:18

多元隐函数偏导公式

我们来推导隐函数 z z ( x , y ) z z(x, y) zz(x,y) 的偏导公式，给定一个隐函数关系： F ( x , y , z ( x , y ) ) 0 F(x, y, z(x, y)) 0 F(x,y,z(x,y))0 🧠 目标： 求 ∂ z ∂ x \frac{\partial z}{\partial x} ∂x∂z、 …...

编程新知 2025/7/8 5:28:42

用递归算法解锁「子集」问题 —— LeetCode 78题解析

文章目录一、题目介绍二、递归思路详解：从决策树开始理解三、解法一：二叉决策树 DFS四、解法二：组合式回溯写法（推荐）五、解法对比递归算法是编程中一种非常强大且常见的思想，它能够优雅地解决很多复杂的…...

编程新知 2025/7/7 18:30:50

跨平台商品数据接口的标准化与规范化发展路径：淘宝京东拼多多的最新实践

在电商行业蓬勃发展的当下，多平台运营已成为众多商家的必然选择。然而，不同电商平台在商品数据接口方面存在差异，导致商家在跨平台运营时面临诸多挑战，如数据对接困难、运营效率低下、用户体验不一致等。跨平台商品数据接口的标准…...

编程新知 2025/7/5 15:42:25

如何把工业通信协议转换成http websocket

1.现状工业通信协议多数工作在边缘设备上，比如：PLC、IOT盒子等。上层业务系统需要根据不同的工业协议做对应开发，当设备上用的是modbus从站时，采集设备数据需要开发modbus主站；当设备上用的是西门子PN协议时&#xf…...

编程新知 2025/7/6 8:43:39

【版本控制】GitHub Desktop 入门教程与开源协作全流程解析

目录 0 引言1 GitHub Desktop 入门教程1.1 安装与基础配置1.2 核心功能使用指南仓库管理日常开发流程分支管理 2 GitHub 开源协作流程详解2.1 Fork & Pull Request 模型2.2 完整协作流程步骤步骤 1: Fork（创建个人副本）步骤 2: Clone（克隆…...

编程新知 2025/7/4 14:08:21

深度学习 - PyTorch简介

MySQL：CRUD进阶(七千五百字)

与C共舞：让编译更顺滑（2）

Go 群发邮件Redis 实现邮件群发

夕小瑶：资本寒冬下的AI创业一年

[JAVASE] 异常与 SE阶段知识点补充

可视化数据科学平台在信贷领域应用系列一：数据探索

SpringBoot发送Gmail邮件

【小海实习日记】金融-现货以及合约理解

html 添加元素如何能提升速度

人工智能大模型的进化之路：探索如何让它们变得更“聪明”

【设计模式深度剖析】【6】【结构型】【外观模式】| 以电脑开关按钮为例，并结合微服务架构的API网关加深理解

2024拼多多最新理论+实战干货，从入门到精通全链路多角度学习-7节课

在Three.js中实现模型点击高亮：整合EffectComposer与OutlinePass的终极指南

Webrtc支持HEVC之FFMPEG支持HEVC编解码(一)

高校实验室危险化学品及重大危险源安全管理系统

【Godot4自学手册】第四十一节背包系统（一）UI设置

JS继承的方式

拓展虚拟世界边界，云手机可以做到吗

网络的功能和实现方法简介

系统设计 --- MongoDB亿级数据查询优化策略

Python如何给视频添加音频和字幕

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

MySQL账号权限管理指南：安全创建账户与精细授权技巧

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

多元隐函数偏导公式

用递归算法解锁「子集」问题 —— LeetCode 78题解析

跨平台商品数据接口的标准化与规范化发展路径：淘宝京东拼多多的最新实践

如何把工业通信协议转换成http websocket

【版本控制】GitHub Desktop 入门教程与开源协作全流程解析

深度学习 - PyTorch简介

基础知识

1. PyTorch简介

2. 张量操作

常见问题及解决方案

更多问题咨询

CosAI

相关文章：