当前位置：首页 > news >正文

PyTorch 的 10 条内部用法

news 2026/2/10 23:09:10

欢迎阅读这份有关 PyTorch 原理的简明指南^[1]。无论您是初学者还是有一定经验，了解这些原则都可以让您的旅程更加顺利。让我们开始吧！

1. 张量：构建模块

PyTorch 中的张量是多维数组。它们与 NumPy 的 ndarray 类似，但可以在 GPU 上运行。

import torch

# Create a 2x3 tensor
tensor = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(tensor)

2. 动态计算图

PyTorch 使用动态计算图，这意味着该图是在执行操作时即时构建的。这为在运行时修改图形提供了灵活性。

# Define two tensors
a = torch.tensor([2.], requires_grad=True)
b = torch.tensor([3.], requires_grad=True)

# Compute result
c = a * b
c.backward()

# Gradients
print(a.grad)  # Gradient w.r.t a

3.GPU加速

PyTorch 允许在 CPU 和 GPU 之间轻松切换。利用 .to(device) 获得最佳性能。

device = "cuda" if torch.cuda.is_available() else "cpu"
tensor = tensor.to(device)

4. Autograd：自动微分

PyTorch 的 autograd 为张量上的所有操作提供自动微分。设置 require_grad=True 来跟踪计算。

x = torch.tensor([2.], requires_grad=True)
y = x**2
y.backward()
print(x.grad)  # Gradient of y w.r.t x

5. 带有 nn.Module 的模块化神经网络

PyTorch 提供 nn.Module 类来定义神经网络架构。通过子类化创建自定义层。

import torch.nn as nn

class SimpleNN(nn.Module):

    def __init__(self):
        super().__init__()
        self.fc = nn.Linear(1, 1)
        
    def forward(self, x):
        return self.fc(x)

6. 预定义层和损失函数

PyTorch 在 nn 模块中提供了各种预定义层、损失函数和优化算法。

loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

7. 数据集和DataLoader

为了高效的数据处理和批处理，PyTorch 提供了 Dataset 和 DataLoader 类。

from torch.utils.data import Dataset, DataLoader

class CustomDataset(Dataset):
    # ... (methods to define)
    
data_loader = DataLoader(dataset, batch_size=32, shuffle=True)

8.模型训练循环

通常，PyTorch 中的训练遵循以下模式：前向传递、计算损失、后向传递和参数更新。

for epoch in range(epochs):
    for data, target in data_loader:
        optimizer.zero_grad()
        output = model(data)
        loss = loss_fn(output, target)
        loss.backward()
        optimizer.step()

9. 模型序列化

使用 torch.save() 和 torch.load() 保存和加载模型。

# Save
torch.save(model.state_dict(), 'model_weights.pth')

# Load
model.load_state_dict(torch.load('model_weights.pth'))

10. Eager Execution and JIT

虽然 PyTorch 默认情况下以 eager 模式运行，但它为生产就绪模型提供即时 (JIT) 编译。

scripted_model = torch.jit.script(model)
scripted_model.save("model_jit.pt")

Reference

[1]

Source: https://medium.com/@kasperjuunge/10-principles-of-pytorch-bbe4bf0c42cd

本文由 mdnice 多平台发布

PyTorch 的 10 条内部用法

欢迎阅读这份有关 PyTorch 原理的简明指南[1]。无论您是初学者还是有一定经验，了解这些原则都可以让您的旅程更加顺利。让我们开始吧！ 1. 张量：构建模块 PyTorch 中的张量是多维数组。它们与 NumPy 的 ndarray 类似，但可以在 GPU …...

编程日记 2023/12/15 6:11:26

Django、Echarts异步请求、动态更新

前端页面 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>echarts示例</title> <script src"jquery.min.js"></script><script type "text/javascript" src "echarts.m…...

编程日记 2023/12/15 6:10:25

Mac部署Odoo环境-Odoo本地环境部署

Odoo本地环境部署安装Python安装Homebrew安装依赖brew install libxmlsec1 Python运行环境Pycharm示例配置 Mac部署Odoo环境-Odoo本地环境部署安装Python 新机，若系统没有预装Python，则安装需要版本的Python 点击查询Python官网下载安装Homebrew 一…...

编程日记 2023/12/15 6:09:24

【✅面试编程题：如何用队列实现一个栈】

✅面试编程题：如何用队列实现一个栈 💡典型回答 💡典型回答使用两个队列可以实现一个栈，一个队列用来存储栈中的元素，另一个队列用来在pop操作时暂存元素。上才艺： import java.util.LinkedList; impo…...

编程日记 2023/12/15 6:07:22

Windows本地的RabbitMQ服务怎么在Docker for Windows的容器中使用

1. 进入管理界面 windows安装过程请访问：Windows安装RabbitMQ、添加PHP的AMQP扩展浏览器访问：http://127.0.0.1:15672/ 2. 创建虚拟主机上面访问的是 RabbitMQ 的管理界面，可以在这个界面上进行一些操作，比如创建虚拟主机、…...

编程日记 2023/12/15 6:06:21

YOLOv5改进 | 2023卷积篇 | AKConv轻量级架构下的高效检测（既轻量又提点）

一、本文介绍本文给大家带来的改进内容是AKConv是一种创新的变核卷积，它旨在解决标准卷积操作中的固有缺陷（采样形状是固定的），AKConv的核心思想在于它为卷积核提供了任意数量的参数和任意采样形状，能够使用任意数量…...

编程日记 2023/12/15 6:05:21

微信小程序：模态框（弹窗）的实现

效果 wxml  <image classimg src"{{add}}" bindtapadd_mode></image>  <view class"modal" wx:if"{{showModal}}"><view class"modal-conten…...

编程日记 2023/12/15 6:04:20

uniapp交互反馈api的使用示例

官方文档链接：uni.showToast(OBJECT) | uni-app官网 1.uni.showToast({}) 显示消息提示框。常用属性： title:页面提示的内容 image：改变提示框默认的icon图标 duration：提示框在页面显示多少秒才让它消失添加了image属性后。注…...

编程日记 2023/12/15 6:02:18

XUbuntu22.04之HDMI显示器设置竖屏(一百九十八)

简介： CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！ 优质专栏：Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏：多媒…...

编程日记 2023/12/15 6:01:17

如何用 Cargo 管理 Rust 工程系列甲

以下内容为本人的学习笔记，如需要转载，请声明原文链接微信公众号「ENG八戒」https://mp.weixin.qq.com/s/ceMTUzRjDoiLwjn_KfZSrg 这几年 Rust 可谓是炙手可热的新兴编程语言了，而且被投票为最受程序员喜爱的语言。它很现代，专门…...

编程日记 2023/12/15 5:59:15

Windows下ping IP+端口的方法

有两种方法： 1. windows 开通 telnet 参考： https://zhuanlan.zhihu.com/p/570982111 2. 安装插件参考：Windows下ping IP端口的方法推荐使用第二种。...

编程日记 2023/12/15 5:58:14

【python】os.getcwd()函数详解和示例

os.getcwd() 是 Python 的一个内建函数，用于获取当前工作目录的路径。这个函数属于 os 模块，需要导入这个模块才能使用它。 import os data_rootos.path.abspath(os.path.join(os.getcwd(),"../.."))# get data root path data_root1os.path.…...

编程日记 2023/12/15 5:57:13

Linux(二十一)——virtualenv安装成功之后，依然提示未找到命令（-bash: virtualenv: 未找到命令）

Linux(二十一)——virtualenv安装成功之后，依然提示未找到命令（-bash: virtualenv: 未找到命令） 解决办法： 创建软连接 ln -s /usr/local/python3/bin/virtualenv /usr/bin/virtualenv...

编程日记 2023/12/15 5:56:12

RNN介绍及Pytorch源码解析

介绍一下RNN模型的结构以及源码，用作自己复习的材料。 RNN模型所对应的源码在：\PyTorch\Lib\site-packages\torch\nn\modules\RNN.py文件中。 RNN的模型图如下： 源码注释中写道，RNN的数学公式： 表示在时刻的隐藏状态…...

编程日记 2023/12/15 5:55:12

项目中有时需要文字描边的功能 1.基础的绘制文字使用drawtext处理 void MainWindow::paintEvent(QPaintEvent *event) {QPainter painter(this);painter.setRenderHint(QPainter::Antialiasing, true);painter.setRenderHint(QPainter::SmoothPixmapTransform, true);painte…...

编程日记 2023/12/15 5:54:11

.360勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复

导言： 在数字化时代，.360勒索病毒如影随形，威胁个人和组织的数据安全。本文将深入介绍.360病毒的特征、威胁，以及如何有效地恢复被加密的数据文件，同时提供预防措施，助您更好地保护数字资产。如不幸感染这…...

编程日记 2023/12/15 5:53:09

Nginx(四层＋七层代理)+Tomcat实现负载均衡、动静分离

一、Tomcat多实例部署具体步骤请看我之前的博客写文章-CSDN创作中心https://mp.csdn.net/mp_blog/creation/editor/134956765?spm1001.2014.3001.9457 1.1 访问测试多实例的部署 1.2 分别在三个tomcat服务上部署jsp的动态页面 mkdir /usr/local/tomcat/webapps/test vim …...

编程日记 2023/12/15 5:52:08

【前端】vscode 相关插件

一插件： 01、ESLint 用来识别并检查ECMAScript/JavaScript 代码的工具 02、Prettier 用来格式化代码，如.js、.vue、css等都可以进行格式化 03、Vetur 用来识别并高亮vue语法 04、EditorConfig 用来设置vscode的编程行为二、安装依赖 01、…...

编程日记 2023/12/15 5:51:07

【MySQL】MySQL库的增删查改

文章目录 1.库的操作1.1创建数据库1.2创建数据库案例 2.字符集和校验规则2.1查看系统默认字符集以及校验规则2.2查看数据库支持的字符集2.3查看数据库支持的字符集校验规则2.4校验规则对数据库的影响 3.操纵数据库3.1查看数据库3.2显示创建语句3.3修改数据库3.4数据库删除3.5备…...

编程日记 2023/12/15 5:50:06

基于基于深度学习的表情识别人脸打分系统

1.研究背景与意义项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义随着人工智能技术的快速发展，深度学习在计算机视觉领域取得了巨大的突破。表情识别是计算机视觉领域的一个重要研究方向，它可以通过分析人…...

编程日记 2023/12/15 5:49:06

谷歌浏览器插件

项目中有时候会用到插件 sync-cookie-extension1.0.0：开发环境同步测试 cookie 至 localhost，便于本地请求服务携带 cookie 参考地址：https://juejin.cn/post/7139354571712757767 里面有源码下载下来，加在到扩展即可使用FeHelp…...

编程新知 2025/8/16 3:55:30

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2026/1/24 10:07:40

Cinnamon修改面板小工具图标

Cinnamon开始菜单-CSDN博客设置模块都是做好的，比GNOME简单得多！ 在 applet.js 里增加 const Settings imports.ui.settings;this.settings new Settings.AppletSettings(this, HTYMenusonichy, instance_id); this.settings.bind(menu-icon, menu…...

编程新知 2026/1/31 14:56:22

多模态大语言模型arxiv论文略读（108）

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题：CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者：Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

编程新知 2026/2/1 6:11:51

云原生玩法三问：构建自定义开发环境

云原生玩法三问：构建自定义开发环境引言临时运维一个古董项目，无文档，无环境，无交接人，俗称三无。运行设备的环境老，本地环境版本高，ssh不过去。正好最近对腾讯出品的云原生 cnb 感兴趣&…...

编程新知 2026/2/2 9:25:26

《C++ 模板》

目录函数模板类模板非类型模板参数模板特化函数模板特化类模板的特化模板，就像一个模具，里面可以将不同类型的材料做成一个形状，其分为函数模板和类模板。函数模板函数模板可以简化函数重载的代码。格式：templa…...

编程新知 2025/6/11 3:20:47

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

在Vuzix M400 AR智能眼镜的助力下，卢森堡罗伯特舒曼医院（the Robert Schuman Hospitals, HRS）凭借在无菌制剂生产流程中引入增强现实技术（AR）创新项目，荣获了2024年6月7日由卢森堡医院药剂师协会&#xff0…...

编程新知 2026/2/9 2:41:28

PAN/FPN

import torch import torch.nn as nn import torch.nn.functional as F import mathclass LowResQueryHighResKVAttention(nn.Module):"""方案 1: 低分辨率特征 (Query) 查询高分辨率特征 (Key, Value).输出分辨率与低分辨率输入相同。"""def __…...

编程新知 2025/10/20 4:39:36