当前位置：首页 > news >正文

PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控

news 2026/2/10 0:54:57

一、简介

在现代深度学习的研究和开发中，模型的可视化和监控是不可或缺的一部分。PyTorch，作为一个流行的深度学习框架，通过其丰富的生态系统提供了多种工具来满足这一需求。其中，torch.utils.tensorboard 是一个强大的接口，它使得 PyTorch 用户能够轻松地将训练过程中的各种数据记录到 TensorBoard 中，进而实现数据的可视化和分析。TensorBoard 本身是一个独立的工具，最初由 TensorFlow 开发，但 PyTorch 通过 torch.utils.tensorboard 模块实现了与 TensorBoard 的无缝集成。这使得 PyTorch 用户能够享受到 TensorBoard 提供的强大可视化功能，而无需切换到 TensorFlow 框架。本文将详细介绍 torch.utils.tensorboard 的使用，包括其背景、核心功能、安装与配置、以及详细的示例代码，旨在帮助读者全面掌握这一工具。

二、安装与配置

在开始使用 torch.utils.tensorboard 之前，需要确保已经安装了 TensorBoard。可以使用以下命令通过 pip 安装：

pip install tensorboard

此外，还需要安装 PyTorch。如果你还没有安装 PyTorch，可以根据官方网站的指南进行安装。
安装完成后，你可以通过以下命令启动 TensorBoard 服务器：

tensorboard --logdir=path_to_log_directory

其中 path_to_log_directory 是你希望 TensorBoard 读取日志文件的目录路径。在浏览器中访问 http://localhost:6006，即可查看 TensorBoard 的可视化界面。

三、核心功能

3.1 记录标量（Scalars）

标量是训练过程中最常见的监控指标，如损失（loss）、准确率（accuracy）等。使用 add_scalar 方法可以记录单个标量值，而 add_scalars 方法则可以同时记录多个标量值。

1. 编写测试代码

import torch
from torch.utils.tensorboard import SummaryWriter
# 初始化 SummaryWriter
writer = SummaryWriter('runs/scalar_example')for epoch in range(100):# 模拟训练过程中的损失值loss = torch.randn(1).item()# 记录损失值到 TensorBoardwriter.add_scalar('Loss/train', loss, epoch)
# 关闭 SummaryWriter
writer.close()

在上述代码中，我们创建了一个 SummaryWriter 实例，并指定了日志文件的存储目录为 runs/scalar_example。然后，我们在一个模拟的训练循环中，每个 epoch 记录一次损失值。最后，关闭 SummaryWriter 以释放资源。

2. 在conda环境中，启动tensorboard
我的工程目录在：
E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控\project

#进入共目录
(yolov11) C:\Users\Administrator>E:
(yolov11) E:\>cd E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控\project
#启动tensorboard
(yolov11) E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模 型的可视化和训练过程监控\project>tensorboard --logdir=runs\scalar_example

3. 在浏览器中打开http://localhost:6006
在这里插入图片描述

4.点击scalar图标
在这里插入图片描述

3.2 记录直方图（Histograms）

直方图用于可视化模型参数的分布，如权重和偏置的直方图。这有助于理解模型在训练过程中的变化，以及检测潜在的异常值。

示例代码

import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter# 定义一个简单的神经网络
class SimpleNet(nn.Module):def __init__(self):super(SimpleNet, self).__init__()self.fc = nn.Linear(10, 1)def forward(self, x):return self.fc(x)# 初始化网络和 SummaryWriter
model = SimpleNet()
writer = SummaryWriter('runs/histogram_example')# 模拟一个训练步骤
for epoch in range(10):# 获取网络参数的梯度for name, param in model.named_parameters():writer.add_histogram(name, param.detach().cpu().numpy(), epoch)writer.add_histogram(f'{name}.grad', param.grad.detach().cpu().numpy(), epoch)# 关闭 SummaryWriter
writer.close()

在这个例子中，我们定义了一个简单的全连接网络，并在每个 epoch 记录网络参数的直方图以及梯度的直方图。按照上文的方式启动tensorboard，在浏览器中访问，即可查看。
在这里插入图片描述

3.3 记录图像（Images）

图像是另一种重要的可视化手段，特别是在处理图像数据或需要可视化特征图时。add_image 方法用于记录单个图像，而 add_images 方法则可以记录一个图像批次。

示例代码

import torch
import torchvision.utils as vutils
from torch.utils.tensorboard import SummaryWriter# 初始化 SummaryWriter
writer = SummaryWriter('runs/image_example')# 创建一个随机的图像批次
img_batch = torch.randn(16, 3, 64, 64)# 使用 torchvision.utils.make_grid 将图像批次转换为网格形式
img_grid = vutils.make_grid(img_batch, nrow=4, normalize=True, scale_each=True)# 记录图像到 TensorBoard
writer.add_image('ImageGrid', img_grid)# 关闭 SummaryWriter
writer.close()

在这个例子中，我们创建了一个随机的图像批次，并使用 make_grid 函数将其转换为网格形式，然后记录到 TensorBoard 中。
在这里插入图片描述

3.4 记录文本（Text）

有时候，我们可能需要在 TensorBoard 中记录一些文本信息，如模型配置、超参数或日志消息。add_text 方法正是为此设计的。

示例代码

from torch.utils.tensorboard import SummaryWriter# 初始化 SummaryWriter
writer = SummaryWriter('runs/text_example')# 记录文本信息到 TensorBoard
writer.add_text('Configuration', 'Learning Rate: 0.01, Batch Size: 32', 0)
writer.add_text('Log', 'Epoch 1: Loss=0.5, Accuracy=80%', 1)# 关闭 SummaryWriter
writer.close()

在这个例子中，我们使用 add_text 方法记录了一些简单的文本信息。
在这里插入图片描述

3.5 记录模型图结构（Graph）

了解模型的计算图结构对于调试和优化模型至关重要。add_graph 方法允许我们记录模型的前向传播图。

示例代码

import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter# 定义一个简单的神经网络
class SimpleNet(nn.Module):def __init__(self):super(SimpleNet, self).__init__()self.fc1 = nn.Linear(10, 5)self.relu = nn.ReLU()self.fc2 = nn.Linear(5, 2)def forward(self, x):x = self.fc1(x)x = self.relu(x)x = self.fc2(x)return x# 初始化模型和 SummaryWriter
model = SimpleNet()
writer = SummaryWriter('runs/graph_example')# 创建一个随机输入张量
input_tensor = torch.randn(1, 10)# 记录模型图结构到 TensorBoard
writer.add_graph(model, input_tensor)# 关闭 SummaryWriter
writer.close()

在这个例子中，我们定义了一个包含两个全连接层和一个 ReLU 激活函数的简单网络，并使用 add_graph 方法记录了其计算图结构。
在这里插入图片描述

4、注意事项

安装和配置：你需要确保已经安装了 torch 和 tensorboard。虽然 torch.utils.tensorboard 是 PyTorch 的一部分，但 tensorboard 需要单独安装，用于可视化数据。
初始化 SummaryWriter:在开始记录数据之前，你需要初始化一个 SummaryWriter 对象，指定一个日志目录（log_dir）。这个目录将用于存储所有记录的数据。
记录数据的位置：应该在训练循环中适当的位置记录数据。例如，在每次迭代或每个 epoch 结束时记录损失值、梯度等。
关闭 SummaryWriter:在训练结束后，确保调用 SummaryWriter 的 close() 方法来关闭它，并确保所有数据都已写入日志文件。
日志目录的唯一性：为了避免新日志覆盖旧的日志文件，确保每次运行训练时日志目录是唯一的。可以使用时间戳或其他唯一标识符来命名日志目录。

5、小结

torch.utils.tensorboard 是一个功能强大的工具，它能够帮助开发者在训练深度学习模型时高效地记录和可视化各种关键数据。然而，要想熟练掌握这个工具，并不是一蹴而就的。这需要开发者在实际项目中多使用 torch.utils.tensorboard，通过不断的实践来熟悉它的各种功能和用法。同时，多阅读相关的官方文档也是非常重要的。官方文档通常提供了详尽的功能介绍、使用指南以及常见问题解答，能够帮助开发者更好地理解和运用 torch.utils.tensorboard。此外，研究和分析示例源码也是提升熟练度的有效途径。通过查看和模仿优秀的示例源码，开发者可以学习到如何将 torch.utils.tensorboard 应用于实际项目中，并借鉴其中的最佳实践和技巧。因此，要想熟练掌握 torch.utils.tensorboard，开发者应该注重实践、阅读和源码分析，不断提升自己的技能水平。

PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控

一、简介在现代深度学习的研究和开发中，模型的可视化和监控是不可或缺的一部分。PyTorch，作为一个流行的深度学习框架，通过其丰富的生态系统提供了多种工具来满足这一需求。其中，torch.utils.tensorboard 是一个强大的接口&…...

编程日记 2025/1/21 9:52:17

服务器日志自动上传到阿里云OSS备份

背景公司服务器磁盘空间有限，只能存近15天日志，但是有时需要查看几个月前的日志，需要将服务器日志定时备份到某个地方，需要查询的时候有地方可查。针对这个问题，想到3个解决方法： 1、买一个配置比较低…...

编程日记 2025/1/21 9:50:14

树莓派学习

飞书：https://hi06pny1nlj.feishu.cn/docx/GYsMdth7ooNlbJx8zBDcdbcPnec?fromfrom_copylink csdn：https://blog.csdn.net/qq_41685627/article/details/145250576 基础工作安装和部署 1.1 树莓派三种连接电脑的方式 https://blog.csdn.net/weixin…...

编程日记 2025/1/21 9:48:12

NestJS中实现注入多个实现了同一个接口的Service

在NestJS中有一种场景，在注入的时候需要将多个实现了同一个接口的service都注入到系统里，而NestJS中默认时没有这种注入，此时我们可以使用一个变通的provider来实现这一功能。看下面例子，假定我们有一个OSService接口&#xff0…...

编程日记 2025/1/21 9:47:10

Qt按钮美化教程

前言 Qt按钮美化主要有三种方式：QSS、属性和自绘 QSS 字体大小 font-size: 18px;文字颜色 color: white;背景颜色 background-color: rgb(10,88,163); 按钮边框 border: 2px solid rgb(114,188,51);文字对齐 text-align: left;左侧内边距 padding-left: 10…...

编程日记 2025/1/21 9:45:07

基于单片机的多功能蓝牙语音智能台灯（论文+源码）

1总体方案设计通过需求分析，本设计多功能蓝牙语音智能台灯的系统框图如图2.1所示，系统架构包括主控制器STM32F103单片机、HC-06蓝牙通信模块、LU-ASR01语音识别模块、OLED液晶、LED灯、按键等器件，在使用时用户可以通过手机APP、语音识别、…...

编程日记 2025/1/21 9:42:58

第15章：Python TDD应对货币类开发变化（二）

写在前面这本书是我们老板推荐过的，我在《价值心法》的推荐书单里也看到了它。用了一段时间 Cursor 软件后，我突然思考，对于测试开发工程师来说，什么才更有价值呢？如何让 AI 工具更好地辅助自己写代码，或许…...

编程日记 2025/1/21 9:41:55

算法随笔_13: 有效三角形的个数

上一篇:算法随笔_12:最短无序子数组-CSDN博客题目描述如下: 给定一个包含非负整数的数组 nums ，返回其中可以组成三角形三条边的三元组个数。示例 1: 输入: nums [2,2,3,4] 输出: 3 解释:有效的组合是: 2,3,4 (使用第一个 2) 2,3,4 (使用第二个 2) 2,2,3 算法…...

编程日记 2025/1/21 9:36:48

WSL 2 自动更新虚拟 IP 到 window hosts

window下的wsl2 开发中使用到域名映射，但是WSL2 每次启动都会被分配一个虚拟的 ip 地址，每次启动虚拟ip 都不一样，导致要频繁更改 window 的 hosts 文件，太麻烦了，所以写一个自动执行的 .sh 脚本，每次启动…...

编程日记 2025/1/21 9:29:41

我在广州学Mysql 系列——触发器的使用

ℹ️大家好，我是练小杰，这周是春节前的最后一周了，现在一双手数都能数得过来了！！ 本播客将学习MYSQL中触发器的相关概念以及基础命令~~ 回顾：👉【MYSQL视图相关例题】数据库专栏👉【…...

编程日记 2025/1/21 9:28:34

【useCallback Hook】在多次渲染中缓存组件中的函数，避免重复创建函数

文章目录什么是 useCallback？基本语法为什么需要 useCallback？示例1. 避免子组件重复创建函数2. 作为 useEffect 的依赖项注意事项总结在 React 开发中，性能优化是一个重要的主题。随着应用规模的增长，组件的重新渲染可能会变…...

编程日记 2025/1/21 9:26:29

2025/1/20 学习Vue的第三天

玩性太大了玩得也不开心，天天看电视刷视频。内心实在空洞。最近天天看小红书上的外国人，结实外国友人（狗头）哈哈哈认识了不少人，有埃及的有美国的，还有天天看菲利普吃糖葫芦哈哈哈哈哈一个阳光的德国大男…...

编程日记 2025/1/21 9:23:25

Kotlin Bytedeco OpenCV 图像图像49 仿射变换图像裁剪

Kotlin Bytedeco OpenCV 图像图像49 仿射变换图像裁剪 1 添加依赖2 测试代码3 测试结果在OpenCV中，仿射变换（Affine Transformation）和透视变换（Perspective Transformation）是两种常用的图像几何变换方法。变换方…...

编程日记 2025/1/21 9:18:21

金融项目实战 07|Python实现接口自动化——连接数据库和数据清洗、测试报告、持续集成

目录一、投资模块（投资接口投资业务） 二、连接数据库封装和清洗数据 1、连接数据库 2、数据清洗 4、调用三、批量执行测试用例并生成测试报告四、持续集成 1、代码上传gitee 2、Jenkin持续集成一、投资模块（投资接口投资业务…...

编程日记 2025/1/21 9:15:11

（快速入门）保姆级详细的 Midjourney 基础教程

一、前言篇 1. 1. AI 绘图是什么？ AI 绘画，顾名思义就是利用人工智能进行绘画，是人工智能生成内容（AIGC）的一个应用场景。其主要原理简单来说就是收集大量已有作品数据，通过算法对它们进行解析，最后再生成新作品，而算法也便是 AI 绘画的核心，是它得以爆火的基础…...

编程日记 2025/1/21 9:13:06

leetcode——找到字符串中所有字母异位词（java）

给定两个字符串 s 和 p，找到 s 中所有 p 的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。示例 1: 输入: s "cbaebabacd", p "abc" 输出: [0,6] 解释: 起始索引等于 0 的子串是 "cba", 它是 "…...

编程日记 2025/1/21 9:09:00

大文件上传服务-后端V1V2

文章目录大文件上传概述:minio分布式文件存储使用的一些技术校验MD5的逻辑 uploadV1 版本 1uploadv2 版本 2 大文件上传概述: 之前项目做了一个文件上传的功能,最近看到有面试会具体的问这个上传功能的细节，把之前做的项目拿过来总结一下，自己写的一个…...

编程日记 2025/1/21 9:07:56

Single-Model and Any-Modality for Video Object Tracking——2024——cvpr-阅读笔记

Single-Model and Any-Modality for Video Object Tracking 摘要相关工作创新处MethodShared embeddingModal promptingRGB Tracker based on TransformerOverall ExperiimentDatasetRGB-D samples are sourced from DepthTrackRGB-T samples are extracted from LasHeRRGB-E s…...

编程日记 2025/1/21 9:05:53

一、简介

二、安装与配置

三、核心功能

3.1 记录标量（Scalars）

3.2 记录直方图（Histograms）

3.3 记录图像（Images）

3.4 记录文本（Text）

3.5 记录模型图结构（Graph）

4、注意事项

5、小结

相关文章：