当前位置: 首页 > news >正文

PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控

一、简介

在现代深度学习的研究和开发中,模型的可视化和监控是不可或缺的一部分。PyTorch,作为一个流行的深度学习框架,通过其丰富的生态系统提供了多种工具来满足这一需求。其中,torch.utils.tensorboard 是一个强大的接口,它使得 PyTorch 用户能够轻松地将训练过程中的各种数据记录到 TensorBoard 中,进而实现数据的可视化和分析。TensorBoard 本身是一个独立的工具,最初由 TensorFlow 开发,但 PyTorch 通过 torch.utils.tensorboard 模块实现了与 TensorBoard 的无缝集成。这使得 PyTorch 用户能够享受到 TensorBoard 提供的强大可视化功能,而无需切换到 TensorFlow 框架。本文将详细介绍 torch.utils.tensorboard 的使用,包括其背景、核心功能、安装与配置、以及详细的示例代码,旨在帮助读者全面掌握这一工具。

二、安装与配置

在开始使用 torch.utils.tensorboard 之前,需要确保已经安装了 TensorBoard。可以使用以下命令通过 pip 安装:

pip install tensorboard

此外,还需要安装 PyTorch。如果你还没有安装 PyTorch,可以根据官方网站的指南进行安装。
安装完成后,你可以通过以下命令启动 TensorBoard 服务器:

tensorboard --logdir=path_to_log_directory

其中 path_to_log_directory 是你希望 TensorBoard 读取日志文件的目录路径。在浏览器中访问 http://localhost:6006,即可查看 TensorBoard 的可视化界面。

三、核心功能

3.1 记录标量(Scalars)

标量是训练过程中最常见的监控指标,如损失(loss)、准确率(accuracy)等。使用 add_scalar 方法可以记录单个标量值,而 add_scalars 方法则可以同时记录多个标量值。

1. 编写测试代码

import torch
from torch.utils.tensorboard import SummaryWriter
# 初始化 SummaryWriter
writer = SummaryWriter('runs/scalar_example')for epoch in range(100):# 模拟训练过程中的损失值loss = torch.randn(1).item()# 记录损失值到 TensorBoardwriter.add_scalar('Loss/train', loss, epoch)
# 关闭 SummaryWriter
writer.close()

在上述代码中,我们创建了一个 SummaryWriter 实例,并指定了日志文件的存储目录为 runs/scalar_example。然后,我们在一个模拟的训练循环中,每个 epoch 记录一次损失值。最后,关闭 SummaryWriter 以释放资源。

2. 在conda环境中,启动tensorboard
我的工程目录在:
E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控\project

#进入共目录
(yolov11) C:\Users\Administrator>E:
(yolov11) E:\>cd E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控\project
#启动tensorboard
(yolov11) E:\深图智能工作室\CSDN\深度学习教程\pytorch使用教程\PyTorch使用教程(13)-PyTorch使用教程(13)-一文搞定模 型的可视化和训练过程监控\project>tensorboard --logdir=runs\scalar_example

3. 在浏览器中打开http://localhost:6006
在这里插入图片描述

4.点击scalar图标
在这里插入图片描述

3.2 记录直方图(Histograms)

直方图用于可视化模型参数的分布,如权重和偏置的直方图。这有助于理解模型在训练过程中的变化,以及检测潜在的异常值。

示例代码

import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter# 定义一个简单的神经网络
class SimpleNet(nn.Module):def __init__(self):super(SimpleNet, self).__init__()self.fc = nn.Linear(10, 1)def forward(self, x):return self.fc(x)# 初始化网络和 SummaryWriter
model = SimpleNet()
writer = SummaryWriter('runs/histogram_example')# 模拟一个训练步骤
for epoch in range(10):# 获取网络参数的梯度for name, param in model.named_parameters():writer.add_histogram(name, param.detach().cpu().numpy(), epoch)writer.add_histogram(f'{name}.grad', param.grad.detach().cpu().numpy(), epoch)# 关闭 SummaryWriter
writer.close()

在这个例子中,我们定义了一个简单的全连接网络,并在每个 epoch 记录网络参数的直方图以及梯度的直方图。按照上文的方式启动tensorboard,在浏览器中访问,即可查看。
在这里插入图片描述

3.3 记录图像(Images)

图像是另一种重要的可视化手段,特别是在处理图像数据或需要可视化特征图时。add_image 方法用于记录单个图像,而 add_images 方法则可以记录一个图像批次。

示例代码

import torch
import torchvision.utils as vutils
from torch.utils.tensorboard import SummaryWriter# 初始化 SummaryWriter
writer = SummaryWriter('runs/image_example')# 创建一个随机的图像批次
img_batch = torch.randn(16, 3, 64, 64)# 使用 torchvision.utils.make_grid 将图像批次转换为网格形式
img_grid = vutils.make_grid(img_batch, nrow=4, normalize=True, scale_each=True)# 记录图像到 TensorBoard
writer.add_image('ImageGrid', img_grid)# 关闭 SummaryWriter
writer.close()

在这个例子中,我们创建了一个随机的图像批次,并使用 make_grid 函数将其转换为网格形式,然后记录到 TensorBoard 中。
在这里插入图片描述

3.4 记录文本(Text)

有时候,我们可能需要在 TensorBoard 中记录一些文本信息,如模型配置、超参数或日志消息。add_text 方法正是为此设计的。

示例代码

from torch.utils.tensorboard import SummaryWriter# 初始化 SummaryWriter
writer = SummaryWriter('runs/text_example')# 记录文本信息到 TensorBoard
writer.add_text('Configuration', 'Learning Rate: 0.01, Batch Size: 32', 0)
writer.add_text('Log', 'Epoch 1: Loss=0.5, Accuracy=80%', 1)# 关闭 SummaryWriter
writer.close()

在这个例子中,我们使用 add_text 方法记录了一些简单的文本信息。
在这里插入图片描述

3.5 记录模型图结构(Graph)

了解模型的计算图结构对于调试和优化模型至关重要。add_graph 方法允许我们记录模型的前向传播图。

示例代码

import torch
import torch.nn as nn
from torch.utils.tensorboard import SummaryWriter# 定义一个简单的神经网络
class SimpleNet(nn.Module):def __init__(self):super(SimpleNet, self).__init__()self.fc1 = nn.Linear(10, 5)self.relu = nn.ReLU()self.fc2 = nn.Linear(5, 2)def forward(self, x):x = self.fc1(x)x = self.relu(x)x = self.fc2(x)return x# 初始化模型和 SummaryWriter
model = SimpleNet()
writer = SummaryWriter('runs/graph_example')# 创建一个随机输入张量
input_tensor = torch.randn(1, 10)# 记录模型图结构到 TensorBoard
writer.add_graph(model, input_tensor)# 关闭 SummaryWriter
writer.close()

在这个例子中,我们定义了一个包含两个全连接层和一个 ReLU 激活函数的简单网络,并使用 add_graph 方法记录了其计算图结构。
在这里插入图片描述

4、注意事项

  • 安装和配置:你需要确保已经安装了 torch 和 tensorboard。虽然 torch.utils.tensorboard 是 PyTorch 的一部分,但 tensorboard 需要单独安装,用于可视化数据。

  • 初始化 SummaryWriter:在开始记录数据之前,你需要初始化一个 SummaryWriter 对象,指定一个日志目录(log_dir)。这个目录将用于存储所有记录的数据。

  • 记录数据的位置:应该在训练循环中适当的位置记录数据。例如,在每次迭代或每个 epoch 结束时记录损失值、梯度等。

  • 关闭 SummaryWriter:在训练结束后,确保调用 SummaryWriter 的 close() 方法来关闭它,并确保所有数据都已写入日志文件。

  • 日志目录的唯一性:为了避免新日志覆盖旧的日志文件,确保每次运行训练时日志目录是唯一的。可以使用时间戳或其他唯一标识符来命名日志目录。

5、小结

torch.utils.tensorboard 是一个功能强大的工具,它能够帮助开发者在训练深度学习模型时高效地记录和可视化各种关键数据。然而,要想熟练掌握这个工具,并不是一蹴而就的。这需要开发者在实际项目中多使用 torch.utils.tensorboard,通过不断的实践来熟悉它的各种功能和用法。同时,多阅读相关的官方文档也是非常重要的。官方文档通常提供了详尽的功能介绍、使用指南以及常见问题解答,能够帮助开发者更好地理解和运用 torch.utils.tensorboard。此外,研究和分析示例源码也是提升熟练度的有效途径。通过查看和模仿优秀的示例源码,开发者可以学习到如何将 torch.utils.tensorboard 应用于实际项目中,并借鉴其中的最佳实践和技巧。因此,要想熟练掌握 torch.utils.tensorboard,开发者应该注重实践、阅读和源码分析,不断提升自己的技能水平。

相关文章:

PyTorch使用教程(13)-一文搞定模型的可视化和训练过程监控

一、简介 在现代深度学习的研究和开发中,模型的可视化和监控是不可或缺的一部分。PyTorch,作为一个流行的深度学习框架,通过其丰富的生态系统提供了多种工具来满足这一需求。其中,torch.utils.tensorboard 是一个强大的接口&…...

服务器日志自动上传到阿里云OSS备份

背景 公司服务器磁盘空间有限,只能存近15天日志,但是有时需要查看几个月前的日志,需要将服务器日志定时备份到某个地方,需要查询的时候有地方可查。 针对这个问题,想到3个解决方法: 1、买一个配置比较低…...

树莓派学习

飞书:https://hi06pny1nlj.feishu.cn/docx/GYsMdth7ooNlbJx8zBDcdbcPnec?fromfrom_copylink csdn:https://blog.csdn.net/qq_41685627/article/details/145250576 基础工作 安装和部署 1.1 树莓派三种连接电脑的方式 https://blog.csdn.net/weixin…...

NestJS中实现注入多个实现了同一个接口的Service

在NestJS中有一种场景,在注入的时候需要将多个实现了同一个接口的service都注入到系统里,而NestJS中默认时没有这种注入,此时我们可以使用一个变通的provider来实现这一功能。 看下面例子,假定我们有一个OSService接口&#xff0…...

Qt按钮美化教程

前言 Qt按钮美化主要有三种方式:QSS、属性和自绘 QSS 字体大小 font-size: 18px;文字颜色 color: white;背景颜色 background-color: rgb(10,88,163); 按钮边框 border: 2px solid rgb(114,188,51);文字对齐 text-align: left;左侧内边距 padding-left: 10…...

基于单片机的多功能蓝牙语音智能台灯(论文+源码)

1总体方案设计 通过需求分析,本设计多功能蓝牙语音智能台灯的系统框图如图2.1所示,系统架构包括主控制器STM32F103单片机、HC-06蓝牙通信模块、LU-ASR01语音识别模块、OLED液晶、LED灯、按键等器件,在使用时用户可以通过手机APP、语音识别、…...

第15章:Python TDD应对货币类开发变化(二)

写在前面 这本书是我们老板推荐过的,我在《价值心法》的推荐书单里也看到了它。用了一段时间 Cursor 软件后,我突然思考,对于测试开发工程师来说,什么才更有价值呢?如何让 AI 工具更好地辅助自己写代码,或许…...

算法随笔_13: 有效三角形的个数

上一篇:算法随笔_12:最短无序子数组-CSDN博客 题目描述如下: 给定一个包含非负整数的数组 nums ,返回其中可以组成三角形三条边的三元组个数。 示例 1: 输入: nums [2,2,3,4] 输出: 3 解释:有效的组合是: 2,3,4 (使用第一个 2) 2,3,4 (使用第二个 2) 2,2,3 算法…...

WSL 2 自动更新 虚拟 IP 到 window hosts

window下的wsl2 开发中使用到 域名映射,但是WSL2 每次启动都会被分配一个虚拟的 ip 地址,每次启动虚拟ip 都不一样,导致要频繁 更改 window 的 hosts 文件,太麻烦了,所以写一个自动执行的 .sh 脚本,每次启动…...

我在广州学Mysql 系列——触发器的使用

ℹ️大家好,我是练小杰,这周是春节前的最后一周了,现在一双手数都能数得过来了!! 本播客将学习MYSQL中触发器的相关概念以及基础命令~~ 回顾:👉【MYSQL视图相关例题】 数据库专栏👉【…...

【useCallback Hook】在多次渲染中缓存组件中的函数,避免重复创建函数

文章目录 什么是 useCallback?基本语法 为什么需要 useCallback?示例1. 避免子组件重复创建函数2. 作为 useEffect 的依赖项 注意事项总结 在 React 开发中,性能优化是一个重要的主题。随着应用规模的增长,组件的重新渲染可能会变…...

2025/1/20 学习Vue的第三天

玩性太大了玩得也不开心,天天看电视刷视频。 内心实在空洞。 最近天天看小红书上的外国人,结实外国友人(狗头)哈哈哈认识了不少人,有埃及的有美国的,还有天天看菲利普吃糖葫芦哈哈哈哈哈一个阳光的德国大男…...

Kotlin Bytedeco OpenCV 图像图像49 仿射变换 图像裁剪

Kotlin Bytedeco OpenCV 图像图像49 仿射变换 图像裁剪 1 添加依赖2 测试代码3 测试结果 在OpenCV中,仿射变换(Affine Transformation)和透视变换(Perspective Transformation)是两种常用的图像几何变换方法。 变换方…...

金融项目实战 07|Python实现接口自动化——连接数据库和数据清洗、测试报告、持续集成

目录 一、投资模块(投资接口投资业务) 二、连接数据库封装 和 清洗数据 1、连接数据库 2、数据清洗 4、调用 三、批量执行测试用例 并 生成测试报告 四、持续集成 1、代码上传gitee 2、Jenkin持续集成 一、投资模块(投资接口投资业务…...

(快速入门)保姆级详细的 Midjourney 基础教程

一、前言篇​ 1. 1. AI 绘图是什么?​ AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,而算法也便是 AI 绘画的核心,是它得以爆火的基础…...

leetcode——找到字符串中所有字母异位词(java)

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。 示例 1: 输入: s "cbaebabacd", p "abc" 输出: [0,6] 解释: 起始索引等于 0 的子串是 "cba", 它是 "…...

大文件上传服务-后端V1V2

文章目录 大文件上传概述:minio分布式文件存储使用的一些技术校验MD5的逻辑 uploadV1 版本 1uploadv2 版本 2 大文件上传概述: 之前项目做了一个文件上传的功能,最近看到有面试会具体的问这个上传功能的细节,把之前做的项目拿过来总结一下,自己写的一个…...

Single-Model and Any-Modality for Video Object Tracking——2024——cvpr-阅读笔记

Single-Model and Any-Modality for Video Object Tracking 摘要相关工作创新处MethodShared embeddingModal promptingRGB Tracker based on TransformerOverall ExperiimentDatasetRGB-D samples are sourced from DepthTrackRGB-T samples are extracted from LasHeRRGB-E s…...

阳振坤:AI 大模型的基础是数据,AI越发达,数据库价值越大

2024年1月12日,第四届OceanBase数据库大赛决赛在北京圆满落幕。在大赛的颁奖典礼上,OceanBase 首席科学家阳振坤老师为同学们献上了一场主题为“爱上数据库”的公开课,他不仅分享了个人的成长历程,还阐述了对数据库行业现状与未来…...

Linux磁盘空间不足,12个详细的排查方法

在Linux系统运维过程中,磁盘空间不足是一个常见且棘手的问题。当磁盘空间被占满时,系统的正常运行会受到影响,甚至可能导致服务中断。因此,迅速有效地排查和解决磁盘空间问题显得尤为重要。本文将详细介绍16个排查Linux磁盘空间问…...

身份证OCR识别接口接入实战:Python/Java/PHP/C#四语言代码示例与踩坑指南

#身份证OCR, #OCR接口, #API接入, #Python示例, #Java示例, #PHP示例, #踩坑指南, #石榴智能, #实名认证, #图片识别 身份证OCR识别接口接入实战:Python/Java/PHP/C#四语言代码示例与踩坑指南 作者:石榴智能技术团队 一、前言 身份证OCR识别已经不是什…...

保姆级教程:在ROS2 Humble/Foxy的Gazebo中配置RGB-D相机(附解决点云颜色/坐标问题)

ROS2 Humble/Foxy中Gazebo深度相机仿真全攻略:从配置到点云问题解决在机器人仿真开发中,深度相机(RGB-D)是不可或缺的传感器之一。它能够同时提供彩色图像和深度信息,为SLAM、物体识别、避障等任务提供关键数据支持。本…...

如何在macOS上免费解锁QQ音乐加密文件:完整指南

如何在macOS上免费解锁QQ音乐加密文件:完整指南 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转换结果…...

极致精简,功能强大的PDF编辑工具

这是一款功能全面的PDF编辑工具 你只需要导入一份PDF格式文件 就可以快速的对它进行插入 批注编辑保护转换等各种操作 而且无需登录 也可以直接使用 在插入选项中可以进行插入文字图片 页面页眉页脚页码文档背景水印视频音频等 在批注选项中可以管理批注隐藏批注 高亮显示 文本…...

半导体元件(二极管/三极管/MOS管/IC)损坏诊断全解

半导体元件(二极管、三极管、MOS 管、集成电路)是 PCB 的核心功能单元,对过压、过流、ESD、高温极度敏感,损坏后直接导致电路功能失效、短路烧板。很多工程师维修时盲目更换芯片,不仅成本高,还易误判。​一…...

Git Bash 中无法启动 Claude Code ?

最近需要在 git bash 中跑 Claude Code 。git bash 是随 git for windows 套件安装的,很久没更新了,结果启动 Claude Code 报错:Warning: no stdin data received in 3s, proceeding without it. If piping from a slow command, redirect st…...

基于Meshtastic构建LoRa Mesh网络:从硬件自制到传感器集成实战

1. 项目概述:构建一个灵活且易用的LoRa Mesh网络 如果你对物联网、远程传感或者去中心化通信网络感兴趣,那么LoRa技术一定不会陌生。它以其超低功耗、超远距离和强大的抗干扰能力,成为了构建广域传感网络的理想选择。然而,传统的…...

3步开启Windows 11安卓应用新体验:WSA完整使用指南

3步开启Windows 11安卓应用新体验:WSA完整使用指南 【免费下载链接】WSA Developer-related issues and feature requests for Windows Subsystem for Android 项目地址: https://gitcode.com/gh_mirrors/ws/WSA Windows Subsystem for Android(简…...

告别繁琐审核!实测AI Agent如何重塑复杂非结构化票据与合同处理流程?

摘要:在企业数字化转型步入深水区的2026年,处理复杂非结构化票据与合同已成为横亘在财务、法务部门面前的“最后一公里”难题。传统RPA因UI变动易崩溃、主流智能体因缺乏API适配而无法落地,导致大量业务仍依赖低效的人工操作。本文由「企服AI…...

全方位梳理 OpenClaw 部署与使用干货

OpenClaw 一键安装包|可视化部署,简化环境配置流程 ✨适配系统:Windows10/11 64 位 当前版本:v2.7.5(虾壳云版) ✨核心优势:全程可视化操作,不用命令行、不用手动配置 Python/Node…...