当前位置：首页 > article >正文

AI笔记 - 模型调试 - 调试方式

article 2026/2/8 10:40:44

模型调试方式

基础信息
打印模型信息
计算参数量和计算量
- 过滤原则
- profile方法
- get_model_complexity_info方法
- FlopCountAnalysis方法

基础信息

# 打印执行的设备数量：device_count:1
print(f"device_count:{torch.cuda.device_count()}")# 打印当前网络执行的设备信息：device: cuda:0
print(f"device: {next(self.net.parameters()).device}")  # 应该输出: cuda:0

打印模型信息

#操作	    代码示例
#-----------------------------------------------------
#遍历所有模块	for name, module in model.named_modules():
#-----------------------------------------------------
#打印参数详情	module.named_parameters()
#-----------------------------------------------------
#打印缓冲区	module.named_buffers()
#-----------------------------------------------------
#过滤特定层	isinstance(module, nn.Conv2d)
#-----------------------------------------------------
#统计计算量	profile(module, inputs=(input,))
#-----------------------------------------------------import torchvision.models as modelsmodel = models.resnet50(weights=None).cuda()  # 不加载预训练权重以减少下载时间
input = torch.randn(1, 3, 224, 224).cuda()
for name, p in model.named_parameters():
print(f"params name:{name}, shape:{p.shape}, device:{p.device}")
print(f"dtype: {p.dtype}, 是否需要梯度:{p.requires_grad}")#params name:conv1.weight, shape:torch.Size([64, 3, 7, 7]), device:cuda:0
#dtype: torch.float32, 是否需要梯度:True
#params name:bn1.weight, shape:torch.Size([64]), device:cuda:0
#dtype: torch.float32, 是否需要梯度:True
#params name:bn1.bias, shape:torch.Size([64]), device:cuda:0
#dtype: torch.float32, 是否需要梯度:True
...for name, module in model.named_modules():print(f"模块名称:{name}, 模块类型:{type(module).__name__}")# 打印可训练参数（weight/bias）for param_name, param in module.named_parameters():print(f"  - 参数:{param_name} | 形状:{param.shape} | 设备:{param.device} | 需梯度:{param.requires_grad} | 数据类型:{param.dtype}")# 打印缓冲区（如BatchNorm的running_mean）for buffer_name, buffer in module.named_buffers():print(f"  - 缓冲区: {buffer_name} | 形状: {buffer.shape} | 设备: {buffer.device}")# 模块名称:, 模块类型:ResNet
#  - 参数:conv1.weight | 形状:torch.Size([64, 3, 7, 7]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32
#  - 参数:bn1.weight | 形状:torch.Size([64]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32
#  - 参数:bn1.bias | 形状:torch.Size([64]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32......
#  - 缓冲区: bn1.running_mean | 形状: torch.Size([64]) | 设备: cuda:0
#  - 缓冲区: bn1.running_var | 形状: torch.Size([64]) | 设备: cuda:0
#  - 缓冲区: bn1.num_batches_tracked | 形状: torch.Size([]) | 设备: cuda:0
#  - 缓冲区: layer1.0.bn1.running_mean | 形状: torch.Size([64]) | 设备: cuda:0......
# 模块名称:layer1.0, 模块类型:Bottleneck
#  - 参数:conv1.weight | 形状:torch.Size([64, 64, 1, 1]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32
#  - 参数:bn1.weight | 形状:torch.Size([64]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32......
#  - 缓冲区: bn1.running_mean | 形状: torch.Size([64]) | 设备: cuda:0
#  - 缓冲区: bn1.running_var | 形状: torch.Size([64]) | 设备: cuda:0
#  - 缓冲区: bn1.num_batches_tracked | 形状: torch.Size([]) | 设备: cuda:0......
#模块名称:layer1.0.conv1, 模块类型:Conv2d
#  - 参数:weight | 形状:torch.Size([64, 64, 1, 1]) | 设备:cuda:0 | 需梯度:True | 数据类型:torch.float32
#模块名称:layer1.0.bn1, 模块类型:BatchNorm2d
......

计算参数量和计算量

过滤原则

在计算模型计算量（FLOPs）时，过滤掉 BatchNorm2d、Sequential 和 Bottleneck 等非关键层是常见的需求

层类型	是否过滤	原因
BatchNorm2d	✅ 过滤	计算量极小（仅逐通道缩放），可忽略
Sequential	✅ 过滤	容器层（实际计算在子层）
Bottleneck	✅ 过滤	复合层（计算量已包含在子层中）
Conv2d/Linear	❌ 保留	核心计算层
ReLU/Pooling	⚠️ 可选	通常忽略（或单独统计）

profile方法

from thop import profilemodel = models.resnet50(weights=None).cuda()  # 不加载预训练权重以减少下载时间
input = torch.randn(1, 3, 224, 224).cuda()
flops, params = profile(model, inputs=(input,))
print(f"FLOPs: {flops / 1e9:.2f} G")  # 输出: ~4.11 GFLOPs
print(f"Params: {params / 1e6:.2f} M")  # 输出: ~25.56 Million

get_model_complexity_info方法

from ptflops import get_model_complexity_infomacs, params = get_model_complexity_info(self.net,(3, 1280, 1280),  # (channels, height, width)as_strings=True,print_per_layer_stat=True,  # 打印每层计算量verbose=True,
)
print(f"FLOPs: {macs}")
print(f"Params: {params}")# Warning: module IntermediateLayerGetter，FPN，SSH，ClassHead，BboxHead，LandmarkHead，RetinaFace，DataParallel is treated as a zero-op.
# DataParallel(
#  426.61 k, 100.000% Params, 4.07 GMac, 99.943% MACs, 
#  (module): RetinaFace(
#    426.61 k, 100.000% Params, 4.07 GMac, 99.943% MACs, 
#    (body): IntermediateLayerGetter(
#      213.07 k, 49.946% Params, 1.45 GMac, 35.733% MACs, 
#      (stage1): Sequential(
#        10.13 k, 2.374% Params, 642.25 MMac, 15.774% MACs, 
#        (0): Sequential(
#          232, 0.054% Params, 98.3 MMac, 2.414% MACs, 
#          (0): Conv2d(216, 0.051% Params, 88.47 MMac, 2.173% MACs, 3, 8, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
#          (1): BatchNorm2d(16, 0.004% Params, 6.55 MMac, 0.161% MACs, 8, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
#          (2): LeakyReLU(0, 0.000% Params, 3.28 MMac, 0.080% MACs, negative_slope=0.1, inplace=True)
#        )
#        (1): Sequential()
#  ......
# )
# FLOPs: 4.07 GMac
# Params: 426.61 k

FlopCountAnalysis方法

from fvcore.nn import FlopCountAnalysisflops = FlopCountAnalysis(self.net, image)
flops = flops.unsupported_ops_warnings(False)  # 忽略不支持的操作警告# 计算总 FLOPs
print(flops.by_module())  # 打印每个模块的 FLOPs
total_flops = flops.total()
print(f"Total FLOPs: {total_flops / 1e9:.2f} G")# 打印每一层的 FLOPs，返回字典 {模块名: FLOPs}
print(flops.by_module())# 打印按模块分组的 FLOPs
print(flops.by_module_and_operator())  # 更详细的统计

AI笔记 - 模型调试 - 调试方式

模型调试方式基础信息打印模型信息计算参数量和计算量过滤原则profile方法get_model_complexity_info方法FlopCountAnalysis方法基础信息 # 打印执行的设备数量：device_count:1 print(f"device_count:{torch.cuda.device_count()}")# 打印当前网络执行…...

编程日记 2025/12/16 6:43:33

榕壹云物品回收系统实战案例：基于ThinkPHP+MySQL+UniApp的二手物品回收小程序开发与优化

摘要：本文深入解析了一款基于ThinkPHPMySQLUniApp框架开发的二手物品回收小程序——榕壹云物品回收系统的技术实现与商业价值。通过剖析项目背景、核心技术架构、功能特性及系统优势，为开发者与潜在客户提供全面的参考指南，助力资源循环利用与…...

编程日记 2026/1/30 16:52:36

《软件工程》第 9 章 - 软件详细设计

目录 9.1 详细设计的任务与过程模型 9.2 用例设计 9.2.1 设计用例实现方案 9.2.2 构造设计类图 9.2.3 整合并优化用例实现方案 9.3 子系统设计 9.3.1 确立内部设计元素 9.3.2 导出设计类图 9.4 构件设计 9.5 类设计 9.5.1 精化类间关系 9.5.2 精化属性和操作 9.5.…...

编程日记 2026/2/1 7:21:47

WebVm：无需安装，一款可以在浏览器运行的 Linux 来了

WebVM 是一款可以在浏览器中运行的Linux虚拟机。不是那种HTMLJavaScript模拟的UI，完全通过HTML5/WebAssembly技术实现客户端运行。通过集成CheerpX虚拟化引擎，可直接在浏览器中运行未经修改的Debian系统。 Stars 数13054Forks 数2398 主要特点完整 Lin…...

编程日记 2026/1/29 18:13:38

王树森推荐系统公开课排序06：粗排模型

shared bottom 表示神经网络被所有特征共享。精排模型主要开销在神经网络，神经网络很大且很复杂。每做一次推荐，用户塔只做一次推理。物品塔存放入向量数据库。后期融合模型常用于召回，前期融合模型常用于精排。物品塔短时间内比较稳…...

编程日记 2026/2/1 8:13:30

go并发编程| channel入门

channel 介绍 channel 是在 Go 的并发编程中使用的，这个工具的作用之一是 goroutine 之间通信（线程通信指的是多个线程之间通过共享数据或协作机制来协调操作，通常需要借助锁来保证同步）。Go 中推荐使用 channel（不同…...

编程日记 2026/1/4 4:47:46

PH热榜 | 2025-05-29

1. Tapflow 2.0 标语：将你的文档转化为可销售的指导手册、操作手册和工作流程。介绍：Tapflow 2.0将各类知识（包括人工智能、设计、开发、营销等）转化为有条理且可销售的产品。现在你可以导入文件，让人工智能快速为你…...

编程日记 2026/1/30 13:58:44

详解GPU

详解GPU GPU（图形处理器）就像电脑里的 “图形小能手”，原本主要用来画画（渲染图形），现在还能帮忙干很多杂活（并行计算） 一、先认识 GPU 的 “钥匙”：驱动和开发工具装驱…...

编程日记 2025/11/17 0:14:14

WPF【11_10】WPF实战-重构与美化(配置Material UI框架)

11-16 【UI美化】配置Material UI框架三种比较主流的 UI 设计规范，分别是： 苹果的扁平化 UI 设计、安卓或者说谷歌的 Material Design 以及微软的 Metro 风格。这三种风格都极具特色，不过我们接下来将会使用的是 Material Design 。在 W…...

编程日记 2025/12/10 20:01:53

(自用)Java学习-5.16(取消收藏，批量操作，修改密码，用户更新，上传头像)

1. 取消收藏功能前端实现： 用户点击“取消收藏”按钮时，前端通过变量status判断当前状态（0为未收藏，1为已收藏）。发送AJAX请求到后端接口： 添加收藏：/favoriteise/addFavoriteise?pid商品ID…...

编程日记 2025/10/28 2:42:32

【Node.js】部署与运维

个人主页：Guiat 归属专栏：node.js 文章目录 1. Node.js 部署概述1.1 部署的核心要素1.2 Node.js 部署架构全景 2. 传统服务器部署2.1 Linux 服务器环境准备系统更新与基础软件安装创建应用用户 2.2 应用部署脚本2.3 环境变量管理2.4 Nginx 反向代理配置2…...

编程日记 2026/1/22 16:56:28

【Java Web】速通JavaScript

参考笔记：JavaWeb 速通JavaScript_javascript 速通-CSDN博客目录一、JavaScript快速入门 1. 基本介绍 2. JavaScript特点 3. JavaScript的引入方式(重要) 3.1 写在script标签中 3.2 以外部文件方式引入二、JS的数据类型 1. 变量 2. 常用数据类型 3.特殊值三、…...

编程日记 2026/1/29 17:31:56

TDengine 运维——巡检工具（安装前预配置）

背景 TDengine 的安装部署对环境系统有一定的依赖和要求，安装部署前需要进行环境预配置操作，本文档旨在说明安装前预配置工具在安装 TDengine 前对环境的预配置内容和工具的使用方法。预配置工具使用方法工具支持通过 help 参数查看支持的语法 Usa…...

编程日记 2026/2/3 0:44:46

C#索引器详解：让对象像数组一样被访问

索引器是C#中一个强大而实用的特性，它允许我们像访问数组一样访问类的成员。本文将全面介绍索引器的概念、语法、实现方式以及实际应用场景。索引器基础概念索引器（Indexer）是一组get和set访问器，与属性类似，但有以…...

编程日记 2026/1/4 5:36:34

机器学习课设

🎓 图像处理课程设计任务书课程名称： 图像处理与模式识别课设题目： 基于手工特征提取与传统机器学习方法的图像分类系统实现一、课设目的本课程设计旨在加深对图像处理与分类算法的理解，提升图像特征提取、传统机器学习模…...

编程日记 2025/12/23 4:40:18

vue 如何对 div 标签设置assets内本地背景图片

在 Vue 中为 <div> 设置 assets 目录下的本地背景图片，需要通过 Webpack 或 Vite 等构建工具处理路径引用。以下是详细实现方法： 一、项目结构说明假设你的项目结构如下： src/assets/images/bg.jpg # 背景图片components/…...

编程日记 2026/1/10 7:26:07

wsl2 docker重启后没了

参考这篇文章：wsl2 docker重启后没了_mob64ca12f55920的技术博客_51CTO博客...

编程日记 2025/12/12 3:24:17

1、打开配置文件 vi /etc/netplan/00-installer-config.yaml 2、修改文件内容 # This is the network config written by subiquity network:ethernets:ens33:dhcp4: false # 禁用 dhcpaddresses:- 192.168.12.15/24 # 静态IProutes:- to: defaultvia: 192.168.12.254 …...

编程日记 2025/11/26 2:31:21