当前位置：首页 > news >正文

YOLOv5：对yolov5n模型进一步剪枝压缩

news 2026/2/10 17:50:11

YOLOv5：对yolov5n模型进一步剪枝压缩

前言
前提条件
相关介绍
具体步骤
- 修改yolov5n.yaml配置文件
- 单通道数据（黑白图片）
- - 修改models/yolo.py文件
  - 修改train.py文件
- 剪枝后模型大小
参考

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

熟悉Python

具体步骤

修改yolov5n.yaml配置文件

YOLOv5相关YAML配置里面参数含义，可查阅YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层：
https://blog.csdn.net/FriendshipTang/article/details/130375883
这里顺带解释一下，depth_multiple和width_multiple参数含义。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple

 - nc: 8 代表数据集中的类别数目。- depth_multiple: 0.33- 用来控制模型的深度，仅在number≠1时启用。- 如第一个C3层的参数设置为[-1, 3, C3, [128]]，其中number=3，表示在yolov5s中含有 3 × 0.33 ≈ 1个C3。- width_multiple: 0.50- 用来控制模型的宽度，主要作用于args中的channel_out。- 如第一个Conv层，输出通道数channel_out=64，那么在yolov5s中，会将卷积过程中的卷积核设置为 64 × 0.50 = 32，所以会输出 32 通道的特征图。

将

depth_multiple: 0.33  # model depth multiple
width_multiple: 0.25  # layer channel multiple

改为

depth_multiple: 0.16  # model depth multiple
width_multiple: 0.125  # layer channel multiple

即可达到减少卷积层数的目的。
在这里插入图片描述

单通道数据（黑白图片）

如果数据集是单通道数据，即黑白图片数据集，还可以修改训练时输入的通道数（yolov5默认输入通道数ch=3,我们可以修改ch=1），减少训练参数。
如果是彩色图片数据集，可跳过此部分的内容。

修改models/yolo.py文件

        if m in {Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, nn.ConvTranspose2d, DWConvTranspose2d, C3x}:c1, c2 = ch[f], args[0]if c2 != no:  # if not outputc2 = make_divisible(c2 * gw, 8)

添加:

        if m in (Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, nn.ConvTranspose2d, DWConvTranspose2d, C3x):c1, c2 = ch[f], args[0]# 添加的内容if i == 0: # 第一层输入，为单通道图片c1 = 1if c2 != no:  # if not outputc2 = make_divisible(c2 * gw, 8)

在这里插入图片描述

        # Define modelch = self.yaml['ch'] = self.yaml.get('ch', ch)  # input channels

添加:

        # Define modelch = self.yaml['ch'] = self.yaml.get('ch', ch)  # input channels# 添加的内容self.yaml['ch'] = 1ch = self.yaml['ch']

在这里插入图片描述

修改train.py文件

model = Model(cfg or ckpt['model'].yaml, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

改为

# 修改的内容
# model = Model(cfg or ckpt['model'].yaml, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create
model = Model(cfg or ckpt['model'].yaml, ch=1, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

在这里插入图片描述

model = Model(cfg, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

改为

# 修改的内容
# model = Model(cfg, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create
model = Model(cfg, ch=1, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

在这里插入图片描述

for i, (imgs, targets, paths, _) in pbar:  # batch -------------------------------------------------------------callbacks.run('on_train_batch_start')ni = i + nb * epoch  # number integrated batches (since train start)imgs = imgs.to(device, non_blocking=True).float() / 255  # uint8 to float32, 0-255 to 0.0-1.0# Warmupif ni <= nw:xi = [0, nw]  # x interp# compute_loss.gr = np.interp(ni, xi, [0.0, 1.0])  # iou loss ratio (obj_loss = 1.0 or iou)accumulate = max(1, np.interp(ni, xi, [1, nbs / batch_size]).round())for j, x in enumerate(optimizer.param_groups):# bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0x['lr'] = np.interp(ni, xi, [hyp['warmup_bias_lr'] if j == 0 else 0.0, x['initial_lr'] * lf(epoch)])if 'momentum' in x:x['momentum'] = np.interp(ni, xi, [hyp['warmup_momentum'], hyp['momentum']])

添加:

for i, (imgs, targets, paths, _) in pbar:  # batch -------------------------------------------------------------callbacks.run('on_train_batch_start')ni = i + nb * epoch  # number integrated batches (since train start)# imgs = imgs.to(device, non_blocking=True).float() / 255  # uint8 to float32, 0-255 to 0.0-1.0# 添加的内容，目的是将训练集的图片变为单通道图片(黑白图片)imgs = imgs[:, 0, :, :].unsqueeze(1).to(device, non_blocking=True).float() / 255 # Warmupif ni <= nw:xi = [0, nw]  # x interp# compute_loss.gr = np.interp(ni, xi, [0.0, 1.0])  # iou loss ratio (obj_loss = 1.0 or iou)accumulate = max(1, np.interp(ni, xi, [1, nbs / batch_size]).round())for j, x in enumerate(optimizer.param_groups):# bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0x['lr'] = np.interp(ni, xi, [hyp['warmup_bias_lr'] if j == 0 else 0.0, x['initial_lr'] * lf(epoch)])if 'momentum' in x:x['momentum'] = np.interp(ni, xi, [hyp['warmup_momentum'], hyp['momentum']])

在这里插入图片描述

剪枝后模型大小

原来的yolo5n模型大小为3.5m，剪枝训练后的yolo5n模型大小为2.6m。

参考

[1] https://github.com/ultralytics/yolov5

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

YOLOv5：对yolov5n模型进一步剪枝压缩

YOLOv5：对yolov5n模型进一步剪枝压缩前言前提条件相关介绍具体步骤修改yolov5n.yaml配置文件单通道数据（黑白图片）修改models/yolo.py文件修改train.py文件剪枝后模型大小参考前言由于本人水平有限，难免出现错漏，…...

编程日记 2023/9/7 10:51:43

大数据(八)：Pandas的基础应用详解(五)

专栏介绍结合自身经验和内部资料总结的Python教程，每天3-5章，最短1个月就能全方位的完成Python的学习并进行实战开发，学完了定能成为大佬！加油吧！卷起来！全部文章请访问专栏：《Python全栈教程（0基础）》再推荐一下最近热更的：《大厂测试高频面试题详解》该专栏对…...

编程日记 2023/9/7 10:50:42

【算法】归并排序详解

归并排序详解归并排序代码实现1. 递归版本2. 非递归版本排序： 排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。稳定性： 假定在待排序的记录序列中，存在多个具有相…...

编程日记 2023/9/7 10:49:41

linux 进程隔离Namespace 学习

一、linux namespace 介绍 1.1、概念 Linux Namespace是Linux内核提供的一种机制，它用于隔离不同进程的资源视图，使得每个进程都拥有独立的资源空间，从而实现进程之间的隔离和资源管理。 Linux Namespace的设计目标是为了解决多个进程之间…...

编程日记 2023/9/7 10:48:39

【MySQL】事务详解

事务详解一. 为什么使用事务二. 事务的概念三. 使用四. 事务的特性原子性（Atomicity）一致性（Consistency）隔离性（Isolation）持久性（Durability） 五. 事务并发所带来的问题脏读问题…...

编程日记 2023/9/7 10:47:37

爬虫到底难在哪里？

目录爬虫到底难在哪里怎么学习爬虫注意事项爬虫工具总结学习Python爬虫的难易程度因人而异，对于具备编程基础的人来说，学习Python爬虫并不困难。Python语言本身比较简单易学，适合初学者使用。爬虫到底难在哪里爬虫的难点主要包…...

编程日记 2023/9/7 10:46:36

linux常用命令行整理

1、linux的以及目录 bin 二进制可执行文件sbin 二进制可执行文件(root用户权限)etc 系统管理和配置文件,例如常见host文件home 用户文件的根目录usr 用户存放系统应用程序(共享系统资源)opt 可选的应用程序proc 虚拟文件系统root 超级用户dev 存放设备文件mnt 系统管理员安装临…...

编程日记 2023/9/7 10:45:35

python字符串相关

python字符串相关一、reverse() 函数只能反转列表二、reversed() 反转元组字符串等等返回迭代器三、join和reversed反转字符串四、join串联字符串（join连接对象仅限字符串、储存字符串的元组、列表、字典）数字对象可通过str()转化为字符串⭐对象为字…...

编程日记 2023/9/7 10:44:35

JavaScript学习笔记01

JavaScript笔记01 什么是 JavaScript JavaScript 是一门世界上最流行的脚本语言，它是一种弱类型的脚本语言，其代码不需要经过编译，而是由浏览器解释运行，用于控制网页的行为。发展历史参考：JavaScript的起源故事…...

编程日记 2023/9/7 10:43:33

golang 通用的 grpc http 基础开发框架

go-moda golang 通用的 grpc http 基础开发框架仓库地址: https://github.com/webws/go-moda仓库一直在更新,欢迎大家吐槽和指点特性 transport: 集成 http（echo、gin）和 grpc。tracing: openTelemetry 实现微务链路追踪pprof: 分析性能config: 通用…...

编程日记 2023/9/7 10:42:32

FSK解调技术的FPGA实现

本原创文章由深圳市小眼睛科技有限公司创作，版权归本公司所有，如需转载，需授权并注明出处一、FSK信号的解调原理 FSK信号的解调也有非相干和相干两种，FSK信号可以看作是用两个频率源交替传输得到的，所以FSK的接收机由…...

编程日记 2023/9/7 10:41:31

Matlab图像处理-高斯低通滤波器

高通滤波图像的边缘、细节主要位于高频部分，而图像的模糊是由于高频成分比较弱产生的。高通滤波就是为了高消除模糊，突出边缘。因此采用高通滤波器让高频成分通过，消除低频噪声成分削弱，再经傅里叶逆变换得到边缘锐化的图像。 …...

编程日记 2023/9/7 10:40:30

文件上传之图片马混淆绕过与条件竞争

一、图片马混淆绕过 1.上传gif imagecreatefromxxxx函数把图片内容打散，，但是不会影响图片正常显示 $is_upload false; $msg null; if (isset($_POST[submit])){// 获得上传文件的基本信息，文件名，类型，大小&…...

编程日记 2023/9/7 10:39:27

代码随想录二刷day16

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、力扣104. 二叉树的最大深度二、力扣559. N 叉树的最大深度三、力扣111. 二叉树的最小深度三、力扣力扣222. 完全二叉树的节点个数前言一、力扣104. 二叉树…...

编程日记 2023/9/7 10:37:25

【开发】安防监控/视频存储/视频汇聚平台EasyCVR优化播放体验的小tips

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同，可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.265自动转码H.264、平台级联等。为了便于用户二次开发、调用与集成，…...

编程日记 2023/9/7 10:36:24

力扣（LeetCode）算法_C++—— 只出现一次的数字

给你一个非空整数数组 nums ，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题，且该算法只使用常量额外空间。示例 1 ： 输入&#xff1…...

编程日记 2023/9/7 10:35:22

Windows配置SonarQube代码审查工具详细步骤（附带IDEA SonarLint插件使用）

文章目录环境说明以及准备一. SonarQube的下载与安装二. 添加SonarQube项目三. 使用Maven命令上传代码到SonarQube四. IDEA安装SonarLint插件环境说明以及准备本篇博客使用的SonarQube版本为9.8，注意JDK 1.8已经不能支持 NameVersionDownLoad LinkSonarQube9.8…...

编程日记 2023/9/7 10:34:21

【Unity3D】UI Toolkit元素

1 前言 UI Toolkit简介中介绍了 UI Builder、样式属性、UQuery、Debugger，UI Toolkit容器中介绍了 VisualElement、ScrollView、ListView、GroupBox 等容器，UI Toolkit样式选择器中介绍了简单选择器、复杂选择器、伪类选择器等样式选择器，…...

编程日记 2023/9/7 10:33:20

Task :app:compileDebugKotlin FAILED

gradle.properties 里面加上 android.enableJetifiertrue...

编程日记 2023/9/7 10:32:18

Android——数据存储（一）（二十一）

1. 数据存储 1.1 知识点 （1）掌握Android数据存储的分类； （2）可以使用SharedPreferences存储数据。 1.2 具体内容对于我们数据的存储而言，Android一共提供了5个数据存储的方式：SharedPrefe…...

编程日记 2023/9/7 10:31:17

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

自然语言处理——Transformer

自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效，它能挖掘数据中的时序信息以及语义信息，但是它有一个很大的缺陷——很难并行化。我们可以考虑用CNN来替代RNN，但是…...

编程新知 2026/2/1 7:05:07

什么是Ansible Jinja2

理解 Ansible Jinja2 模板 Ansible 是一款功能强大的开源自动化工具，可让您无缝地管理和配置系统。Ansible 的一大亮点是它使用 Jinja2 模板，允许您根据变量数据动态生成文件、配置设置和脚本。本文将向您介绍 Ansible 中的 Jinja2 模板，并通…...

编程新知 2026/2/6 1:00:25

NPOI操作EXCEL文件 ——CAD C# 二次开发

缺点:dll.版本容易加载错误。CAD加载插件时，没有加载所有类库。插件运行过程中用到某个类库，会从CAD的安装目录找，找不到就报错了。【方案2】让CAD在加载过程中把类库加载到内存【方案3】是发现缺少了哪个库，就用插件程序加载进…...

编程新知 2026/1/26 13:35:42

django blank 与 null的区别

1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空但是，要注意以下几点： Django的表单验证与null无关：null参数控制的是数据库层面字段是否可以为NULL，而blank参数控制的是Django表单验证时字…...

编程新知 2025/7/7 3:34:13

DAY 26 函数专题1

函数定义与参数知识点回顾：1. 函数的定义2. 变量作用域：局部变量和全局变量3. 函数的参数类型：位置参数、默认参数、不定参数4. 传递参数的手段：关键词参数5 题目1：计算圆的面积任务： 编写一…...

编程新知 2025/11/28 7:53:17

验证redis数据结构

一、功能验证 1.验证redis的数据结构（如字符串、列表、哈希、集合、有序集合等）是否按照预期工作。 2、常见的数据结构验证方法： ①字符串（string） 测试基本操作 set、get、incr、decr 验证字符串的长度和内容是否正…...

编程新知 2025/10/5 5:37:09

【记录坑点问题】IDEA运行：maven-resources-production:XX: OOM: Java heap space

问题：IDEA出现maven-resources-production:operation-service: java.lang.OutOfMemoryError: Java heap space 解决方案：将编译的堆内存增加一点位置：设置setting-》构建菜单build-》编译器Complier...

编程新知 2026/1/26 19:41:09

scan_mode设计原则

scan_mode设计原则在进行mtp controller设计时，基本功能设计完成后，需要设计scan_mode设计。 1、在进行scan_mode设计时，需要保证mtp处于standby模式，不会有擦写、编程动作。 2、只需要固定mtp datasheet说明的接口即可&#xf…...

编程新知 2026/1/1 11:50:56

python打卡day47

昨天代码中注意力热图的部分顺移至今天知识点回顾： 热力图作业：对比不同卷积层热图可视化的结果 import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, transforms from torch.utils.data import D…...

编程新知 2025/9/18 6:40:28

YOLOv5：对yolov5n模型进一步剪枝压缩

前言

前提条件

相关介绍

具体步骤

修改yolov5n.yaml配置文件

单通道数据（黑白图片）

修改models/yolo.py文件

修改train.py文件

剪枝后模型大小

参考

相关文章：