目标检测-YOLOv4
YOLOv4介绍
YOLOv4 是 YOLO 系列的第四个版本,继承了 YOLOv3 的高效性,并通过大量优化和改进,在目标检测任务中实现了更高的精度和速度。相比 YOLOv3,YOLOv4 在框架设计、特征提取、训练策略等方面进行了全面升级。它在保持实时检测的同时,显著提升了检测性能,尤其在复杂场景中的表现尤为出色。
相比 YOLOv3 的改进与优势
-
改进的 Backbone (CSPDarknet-53)
YOLOv4 使用了 CSPDarknet-53 作为其主干网络 (Backbone)。CSPNet(Cross Stage Partial Network)通过部分特征的逐层传递减少了冗余梯度信息,提高了推理速度和精度。此外,它能够有效降低内存占用,使得网络更加轻量化。 -
PANet (Path Aggregation Network)
YOLOv4 引入了 PANet 来替代 YOLOv3 中的 FPN (Feature Pyramid Networks)。PANet 更有效地聚合不同尺度的特征,增强了特征表达能力,尤其对小目标检测性能提升明显。 -
Mish 激活函数
YOLOv4 使用 Mish 激活函数代替 YOLOv3 中的 Leaky ReLU。Mish 激活函数可以提供更平滑的梯度传递,提升了模型的学习能力和泛化性。 -
自适应输入分布 (Mosaic Data Augmentation)
在数据增强方面,YOLOv4 引入了 Mosaic Data Augmentation,这种技术通过将四张不同的图片拼接在一起进行训练,使得模型能够更好地适应不同尺寸、位置和背景的物体,从而提高泛化能力。 -
CIoU Loss
YOLOv4 使用了 CIoU Loss(Complete IoU Loss),相比 YOLOv3 使用的 IoU Loss,CIoU 更好地考虑了边界框的重叠度、中心点距离以及长宽比,使得目标定位更加精确。 -
DropBlock Regularization
为了防止过拟合,YOLOv4 引入了 DropBlock 正则化方法,这是一种空间正则化技术,可以在卷积层中随机去除一部分神经元,以增强模型的泛化能力。 -
自适应权重计算 (SAM, Self-Adversarial Training)
SAM (Spatial Attention Module) 提升了网络的注意力机制,使模型更好地聚焦于重要的特征部分。此外,YOLOv4 还引入了 Self-Adversarial Training 作为一种新型的自对抗训练方法,增强了模型的鲁棒性。
核心代码展示
以下是 YOLOv4 的核心部分代码,包括主干网络 CSPDarknet-53 和 PANet 构建模块。
import torch
import torch.nn as nn# 1. Mish 激活函数
class Mish(nn.Module):def forward(self, x):return x * torch.tanh(nn.functional.softplus(x))# 2. 卷积块,包含卷积、BN 和 Mish 激活函数
class ConvBlock(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, stride, padding):super(ConvBlock, self).__init__()self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding, bias=False)self.bn = nn.BatchNorm2d(out_channels)self.activation = Mish()def forward(self, x):return self.activation(self.bn(self.conv(x)))# 3. CSP 模块
class CSPBlock(nn.Module):def __init__(self, in_channels, out_channels, num_blocks):super(CSPBlock, self).__init__()half_channels = out_channels // 2self.conv1 = ConvBlock(in_channels, half_channels, 1, 1, 0)self.conv2 = ConvBlock(in_channels, half_channels, 1, 1, 0)self.res_blocks = nn.Sequential(*[ResidualBlock(half_channels) for _ in range(num_blocks)])self.conv3 = ConvBlock(half_channels * 2, out_channels, 1, 1, 0)def forward(self, x):x1 = self.conv1(x)x2 = self.conv2(x)x1 = self.res_blocks(x1)return self.conv3(torch.cat([x1, x2], dim=1))# 4. PANet 下采样模块
class PANetDownsample(nn.Module):def __init__(self, in_channels, out_channels):super(PANetDownsample, self).__init__()self.conv = ConvBlock(in_channels, out_channels, 3, 2, 1) # 步长为 2,进行下采样def forward(self, x):return self.conv(x)# 5. YOLOv4 Backbone: CSPDarknet53
class CSPDarknet53(nn.Module):def __init__(self):super(CSPDarknet53, self).__init__()self.conv1 = ConvBlock(3, 32, 3, 1, 1)self.conv2 = ConvBlock(32, 64, 3, 2, 1)self.csp_block1 = CSPBlock(64, 128, 2)self.csp_block2 = CSPBlock(128, 256, 8)self.csp_block3 = CSPBlock(256, 512, 8)self.csp_block4 = CSPBlock(512, 1024, 4)def forward(self, x):x = self.conv1(x)x = self.conv2(x)x = self.csp_block1(x)x_52x52 = self.csp_block2(x)x_26x26 = self.csp_block3(x_52x52)x_13x13 = self.csp_block4(x_26x26)return x_52x52, x_26x26, x_13x13# 6. YOLOv4 Head: PANet
class PANet(nn.Module):def __init__(self, num_classes):super(PANet, self).__init__()self.num_classes = num_classes# 下采样和卷积操作self.downsample_52x52 = PANetDownsample(256, 512)self.downsample_26x26 = PANetDownsample(512, 1024)# 最终输出预测层 (每个尺度的 YOLO head)self.yolo_head_52x52 = YOLOHead(256, num_classes)self.yolo_head_26x26 = YOLOHead(512, num_classes)self.yolo_head_13x13 = YOLOHead(1024, num_classes)def forward(self, x_52x52, x_26x26, x_13x13):x_26x26 = self.downsample_52x52(x_52x52) + x_26x26x_13x13 = self.downsample_26x26(x_26x26) + x_13x13yolo_output_52x52 = self.yolo_head_52x52(x_52x52)yolo_output_26x26 = self.yolo_head_26x26(x_26x26)yolo_output_13x13 = self.yolo_head_13x13(x_13x13)return [yolo_output_52x52, yolo_output_26x26, yolo_output_13x13]# 7. YOLOv4 完整模型
class YOLOv4(nn.Module):def __init__(self, num_classes):super(YOLOv4, self).__init__()self.backbone = CSPDarknet53()self.panet = PANet(num_classes)def forward(self, x):x_52x52, x_26x26, x_13x13 = self.backbone(x)return self.panet(x_52x52, x_26x26, x_13x13)# YOLO Head 定义
class YOLOHead(nn.Module):def __init__(self, in_channels, num_classes):super(YOLOHead, self).__init__()self.conv = ConvBlock(in_channels, in_channels * 2, 3, 1, 1)self.pred = nn.Conv2d(in_channels * 2, 3 * (num_classes + 5), 1, 1, 0)def forward(self, x):x = self.conv(x)return self.pred(x)
代码解释
-
Mish 激活函数
Mish 激活函数取代了 YOLOv3 中的 Leaky ReLU,它的平滑梯度使得模型训练更加稳定。 -
CSPDarknet-53
YOLOv4 使用 CSPDarknet-53 作为主干网络,它引入
了 CSPNet 架构,在每个残差块中进行特征分割和融合,降低了内存消耗并提升了特征提取的效率。
-
PANet
PANet 的引入通过强化不同尺度的特征聚合,提升了小目标的检测效果。它替代了 YOLOv3 中的 FPN。 -
YOLOHead
YOLOv4 中的检测头与 YOLOv3 类似,但在每个尺度上进行了更多的特征卷积操作,以提高预测的准确度。
结论
YOLOv4 相比 YOLOv3 进行了多个方面的改进,包括主干网络的升级、特征聚合模块的优化、激活函数的替换、以及新型的正则化和损失函数的引入。这些改进使得 YOLOv4 在保持实时检测能力的同时,提升了检测的精度和鲁棒性。
相关文章:
目标检测-YOLOv4
YOLOv4介绍 YOLOv4 是 YOLO 系列的第四个版本,继承了 YOLOv3 的高效性,并通过大量优化和改进,在目标检测任务中实现了更高的精度和速度。相比 YOLOv3,YOLOv4 在框架设计、特征提取、训练策略等方面进行了全面升级。它在保持实时检…...
一台笔记本电脑的硬件都有哪些以及对应的功能
一台笔记本电脑的硬件通常包括多个关键组件,这些组件共同协作,确保电脑的正常运行。以下是笔记本电脑的主要硬件及其功能: 1. 中央处理器(CPU) 功能:CPU 是电脑的“大脑”,负责处理所有的计算…...
【程序分享1】第一性原理计算 + 数据处理程序
【1】第一性原理计算 数据处理程序 SMATool 程序:VASP QE 零温 有限温度 拉伸、剪切、双轴、维氏硬度的计算 ElasTool v3.0 程序:材料弹性和机械性能的高效计算和可视化工具包 VELAS 程序:用于弹性各向异性可视化和分析 Phasego 程序…...
【数据结构】栈与队列OJ题(用队列实现栈)(用栈实现队列)
目录 1.用队列实现栈oj题 对比 一、初始化 二、出栈 三、入栈 四、取队头元素: 2.用栈实现队列 一、定义 二、入队列 三、出队列 四、队头 五、判空 前言:如果想了解什么是栈和队列请参考上一篇文章进来一起把【数据结构】的【栈与队列】狠…...
element-ui打包之后图标不显示,woff、ttf加载404
1、bug 起因 昨天在 vue 项目中编写 element-ui 的树形结构的表格,发现项目中无法生效,定位问题之后发现项目使用的 element-ui 的版本是 2.4.11 。看了官方最新版本是 2.15.14,然后得知 2.4.11 版本是不支持表格树形结构的。于是决定升级 el…...
探究零工市场小程序如何改变传统兼职模式
近年来,零工市场小程序正逐渐改变传统的兼职模式,为求职者和雇主提供了一个更为高效、便捷的平台。本文将深入探讨零工市场小程序如何影响传统兼职模式,以及它带来的优势和挑战。 一、背景与挑战 传统的兼职市场往往存在信息不对称的问题&am…...
MySQL数据库安装(详细)—>Mariadb的安装(day21)
该网盘链接有效期为7天,有需要评论区扣我: 通过网盘分享的文件:mariadb-10.3.7-winx64.msi 链接: https://pan.baidu.com/s/1-r_w3NuP8amhIEedmTkWsQ?pwd2ua7 提取码: 2ua7 1 双击打开安装软件 本次安装的是mariaDB,双击打开mar…...
微信小程序实践案例
参考视频: https://www.bilibili.com/video/BV1834y1676P/?p36&spm_id_frompageDriver&vd_sourceb604c19516c17da30b6b1abb6c4e7ec0 前期准备 1、新建三个页面 "pages": ["pages/home/home","pages/message/message",&quo…...
DataLoader使用
文章目录 一、认识dataloader二、DataLoader整合数据集三、使用DataLoader展示图片方法四、去除结尾不满足batch_size设值图片的展示 一、认识dataloader DataLoader 用于封装数据集,并提供批量加载数据的迭代器。它支持自动打乱数据、多线程数据加载等功能。datas…...
CSS学习11--版心和布局流程以及几种分布的例子
版心和布局流程 一、版心二、布局流程三、一列固定宽度且居中四、两列左窄右宽五、通栏平均分布型 一、版心 版心:是指网页主题内容所在的区域。一般在浏览器窗口水平居中位置,常见的宽度值为960px、980px、1000px、1200px等。 二、布局流程 为了提高…...
NetSuite AI 图生代码
去年的ChatGPT热潮期间,我们写过一篇文章说GTP辅助编程的事。 NetSuite GPT的辅助编程实践_如何打开netsuite: html script notes的视图-CSDN博客文章浏览阅读2.2k次,点赞4次,收藏3次。作为GPT综合症的一种表现,我们今朝来探究下…...
Java - BigDecimal计算中位数
日常开发中,如果使用数据库来直接查询一组数据的中位数,就比较简单,直接使用对应的函数就可以了,例如: SUBSTRING_INDEX(SUBSTRING_INDEX(GROUP_CONCAT(目标列名 ORDER BY 目标列名),,,Count(1)/2),,,-1) AS 目标列名_…...
Tensorflow2如何读取自制数据集并训练模型?-- Tensorflow自学笔记13
一. 如何自制数据集? 1. 目录结构 以下是自制数据集-手写数字集, 保存在目录 mnist_image_label 下 2. 数据存储格式 2.1. 目录mnist_train_jpeg_60000 下存放的是 60000张用于测试的手写数字 如 : 0_5.jpg, 表示编号为0,标签为5的图片 6_1.jpg, 表示…...
JVM系列(七) -对象的内存分配流程
一、摘要 在之前的文章中,我们介绍了类加载的过程、JVM 内存布局和对象的创建过程相关的知识。 本篇综合之前的知识,重点介绍一下对象的内存分配流程。 二、对象的内存分配原则 在之前的 JVM 内存结构布局的文章中,我们介绍到了 Java 堆的内存布局,由 年轻代 (Young Ge…...
Apache Ignite 在处理大规模数据时有哪些优势和局限性?
Apache Ignite 在处理大规模数据时的优势和局限性可以从以下几个方面进行分析: 优势 高性能:Ignite 利用内存计算的优势,实现了极高的读写性能,通过分布式架构,它可以将数据分散到多个节点上,从而实现了并…...
怎么利用NodeJS发送视频短信
随着5G时代的来临,企业的数字化转型步伐日益加快,视频短信作为新兴的数字营销工具,正逐步展现出其大的潜力。视频群发短信以其独特的形式和内容,将图片、文字、视频、声音融为一体,为用户带来全新的直观感受࿰…...
WebAPI(三)、 DOM 日期对象Date;获取事件戳;根据节点关系查找节点
文章目录 DOM1. 日期对象(1)、日期对象方法(2)、时间戳(3)、下课倒计时 2. 节点操作(1)、 查找节点(根据节点关系找)(2)、 增加节点:创建create、追加append、克隆clone(3)、 删除节点remove DOM 1. 日期对象 日期对象就是用来表示时间的对…...
012.Oracle-索引
我 的 个 人 主 页:👉👉 失心疯的个人主页 👈👈 入 门 教 程 推 荐 :👉👉 Python零基础入门教程合集 👈👈 虚 拟 环 境 搭 建 :👉&…...
SSL 证书 | 免费获取与自动续期全攻略
前言 随着互联网的不断发展,网站的安全性越来越受到人们的关注。 SSL证书 作为一种保障网站安全的重要手段,已经成为了许多网站的必备配置。 以前阿里云每个账号能生成二十个期限 1 年的免费 SSL 证书,一直用,还挺香࿰…...
达梦数据库管理员常用SQL(一)
达梦数据库管理员常用SQL(一) 数据库基本信息数据库参数信息表空间信息日志文件信息进程和线程信息会话连接信息SQL执行信息等待事件信息事务和锁信息数据库基本信息 --查询数据库内部版本号 select id_code; select build_version from v$instance; select * from v$versi…...
51c自动驾驶~合集58
我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留,CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制(CCA-Attention),…...
通过Wrangler CLI在worker中创建数据库和表
官方使用文档:Getting started Cloudflare D1 docs 创建数据库 在命令行中执行完成之后,会在本地和远程创建数据库: npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库: 现在,您的Cloudfla…...
vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...
为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...
连锁超市冷库节能解决方案:如何实现超市降本增效
在连锁超市冷库运营中,高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术,实现年省电费15%-60%,且不改动原有装备、安装快捷、…...
什么是库存周转?如何用进销存系统提高库存周转率?
你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...
【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习
禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...
JAVA后端开发——多租户
数据隔离是多租户系统中的核心概念,确保一个租户(在这个系统中可能是一个公司或一个独立的客户)的数据对其他租户是不可见的。在 RuoYi 框架(您当前项目所使用的基础框架)中,这通常是通过在数据表中增加一个…...
sshd代码修改banner
sshd服务连接之后会收到字符串: SSH-2.0-OpenSSH_9.5 容易被hacker识别此服务为sshd服务。 是否可以通过修改此banner达到让人无法识别此服务的目的呢? 不能。因为这是写的SSH的协议中的。 也就是协议规定了banner必须这么写。 SSH- 开头,…...
SQL注入篇-sqlmap的配置和使用
在之前的皮卡丘靶场第五期SQL注入的内容中我们谈到了sqlmap,但是由于很多朋友看不了解命令行格式,所以是纯手动获取数据库信息的 接下来我们就用sqlmap来进行皮卡丘靶场的sql注入学习,链接:https://wwhc.lanzoue.com/ifJY32ybh6vc…...
