当前位置：首页 > news >正文

yolo系列笔记（v4-v5）

news 2026/2/8 22:33:17

YOLOv4

YOLOv4网络详解_哔哩哔哩_bilibili

网络结构，在Yolov3的Darknet的基础上增加了CSP结构。

CSP的优点：

加强CNN的学习能力

去除计算瓶颈。

减少显存的消耗。

结构为：

、

其实还是类似与残差网络的结构，保留下采样之前的特征和下采样之后的特征进行拼接，让模型的特征信息能够更全面。

SPP

PAN结构

FPN是将特征层向下累加，这样对于任意特征层来说，他是看不到其下面特征层的信息的，PAN在FPN的基础上，采取了个向上加的功能，让特征层包含的信息更全面。有点类似RNN单向叠加的感觉。这里注意，Yolov4将叠加操作改成了concat拼接。

优化策略

针对前作中的预测框定位的问题。

如果GT真实框真好落在边界点，预测值txty想预测这个边界点的话取值需要趋向于无穷，这显然是很难达到的，所以在v4和v5中对做了一点改进：

问题：这里我个人觉得有点矛盾，因为用sigmoid函数的目的就是为了限制0~1（在一个cell之内）但是这么改进了之后又限制不了了，哪怕是做截断感觉也没啥意义，为啥不用一个简单的函数做映射呢？（下面会做解释）

正负样本分配：

通过计算GT真实框与预设anchor框的IOU来判断正负样本，对于yolov3来说，只采用与GT的IOU最大的anchor作为正样本，Yolov4改成了只要满足IOU大于阈值，那么都是正样本，这样做扩充了正样本的数量。

这里有个改动，Yolov4提出，为了消除grid cell的敏感度，同时也为了扩展正样本数量，落在某个cell内的GT真实框还可能被其周围cell来预测，

因为现在的映射函数改成了：，所以其范围是（-1.5，1.5）相当于以左上角的点作为起点的话，预测框是可以超出一个cell的距离的，像下图3个cell都可以对黑点这个真实框做预测，相当于扩充了正样本的数量，让预测框不被cell限制的那么死。

YOLOV5

YOLOv5网络详解_哔哩哔哩_bilibili

SPP->SPPF

SPP

SPPF

2个k=5的Maxpooling可以等同于一个k=9的Maxpooling，3个k+5等于K=9， SPPF和SPP效果是一样的，但是效率高很多

数据增强

Mosaic：4个拼成一个

copy paste: 将图像抠出来贴到另一张上

Rand affine :随机的缩放，平移等。

MIXup: 调整透明度后叠加

Augment HSV：调整色度，饱和度等

训练策略

损失函数

消除grid敏感度

这个基本和Yolov4中的一样，但Yolov5将长和宽也进行的改动，之前的容易出现指数爆炸，造成BwBh值过大，导致训练不稳定

匹配正样本

Yolov4匹配正样本是通过IOU的阈值是否大于某个预设值来判断是否为正样本，Yolov5在v4的基础上进一步对框的长宽进行限制，下图Rmax是预测框和真实框长宽比值的最大值，当这个最大值超出限制时则将样本设置为负。

相关文章：

yolo系列笔记（v4-v5）

YOLOv4 YOLOv4网络详解_哔哩哔哩_bilibili 网络结构，在Yolov3的Darknet的基础上增加了CSP结构。 CSP的优点： 加强CNN的学习能力去除计算瓶颈。减少显存的消耗。结构为： 、其实还是类似与残差网络的结构，保留下采样之前…...

编程日记 2023/7/31 5:13:08

小白如何高效刷题Leetcode？

文章目录为什么会有这样的现象？研究与学习人生而有别如何解决困境？1. 要补的：化抽象为具体，列举找规律2. 要补的：前人总结的套路3. 与人交流探讨4. 多写总结文章总结明明自觉学会了不少知识，可真正开始…...

编程日记 2023/7/31 5:12:07

使用IDEA打jar包的详细图文教程

1. 点击intellij idea左上角的“File”菜单 -> Project Structure 2. 点击"Artifacts" -> 绿色的"" -> “JAR” -> Empty 3. Name栏填入自定义的名字，Output ditectory 选择 jar 包目标目录，Available Elements 里右击…...

编程日记 2023/7/31 5:11:06

《MySQL 实战 45 讲》课程学习笔记（二）

日志系统：一条 SQL 更新语句是如何执行的？ 与查询流程不一样的是，更新流程还涉及两个重要的日志模块：redo log（重做日志）和 binlog（归档日志）。重要的日志模块：redo l…...

编程日记 2023/7/31 5:10:05

微软亚研院提出模型基础架构RetNet或将成为Transformer有力继承者

作为全新的神经网络架构，RetNet 同时实现了良好的扩展结果、并行训练、低成本部署和高效推理。这些特性将使 RetNet 有可能成为继 Transformer 之后大语言模型基础网络架构的有力继承者。实验数据也显示，在语言建模任务上： RetNet 可以达到与…...

编程日记 2023/7/31 5:09:03

探索单例模式：设计模式中的瑰宝

文章目录常用的设计模式有以下几种：一.创建型模式（Creational Patterns）：二.结构型模式（Structural Patterns）：三.行为型模式（Behavioral Patterns）：四.并发…...

编程日记 2023/7/31 5:08:01

Bobo String Construction 2023牛客暑期多校训练营4-A

登录—专业IT笔试面试备考平台_牛客网题目大意：给出一字符串t，求一个长为n的字符串，使tst中包含且仅包含两个t 1<n<1000;测试样例组数<1000 思路：一开始很容易想到如果t里有1，s就全0，否则s就全…...

编程日记 2023/7/31 5:07:00

【React学习】React父子组件通讯

1. 父到子传值在React框架中，父组件可以通过 props 将数据传递给子组件。子组件通过读取 props 来访问父组件传递过来的数据。当父组件的 props 发生变化时，React 会自动重新渲染子组件以确保子组件中使用的数据保持同步。父组件 import React, {…...

编程日记 2023/7/31 5:05:59

NASM汇编

1. 前置知识 1. 汇编语言两种风格 intel：我们学的NASM就属于Intel风格AT&T：GCC后端工具默认使用这种风格，当然我们也可以加选项改成intel风格 2. 代码 1. 段分布 .text: 存放的是二进制机器码，只读.data: 存放有初始化的…...

编程日记 2023/7/31 5:04:57

第三章 HL7 架构和可用工具 - 使用 HL7 架构结构页面

文章目录第三章 HL7 架构和可用工具 - 使用 HL7 架构结构页面使用 HL7 架构结构页面查看文档类型列表查看消息结构查看段结构第三章 HL7 架构和可用工具 - 使用 HL7 架构结构页面使用 HL7 架构结构页面通过 HL7 架构页面，可以导入和查看 HL7 版本 2 架构规范。…...

编程日记 2023/7/31 5:03:54

spring注解驱动开发（一）

1、需要导入的spring框架的依赖 <dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><version>4.3.12.RELEASE</version></dependency>2、Configuration 设置类为配置类 3、Annota…...

编程日记 2023/7/31 5:02:53

Vue3搭建启动

Vue3搭建&启动一、创建项目二、启动项目三、配置项目1、添加编辑器配置文件2、配置别名3、处理sass/scss4、处理tsx(不用的话可以不处理) 四、添加Eslint 一、创建项目 npm create vite 1.project-name 输入项目名vue3-vite 2.select a framework 选择框架 3.select a var…...

编程日记 2023/7/31 5:01:52

阻塞队列（模拟实现）

概念阻塞队列是带有阻塞功能的队列特性当队列满的时候，继续入队列，就会出现阻塞，阻塞到其他线程从队列中取走元素为止当队列空的时候，继续出队列，也会发生阻塞，阻塞到其他线程往队列中添加元素为止特…...

编程日记 2023/7/31 5:00:51

VScode中python的相对路径与绝对路径 FileNotFoundError: [Errno 2] No such file or directory

VScode中，python里的相对路径是相对于当前工作目录来定位的，而当前的工作目录在VScode中下方的终端窗口会有提示： 说明此时的工作目录并非当前python文件所在的目录，而是C:\Users\xxxxx(你的用户名)。因此，使用VScode…...

编程日记 2023/7/31 4:59:48

Unity XML2——C#读写XML

一、XML 文件的存放位置 （一）只读不写的 XML 放在 Resouces 或者 StreamingAssets 文件夹下，详见 Unity基础3——Resources资源动态加载_weixin_53163894的博客-CSDN博客。 （二）动态存储的 XML 放在 Applica…...

编程日记 2023/7/31 4:58:47

带wiringPi库的交叉编译 ---宿主机x86Ubuntu，目标机ARMv8 aarch64（香橙派）

带wiringPi库的交叉编译如何进行先交叉编译wiringPi库，编译出的库适合香橙派，这时候交叉编译可执行程序的平台和链接库的格式也是正确的，然后通过-I和-L来指定链接的wiringPi库的头文件和库的位置，但是现在还没有学习过&#xf…...

编程日记 2023/7/31 4:57:46

数据仓库基础知识

什么是数据仓库？ 数仓，DataWarehouse，是一个面向主题的、集成的、稳定的、与时间相关的数据集合。而这个数据集合的建立，是为了支持管理者的决策过程。也就是说，我们通过建设数仓，为业务中的流程改进、…...

编程日记 2023/7/31 4:56:45

M 芯片的 macos 系统安装虚拟机 centos7 网络配置

centos 安装之前把网络配置配好或者是把网线插好第一步找到这个第二步打开网络适配器选择图中所指位置设置好之后开机启动 centos 第三步开机以后编写网卡文件保存重启网卡就可以了，如果重启网卡不管用，则重启虚拟机即可 “ ifcfg-ens160 ” 这…...

编程日记 2023/7/31 4:55:43

AcWing 3708. 求矩阵的鞍点

输入样例： 3 4 1 2 3 4 1 2 3 4 1 2 3 4输出样例： 1 4 4 2 4 4 3 4 4 #include<bits/stdc.h> using namespace std; const int N1010; int n,m,a[N][N],x[N],y[N],flag1; int main(){scanf("%d%d",&n,&m);for(int i1;i<n;i…...

编程日记 2023/7/31 4:54:42

web前端开发工程师的具体职责范本（合集）

web前端开发工程师的具体职责范本1 职责： 1.负责web前端架构的搭建，核心业务功能开发和核心代码编写。 2.配合产品经理，实现产品UI和交互方面的需求，持续界面优化，提升用户体验。 3.参与相关业务需求变更评审。 4.…...

编程日记 2023/7/31 4:53:41

Vue记事本应用实现教程

文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展：显示创建时间8. 功能扩展：记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...

编程新知 2025/9/20 5:20:12

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2026/2/8 20:43:02

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/8 20:42:41

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする 1、前言（1）情况说明（2）工程师的信仰2、知识点（1）　にする1，接续：名词＋にする2，接续：疑问词＋にする3，（A）は（B）にする。（2）復習：（1）复习句子（2）ために　＆　ように（３）そう（４）にする3、…...

编程新知 2025/11/20 7:52:01

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2026/1/23 12:16:56

Springcloud：Eureka 高可用集群搭建实战（服务注册与发现的底层原理与避坑指南）

引言：为什么 Eureka 依然是存量系统的核心？ 尽管 Nacos 等新注册中心崛起，但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制，是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

编程新知 2026/1/31 7:23:48

Unit 1 深度强化学习简介

Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库，例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体，比如 SnowballFight、Huggy the Do…...

编程新知 2026/2/8 12:54:53

06 Deep learning神经网络编程基础激活函数 --吴恩达

深度学习激活函数详解一、核心作用引入非线性：使神经网络可学习复杂模式控制输出范围：如Sigmoid将输出限制在(0,1)梯度传递：影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

编程新知 2025/11/17 21:48:26

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤通用： 方法一：使用 Homebrew 安装 Git（推荐） 步骤如下：打开终端（Terminal.app） 1.安装 Homebrew…...

编程新知 2026/1/30 4:58:21

Kubernetes 网络模型深度解析：Pod IP 与 Service 的负载均衡机制，Service到底是什么？

Pod IP 的本质与特性 Pod IP 的定位纯端点地址：Pod IP 是分配给 Pod 网络命名空间的真实 IP 地址（如 10.244.1.2）无特殊名称：在 Kubernetes 中，它通常被称为 “Pod IP” 或 “容器 IP”生命周期：与 Pod …...

编程新知 2025/11/4 22:48:45