当前位置：首页 > news >正文

Yolo系列-yolov1

news 2026/2/8 23:43:33

YOLO-V1
经典的one-stage方法
YouOnlyLookOnce，名字就已经说明了一切！把检测问题转化成回归问题，一个CNN就搞定了！可以对视频进行实时检测，应用领域非常广！
在这里插入图片描述 核心思想：

Yolov1的核心思想是将对象检测问题转化为一个回归问题，通过单个神经网络直接在输入图像上预测边界框和类别。这个网络被划分为多个网格，每个网格负责检测特定区域内的对象。每个网格预测多个边界框和每个边界框的置信度，以及每个边界框所属的类别。整个网络采用全连接层将所有预测值聚合在一起，并利用非极大值抑制过滤出最终的检测结果。这种方法减少了检测过程中的计算量，提高了检测速度，同时保持了较高的准确率。
在这里插入图片描述 网络架构

在这里插入图片描述
YOLOv1（You Only Look Once Version 1）是一种基于卷积神经网络的目标检测算法，由Joseph Redmon于2015年提出。相较于之前的目标检测算法，YOLOv1在速度上有很大的优势，可以实现实时目标检测。

YOLOv1的网络架构可以分为两个阶段：特征提取和目标检测。特征提取使用了一个24层的卷积神经网络，将输入图像经过多次卷积层和池化层处理后，得到一张特征图。目标检测则在这张特征图上完成，将图像分成7x7个网格，并对每个网格预测目标的类别和位置。

YOLOv1的网络架构如下图所示：

yolov1-network-arch

输入图像首先会经过一个卷积层，该卷积层使用Sobel边缘检测滤波器，可以提取图像中的边缘信息。接着经过多个卷积层和池化层处理，最后得到一张7x7x1024的特征图。这张特征图被分为7x7个网格，每个网格预测两个边界框（bounding box），每个边界框包含5个预测值：x、y、w、h和置信度（confidence）。x和y表示边界框中心在网格中的位置，w和h表示边界框的宽度和高度，置信度表示该边界框包含目标的概率。

YOLOv1的训练过程使用了交叉熵损失函数，并且将不同类别的损失进行了加权，使得小目标和大目标的权重相等，避免了某些类别在预测时过度占据了损失函数。此外，YOLOv1的训练过程采用了多尺度输入图像，以更好地处理不同大小的目标。

虽然YOLOv1在速度上有很大的优势，但是在检测精度方面并不是最优的。随后的YOLOv2、YOLOv3和YOLOv4等版本不断推出，对YOLOv1的网络架构进行了改进和优化，提高了检测精度和速度。

每个数字的含义

在这里插入图片描述
损失函数

NMS(非极大值抑制)

在这里插入图片描述 NMS (Non-maximum suppression，非极大值抑制)是一种在计算机视觉中常用的技术，主要用于目标检测、边缘检测等领域中的局部最大值的筛选。

在目标检测中，经常会使用滑动窗口或者锚框来搜索可能包含目标的区域。这个过程中，往往会产生很多重叠的检测结果，不同的检测结果可能都认为自己是目标。这时候，需要使用NMS来筛选掉其中的冗余检测结果，只保留最准确的那一个。

NMS的基本思想很简单，对于一组检测结果，首先会按照其得分（比如分类概率）从高到低排序，然后从得分最高的检测结果开始，遍历其余所有检测结果。对于任意两个重叠度（IoU）大于一定阈值的检测结果，只保留得分较高的那个，将得分较低的检测结果删除。重复这个过程，直到所有检测结果被遍历完。

NMS算法的核心就是对检测框进行排序和遍历并删除冗余的检测框，然后返回排好序的检测框列表。NMS算法是目标检测的重要组成部分，也是多个目标检测算法共有的一个优化手段。
YOLO-V1的优缺点

优点：快速，简单！
问题1：每个Cell只预测一个类别，如果重叠无法解决问题2：小物体检测效果一般，长宽比可选的但单一

Yolo系列-yolov1

相关文章：

Yolo系列-yolov1

单片机TVS/ESD二极管防护

TCP协议的重点知识点

大数据——一文熟悉HBase

如何有效进行RLHF的数据标注？

2023年8月22日OpenAI推出了革命性更新：ChatGPT-3.5 Turbo微调和API更新，为您的业务量身打造AI模型

windows配置wsl，Unbuntu启动GPU加速

Postman测WebSocket接口

【内网穿透】搭建我的世界Java版服务器，公网远程联机

Unable to Locate package python2| Linux Ubuntu系统下python2的安装

从上帝视角俯瞰vue2路由(简单易懂)

STL-空间配置器的了解

哔哩哔哩 B站 bilibili 视频视频音效调节清澈人声

下一代存储解决方案：湖仓一体

IntelliJ IDEA 2023.2.1 修复版本日志

算法通关村十三关 | 数组字符串加法专题

k8s--基本概念理解

流媒体开发千问【持续更新】

全球各国官方语言大盘点，英语不得不学哇。。。

【mq】如何保证消息可靠性

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

CMake基础：构建流程详解

在四层代理中还原真实客户端ngx_stream_realip_module

跨链模式：多链互操作架构与性能扩展方案

c#开发AI模型对话

在WSL2的Ubuntu镜像中安装Docker

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

华硕a豆14 Air香氛版，美学与科技的馨香融合

【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的“no matching...“系列算法协商失败问题

c++第七天继承与派生2