YOLOv5 目标检测优化:降低误检与漏检
1. 引言
在目标检测任务中,误检(False Positive, FP)和漏检(False Negative, FN)是影响检测性能的两个主要问题。误检意味着模型检测到了不存在的目标,而漏检则指模型未能检测到真实存在的目标。本文将介绍如何优化 YOLOv5 以减少误检和漏检,提高检测精度。
2. 误检与漏检的常见原因
2.1 误检的常见原因
- 训练数据质量问题:数据集存在噪声,如误标注或错误样本。
- 背景复杂度过高:目标与背景相似度高,导致模型误判。
- IoU(交并比)阈值过低:如果 NMS(非极大值抑制)中的 IoU 阈值过低,可能会保留过多低质量的框。
- 过拟合:模型在训练数据上表现良好,但在测试数据上泛化能力差。
- 类别不均衡:某些类别样本过多,导致模型倾向于过度检测。
2.2 漏检的常见原因
- 置信度阈值过高:如果模型置信度设定过高,可能会导致部分低置信度目标被忽略。
- 目标尺寸太小:YOLOv5 在小目标检测上相对较弱,可能难以检测微小目标。
- 数据增强过度:过强的数据增强可能会改变目标形态,使模型难以识别。
- 网络结构限制:默认 YOLOv5 的网络结构可能不适用于所有任务,可能需要调整。
- 数据集不完整:如果数据集中缺少某些类别或场景,模型可能无法学习到足够的特征。
3. 降低误检的方法
3.1 提高训练数据质量
- 清理数据集:去除错误标注、重复数据或模糊目标。
- 平衡类别分布:尽可能使数据集中的不同类别样本数量均衡。
- 增加硬例(Hard Examples):针对易混淆类别增加相应样本,提升模型区分能力。
3.2 调整NMS(非极大值抑制)
在 data/hyp.scratch.yaml 中调整 IoU 阈值,例如:
nms_iou: 0.45 # 降低 IoU 阈值可以减少重复框
如果误检较多,可适当 降低 IoU 阈值,如 0.3-0.4,但不能太低,否则可能导致漏检。
3.3 调整置信度阈值
检测时的置信度阈值影响最终输出的检测结果。在 detect.py 中修改 conf-thres 参数,例如:
python detect.py --conf-thres 0.3
如果误检多,可 提高 置信度阈值,如 --conf-thres 0.4,但不能过高,否则可能导致漏检。
3.4 调整损失函数
如果误检较多,可以尝试修改 loss 计算方式,如增加 类别损失(class loss) 的权重:
cls_pw: 1.5 # 默认 1.0,可适当增加
3.5 增强数据增强策略
如果背景复杂导致误检,可以减少强烈的数据增强,避免模型学到无关信息。例如,减少 hsv_h, hsv_s, hsv_v 的变化范围:
hsv_h: 0.015 # 色调变化减少
hsv_s: 0.5 # 饱和度调整
hsv_v: 0.4 # 亮度调整
3.6 采用更强的模型
如果误检仍然较多,可以使用更大的 YOLOv5 变体,如 yolov5l 或 yolov5x,提高检测能力。
python train.py --weights yolov5l.pt --epochs 300
4. 降低漏检的方法
4.1 降低置信度阈值
如果模型漏检较多,可以适当 降低 置信度阈值,例如 --conf-thres 0.2,但不能过低,否则会引入过多误检。
4.2 适当提高 NMS IoU 阈值
如果检测框被误过滤,可以适当 提高 IoU 阈值:
nms_iou: 0.5 # 提高 IoU 过滤
4.3 增强小目标检测能力
YOLOv5 对小目标检测较弱,可采用以下方法:
- 使用更高分辨率的输入:
python train.py --img-size 1280
- 修改网络结构:调整
yolov5s.yaml中的depth_multiple适当增加检测层。 - 数据增强:增加 Mosaic 和 Copy-Paste 以增强小目标样本。
4.4 采用多尺度训练
python train.py --multi-scale
开启多尺度训练,使模型能更好适应不同大小的目标。
4.5 采用更优的 Anchor Box
如果目标形状特殊,可以重新计算 Anchor:
python utils/autoanchor.py --dataset mydataset
4.6 采用数据增广策略
如果漏检主要集中在某些特定角度或场景,可以增加相应的数据增强,例如 旋转、仿射变换。
5. 训练时的优化建议
5.1 选择合适的预训练模型
预训练模型的选择影响模型性能。例如,检测小目标时,使用 yolov5m 或 yolov5l 可能比 yolov5s 更好。
5.2 调整学习率策略
适当调整 lr0 和 lrf,避免训练初期过快收敛。
lr0: 0.01 # 初始学习率
lrf: 0.2 # 最终学习率
5.3 训练更多 epochs
对于复杂任务,可以适当增加训练 epochs,例如:
python train.py --epochs 500
6. 结论
降低误检和漏检需要从 数据、超参数、网络结构、训练策略 等多个方面优化。关键点包括:
- 数据集质量 是核心,应清理数据、平衡类别。
- 调整置信度阈值 适应不同任务需求。
- 优化 NMS 策略,适当调整 IoU 阈值。
- 使用更大的模型 或 改进 Anchor 设计 提升检测能力。
- 数据增强策略 需适度,避免过强影响模型泛化。
通过合理的优化,可以大幅降低误检和漏检,提高 YOLOv5 在目标检测任务中的表现。
相关文章:
YOLOv5 目标检测优化:降低误检与漏检
1. 引言 在目标检测任务中,误检(False Positive, FP)和漏检(False Negative, FN)是影响检测性能的两个主要问题。误检意味着模型检测到了不存在的目标,而漏检则指模型未能检测到真实存在的目标。本文将介绍…...
网络安全治理模型
0x02 知识点 安全的目标是提供 可用性 Avialability机密性 confidentiality完整性 Integrity真实性 Authenticity不可否认性 Nonrepudiation 安全治理是一个提供监督、问责和合规性的框架 信息安全系统 Information Security Management System ISMS 策略,工作程…...
网络原理-
文章目录 协议应用层传输层网络层 数据链路层 协议 在网络通信中,协议是非常重要的概念.协议就是一种约定. 在网络通信过程中,对协议进行了分层 接下来就按照顺序向大家介绍每一种核心的协议. 应用层 应用层是咱们程序员打交道最多的一层协议.应用层里有很多现成的协议,但…...
HTML/CSS中交集选择器
1.作用:选中同时符合多个条件的元素 交集就是或的意思 2.语法:选择器1选择器2选择器3......选择器n{} 3.举例: /* 选中:类名为beauty的p元素,此种写法用的非常的多 */p.beauty{color: red;}/* 选中:类名包含rich和beauty的元素 */.rich.beauty{color: blue;} 4.注意: 1.有标签…...
机器学习(1)安装Pytorch
1.安装命令 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 2.安装过程Log: Looking in indexes: https://download.pytorch.org/whl/cu118 Co…...
Spring Boot过滤器链:从入门到精通
文章目录 一、过滤器链是什么?二、为什么需要过滤器链?三、Spring Boot中的过滤器链是如何工作的?(一)过滤器的生命周期(二)过滤器链的执行流程 四、如何在Spring Boot中定义自己的过滤器&#…...
vue3之echarts3D圆柱
vue3之echarts3D圆柱 效果: 版本 "echarts": "^5.1.2" 核心代码: <template><div ref"charts" class"charts"></div><svg><linearGradient id"labColor" x1"0&q…...
Redux中间件redux-thunk和redux-saga的具体区别是什么?
Redux 中间件是增强 Redux 功能的重要工具,redux-thunk 和 redux-saga 是两个常用的中间件,它们在处理异步操作和副作用时提供了不同的方式和理念。以下是两者的具体区别: 1. 概念与设计理念 redux-thunk 简洁:redux-thunk 是一…...
代码随想录算法训练营第四十三天| 动态规划06
322. 零钱兑换 如果求组合数就是外层for循环遍历物品,内层for遍历背包。 如果求排列数就是外层for遍历背包,内层for循环遍历物品。 这句话结合本题 大家要好好理解。 视频讲解:动态规划之完全背包,装满背包最少的物品件数是多少&…...
UI自动化教程 —— 元素定位技巧:精确找到你需要的页面元素
引言 在UI自动化测试中,准确地定位页面元素是至关重要的。无论是点击按钮、填写表单还是验证页面内容,都需要首先找到相应的页面元素。Playwright 提供了多种方法来实现这一点,包括使用CSS选择器和XPath进行元素定位,以及利用文本…...
MySQL六大日志的功能介绍。
前言 首先,MySQL的日志应该包括二进制日志(Binary Log)、错误日志(Error Log)、查询日志(General Query Log)、慢查询日志(Slow Query Log)、重做日志(Redo …...
二级指针略解【C语言】
以int** a为例 1.二级指针的声明 a 是一个指向 int*(指向整型的指针)的指针,即二级指针。 通俗的讲,a是一个指向指针的指针,对a解引用会是一个指针。 它可以用于操作动态分配的二维数组、指针数组或需要间接修改指针…...
鸿蒙状态管理概述
状态管理 状态管理之v1LocalStorageLocalStorageLink的框架行为LocalStorageProp的框架行为LocalStorage使用场景 AppStorageStorageLink的框架行为StorageProp的框架行为AppStorage的使用场景 PersistentStorageEnvironmentEnvironment内置参数 WatchWatch的使用场景 $$语法$$…...
【核心算法篇十三】《DeepSeek自监督学习:图像补全预训练方案》
引言:为什么自监督学习成为AI新宠? 在传统监督学习需要海量标注数据的困境下,自监督学习(Self-Supervised Learning)凭借无需人工标注的特性异军突起。想象一下,如果AI能像人类一样通过观察世界自我学习——这正是DeepSeek图像补全方案的技术哲学。根据,自监督学习通过…...
由浅入深学习大语言模型RLHF(PPO强化学习- v1浅浅的)
最近,随着DeepSeek的爆火,GRPO也走进了视野中。为了更好的学习GRPO,需要对PPO的强化学习有一个深入的理解,那么写一篇文章加深理解吧。纵观网上的文章,要么说PPO原理,各种复杂的公式看了就晕,要…...
网络安全三件套
一、在线安全的四个误解 Internet实际上是个有来有往的世界,你可以很轻松地连接到你喜爱的站点,而其他人,例如黑客也很方便地连接到你的机器。实际上,很多机器都因为自己很糟糕的在线安全设置无意间在机器和系统中留下了“…...
瑞芯微RV1126部署YOLOv8全流程:环境搭建、pt-onnx-rknn模型转换、C++推理代码、错误解决、优化、交叉编译第三方库
目录 1 环境搭建 2 交叉编译opencv 3 模型训练 4 模型转换 4.1 pt模型转onnx模型 4.2 onnx模型转rknn模型 4.2.1 安装rknn-toolkit 4.2.2 onn转成rknn模型 5 升级npu驱动 6 C++推理源码demo 6.1 原版demo 6.2 增加opencv读取图片的代码 7 交叉编译x264 ffmepg和op…...
【ISO 14229-1:2023 UDS诊断(会话控制0x10服务)测试用例CAPL代码全解析⑤】
ISO 14229-1:2023 UDS诊断【会话控制0x10服务】_TestCase05 作者:车端域控测试工程师 更新日期:2025年02月15日 关键词:UDS诊断、0x10服务、诊断会话控制、ECU测试、ISO 14229-1:2023 TC10-005测试用例 用例ID测试场景验证要点参考条款预期…...
python-leetcode 35.二叉树的中序遍历
给定一个二叉树的根节点root,返回它的中序遍历。 方法一:递归 二叉树的中序遍历:按照访问左子树——根节点——右子树的方式遍历这棵树,而在访问左子树或者右子树的时候我们按照同样的方式遍历,直到遍历完整棵树。因此整个遍历过…...
glob 用法技巧
目录 处理大量文件节省内存 匹配多个文件扩展名 遍历多种格式文件 遍历某一个文件: 查找当前目录和子目录 6. 排除特定文件 7. 大小写不敏感匹配 8. 获取绝对路径 9. 处理特殊字符 处理大量文件节省内存 技巧:用 iglob 替代 glob,逐…...
iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享
平时用 iPhone 的时候,难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵,或者买了二手 iPhone 却被原来的 iCloud 账号锁住,这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...
YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...
linux 错误码总结
1,错误码的概念与作用 在Linux系统中,错误码是系统调用或库函数在执行失败时返回的特定数值,用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递,errno由操作系统维护,保存最近一次发生的错误信息。值得注意的是,errno的值在每次系统调用或函数调用失败时…...
spring:实例工厂方法获取bean
spring处理使用静态工厂方法获取bean实例,也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下: 定义实例工厂类(Java代码),定义实例工厂(xml),定义调用实例工厂ÿ…...
【git】把本地更改提交远程新分支feature_g
创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...
从零实现STL哈希容器:unordered_map/unordered_set封装详解
本篇文章是对C学习的STL哈希容器自主实现部分的学习分享 希望也能为你带来些帮助~ 那咱们废话不多说,直接开始吧! 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...
springboot整合VUE之在线教育管理系统简介
可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生,小白用户,想学习知识的 有点基础,想要通过项…...
AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别
【导读】 野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而,传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案,能够实现大范围覆盖并远程采集数据。尽管具备这些优势…...
[大语言模型]在个人电脑上部署ollama 并进行管理,最后配置AI程序开发助手.
ollama官网: 下载 https://ollama.com/ 安装 查看可以使用的模型 https://ollama.com/search 例如 https://ollama.com/library/deepseek-r1/tags # deepseek-r1:7bollama pull deepseek-r1:7b改token数量为409622 16384 ollama命令说明 ollama serve #:…...
【Linux手册】探秘系统世界:从用户交互到硬件底层的全链路工作之旅
目录 前言 操作系统与驱动程序 是什么,为什么 怎么做 system call 用户操作接口 总结 前言 日常生活中,我们在使用电子设备时,我们所输入执行的每一条指令最终大多都会作用到硬件上,比如下载一款软件最终会下载到硬盘上&am…...
