YOLOv5 目标检测优化:降低误检与漏检
1. 引言
在目标检测任务中,误检(False Positive, FP)和漏检(False Negative, FN)是影响检测性能的两个主要问题。误检意味着模型检测到了不存在的目标,而漏检则指模型未能检测到真实存在的目标。本文将介绍如何优化 YOLOv5 以减少误检和漏检,提高检测精度。
2. 误检与漏检的常见原因
2.1 误检的常见原因
- 训练数据质量问题:数据集存在噪声,如误标注或错误样本。
- 背景复杂度过高:目标与背景相似度高,导致模型误判。
- IoU(交并比)阈值过低:如果 NMS(非极大值抑制)中的 IoU 阈值过低,可能会保留过多低质量的框。
- 过拟合:模型在训练数据上表现良好,但在测试数据上泛化能力差。
- 类别不均衡:某些类别样本过多,导致模型倾向于过度检测。
2.2 漏检的常见原因
- 置信度阈值过高:如果模型置信度设定过高,可能会导致部分低置信度目标被忽略。
- 目标尺寸太小:YOLOv5 在小目标检测上相对较弱,可能难以检测微小目标。
- 数据增强过度:过强的数据增强可能会改变目标形态,使模型难以识别。
- 网络结构限制:默认 YOLOv5 的网络结构可能不适用于所有任务,可能需要调整。
- 数据集不完整:如果数据集中缺少某些类别或场景,模型可能无法学习到足够的特征。
3. 降低误检的方法
3.1 提高训练数据质量
- 清理数据集:去除错误标注、重复数据或模糊目标。
- 平衡类别分布:尽可能使数据集中的不同类别样本数量均衡。
- 增加硬例(Hard Examples):针对易混淆类别增加相应样本,提升模型区分能力。
3.2 调整NMS(非极大值抑制)
在 data/hyp.scratch.yaml 中调整 IoU 阈值,例如:
nms_iou: 0.45 # 降低 IoU 阈值可以减少重复框
如果误检较多,可适当 降低 IoU 阈值,如 0.3-0.4,但不能太低,否则可能导致漏检。
3.3 调整置信度阈值
检测时的置信度阈值影响最终输出的检测结果。在 detect.py 中修改 conf-thres 参数,例如:
python detect.py --conf-thres 0.3
如果误检多,可 提高 置信度阈值,如 --conf-thres 0.4,但不能过高,否则可能导致漏检。
3.4 调整损失函数
如果误检较多,可以尝试修改 loss 计算方式,如增加 类别损失(class loss) 的权重:
cls_pw: 1.5 # 默认 1.0,可适当增加
3.5 增强数据增强策略
如果背景复杂导致误检,可以减少强烈的数据增强,避免模型学到无关信息。例如,减少 hsv_h, hsv_s, hsv_v 的变化范围:
hsv_h: 0.015 # 色调变化减少
hsv_s: 0.5 # 饱和度调整
hsv_v: 0.4 # 亮度调整
3.6 采用更强的模型
如果误检仍然较多,可以使用更大的 YOLOv5 变体,如 yolov5l 或 yolov5x,提高检测能力。
python train.py --weights yolov5l.pt --epochs 300
4. 降低漏检的方法
4.1 降低置信度阈值
如果模型漏检较多,可以适当 降低 置信度阈值,例如 --conf-thres 0.2,但不能过低,否则会引入过多误检。
4.2 适当提高 NMS IoU 阈值
如果检测框被误过滤,可以适当 提高 IoU 阈值:
nms_iou: 0.5 # 提高 IoU 过滤
4.3 增强小目标检测能力
YOLOv5 对小目标检测较弱,可采用以下方法:
- 使用更高分辨率的输入:
python train.py --img-size 1280
- 修改网络结构:调整
yolov5s.yaml中的depth_multiple适当增加检测层。 - 数据增强:增加 Mosaic 和 Copy-Paste 以增强小目标样本。
4.4 采用多尺度训练
python train.py --multi-scale
开启多尺度训练,使模型能更好适应不同大小的目标。
4.5 采用更优的 Anchor Box
如果目标形状特殊,可以重新计算 Anchor:
python utils/autoanchor.py --dataset mydataset
4.6 采用数据增广策略
如果漏检主要集中在某些特定角度或场景,可以增加相应的数据增强,例如 旋转、仿射变换。
5. 训练时的优化建议
5.1 选择合适的预训练模型
预训练模型的选择影响模型性能。例如,检测小目标时,使用 yolov5m 或 yolov5l 可能比 yolov5s 更好。
5.2 调整学习率策略
适当调整 lr0 和 lrf,避免训练初期过快收敛。
lr0: 0.01 # 初始学习率
lrf: 0.2 # 最终学习率
5.3 训练更多 epochs
对于复杂任务,可以适当增加训练 epochs,例如:
python train.py --epochs 500
6. 结论
降低误检和漏检需要从 数据、超参数、网络结构、训练策略 等多个方面优化。关键点包括:
- 数据集质量 是核心,应清理数据、平衡类别。
- 调整置信度阈值 适应不同任务需求。
- 优化 NMS 策略,适当调整 IoU 阈值。
- 使用更大的模型 或 改进 Anchor 设计 提升检测能力。
- 数据增强策略 需适度,避免过强影响模型泛化。
通过合理的优化,可以大幅降低误检和漏检,提高 YOLOv5 在目标检测任务中的表现。
相关文章:
YOLOv5 目标检测优化:降低误检与漏检
1. 引言 在目标检测任务中,误检(False Positive, FP)和漏检(False Negative, FN)是影响检测性能的两个主要问题。误检意味着模型检测到了不存在的目标,而漏检则指模型未能检测到真实存在的目标。本文将介绍…...
网络安全治理模型
0x02 知识点 安全的目标是提供 可用性 Avialability机密性 confidentiality完整性 Integrity真实性 Authenticity不可否认性 Nonrepudiation 安全治理是一个提供监督、问责和合规性的框架 信息安全系统 Information Security Management System ISMS 策略,工作程…...
网络原理-
文章目录 协议应用层传输层网络层 数据链路层 协议 在网络通信中,协议是非常重要的概念.协议就是一种约定. 在网络通信过程中,对协议进行了分层 接下来就按照顺序向大家介绍每一种核心的协议. 应用层 应用层是咱们程序员打交道最多的一层协议.应用层里有很多现成的协议,但…...
HTML/CSS中交集选择器
1.作用:选中同时符合多个条件的元素 交集就是或的意思 2.语法:选择器1选择器2选择器3......选择器n{} 3.举例: /* 选中:类名为beauty的p元素,此种写法用的非常的多 */p.beauty{color: red;}/* 选中:类名包含rich和beauty的元素 */.rich.beauty{color: blue;} 4.注意: 1.有标签…...
机器学习(1)安装Pytorch
1.安装命令 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 2.安装过程Log: Looking in indexes: https://download.pytorch.org/whl/cu118 Co…...
Spring Boot过滤器链:从入门到精通
文章目录 一、过滤器链是什么?二、为什么需要过滤器链?三、Spring Boot中的过滤器链是如何工作的?(一)过滤器的生命周期(二)过滤器链的执行流程 四、如何在Spring Boot中定义自己的过滤器&#…...
vue3之echarts3D圆柱
vue3之echarts3D圆柱 效果: 版本 "echarts": "^5.1.2" 核心代码: <template><div ref"charts" class"charts"></div><svg><linearGradient id"labColor" x1"0&q…...
Redux中间件redux-thunk和redux-saga的具体区别是什么?
Redux 中间件是增强 Redux 功能的重要工具,redux-thunk 和 redux-saga 是两个常用的中间件,它们在处理异步操作和副作用时提供了不同的方式和理念。以下是两者的具体区别: 1. 概念与设计理念 redux-thunk 简洁:redux-thunk 是一…...
代码随想录算法训练营第四十三天| 动态规划06
322. 零钱兑换 如果求组合数就是外层for循环遍历物品,内层for遍历背包。 如果求排列数就是外层for遍历背包,内层for循环遍历物品。 这句话结合本题 大家要好好理解。 视频讲解:动态规划之完全背包,装满背包最少的物品件数是多少&…...
UI自动化教程 —— 元素定位技巧:精确找到你需要的页面元素
引言 在UI自动化测试中,准确地定位页面元素是至关重要的。无论是点击按钮、填写表单还是验证页面内容,都需要首先找到相应的页面元素。Playwright 提供了多种方法来实现这一点,包括使用CSS选择器和XPath进行元素定位,以及利用文本…...
MySQL六大日志的功能介绍。
前言 首先,MySQL的日志应该包括二进制日志(Binary Log)、错误日志(Error Log)、查询日志(General Query Log)、慢查询日志(Slow Query Log)、重做日志(Redo …...
二级指针略解【C语言】
以int** a为例 1.二级指针的声明 a 是一个指向 int*(指向整型的指针)的指针,即二级指针。 通俗的讲,a是一个指向指针的指针,对a解引用会是一个指针。 它可以用于操作动态分配的二维数组、指针数组或需要间接修改指针…...
鸿蒙状态管理概述
状态管理 状态管理之v1LocalStorageLocalStorageLink的框架行为LocalStorageProp的框架行为LocalStorage使用场景 AppStorageStorageLink的框架行为StorageProp的框架行为AppStorage的使用场景 PersistentStorageEnvironmentEnvironment内置参数 WatchWatch的使用场景 $$语法$$…...
【核心算法篇十三】《DeepSeek自监督学习:图像补全预训练方案》
引言:为什么自监督学习成为AI新宠? 在传统监督学习需要海量标注数据的困境下,自监督学习(Self-Supervised Learning)凭借无需人工标注的特性异军突起。想象一下,如果AI能像人类一样通过观察世界自我学习——这正是DeepSeek图像补全方案的技术哲学。根据,自监督学习通过…...
由浅入深学习大语言模型RLHF(PPO强化学习- v1浅浅的)
最近,随着DeepSeek的爆火,GRPO也走进了视野中。为了更好的学习GRPO,需要对PPO的强化学习有一个深入的理解,那么写一篇文章加深理解吧。纵观网上的文章,要么说PPO原理,各种复杂的公式看了就晕,要…...
网络安全三件套
一、在线安全的四个误解 Internet实际上是个有来有往的世界,你可以很轻松地连接到你喜爱的站点,而其他人,例如黑客也很方便地连接到你的机器。实际上,很多机器都因为自己很糟糕的在线安全设置无意间在机器和系统中留下了“…...
瑞芯微RV1126部署YOLOv8全流程:环境搭建、pt-onnx-rknn模型转换、C++推理代码、错误解决、优化、交叉编译第三方库
目录 1 环境搭建 2 交叉编译opencv 3 模型训练 4 模型转换 4.1 pt模型转onnx模型 4.2 onnx模型转rknn模型 4.2.1 安装rknn-toolkit 4.2.2 onn转成rknn模型 5 升级npu驱动 6 C++推理源码demo 6.1 原版demo 6.2 增加opencv读取图片的代码 7 交叉编译x264 ffmepg和op…...
【ISO 14229-1:2023 UDS诊断(会话控制0x10服务)测试用例CAPL代码全解析⑤】
ISO 14229-1:2023 UDS诊断【会话控制0x10服务】_TestCase05 作者:车端域控测试工程师 更新日期:2025年02月15日 关键词:UDS诊断、0x10服务、诊断会话控制、ECU测试、ISO 14229-1:2023 TC10-005测试用例 用例ID测试场景验证要点参考条款预期…...
python-leetcode 35.二叉树的中序遍历
给定一个二叉树的根节点root,返回它的中序遍历。 方法一:递归 二叉树的中序遍历:按照访问左子树——根节点——右子树的方式遍历这棵树,而在访问左子树或者右子树的时候我们按照同样的方式遍历,直到遍历完整棵树。因此整个遍历过…...
glob 用法技巧
目录 处理大量文件节省内存 匹配多个文件扩展名 遍历多种格式文件 遍历某一个文件: 查找当前目录和子目录 6. 排除特定文件 7. 大小写不敏感匹配 8. 获取绝对路径 9. 处理特殊字符 处理大量文件节省内存 技巧:用 iglob 替代 glob,逐…...
通过Wrangler CLI在worker中创建数据库和表
官方使用文档:Getting started Cloudflare D1 docs 创建数据库 在命令行中执行完成之后,会在本地和远程创建数据库: npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库: 现在,您的Cloudfla…...
基于Flask实现的医疗保险欺诈识别监测模型
基于Flask实现的医疗保险欺诈识别监测模型 项目截图 项目简介 社会医疗保险是国家通过立法形式强制实施,由雇主和个人按一定比例缴纳保险费,建立社会医疗保险基金,支付雇员医疗费用的一种医疗保险制度, 它是促进社会文明和进步的…...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案
一、TRS收益互换的本质与业务逻辑 (一)概念解析 TRS(Total Return Swap)收益互换是一种金融衍生工具,指交易双方约定在未来一定期限内,基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...
【HTML-16】深入理解HTML中的块元素与行内元素
HTML元素根据其显示特性可以分为两大类:块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...
自然语言处理——循环神经网络
自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元(GRU)长短期记忆神经网络(LSTM)…...
vue3+vite项目中使用.env文件环境变量方法
vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...
【分享】推荐一些办公小工具
1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由:大部分的转换软件需要收费,要么功能不齐全,而开会员又用不了几次浪费钱,借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...
JavaScript基础-API 和 Web API
在学习JavaScript的过程中,理解API(应用程序接口)和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能,使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...
