当前位置：首页 > news >正文

深度学习9--目标检测

news 2026/2/9 14:46:25

1.概念介绍

目标检测不仅可以检测数字，而且可以检测动物的种类、汽车的种类等。例如，自动驾驶车辆需要自动识别前方物体是车辆还是行人，需要自动识别道路两旁的指示牌和前方的红绿灯颜色。对于自动检测的算法，有两个要求，一个是快，一个是准。VOC是一个挑战赛，主要目的是识别真实场景中的一系列物体。交并比是交集与并集的比例。假设需要检测到其中“0”的位置。白色方框是人工标注的标准答案，也是想要预测的理想位置。灰色方框是预测的实际位置。通过IoU 计算，利用两个框的交集面积与并集面积的比值就可以衡量模型预测的灰框是否准确。

平均精度均值（mAP）衡量一个目标检测模型整体效果的指标。对于图像分类模型，整个流程就是根据损失函数来反向传播更新深度卷积网络中各个卷积核的参数，而所需要的数据集就是图片数据和图片标签。其实对于YOLOv1这样的一步走模型，整个流程大体差不多，所以需要研究的有4个方面：输入、网络、输出、损失函数。

输出：YOLO v1模型速度之所以快是因为它的候选框的数量并不多。首先，把一个输入图片分成S×S 的格子，然后以每个格子为中心，预测出来B 个候选框(Bounding Boxes),每个候选框包含5个预测值，其中4个表示位置信息，1个表示置信度。

注意：如果两个物体的中心点在同一个cell内，则会失去一个物体的预测。因为同一个cell最终只能给出一个有效候选框，而一个有效候选框无法预测两个不同的物体。

对图像的一些处理，包括随机剪裁、随机调整尺寸、随机调整光亮、随机调整饱和度、随机平移等，都是图像增强的方法。

TP、TN、FP、 FN。TP是真实的正样本，即预测是正样本，而且预测对了，真的是正样本；TN 是预测是负样本，预测对了，真的是负样本；FP 是错误的正样本，预测是正样本，但是错了，其实不是正样本；FN 是预测是负样本，预测错了，其实是正样本。先计算每个预测框与真实框的IoU, 如果IoU 大于0.5,这个预测框就是真的正样本，则认为该预测框成功地检测出了目标；如果小于0.5,那么这个预测框就没有找到目标。

接下来考虑置信度。要给置信度增加一个阈值，然后只考虑置信度在阈值之上的预测框。继续看上面的例子。假设阈值是0.9,那就忽视所有阈值小于0.9的预测框。AP 是对某一个类检测的好坏，mAP 是所有类的AP 的平均值。

归一化(Batch Normalization)。Batch Normalization可以提升模型的收敛速度，也可以起到轻微的正则化的效果，降低模型过拟合。改进是高精度的分类器(High Resolution Classifier)

改进是先验框(Prior Anchor)，改进是聚类(Dimension Cluster) ，改进是细粒度特征，改进是多尺度训练。

深度学习9--目标检测

1.概念介绍

相关文章：

深度学习9--目标检测

第131天：内网安全-横向移动Kerberos 攻击SPN扫描WinRMWinRSRDP

微信小程序的四种弹窗使用

我的第一个CUDA程序

workerman下的webman路由浏览器跨域的一种问题

Windows11 -MASKRCNN-部署测试

函数(子程序)的常见、易混淆概念详解【对初学者有帮助】

TiDB-从0到1-DM工具

AppScan——Web 应用安全扫描的得力工具

虚幻5|AI行为树，进阶篇

在 Spring Boot 中配置 Tomcat 监听多个端口

stm32f407新建项目工程及烧录

c++中加不加const的值传递和引用传递的区别

Qt的窗口设置

51单片机-LCD1602显示屏

多模态分析代理 MAIA：多智能体解决视觉模型黑盒问题

AT360-6T杭州中科微单频高精度授时模块场景应用

Python酷库之旅-第三方库Pandas(081)

C语言基础⑩——构造类型（结构体）

宝兰德荣获openEuler项目群青铜捐赠人称号，共筑开源生态繁荣新篇章

基于算法竞赛的c++编程（28）结构体的进阶应用

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

逻辑回归：给不确定性划界的分类大师

oracle与MySQL数据库之间数据同步的技术要点

linux 错误码总结

Cinnamon修改面板小工具图标

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

06 Deep learning神经网络编程基础激活函数 --吴恩达

HDFS分布式存储 zookeeper

论文笔记——相干体技术在裂缝预测中的应用研究