当前位置：首页 > news >正文

【目标检测01】真实框、预测框、锚框和交并比IoU

news 2026/2/11 1:12:31

文章目录

- 1. 任务定义
- 2. 基本概念
- - 2.1 边界框（bounding box）
  - 2.2 真实框、预测框和锚框
  - 2.3 交并比 (IoU)
  - 2.4 代码实现

1. 任务定义

目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别，并在该目标周围绘制边界框，标示出每个目标的位置，如图所示。
在这里插入图片描述

2. 基本概念

2.1 边界框（bounding box）

检测任务需要同时预测物体的类别和位置，因此需要引入一些跟位置相关的概念。通常使用边界框（bounding box，bbox）来表示物体的位置，边界框是正好能包含物体的矩形框，如下图所示，图中3个人分别对应3个边界框。
在这里插入图片描述
一般有两种表示边界框位置的格式：

(1) $x y x y$ ，即 $(x 1, y 1, x 2, y 2)$ ，其中 $(x 1, y 1)$ 是矩形框左上角的坐标， $(x 2, y 2)$ 是矩形框右下角的坐标。

(2) $x y w h$ ，即 $(x, y, w, h)$ ，其中 $(x, y)$ 是矩形框的中心坐标， $w$ 是矩形框的宽度， $h$ 是矩形框的高度。

因此，在阅读代码的时候，要注意使用的是哪一种格式的表示方式。

2.2 真实框、预测框和锚框

从训练数据集的标签里给出目标物体边界框所对应的位置叫真实框

由模型预测出目标物体边界框所对应的位置叫预测框

不同于真实框和预测框，锚框是人为预先设定好的矩形框，模型在这种锚框的基础上预测偏移量才能得到预测框

2.3 交并比 (IoU)

如何衡量预测框和真实框之间的关系呢？在检测任务中是使用交并比（Intersection of Union，IoU）作为衡量指标。这一概念来源于数学中的集合，用来描述两个集合A和B之间的关系，它等于两个集合的交集里面所包含的元素个数，除以它们的并集里面所包含的元素个数，具体计算公式如下：
$\frac{A \cap B}{A \cup B}$ 我们将用这个概念来描述两个框之间的重合度。两个框可以看成是两个像素的集合，它们的交并比等于两个框重合部分的面积除以它们合并起来的面积。下图“交集”中青色区域是两个框的重合面积，图“并集”中蓝色区域是两个框的相并面积。用这两个面积相除即可得到它们之间的交并比。
在这里插入图片描述
假设两个矩形框A和B的位置分别为：
$A: [x_{a1}, y_{a1}, x_{a2}, y_{a2}] \\ A: [x_{b1}, y_{b1}, x_{b2}, y_{b2}]$ 它们之间的位置关系如图所示：

A和B相交部分左上角坐标为：
$x1 = max(x_{a1}, x_{b1})\\ y1 = max(y_{a1}, y_{b1})$ 相交部分右下角坐标为：
$x2 = min(x_{a2}, x_{b2})\\ y2 = min(y_{a2}, y_{b2})$ 相交部分面积为：
$max(x_2 - x_1 + 1.0, 0) \cdot max(y_2 - y_1 + 1.0, 0)$ 分别计算A和B的面积：
$S_A = (x_{a2} - x_{a1} + 1.0) \cdot (y_{a2} - y_{a1} + 1.0) \\ S_B = (x_{b2} - x_{b1} + 1.0) \cdot (y_{b2} - y_{b1} + 1.0)$ 计算相并部分：
$union = S_A + S_B - intersection$ 计算交并比：
$\frac{intersection}{union}$

2.4 代码实现

（1）矩形框坐标形式为 $x y x y$ 形式时：

def box_iou_xyxy(box1, box2):# 获取box1左上角和右下角的坐标x1min, y1min, x1max, y1max = box1[0], box1[1], box1[2], box1[3]# 计算box1的面积s1 = (y1max - y1min + 1.) * (x1max - x1min + 1.)# 获取box2左上角和右下角的坐标x2min, y2min, x2max, y2max = box2[0], box2[1], box2[2], box2[3]# 计算box2的面积s2 = (y2max - y2min + 1.) * (x2max - x2min + 1.)# 计算相交矩形框的坐标xmin = np.maximum(x1min, x2min)ymin = np.maximum(y1min, y2min)xmax = np.minimum(x1max, x2max)ymax = np.minimum(y1max, y2max)# 计算相交矩形行的高度、宽度、面积inter_h = np.maximum(ymax - ymin + 1., 0.)inter_w = np.maximum(xmax - xmin + 1., 0.)intersection = inter_h * inter_w# 计算相并面积union = s1 + s2 - intersection# 计算交并比iou = intersection / unionreturn iou

1）矩形框坐标形式为 $x y w h$ 形式时：

def box_iou_xywh(box1, box2):# 获取box1左上角和右下角的坐标x1min, y1min = box1[0] - box1[2]/2.0, box1[1] - box1[3]/2.0x1max, y1max = box1[0] + box1[2]/2.0, box1[1] + box1[3]/2.0# 计算box1的面积s1 = box1[2] * box1[3]# 获取box2左上角和右下角的坐标x2min, y2min = box2[0] - box2[2]/2.0, box2[1] - box2[3]/2.0x2max, y2max = box2[0] + box2[2]/2.0, box2[1] + box2[3]/2.0# 计算box2的面积s2 = box2[2] * box2[3]xmin = np.maximum(x1min, x2min)ymin = np.maximum(y1min, y2min)xmax = np.minimum(x1max, x2max)ymax = np.minimum(y1max, y2max)inter_h = np.maximum(ymax - ymin, 0.)inter_w = np.maximum(xmax - xmin, 0.)intersection = inter_h * inter_wunion = s1 + s2 - intersectioniou = intersection / unionreturn iou

【目标检测01】真实框、预测框、锚框和交并比IoU

文章目录

1. 任务定义

2. 基本概念

2.1 边界框（bounding box）

2.2 真实框、预测框和锚框

2.3 交并比 (IoU)

2.4 代码实现

相关文章：

【目标检测01】真实框、预测框、锚框和交并比IoU

青少年编程能力等级测评CPA C++五级试卷（2）

SATA数据线

《云原生安全攻防》-- K8s攻击案例：权限维持的攻击手法

回溯算法-Java【力扣】【算法学习day.14】

从本地到云端：跨用户请求问题的完美解决方案

leetcode day4 409+5

英语语法学习框架（考研）

基于neo4j的学术论文关系管理系统

C#中的委托、匿名方法、Lambda、Action和Func

IDEA关联Tomcat——最新版本IDEA 2024

【如何获取股票数据18】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股解禁限售数据获取实例演示及接口API说明文档

NVR小程序接入平台/设备EasyNVR多品牌NVR管理工具/设备的多维拓展与灵活应用

GPT-4o 和 GPT-4 Turbo 模型之间的对比

gin入门教程（10）：实现jwt认证

Python 基础语法 - 数据类型

自托管无代码数据库Undb

正则的正向前瞻断言和负向前瞻断言

大厂物联网(IoT)高频面试题及参考答案

react hook

龙虎榜——20250610

大数据学习（132）-HIve数据分析

搭建DNS域名解析服务器(正向解析资源文件)

mac：大模型系列测试

comfyui 工作流中图生视频如何增加视频的长度到5秒

论文阅读：Matting by Generation

Monorepo架构: Nx Cloud 扩展能力与缓存加速

Python的call 方法

鸿蒙Navigation路由导航-基本使用介绍

构建Docker镜像的Dockerfile文件详解