当前位置：首页 > news >正文

【深度学习基础知识】IOU、GIOU、DIOU、CIOU

news 2026/2/9 14:21:08

这里简单记录下IOU及其衍生公式。

为了拉通IOU及其衍生版的公式对比，以及方便记忆，这里用一个统一的图示来表示出所有的参数

【Ａ】目标框的区域
【Ｂ】预测框的区域
【Ｃ】Ａ与Ｂ的交集
【Ｄ】Ａ与Ｂ的并集 = A+B-C
【Ｅ】Ａ与Ｂ的最小外接矩形框
【Ｆ】最小外接框内非重叠的区域 = E - D，
【ｄ】Ａ中心到Ｂ中心的欧式距离
【Ｌ】Ｅ的对角线距离

将IOU的衍生公式要当做损失函数时，其损失函数为 $\text{IOU loss}=1-\text{IOU}$

IOU

公式：
$\text{IOU} = \frac{C}{D}$
优点
优化了原有的L1 loss，L2 loss和Smooth L1 loss，这三个loss都是基于独立的点来进行计算的。
直观的反映预测检测框与真实检测框的检测效果。判断Predbox 和GTbox的距离最直接的指标。

缺点
如果两个框没有相交，C=0，不能反映A与B的距离。此时损失函数不可导，没有梯度回传，loss无法优化两个框不想交的情况。
IoU无法精确的反映两者的重合度大小。如下图所示，三种情况IoU都相等，但看得出来他们的重合度是不一样的，左边的图回归的效果最好，右边的最差。

GIOU

提出
在CVPR2019中，论文Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 的提出了GIoU的思想。
公式
$\text{GIOU} = \frac{C}{D}-\frac{F}{E}$ IOU越大的同时，非重叠区域占比越小，此时两个框越贴合。
优点
加入了非重叠区域的影响，改善了IOU的计算过程
在A和B不相交时，可以进行学习训练

缺点
当目标框A 和检测框 B 完全互相包含时，F=0，即GIOU退化为IOU。此时无法区分A与B的相对位置，无法进行有效的学习

DIOU

提出于 Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression
公式
$\text{GIOU} = \frac{C}{D}-\frac{d}{L}$ 用对角距离把检测框和预测框的中心点距离进行归一化。在IOU值相同时，两个框的中心点归一化距离越小，代表预测框和目标框的更贴合。
IOU越大的同时，中心点归一化距离越近，此时两个框越贴合。
优点
DIOU Loss可以直接最小化两个目标框的距离，比GIOU收敛的更快。
对于GIOU的缺点，即目标框包裹预测框的这种情况，DIOU Loss可以使回归非常快，而GIOU Loss几乎退化为IOU Loss。

缺点
框的长宽比指标没有考虑
如图9所示，当IOU值和两个框的中心点距离一样时，即检测框中心点在以目标框中心点为圆心半径相同的圆弧上时，DIOU没办法区分。

CIOU

公式： $\text{CIOU} = \frac{C}{D}-\frac{d}{F}-\alpha v \\ v=\frac{4}{\pi^2}(arctan(\frac{w^{gt}}{h^{gt}})-arctan(\frac{w^{pred}}{h^{pred}}))$
解释：加入了长宽比相似性的指标， $\alpha$ 是权重系数，在论文里有相关计算，是两个框长宽比指标的相似性计算。
通俗意思是在IOU值和中心点距离值相同时，两个框的长宽比指标越相似，说明预测框与目标框的对比效果越好。
优点：添加了长宽比的惩罚项，使得评估更加准确。
缺点：CIOU Loss涉及到反三角函数，在计算的过程中会消耗一定的算力，整体训练时间会慢一点。

【深度学习基础知识】IOU、GIOU、DIOU、CIOU

这里简单记录下IOU及其衍生公式。为了拉通IOU及其衍生版的公式对比，以及方便记忆，这里用一个统一的图示来表示出所有的参数【Ａ】目标框的区域【Ｂ】预测框的区域【Ｃ】Ａ与Ｂ的交集【&#xff…...

编程日记 2024/3/22 21:46:24

【自用笔记】单词

cognitive 认知formulation 阐述方式nonlinear 非线性nonconvex 非凸，无最优解cumulative return 累计回报propagation 传播optimization 优化objective 目标标准差（standard deviation）正态分布（Normal distribution）…...

编程日记 2024/3/22 21:44:22

Linux之shell条件判断

华子目录 if语句单分支案例双分支案例多分支 case多条件判断格式执行过程示例 if语句单分支 # 语法1： if <条件表达式> then指令 fi#语法2： if <条件表达式>;then指令 fi案例编写脚本choice1.sh,利用单分支结构实现输入2个整数&#…...

编程日记 2024/3/22 21:42:20

“postinstall“: “patch-package“ 修补安装包补丁

在 package.json 文件里，postinstall 是一个钩子脚本，它在每次运行 npm install 命令后自动执行。当你在该字段中指定 "patch-package" 时，意思是在 npm install 安装所有依赖包之后，自动运行 patch-package 命令。 pa…...

编程日记 2024/3/22 21:39:18

PHP+MySQL开发组合：多端多商户DIY商城源码系统带完整的搭建教程以及安装代码包

近年来，电商行业的迅猛发展，越来越多的商户开始寻求搭建自己的在线商城。然而，传统的商城系统往往功能单一，无法满足商户个性化、多样化的需求。同时，搭建一个功能完善的商城系统需要专业的技术团队和大量的时间成本&a…...

编程日记 2024/3/22 21:37:16

Node.js常用命令

Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境，它使得开发者可以使用 JavaScript 来编写服务端的应用。Node.js 提供了大量的命令行工具，以下是一些最常用的 Node.js 命令： 1. node 运行 JavaScript 文件：node [fil…...

编程日记 2024/3/22 21:33:12

LeetCode 2. 两数相加

目录题目题目描述示例 1：示例 2：示例 3：提示：原题链接题解解题思路代码实现（C） 题目题目描述给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的&#xf…...

编程日记 2024/3/22 21:31:09

抖去推无人直播+矩阵托管+AI文案撰写一体化工具如何开发搭建

一、开发和搭建抖去推无人直播矩阵托管AI文案撰写一体化工具需要以下步骤： 确定功能需求：确定抖去推无人直播、矩阵托管和AI文案撰写的具体功能需求，如直播推流、直播管理、托管服务、AI文案生成等。技术选型：选择适合开发该工…...

编程日记 2024/3/22 21:30:08

【鸿蒙HarmonyOS开发笔记】常用组件介绍篇 —— 弹窗组件

简介弹窗是移动应用中常见的一种用户界面元素，常用于显示一些重要的信息、提示用户进行操作或收集用户输入。ArkTS提供了多种内置的弹窗供开发者使用，除此之外还支持自定义弹窗，来满足各种不同的需求。下面是所有涉及到的弹窗组件官方文档…...

编程日记 2024/3/22 21:28:06

【嵌入式学习】Qtday03.21

一、思维导图二、练习自由发挥登录窗口的应用场景，实现一个登录窗口界面。（不要使用课堂上的图片和代码，自己发挥，有利于后面项目的完成） 要求： 1. 需要使用Ui界面文件进行界面设计 2. ui界面上的组件…...

编程日记 2024/3/22 21:27:05

【C语言】C语言运算符优先级详解

文章目录 📝前言🌉运算符优先级简述 🌠逻辑与和逻辑或🌉赋值和逗号运算符 🌠位运算🌉条件表达式🌉位运算与算术运算结合🌉混合使用条件表达式和赋值运算符🌉 逗号运算符的…...

编程日记 2024/3/22 21:26:04

第十节HarmonyOS 常用容器组件3-GridRow

1、描述栅格容器组件，仅可以和栅格子组件（GridCol）在栅格布局场景中使用。 2、子组件可以包含GridCol子组件。 3、接口 GridRow(options:{columns: number | GridRowColumnOption, gutter?: Length | GutterOption, Breakpoints?: B…...

编程日记 2024/3/22 21:24:02

SCXI-1193是National Instruments公司生产的吗？

NI SCXI-1193是一款高密度、32通道RF多路复用器开关模块。 NI SCXI-1193 是一款由 National Instruments（NI）公司生产的屏蔽式电缆。这款电缆通常用于连接数据采集设备和传感器或执行器，以实现信号传输和数据采集。SCXI-1193 电缆具有高度灵活…...

编程日记 2024/3/22 21:19:59

使用clion开发tftlcd屏，移植驱动时遇到的问题记录

问题现象屏幕只有一半屏在刷新问题出现的情况(在CLION开发时遇到过) 总结...

编程日记 2024/3/22 21:14:54

工程信号的去噪和（分类、回归和时序）预测

🚀【信号去噪及预测论文代码指导】🚀 还为小论文没有思路烦恼么？本人专注于最前沿的信号处理与预测技术——基于信号模态分解的去噪算法和深度学习的信号（回归、时序和分类）预测算法，致力于为您提供最精确、…...

编程日记 2024/3/22 21:07:46

【VUE】前端阿里云OSS断点续传，分片上传

什么是OSS： 数据以对象（Object）的形式存储在OSS的存储空间（Bucket ）中。如果要使用OSS存储数据，您需要先创建Bucket，并指定Bucket的地域、访问权限、存储类型等属性。创建Bucket后，您…...

编程日记 2024/3/22 21:03:40

春招面试高频题目总结

面试问题 redis 可以用于进程间通信吗？ Why？How? ---> 延展一下有哪些进程间通信技术, 优劣如何？ 有大量的插入sql语句，一条条的插入性能很差，如何通过事务进行优化？ 保证线程安全的策略有哪些&…...

编程日记 2024/3/22 21:02:39

基于SSM+Jsp+Mysql的KTV点歌系统

基于SSMJspMysql的KTV点歌系统基于SSMJspMysql的KTV点歌系统的设计与实现开发语言：Java框架：ssm技术：JSPJDK版本：JDK1.8服务器：tomcat7数据库：mysql 5.7（一定要5.7版本）数据库工…...

编程日记 2024/3/22 21:00:36

进入docker docker exec -it oracle bash 修改环境变量文件 vi .bash_profile 为以下内容 # .bash_profile# Get the aliases and functions if [ -f ~/.bashrc ]; then. ~/.bashrc fi# User specific environment and startup programsPATH$PATH:$HOME/binexport PATH expo…...

编程日记 2024/3/22 20:59:35

5.3、【AI技术新纪元：Spring AI解码】图像生成API

Spring 图像生成API Spring图像生成API旨在提供一个简单且便携的接口，用于与各类专注于图像生成的AI模型交互，使开发者能够在不同图像相关模型之间轻松切换，只需对代码进行最少的改动。这一设计遵循了Spring框架的模块化和可互换性理念，确保开发人员能够快速调整其应用程序…...

编程日记 2024/3/22 20:58:34

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/9 13:51:46

css实现圆环展示百分比，根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

编程新知 2026/2/5 4:28:28

Spring Boot 实现流式响应（兼容 2.7.x）

在实际开发中，我们可能会遇到一些流式数据处理的场景，比如接收来自上游接口的 Server-Sent Events（SSE） 或流式 JSON 内容，并将其原样中转给前端页面或客户端。这种情况下，传统的 RestTemplate 缓存机制会…...

编程新知 2025/8/11 8:18:44

在Ubuntu中设置开机自动运行（sudo）指令的指南

在Ubuntu系统中，有时需要在系统启动时自动执行某些命令，特别是需要 sudo权限的指令。为了实现这一功能，可以使用多种方法，包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法，并提供…...

编程新知 2025/12/23 11:20:24

MySQL 8.0 OCP 英文题库解析（十三）

Oracle 为庆祝 MySQL 30 周年，截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。从今天开始，将英文题库免费公布出来，并进行解析，帮助大家在一个月之内轻松通过OCP认证。本期公布试题111~120 试题1…...

编程新知 2026/1/31 7:25:57

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构，使它们在 VS 解决方案资源管理器中以“组”（Filter）的形式进行分类展示。 🎯 目标通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总（共4种）方法描述是否推荐…...

编程新知 2025/12/4 15:47:17

基于matlab策略迭代和值迭代法的动态规划

经典的基于策略迭代和值迭代法的动态规划matlab代码，实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...

编程新知 2025/12/7 23:28:25

python执行测试用例，allure报乱码且未成功生成报告

allure执行测试用例时显示乱码：‘allure’ �����ڲ����ⲿ���Ҳ���ǿ�&am…...

编程新知 2026/2/7 4:21:44

免费PDF转图片工具

免费PDF转图片工具一款简单易用的PDF转图片工具，可以将PDF文件快速转换为高质量PNG图片。无需安装复杂的软件，也不需要在线上传文件，保护您的隐私。工具截图主要特点 🚀 快速转换：本地转换，无需等待上…...

编程新知 2026/1/26 9:07:56

uniapp手机号一键登录保姆级教程（包含前端和后端）

目录前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号（第三种）后台调用云函数获取手机号错误码常见问题前置条件手机安装有sim卡手机开启…...

编程新知 2026/1/27 2:03:36

【深度学习基础知识】IOU、GIOU、DIOU、CIOU

IOU

GIOU

DIOU

CIOU

相关文章：

【深度学习基础知识】IOU、GIOU、DIOU、CIOU

【自用笔记】单词

Linux之shell条件判断

“postinstall“: “patch-package“ 修补安装包补丁

PHP+MySQL开发组合：多端多商户DIY商城源码系统带完整的搭建教程以及安装代码包

Node.js常用命令

LeetCode 2. 两数相加

抖去推无人直播+矩阵托管+AI文案撰写一体化工具如何开发搭建

【鸿蒙HarmonyOS开发笔记】常用组件介绍篇 —— 弹窗组件

【嵌入式学习】Qtday03.21

【C语言】C语言运算符优先级详解

第十节HarmonyOS 常用容器组件3-GridRow

SCXI-1193是National Instruments公司生产的吗？

使用clion开发tftlcd屏，移植驱动时遇到的问题记录

工程信号的去噪和（分类、回归和时序）预测

【VUE】前端阿里云OSS断点续传，分片上传

春招面试高频题目总结

基于SSM+Jsp+Mysql的KTV点歌系统

Docker Oracle提示密码过期

5.3、【AI技术新纪元：Spring AI解码】图像生成API

XML Group端口详解

css实现圆环展示百分比，根据值动态展示所占比例

Spring Boot 实现流式响应（兼容 2.7.x）

在Ubuntu中设置开机自动运行（sudo）指令的指南

MySQL 8.0 OCP 英文题库解析（十三）

CMake控制VS2022项目文件分组

基于matlab策略迭代和值迭代法的动态规划

python执行测试用例，allure报乱码且未成功生成报告

免费PDF转图片工具

uniapp手机号一键登录保姆级教程（包含前端和后端）