当前位置：首页 > news >正文

YOLOv11改进策略【损失函数篇】| Slide Loss，解决简单样本和困难样本之间的不平衡问题

news 2026/2/9 2:37:54

一、本文介绍

本文记录的是改进YOLOv11的损失函数，将其替换成Slide Loss，并详细说明了优化原因，注意事项等。Slide Loss函数可以有效地解决样本不平衡问题，为困难样本赋予更高的权重，使模型在训练过程中更加关注困难样本。若是在自己的数据集中发现容易样本的数量非常大，而困难样本相对稀疏，可尝试使用Slide Loss来提高模型在处理复杂样本时的性能。

文章目录

一、本文介绍
二、Slide Loss原理
- 2.1 IoU含义
- 2.2 原理
- 2.2 优势
三、Slide Loss的实现代码
四、添加步骤
- 4.1 修改ultralytics/utils/loss.py
- 4.2 Slide Loss的调用

二、Slide Loss原理

2.1 IoU含义

IoU(P, G) = area(P∩G) / area(G)，其中P是预测框，G是真实框（ground truth）。IoU的值在[0, 1]之间。

IoU是预测框与真实框的交集面积与并集面积之比。它用于衡量预测框与真实框的重合程度。

2.2 原理

样本分类依据：
- Slide Loss函数基于预测框和真实框的IoU大小来区分容易样本和困难样本。
- 为了减少超参数，将所有边界框的IoU值的平均值作为阈值µ，小于µ的被视为负样本，大于µ的为正样本。
强调边界样本：
- 但处于边界附近的样本由于分类不明确，往往会遭受较大损失。为了解决这个问题，希望模型能够学习优化这些样本，并更充分地利用这些样本训练网络。
- 首先将样本通过参数µ分为正样本和负样本，然后通过一个加权函数Slide来强调处于边界的样本。
- Slide加权函数表达式为：
  $\begin{cases} 1&x\leq\mu - 0.1\\ e^{1-\mu}&\mu < x <\mu - 0.1\\ e^{1 - x}&x\geq u \end{cases}$

在这里插入图片描述

2.2 优势

解决样本不平衡问题：
- 在大多数情况下，容易样本的数量非常大，而困难样本相对稀疏，Slide Loss函数可以有效地解决样本不平衡问题，使模型在训练过程中更加关注困难样本。
自适应学习阈值：
- 通过自动计算所有边界框的IoU值的平均值作为阈值µ，减少了人为设置超参数的难度，提高了模型的适应性。
提高模型性能：
- 根据论文实验结果，Slide函数在中等难度和困难子集上提高了模型的性能，使模型能够更好地学习困难样本的特征，提高了模型的泛化能力。

论文：https://arxiv.org/pdf/2208.02019
源码：https://github.com/Krasjet-Yu/YOLO-FaceV2/blob/d9c8f24d5dba392ef9d6b350a7c50b850051b32b/utils/loss.py#L16

三、Slide Loss的实现代码

Slide Loss的实现代码如下：

import math
class SlideLoss(nn.Module):def __init__(self, loss_fcn):super(SlideLoss, self).__init__()self.loss_fcn = loss_fcnself.reduction = loss_fcn.reductionself.loss_fcn.reduction = 'none'  # required to apply SL to each elementdef forward(self, pred, true, auto_iou=0.5):loss = self.loss_fcn(pred, true)if auto_iou < 0.2:auto_iou = 0.2b1 = true <= auto_iou - 0.1a1 = 1.0b2 = (true > (auto_iou - 0.1)) & (true < auto_iou)a2 = math.exp(1.0 - auto_iou)b3 = true >= auto_ioua3 = torch.exp(-(true - 1.0))modulating_weight = a1 * b1 + a2 * b2 + a3 * b3loss *= modulating_weightif self.reduction == 'mean':return loss.mean()elif self.reduction == 'sum':return loss.sum()else:  # 'none'return loss

四、添加步骤

4.1 修改ultralytics/utils/loss.py

此处需要修改的文件是ultralytics/utils/loss.py

loss.py中定义了模型的损失函数和计算方法，我们想要加入新的损失函数就只需要将代码放到这个文件内即可。

Slide Loss添加后如下：

在这里插入图片描述

4.2 Slide Loss的调用

在loss.py中的v8DetectionLoss函数中添加如下代码，使模型调用此Slide Loss函数。

self.bce = SlideLoss(nn.BCEWithLogitsLoss(reduction="none"))

在这里插入图片描述

此时再次训练模型便会使用Slide Loss计算模型的损失函数。

YOLOv11改进策略【损失函数篇】| Slide Loss，解决简单样本和困难样本之间的不平衡问题

一、本文介绍本文记录的是改进YOLOv11的损失函数，将其替换成Slide Loss，并详细说明了优化原因，注意事项等。Slide Loss函数可以有效地解决样本不平衡问题，为困难样本赋予更高的权重，使模型在训练过程中更加关注困难样…...

编程日记 2024/9/30 22:06:48

动静态库（Linux）

文章目录前言一、静态库二、动态库三、深入理解动态库总结前言我们之前用过c语言的库.Linux中默认的都是使用动态库，如果想要使用静态库，就必须加上-static选项。默认都是安装的动态库，系统中一般没有静态库，如果要使用&#…...

编程日记 2024/9/30 22:05:46

51单片机和ARM单片机的区别

在嵌入式系统设计与应用中，单片机作为核心控制单元，扮演着至关重要的角色。其中，51单片机和ARM单片机作为两种常见的单片机类型，各自具有独特的特点和优势。本文将从多个维度深入探讨这两种单片机的区别，以便读者更好地…...

编程日记 2024/9/30 22:03:44

[Day 81] 區塊鏈與人工智能的聯動應用：理論、技術與實踐

區塊鏈在食品安全中的應用前言食品安全一直是全球關注的問題，隨著全球供應鏈的複雜性增加，追踪食品從生產到消費的過程變得愈發困難。區塊鏈技術以其去中心化、不可篡改的特性，為食品安全提供了可靠的解決方案。在這篇文章中，…...

编程日记 2024/9/30 22:02:43

flac格式怎么转mp3？关于flac转为MP3的方法介绍

flac格式怎么转mp3？MP3格式经过压缩，相较于flac文件，显著减小了文件体积。这一特点使得音乐的存储和传输更加便捷，尤其适合移动设备以及存储空间有限的场景。由于MP3文件体积较小，分享音乐变得非常简单，无论…...

编程日记 2024/9/30 22:00:41

【笔记】KaiOS 系统框架和应用结构（APP界面逻辑）

KaiOS系统框架最早自下而上分成Gonk-Gecko-Gaia层，代码有同名的目录，现在已经不用这种称呼。按照官网3.0的版本迭代介绍，2.5->3.0已经将系统更新成如下部分：仅分为上层web应用和底层平台核心，通过WebAPIs连接上下层，这也是kaios系统升级变更较大的部分。 KaiOS P…...

编程日记 2024/9/30 21:56:38

java项目实现钉钉异常告警实时监控

最近有个小伙伴问我，我们的项目核心业务的地方总是有异常，虽然有打印日志，但不能立马通知我；所以今天我就教大家如何实现异常报警实时提醒 1.需要有钉钉自己新建的企业用户 2.建一个群，需要有三人以上；…...

编程日记 2024/9/30 21:55:37

Spring Boot应用：电子商务平台开发

第2章关键技术简介 2.1 Java技术 Java是一种非常常用的编程语言，在全球编程语言排行版上总是前三。在方兴未艾的计算机技术发展历程中，Java的身影无处不在，并且拥有旺盛的生命力。Java的跨平台能力十分强大，只需一次编译&#xf…...

编程日记 2024/9/30 21:53:33

怎么在Vue3项目中引入Vant组件库并使用？

文章目录前言一、项目中使用步骤1.安装：2.样式的导入（2种方法）2.1 main.ts全局导入（平常自己的项目用的这个全局）2.2 按需引入组件样式 (简单介绍一下)1.安装插件2.配置插件 3.组件按需使用：App.vue 总结 …...

编程日记 2024/9/30 21:52:32

springboot中有哪些方式可以解决跨域问题

文章目录什么是跨域解决方案CrossOrigin注解实现WebMvcConfigurer接口CorsFilter过滤器如何选择？ 前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。 Talk is cheap &#xff0…...

编程日记 2024/9/30 21:51:30

Temporal Dynamic Quantization for Diffusion Models阅读

文章目录 AbstractIntroductionBackgrounds and Related Works2.1 扩散模型2.2 量化2.3 量化感知训练和训练后量化 TemporalDynamic Quantization3.1 量化方法3.2 扩散模型量化的挑战3.3 TDQ模块的实现3.4 工程细节时间步的频率编码TDQ模块的初始化 Experimental SetupResults5…...

编程日记 2024/9/30 21:48:28

828华为云征文｜华为云Flexus X实例性能实测：速度与稳定性的完美结合

828华为云征文｜华为云Flexus X实例性能实测：速度与稳定性的完美结合前言一、Flexus云服务器X实例介绍1.1 Flexus云服务器X实例简介1.2 Flexus云服务器X实例特点1.3 Flexus云服务器X实例使用场景二、实践环境介绍2.1 本次实践环境规划2.2 本次实践介绍 …...

编程日记 2024/9/30 21:47:26

【PyTorch】图像分割

图像分割是什么 Image Segmentation 将图像每一个像素分类图像分割分类超像素分割：少量超像素代替大量像素，常用于图像预处理语义分割：逐像素分类，无法区分个体实例分割：对个体目标进行分割全景分割：…...

编程日记 2024/9/30 21:45:24

如何快速建立自己的异地互联的远程视频监控系统，通过web浏览器可以直接查看公网上的监控视频（上）

目录一、需求二、方案 2.1、计划方案 2.2、实施准备 2.2.1所需配置的产品和服务 2.2.1.1云主机 （1）选择云平台 （2）配置云服务器 2.2.2.2视频监控平台软件 （1）视频监控平台软件 （2&am…...

编程日记 2024/9/30 21:44:23

实验2思科网院项目2.7.2-packet-tracer---configure-single-area-ospfv2---实践练习

实践练习 2.7.2-packet-tracer---configure-single-area-ospfv2---实践练习physical-mode 实验拓扑相关设备配置实验目标: 第 1 部分：构建网络并配置设备的基本设置第 2 部分：配置和验证单区域 OSPFv2 的基本部署第 3 部分：优化和验…...

编程日记 2024/9/30 21:42:20

Nginx实战经验分享：从小白到专家的成长历程！

目录一、Nginx概述1、Nginx简介（1）事件驱动模型（2）异步处理（3）模块化设计（4）高性能（5）反向代理（6）负载均衡（7&#xff09…...

编程日记 2024/9/30 21:37:16

从画质设置看游戏引擎（其一）

前往我的博客，获取无广告，更好的阅读体验 1. 抗锯齿（Anti-Aliasing） 1.1 锯齿问题的起因在三维模型的世界中，模型是连续的，但是屏幕像素是不连续，是离散的； 即当一个圆形显示在显…...

编程日记 2024/9/30 21:36:15

#git 问题failed to resolve head as a valid ref

问题如下： 解决方法： 1、运行 git fsck --full 可以查看具体error信息，一般都是head索引问题 2、.git\refs\heads\xxx（当前分支）txt编辑器打开显示乱码，而不是hash编码 3、在.git\logs\refs\heads\xxx&a…...

编程日记 2024/9/30 21:33:12

YOLOv11，地瓜RDK X5开发板，TROS端到端140FPS！

YOLOv11 Detect YOLOv11 Detect YOLO介绍性能数据 (简要) RDK X5 & RDK X5 Module 模型下载地址输入输出数据公版处理流程优化处理流程步骤参考环境、项目准备导出为onnxPTQ方案量化转化使用hb_perf命令对bin模型进行可视化, hrt_model_exec命令检查bin模型的输入输出情况…...

编程日记 2024/9/30 21:30:09

Python精选200Tips：181-182

针对图像的经典卷积网络结构进化史及可视化针对图像的经典卷积网络结构进化史及可视化（续）P181--MobileNet【2017】模型结构及创新性说明模型结构代码MobileNet V1版本MobileNet V2版本MobileNet V3 版本Small版本Large版本 P182--EfficientNet【2019】…...

编程日记 2024/9/30 21:28:07

MMaDA: Multimodal Large Diffusion Language Models

CODE ： https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA，它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

编程新知 2026/2/3 15:24:36

从零实现STL哈希容器：unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享希望也能为你带来些帮助~ 那咱们废话不多说，直接开始吧！ 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

编程新知 2026/1/31 12:47:25

【无标题】路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论一、传统路径模型的根本缺陷在经典正方形路径问题中（图1）： mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...

编程新知 2025/10/21 1:07:59

[大语言模型]在个人电脑上部署ollama 并进行管理,最后配置AI程序开发助手.

ollama官网: 下载 https://ollama.com/ 安装查看可以使用的模型 https://ollama.com/search 例如 https://ollama.com/library/deepseek-r1/tags # deepseek-r1:7bollama pull deepseek-r1:7b改token数量为409622 16384 ollama命令说明 ollama serve #&#xff1a…...

编程新知 2026/1/31 4:37:53

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案

目录使用 erase 返回值继续迭代使用索引进行遍历我们知道类似 vector 的顺序迭代器被删除后，迭代器会失效，因为顺序迭代器在内存中是连续存储的，元素删除后，后续元素会前移。但一些场景中，我们又需要在执行删除操作…...

编程新知 2025/9/30 8:10:20

认识CMake并使用CMake构建自己的第一个项目

1.CMake的作用和优势跨平台支持：CMake支持多种操作系统和编译器，使用同一份构建配置可以在不同的环境中使用简化配置：通过CMakeLists.txt文件，用户可以定义项目结构、依赖项、编译选项等，无需手动编写复杂的构建脚本…...

编程新知 2026/2/7 19:54:51

Elastic 获得 AWS 教育 ISV 合作伙伴资质，进一步增强教育解决方案产品组合

作者：来自 Elastic Udayasimha Theepireddy (Uday), Brian Bergholm, Marianna Jonsdottir 通过搜索 AI 和云创新推动教育领域的数字化转型。我们非常高兴地宣布，Elastic 已获得 AWS 教育 ISV 合作伙伴资质。这一重要认证表明，Elastic 作为 …...

编程新知 2026/2/7 16:38:17