当前位置: 首页 > news >正文

多篇论文介绍-Wiou

论文地址

目录

https://arxiv.org/pdf/2301.10051.pdf

01 CIEFRNet:面向高速公路的抛洒物检测算法

02改进 YOLOv5 的 PDC 钻头复合片缺损识别

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测

05 基于改进YOLOv8的SAR图像飞机目标检测算法

06 基于改进YOLOv8的隧道火灾检测研究

07 融合 CA-BiFPN 的轻量化人体姿态估计算法

08基于改进 YOLOv5s 的果园环境葡萄检测

09 基于融合 GhostNetV2 的 YOLO v7 水稻籽粒检测

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法


01 CIEFRNet:面向高速公路的抛洒物检测算法

        损失函数影响着网络的收敛速度和精度,良好的损失函数定义能为模型带来性能的显著提升。本文算法的损失函数由目标边界框损失、置信度损失和分类损失构成,如式(9)所示:

本的学习能力,本文引入了动态非单调聚焦机制的WIoU损失函数,其计算公式如式(10)、(11)、(12)和(13)所示。

      

其中LBcE为置信度和分类损失,Lwou为边界框损失。

02改进 YOLOv5 PDC 钻头复合片缺损识别

        YOLOv5网络的损失函数包括置信度损失、分类损失和边界框损失函数,边界框损失函数反应了真实框和预测框的误差。边界框损失函数的设计对于目标检测性能有很大的影响,好的边界框损失函数能提升目标检测精度。对于目标检测数据集中会有低质量的示例,如果过多的强调对低质量示例边界框的回归,就会影响网络检测性能的提升,为了解决这一问题 Wise-IoU(WIoU)y[221损失函数被提出,WloU是一种基于动态非单调聚焦的机制的边界框定位损失函数。对于低质量示例,预测框和真实框的纵横比、距离等几何度量会增加对低质量示例的惩罚影响模型的泛化能力,当预测框和真实框能够很好的重合时应当降低几何度量的惩罚。WIoU共有三个版本,vl构造了基于注意力的边界框损失,v2和 v3在v1的基础上附加聚焦机制,其中v3的性能更好。WIoU根据距离度量构建得到了WloUv1,如公式(7)所示:

   

 

 

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测

        在水下目标检测中,因训练数据中难以避免地包含低质量示例,所以如距离、纵横比的几何度量都会加剧对低质量示例的惩罚从而使模型的泛化性能下降。传统的损失函数不能在锚框与目标框较好地重合时削弱阻碍对象检测模型泛化的惩罚,过多地干预训练使模型没有很好的泛化能力。对此本文使用WloU代替YOLOv5的CIoU,WloU提出了一个动态的非单调FM,可以降低高质量的锚框的竞争力和掩盖低质量的例子的影响。WloU的动态非单调聚焦机制使用“离群度”替代CIoU对锚框进行质量评估,并提供了明智的梯度增益分配策略。该策略在降低高质量锚框的竞争力的同时,也减小了低质量示例产生的有害梯度。这使得 WIoU可以聚焦于普通质量的锚框,并提高检测器的整体性能并且使模型的泛化能力得到了有效的提高。
        在计算速度上,YOLOv5种引入WloU所增加的计算成本主要在于聚焦系数的计算、IoU损失的均值统计。在实验条件相同时,WloU因为没有对纵横比进行计算反而有更快的速度。在损失函数对比实验中,WloU的计算时长仅为CIoU的87.7%。

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测


摘要:为提高无人机对架空输电线路巡检的效率和线路中螺栓缺销的检测精度,提出了改进的你只看一次第7微小版( you only look once version 7-tiny, YOLOv7-tiny)输电线路螺栓缺销检测算法。该算法采用高效的分布移位卷积(distribution shifting convolution , DSConv)来替换YOLOv7-tiny网络中的3x3卷积,以提高模型的计算速度并降低计算复杂度;在模型的检测头部分,添加了高效解耦头结构, 以提高模型的准确度和稳定性;并采用明智的交并比( wise intersection over union , WloU)损失函数来提高正样本的权重,使模型更加关注缺销螺栓目标,以减少正负样本不平衡带来的噪声干扰。实验结果表明,改进YOLOv7-tiny算法对输电线路螺栓缺销检测的平均精度均值达到90.6% ,检测速度达到143.0帧/s,同时实现了检测的高速度和高精度。该算法在无人机输电线路巡检中具有一定的优势。
关键词:无人机巡检;螺栓;缺销;YOLOv7-tiny ; DSConv; WloU;高效解耦头

05 基于改进YOLOv8的SAR图像飞机目标检测算法


摘要∶针对合成孔径雷达(Synthetic Aperture Radar, SAR )图像飞杌目标检测算法存在模型复杂度较高、检测效果差、泛化能力弱等问题,提出一种基于改进YOLOv8的SAR图像飞机目标检测算法。首先,针对SAR图像飞机目标较小的特点,剔除大目标检测层,重构特征提取网络和特征融合网络,降低模型计算量。其次,在主干网络引入可变形卷积( deformable convolutional networks,DCN),增强特征提取能力;在颈部网络引入全局注意力机制(GAM attention,GAM ),提高检测精度。最后,采用WIOU( Wise-loU)损失函数,提高收敛速度和回归精度。在SADD数据集( SAR Aircraft Detection Dataset )上实验结果显示:改进算法较原YOLOv8算法模型体积压缩59.66%,参数量降低61.18%,计算量减少18.29%,最高精度提高至98.1%。与其他算法相比,所提算法在保证较高检测精度的情况下大幅降低了模型体积、参数量和计算量。实验结果表明所提算法实现了模型复杂度和检测精度的平衡。
关键词:YOLOv8;合成孔径雷达;网络重构;可变形卷积;GAM注意力机制;WIOU

06 基于改进YOLOv8的隧道火灾检测研究


摘要:隧道内火灾检测存在检测困难和难以直接部著到资源有限的以八八仅也I分就应自/抑题,提出一种基于改进YOLOv8的隧道火灾检测算法;自先分入0N1江Do休NR殂侨斫识和高吞制冗余特征,同时增强全局信息的捕捉;其次引人」一种新的同你仓帜roV个一所队A结里寿明.吐量的模型;最后使用WIoU函数优化网络的边界椎损大,便网络能时达基仪后描天参粉减少了了该网络在所使用隧道火灾数据集上的平均精度mAP提开」 1.3%,同的霍里化旧GA参只D道场辱29.7个百分点,向前推理时间降低了44%;算法能够平衡精度和轻重化的而水,可以满疋陇追功尔下的实时检测。
关键词:YOLOv8;局部卷积;WloU;极化注意力;轻量化

07 融合 CA-BiFPN 的轻量化人体姿态估计算法

摘要:针对现有的基于热力图的人体姿态估计网络模型复杂度高、算力需求大、不易部署至嵌入式平台和无人机移动平台等问题,提出了一种基于YOLOv5s6-Pose-ti-lite 不使用热力图的轻量化人体姿态估计网络模型。通过将主干网络替换为GhostNet网络,它旨在以更少的计算资源输出更有效的特征信息,提升网络检测速度,缓解网络冗余的问题;在主干网络中结合轻量化的坐标注意力CA(Coordinate Attention)模块,将图片的人体关键点位置信息聚集到通道上,增强特征提取能力;引入加权双向特征金字塔网络(bidirectional Feature Pyramid Network),提升模型的特征融合能力,平衡不同尺度的特征信息;最后将CIoU损失函数替换为Wise-loU(WIoU),进一步提升模型对人体关键点回归的性能。结果表明,在COCO2017人体关键点数据集上,优化后的网络模型参数量降低26.2%,计算量降低30%,平均精确度提升1.7个百分点、平均召回率提升2.7个百分点,能够满足实时性的效果,验证了所提模型的可行性和有效性。
关键词:人体姿态估计;轻量化;坐标注意力;加权双向特征金字塔网络;损失函数

08基于改进 YOLOv5s 的果园环境葡萄检测

摘要:为了快速精准地识别复杂果园环境下的葡萄目标,该研究基于YOLOv5s提出一种改进的葡萄检测模型(MRW.YOLOv5s)。首先,为了减少模型参数量,采用轻量型网络MobileNetv3作为特征提取网络,并在 MobileNetv3的bneck 结构中嵌入坐标注意力模块(coordinate attention,CA)以加强网络的特征提取能力;其次,在颈部网络中引入RepVGG Block,融合多分支特征提升模型的检测精度,并利用RepVGG Block的结构重参数化进一步加快模型的推理速度;最后,采用基于动态非单调聚焦机制的损失(wise intersection over union loss,WloU Loss)作为边界框回归损失函数,加速网络收敛并提高模型的检测准确率。结果表明,改进的MRW-YOLOv5s模型参数量仅为7.56 M,在测试集上的平均精度均值(mean average precision,mAP)达到97.74%,相较于原YOLOv5s模型提升了2.32个百分点,平均每幅图片的检测时间为10.03 ms,比原YOLOv5s模型减少了6.13 ms。与主流的目标检测模型SSD、RetinaNet.YOLOv4、YOLOv7和YOLOX相比,MRW-YOLOv5s模型的 mAP分别高出9.89、7.53、2.12、0.91、2.42个百分点.并且在模型参数量大小和检测速度方面有着很大的优势,该研究可为果园智能化、采摘机械化提供技术支持。
关键词:图像处理;果实识别;YOLOv5s;注意力机制;RepVGG;Wise loU

09 基于融合 GhostNetV2 YOLO v7 水稻籽粒检测

摘要:水稻籽粒检测在粮食储存中凸显重要作用,直接影响粮食销售的价格。针对一般机器视觉检测算法在水稻籽粒小目标的密集场景下存在难以识别且网络模型参数大,检测速度较慢、成本高等问题,提出一种基于YOLO v7优化的水稻籽粒检测算法。首先将部分高效聚合网络模块(Efficient layer aggregationnetwork,ELAN)替换成轻量级网络模块GhostNetV2添加到主干及颈部网络部分,实现网络参数精简化的同时也减少了通道中的特征冗余;其次将卷积和自注意力结合的注意力模块(Convolution and self-attentionmixed model,ACmix)添加到MP模块中,平衡全局和局部的特征信息,充分关注特征映射的细节信息;最后使用WIloU(Wise intersection over union)作为损失函数,减少了距离、纵横比之类的惩罚项干扰,单调聚焦机制的设计提高了模型的定位性能。在水稻籽粒图像数据集上验证改进后的模型检测水平,实验结果表明改进后的YOLO v7模型的精确率和召回率的调和平均数(F1-score)高达 0.99,mAP@0.5达 96.55%,mAP@0.5:0.95达70.10%,训练模型参数量也有所下降,在实际场景以暗黑色为背景的水稻杂质检测中的效果优于其他模型,满足了水稻籽粒的实时检测要求,可考虑将此算法应用于自动化检测粮食系统之中。关键词:水稻籽粒检测;YOLO v7;轻量级网络;注意力模块;损失函数

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法

摘要:针对当前智能巡检背景下,基于深度学习的绝缘子缺陷检测模型存在泛化性能低、对复杂背景下绝缘子难以识别的问题。从特征提取和融合角度考虑,提出了一种结合特征重用与特征重建的轻量化YOLO-RR网络进行绝缘子缺陷检测。首先,在特征提取阶段,以DenseNet为基础构建了dense35网络作为主干网络,依赖特征的重用,增加对细节的感知能力,提升了模型在低饱和度和低对比度成像情况下检测精度的同时也缩减了网络参数量;其次,在特征融合阶段,提出H-BiFPN结构进行不同尺度特征间双向融合,在特征提取的过程中将特征进行重用和重建,丰富了不同尺度的特征信息,解决了连续卷积下小目标信息丢失的问题,提升了对小目标的检测精度,较原来单向支路的特征融合更加高效。最后,使用WIoU_Loss来优化模型,通过对普通充分锚框的关注,使预测框更加精准。在扩充后的CPLID数据集上进行实验,改进后算法识别率达到93.6%,网络参数量压缩到5M,优于经典模型。能够满足绝缘子缺陷定位的准确性和实时性要求,同时在背景干扰较大、受光照影响的成像上也有很好的检测效果。
关键词:绝缘子检测;YOLO;特征重用;特征重建;轻量化;智能巡检
 


 

相关文章:

多篇论文介绍-Wiou

论文地址 目录 https://arxiv.org/pdf/2301.10051.pdf 01 CIEFRNet:面向高速公路的抛洒物检测算法 02改进 YOLOv5 的 PDC 钻头复合片缺损识别 03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测 04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测 05 基于改…...

Django介绍,安装,创建

文章目录 1. web应用程序1.1 什么是web?1.2 web应用程序的优点1.3 web应用程序的缺点1.4 什么是web框架? 2. 手撸web框架 1. web应用程序 1.1 什么是web? Web应用程序是一种可以通过Web访问的应用程序,用户只需要有浏览器即可,不需要再安装其他软件 案…...

Java通过javacv获取视频、音频、图片等元数据信息(分辨率、大小、帧等信息)

相信我们都会或多或少需要给前端返回视频或者音频的一些信息,那么今天这篇文章通过Java语言使用javacv来获取视频、音频、图片等元数据信息(分辨率、大小、帧等信息) 一、首先导入依赖 可以先导入javacv/javacv-platform依赖,由于依赖比较大,所以我们可以先去除部分不需…...

flask和fastapi的区别以及demo实现

flask和fastapi的区别以及demo实现 flask和fastapi的区别fastapi简单demoFastAPI包括全局异常捕捉和参数验证的demoflask和fastapi的区别 Flask:Flask是一个轻量级的Web框架,它提供了最基本的工具,可以自由选择其他库和组件来构建应用。灵活性:Flask允许用户自由选择数据库、…...

python特殊循环队列_队中元素个数代替队尾指针

对于循环队列来说,如果知道队头指针和队中元素个数,则可以计算出队尾指针。也就是说,可以用队中元素个数代替队尾指针。设计出这种循环队列的判队空、进队、出队和取队头元素的算法。 本例的循环队列包含data 数组、队头指针 front和队中元素…...

什么是观察者模式?用 Python 如何实现 Observer(观察者或发布订阅)对象行为型模式?

什么是观察者模式? 观察者模式(Observer pattern)是一种行为型设计模式,它允许对象之间建立一种一对多的依赖关系,当一个对象的状态发生变化时,其相关依赖对象都会得到通知并自动更新。 在观察者模式中&am…...

pytorch直线拟合

目录 1、数据分析 2、pytorch直线拟合 1、数据分析 直线拟合的前提条件通常包括以下几点: 存在线性关系:这是进行直线拟合的基础,数据点之间应该存在一种线性关系,即数据的分布可以用直线来近似描述。这种线性关系可以是数据点…...

相机传感器

相机的传感器大小通常用英寸(1英寸2.54厘米)来表示。例如:全画幅相机的传感器大小为:36mm*24mm,称为 35mm全画幅。 几分之一英寸 所谓的 1/2.7,1/2.5等等,里面的分子1是一个标准,分…...

大语言模型的关键技术

大语言模型的关键技术: 经过漫长的发展,LLM 进化到了当前的状态——通用且有能力的学习者。在这个过程中,人们提出了许多重要的技术,大大提升了 LLM 的能力。在此,我们简要列举了几种重要的技术,这些技术&a…...

uniapp使用vur-cli新建项目并打包

新建项目 npm install -g vue/cli vue create -p dcloudio/uni-preset-vue my-project选择默认模板npm run dev:h5 运行 安装sass和uview &#xff08;npm安装失败&#xff09; bug&#xff1a;使用uni.scss中的变量或样式&#xff0c;<style lang"scss"> 必…...

后台管理系统解决方案-中大型-Vben Admin

后台管理系统解决方案-中大型-Vben Admin 官网 Vben Admin 在线演示 Vben Admin 为什么选择它 github现有20K星&#xff0c;并且它有个可视化生成表单&#xff0c;我很喜欢 快速开始 # 拉取代码 git clone https://github.com/vbenjs/vue-vben-admin-doc# 安装依赖 yarn#…...

通俗理解repartition和coalesce区别

官方的解释 reparation 返回一个具有恰好numPartitions分区的新RDD。 可以增加或减少此RDD中的并行级别。在内部,reparation会使用shuffle来重新分发的数据。 如果要减少此RDD中的分区数量,请考虑使用coalesce,这样可以避免执行shuffle。 coalesce 返回一个新的RDD,该RDD被…...

优雅设计之美:实现Vue应用程序的时尚布局

本文为翻译文章&#xff0c;原文链接&#xff1a; ** https://fadamakis.com/clean-layout-architecture-for-vue-applications-a738201a2a1e 前言 页面布局是减少代码重复和创建可维护且具有专业外观的应用程序的基本模式。如果使用的是Nuxt&#xff0c;则可以提供开箱即用…...

05预测识别-依托YOLO V8进行训练模型的识别——对视频中的目标进行跟踪统计

上文中详细介绍了如何对视频进行抽帧,并对帧的图像进行目标识别。但在日常工作中,我们也会遇到需要对目标进行跟踪统计的情况,比如我们需要连续统计某一类目标有多少个的时候,如果单纯从帧中抽取图像的话,系统将无法判断是否为同一目标,从而造成目标数量统计的重复,导致…...

Android Studio(意图Intent)

前言 意图的作用&#xff1a;页面的跳转&#xff08;从一个页面跳转到另一个页面&#xff09;。 意图的创建&#xff1a;需要哪些参数&#xff1f;首先&#xff0c;从哪个页面跳转到哪个页面&#xff1b;其二&#xff0c;跳转到另一个页面需要携带数据吗。 下面介绍顺序&#x…...

Bean作用域

从笔者之前的博客&#xff0c;我们可以看出 Spring 是⽤来读取和存储 Bean&#xff0c;因此在 Spring 中 Bean 是最核⼼的操作 资源&#xff0c;所以接下来我们深⼊学习⼀下 Bean 对象&#xff1a;Bean作用域&#xff01; 限定程序中变量的可用范围叫做作用域&#xff01;或者…...

YOLOV5----修改损失函数-SE

主要修改yolo.py、yolov5s.yaml及添加SE.py 一、SE.py import numpy as np import torch from torch import nn from torch.nn import initclass SEAttention(nn.Module):def __init__(self, channel=512...

Mybatis(一)

1. Mybatis简介 MyBatis下载地址 1.1 MyBatis历史 MyBatis最初是Apache的一个开源项目iBatis, 2010年6月这个项目由Apache Software Foundation迁移到了Google Code。随着开发团队转投Google Code旗下&#xff0c;iBatis3.x正式更名为MyBatis。代码于2013年11月迁移到Github…...

使用Go构建一个Postgres流平台

使用 Go 通道从拉推模型转向更高效的流方法。这通过重叠拉取和推送阶段来提高性能&#xff0c;减少总体处理时间和延迟。 Go通道提供数据同步、资源管理和并发处理。它们允许 goroutine 安全地通信和交换数据。这些源实现了每秒 10-12k 事务的吞吐量&#xff0c;最小延迟为 1-…...

QT基础与细节理解

前言 本博客旨在记录QT学习过程中的一些细节知识理解&#xff0c;由于问题的产生并非成体系&#xff0c;所以前期的记录可能会无序一些。烦请读者参阅目录进行快速的问题定位与跳转 QT基础与细节理解 前言正文部分QT基础1&#xff1a;正确理解: QWidget(parent), ui(new Ui::u…...

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动

一、前言说明 在2011版本的gb28181协议中&#xff0c;拉取视频流只要求udp方式&#xff0c;从2016开始要求新增支持tcp被动和tcp主动两种方式&#xff0c;udp理论上会丢包的&#xff0c;所以实际使用过程可能会出现画面花屏的情况&#xff0c;而tcp肯定不丢包&#xff0c;起码…...

Day131 | 灵神 | 回溯算法 | 子集型 子集

Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣&#xff08;LeetCode&#xff09; 思路&#xff1a; 笔者写过很多次这道题了&#xff0c;不想写题解了&#xff0c;大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

spring:实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例&#xff0c;也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下&#xff1a; 定义实例工厂类&#xff08;Java代码&#xff09;&#xff0c;定义实例工厂&#xff08;xml&#xff09;&#xff0c;定义调用实例工厂&#xff…...

三体问题详解

从物理学角度&#xff0c;三体问题之所以不稳定&#xff0c;是因为三个天体在万有引力作用下相互作用&#xff0c;形成一个非线性耦合系统。我们可以从牛顿经典力学出发&#xff0c;列出具体的运动方程&#xff0c;并说明为何这个系统本质上是混沌的&#xff0c;无法得到一般解…...

CRMEB 框架中 PHP 上传扩展开发:涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展 扩展入口文件 文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中&#xff0c;将 long long 类型转换为 QString 可以通过以下两种常用方法实现&#xff1a; 方法 1&#xff1a;使用 QString::number() 直接调用 QString 的静态方法 number()&#xff0c;将数值转换为字符串&#xff1a; long long value 1234567890123456789LL; …...

JS设计模式(4):观察者模式

JS设计模式(4):观察者模式 一、引入 在开发中&#xff0c;我们经常会遇到这样的场景&#xff1a;一个对象的状态变化需要自动通知其他对象&#xff0c;比如&#xff1a; 电商平台中&#xff0c;商品库存变化时需要通知所有订阅该商品的用户&#xff1b;新闻网站中&#xff0…...

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统 实现kefu123登录&#xff0c;不允许匿名访问&#xff0c;kefu只能访问/data/kefu目录&#xff0c;不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...

三分算法与DeepSeek辅助证明是单峰函数

前置 单峰函数有唯一的最大值&#xff0c;最大值左侧的数值严格单调递增&#xff0c;最大值右侧的数值严格单调递减。 单谷函数有唯一的最小值&#xff0c;最小值左侧的数值严格单调递减&#xff0c;最小值右侧的数值严格单调递增。 三分的本质 三分和二分一样都是通过不断缩…...

Git常用命令完全指南:从入门到精通

Git常用命令完全指南&#xff1a;从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...