当前位置: 首页 > news >正文

YOLOv9|加入2023Gold YOLO中的GD机制!遥遥领先!


专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,助力高效涨点!!!


一、Gold YOLO摘要

        在过去的几年里,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改体系结构、增加数据和设计新的损失,将基线提高到了更高的水平。然而,我们发现以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)已经缓解了这一问题。因此,本研究提供了一种先进的聚集和分布机制(GD)机制,该机制通过卷积和自注意操作来实现。这个新设计的模型名为Gold YOLO,它增强了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。


二、Gold YOLO模块详解

 2.1 模块简介

       Gold yolo的主要思想: 使用GD(gather-and-distribute)机制代替现有的通过不停间接迭代融合不同level的信息的机制​​​​​​​。

        GD由3种模块组成:FAM(Feature Alignment Module,特征对齐模块)、IFM(Information Fusion Module,信息融合模块)、Inject(Information Injection Module,信息注入模块)。其中FAM与IFM用于特征收集,Inject用于分发。

        low-GD主要用于融合模型浅层的特征信息,取代原Neck中的FPN结构,输入为B2,B3,B4,B5的特征张量。输入的特征张量首先通过Low-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过Conv、RepVGGBlock、Conv进行特征提取融合,最后Split,送入Inject模块。

        high-GD主要用于融合模型深层的特征信息,取代原Neck中的FPN结构,输入为P3,P4,P5的特征张量。输入的特征张量首先通过High-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过多头注意力机制和前向网络进行特征提取融合,最后Split,送入Inject模块。

        Inject模块输入有两个,一个是x_local,一个是x_global,也就是GD中处理完的特征张量。通过图中的Conv与空间的缩放操作与x_local进行特征融合,融合方式主要为点积和相加。


三、 GD模块使用教程

3.1 GD模块的代码


3.2 在YOLO v9中的添加教程


3.3 运行配置文件

这部分文章暂不开源!

⭐现在入手仅$ 59.9,早入早发论文!⭐

联系QQ: 2668825911 ,欢迎交流!

本项目持续更新,不付费订阅也可关注等每周更新,每周开源1-2篇。


相关文章:

YOLOv9|加入2023Gold YOLO中的GD机制!遥遥领先!

专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,助力高效涨点!!! 一、Gold YOLO摘要 在过去的几年里,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改体系结构、增加数据和设计新的损…...

WRF模型运行教程(ububtu系统)--III.运行WRF模型(官网案例)

零、创建DATA目录 # 1.创建一个DATA目录用于存放数据(一般为fnl数据,放在Build_WRF目录下)。 mkdir DATA # 2.进入 DATA cd DATA 一、WPS预处理 在模拟之前先确定模拟域(即模拟范围),并进行数据预处理&#xff08…...

html和winform webBrowser控件交互并播放视频(包含转码)

1、 为了使网页能够与winform交互 将com的可访问性设置为真 [System.Security.Permissions.PermissionSet(System.Security.Permissions.SecurityAction.Demand, Name "FullTrust")][System.Runtime.InteropServices.ComVisibleAttribute(true)] 2、在webBrow…...

Neo4j 批量导入数据 从官方文档学习LOAD CSV 命令 小白可食用版

学习LOAD CSV🚀 在使用Neo4j进行大量数据导入的时候,发现如果用代码自动一行一行的导入效率过低,因此明白了为什么需要用到批量导入功能,在Neo4j中允许批量导入CSV文件格式,刚开始从网上的中看了各种半残的博客或者视频…...

Day43-2-企业级实时复制intofy介绍及实践

Day43-2-企业级实时复制intofy介绍及实践 1. 企业级备份方案介绍1.1 利用定时方式,实现周期备份重要数据信息。1.2 实时数据备份方案1.3 实时复制环境准备1.4 实时复制软件介绍1.5 实时复制inotify机制介绍1.6 项目部署实施1.6.1 部署环境准备1.6.2 检查Linux系统支…...

2024年AI辅助研发趋势深度解析:科技革新与效率提升的双重奏

随着人工智能技术的迅猛发展,AI辅助研发正逐渐成为科技界和工业界的热门话题。特别是在2024年,这一趋势将更加明显,AI辅助研发将在各个领域展现出强大的潜力和应用价值。 首先,AI辅助研发将进一步提升研发效率。传统的研发模式往…...

bash: mysqldump: command not found

问题:在linux上执行mysql备份的时候,出现此异常 mysqldump命令找不到 解决: 1、找到mysql目录(找到mysql可执行命令目录) which mysql 有图可知,mysql安装在: /usr1/local/java/mysql 2、my…...

hcie数通和云计算选哪个好?

1. 基础知识与技能要求 数通技术是网络技术的核心,它涉及到网络协议、路由交换、网络安全等多个方面。如果你是一名网络工程师或开发者,想要在数通领域有所建树,你需要具备扎实的基础知识和丰富的实战经验。 云计算则更注重于虚拟化、存储、网…...

浅易理解:非极大抑制NMS

什么是非极大抑制NMS 非极大值抑制(Non-Maximum Suppression,简称NMS)是一种在计算机视觉和图像处理领域中广泛使用的后处理技术,特别是在目标检测任务中。它的主要目的是解决目标检测过程中出现的重复检测问题,即对于…...

C语言如何进⾏字符数组的复制?

一、问题 有两个字符数组a和b,a的值是“Good Bye” ,b的值是 “Bye Bye”,现在要把b 复制到a中,使a变成“Bye Bye”,应该怎么做? 二、解答 在字符串操作中,字符串复制是⽐较常⽤的操作之⼀。在…...

Linux 中搭建 主从dns域名解析服务器

CSDN 成就一亿技术人! 作者主页:点击! Linux专栏:点击! CSDN 成就一亿技术人! ————前言———— 主从(Master-Slave)DNS架构是一种用于提高DNS系统可靠性和性能的配置方式。…...

CSS3病毒病原体图形特效

CSS3病毒病原体图形特效,源码由HTMLCSSJS组成,双击html文件可以本地运行效果,也可以上传到服务器里面 下载地址 CSS3病毒病原体图形特效代码...

Tomcat Web 开发项目构建教程

1下载Tomcat安装包,下载链接:Apache Tomcat - Welcome!,我电脑环境为JDK8,所以下载Tomcat9.0 2、下载完压缩包后,解压到指定位置 3.在intelij中新建一个项目 4.选中创建的项目,双击shift,输入add frame...然…...

Elasticsearch(9) gauss的使用

elasticsearch version: 7.10.1 在Elasticsearch中,gauss作为衰减函数(decay function)被用于function_score查询中,用于实现基于地理位置或其他数值字段的衰减权重评分。gauss衰减函数模拟了高斯分布,即距…...

php前端和java后端数据调用流程

php前端和java后端数据调用流程 前端 1、新建php页面title.php <title>标题</title> <td width"30%" class"form-key">标题内容</td> <td width"70%"><input type"text" class"form-control…...

C语言从入门到熟悉------第四阶段

指针 地址和指针的概念 要明白什么是指针&#xff0c;必须先要弄清楚数据在内存中是如何存储的&#xff0c;又是如何被读取的。如果在程序中定义了一个变量&#xff0c;在对程序进行编译时&#xff0c;系统就会为这个变量分配内存单元。编译系统根据程序中定义的变量类型分配…...

【目标检测-数据集准备】DIOR转为yolo训练所需格式

【目标检测】DIOR遥感影像数据集&#xff0c;转为yolo系列模型训练所需格式。 标签文件位于Annotations下&#xff0c;格式为xml&#xff0c;yolo系列模型训练所需格式为txt&#xff0c;格式为 class_id x_center,y_center,w,h其中&#xff0c;train&#xff0c;text&#xff…...

Nacos为什么对于临时实例采用心跳检测,非临时实例采用主动询问?Nacos同时作为配置中心和注册中心有什么坏处?为什么Nacos可以抗住那么高的注册?

Nacos为什么对于临时实例采用心跳检测,非临时实例采用主动询问? Nacos 对于临时实例采用心跳检测&#xff0c;而对于非临时实例采用主动询问&#xff0c;这两种不同的健康检查机制是为了满足不同场景下的服务发现需求。具体分析如下&#xff1a; 临时实例的心跳检测&#xf…...

【NLP】如何实现快速加载gensim word2vec的预训练的词向量模型

1 问题 通过以下代码&#xff0c;实现加载word2vec词向量&#xff0c;每次加载都是几分钟&#xff0c;效率特别低。 from gensim.models import Word2Vec,KeyedVectors# 读取中文词向量模型&#xff08;需要提前下载对应的词向量模型文件&#xff09; word2vec_model KeyedV…...

前端实例:页面布局1(后端数据实现)

效果图 注&#xff1a;这里用到后端语言php&#xff08;页面是.php文件&#xff09;,提取纯html也可以用 inemployee_index.php <?php include(includes/session.inc); $Title _(内部员工首页); $ViewTopic 内部员工首页; $BookMark 内部员工首页; include(includes/…...

飞书机器人接入OpenClaw指南:千问3.5-27B实现智能问答助手

飞书机器人接入OpenClaw指南&#xff1a;千问3.5-27B实现智能问答助手 1. 为什么选择OpenClaw飞书机器人组合 去年我接手了一个技术文档整理项目&#xff0c;每天需要处理上百份飞书文档的归类与摘要生成。手动操作不仅效率低下&#xff0c;还经常漏掉关键更新。直到发现Open…...

AI大模型学习路线图:小白程序员必看,收藏这份高薪入局指南!

AI大模型学习路线图&#xff1a;小白程序员必看&#xff0c;收藏这份高薪入局指南&#xff01; 本文提供了一套完整的AI大模型学习路线&#xff0c;涵盖大模型基础认知、核心技术&#xff08;RAG、Prompt、Agent&#xff09;、开发基础能力、应用场景落地、项目实操流程及面试求…...

PyTorch 2.8镜像效果实测:RTX 4090D上Qwen2-VL图文理解准确率对比报告

PyTorch 2.8镜像效果实测&#xff1a;RTX 4090D上Qwen2-VL图文理解准确率对比报告 1. 测试环境与配置 1.1 硬件与系统配置 本次测试使用的硬件配置为&#xff1a; GPU&#xff1a;NVIDIA RTX 4090D 24GB显存CPU&#xff1a;10核心处理器内存&#xff1a;120GB存储&#xff…...

基于单片机的全自动咖啡机控制系统设计

一、摘要 全自动咖啡机控制系统控制系统对于现今的日常家居生活和商业模式售卖都有着重大的影响力&#xff0c;随着社会快节奏的发展&#xff0c;传统的人工冲泡模式效率远远满足不了人们的日常需求&#xff0c;并且在冲调多口味咖啡方面&#xff0c;也没有良好的原料精准配比。…...

解决 Antigravity 新谷歌账户无法登录的问题

最近在使用 Antigravity 时遇到一个奇葩问题&#xff0c;折腾了大半天终于解决&#xff0c;特意记录下来&#xff0c;希望能帮到有同样困扰的小伙伴 —— 老谷歌免费账户能正常登录 Antigravity&#xff0c;但新注册的谷歌 Pro 账户&#xff08;和老账户一样都是美国地区&#…...

android studio 解决git用户名和用户邮箱不一致的问题

原因&#xff1a;公司git代码提交&#xff0c;应该用的是公司的账号和邮箱&#xff0c;不要使用私人名称和邮箱&#xff1b;1、查看自己本地的git用户名、邮箱配置1.1、在用户目录下&#xff0c;文件名&#xff1a;.gitconfig1.2、打开后&#xff1a;[user]name zhangjian.***…...

搞定AI教材写作!工具分享及低查重策略,提升编写效率!

完成教材的初稿后&#xff0c;进行修改和优化的过程简直是一场“折磨”&#xff01;在全面阅读全文时&#xff0c;要细致地查找逻辑漏洞和知识点错误&#xff0c;耗费的时间着实不小&#xff1b;而当调整一个章节的结构时&#xff0c;往往会牵涉到后面的多个部分&#xff0c;导…...

Oracle Ogg集成模式升级全攻略:从条件检查到性能优化

Oracle GoldenGate集成模式升级实战手册&#xff1a;从条件预检到调优全解析 在数据同步技术领域&#xff0c;Oracle GoldenGate&#xff08;OGG&#xff09;的集成模式代表着新一代架构设计方向。与经典模式相比&#xff0c;集成模式深度整合了数据库内核级特性&#xff0c;在…...

Hi3519 DV500上跑YOLOv5n,从7秒到34毫秒:一个模型算子优化带来的200倍加速实战

Hi3519 DV500上YOLOv5n性能优化实战&#xff1a;从7秒到34毫秒的200倍加速秘诀 当我们在嵌入式设备上部署目标检测模型时&#xff0c;性能往往是最大的挑战。最近在Hi3519 DV500芯片上部署YOLOv5n模型的经历让我深刻体会到了这一点——最初的推理时间竟然长达7秒&#xff0c;完…...

破解土地-生态耦合难题,从数据处理到SCI论文:AI辅助下PLUS-InVEST模型土地利用格局模拟与生态系统服务

做土地利用、生态系统服务、国土空间规划的同学&#xff0c;是不是经常遇到这些问题&#xff1a;PLUS 模型装不上、跑不通、参数看不懂InVEST 产水 / 土壤保持 / 碳储量 / 生境质量数据总是报错ArcGIS 栅格处理、投影转换、重分类一头雾水多情景模拟不会设计&#xff0c;结果不…...