当前位置: 首页 > news >正文

YOLOv9中加入SCConv模块!

 


专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,主力高效涨点!!!


一、本文介绍

        本文将一步步演示如何在YOLOv9中添加 / 替换新模块,寻找模型上的创新!

适用检测目标:   YOLOv9模块通用改进


二、改进步骤

《YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information》

        论文地址:   https://arxiv.org/abs/2402.13616

        代码地址:   https://github.com/WongKinYiu/yolov9

 2.1 创建一个脚本存放新模块

        为方便调用,这里我将脚本放在models包下,命名为extra.py。

 2.2 将模块复制到脚本中,并导入需要的包(以SCConv为例)

        我们将SCConv的代码复制到刚刚创建的extra.py脚本中。

import torch
import torch.nn as nn
import torch.nn.functional as Ffrom models.common import Convclass SCConv(nn.Module):"""https://github.com/MCG-NKU/SCNet/blob/master/scnet.py"""def __init__(self, inplanes, planes, stride=1, padding=1, dilation=1, groups=1, pooling_r=4):super(SCConv, self).__init__()self.k2 = nn.Sequential(nn.AvgPool2d(kernel_size=pooling_r, stride=pooling_r),Conv(inplanes, planes, k=3, s=1, p=padding, d=dilation, g=groups, act=False))self.k3 = Conv(inplanes, planes, k=3, s=1, p=padding, d=dilation, g=groups, act=False)self.k4 = Conv(inplanes, planes, k=3, s=1, p=padding, d=dilation, g=groups, act=False)def forward(self, x):identity = xout = torch.sigmoid(torch.add(identity, F.interpolate(self.k2(x), identity.size()[2:]))) # sigmoid(identity + k2)out = torch.mul(self.k3(x), out)    # k3 * sigmoid(identity + k2)out = self.k4(out)  # k4return out

2.3 对yolo.py操作

        打开models包下的yolo.py文件夹,将刚才创建的脚本导入。并在下方第700行的位置(位置可能因v9版本更新变动)加入下方代码。

2.4 运行配置文件

        创建模型配置文件(yaml文件),将我们所作改进加入到配置文件中(这一步的配置文件可以复制models  - > detect 下的yaml修改。)。对YOLO系列yaml文件不熟悉的同学可以看我往期的yaml详解教学!

YOLO系列 “.yaml“文件解读-CSDN博客

# YOLOv9# parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.25  # layer channel multiple
#activation: nn.LeakyReLU(0.1)
#activation: nn.ReLU()# anchors
anchors: 3# YOLOv9 backbone
backbone:[[-1, 1, Silence, []],  # conv down[-1, 1, Conv, [64, 3, 2]],  # 1-P1/2# conv down[-1, 1, Conv, [128, 3, 2]],  # 2-P2/4# elan-1 block[-1, 1, RepNCSPELAN4, [256, 128, 64, 1]],  # 3# avg-conv down[-1, 1, ADown, [256]],  # 4-P3/8# elan-2 block[-1, 1, RepNCSPELAN4, [512, 256, 128, 1]],  # 5# avg-conv down[-1, 1, ADown, [512]],  # 6-P4/16# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 7# avg-conv down[-1, 1, ADown, [512]],  # 8-P5/32# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 9]# YOLOv9 head
head:[# elan-spp block[-1, 1, SPPELAN, [512, 256]],  # 10# up-concat merge[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 7], 1, Concat, [1]],  # cat backbone P4# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 13# up-concat merge[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 5], 1, Concat, [1]],  # cat backbone P3# elan-2 block[-1, 1, RepNCSPELAN4, [256, 256, 128, 1]],  # 16 (P3/8-small)# avg-conv-down merge[-1, 1, ADown, [256]],[[-1, 13], 1, Concat, [1]],  # cat head P4# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 19 (P4/16-medium)# avg-conv-down merge[-1, 1, ADown, [512]],[[-1, 10], 1, Concat, [1]],  # cat head P5# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 22 (P5/32-large)# multi-level reversible auxiliary branch# routing[5, 1, CBLinear, [[256]]], # 23[7, 1, CBLinear, [[256, 512]]], # 24[9, 1, CBLinear, [[256, 512, 512]]], # 25# conv down[0, 1, Conv, [64, 3, 2]],  # 26-P1/2# conv down[-1, 1, Conv, [128, 3, 2]],  # 27-P2/4# elan-1 block[-1, 1, RepNCSPELAN4, [256, 128, 64, 1]],  # 28# avg-conv down fuse[-1, 1, ADown, [256]],  # 29-P3/8[[23, 24, 25, -1], 1, CBFuse, [[0, 0, 0]]], # 30  # elan-2 block[-1, 1, RepNCSPELAN4, [512, 256, 128, 1]],  # 31# avg-conv down fuse[-1, 1, ADown, [512]],  # 32-P4/16[[24, 25, -1], 1, CBFuse, [[1, 1]]], # 33 # elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 34# avg-conv down fuse[-1, 1, ADown, [512]],  # 35-P5/32[[25, -1], 1, CBFuse, [[2]]], # 36# elan-2 block[-1, 1, RepNCSPELAN4, [512, 512, 256, 1]],  # 37[-1, 1, SCConv, []],  # 38# detection head# detect[[31, 34, 38, 16, 19, 22], 1, DualDDetect, [nc]],  # DualDDetect(A3, A4, A5, P3, P4, P5)]

3.4 训练过程

        最后,复制我们创建的模型配置,填入训练脚本(train_dual)中(不会训练的同学可以参考我之前的文章。),运行即可。

YOLOv9 最简训练教学!-CSDN博客


如果觉得本文章有用的话给博主点个关注吧!


相关文章:

YOLOv9中加入SCConv模块!

专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,主力高效涨点!!! 一、本文介绍 本文将一步步演示如何在YOLOv9中添加 / 替换新模块,寻找模型上的创新! 适用检测目标: YOLOv9模块…...

代码随想录算法训练营第四十七天丨198. 打家劫舍、​ 213. 打家劫舍 II​、337. 打家劫舍 III

198. 打家劫舍 自己的思路: 初始化两个dp数组,dp[i][0]表示不偷第i户,在0-i户可以偷到的最大金额,dp[i][1]表示偷i户在0-i户可以偷到的最大金额。 class Solution:def rob(self, nums: List[int]) -> int:n len(nums)dp […...

龙蜥Anolis 8.4 anck 安装mysql5.7

el8没有用mysql5.7了,镜像里是mysql8。 禁用 sudo dnf remove mysql sudo dnf module reset mysql sudo dnf module disable mysql 修改Yum源 sudo vi /etc/yum.repos.d/mysql-community.repo [mysql57-community] nameMySQL 5.7 Community Server baseurlhttp:…...

【踩坑】修复xrdp无法关闭Authentication Required验证窗口

转载请注明出处:小锋学长生活大爆炸[xfxuezhang.cn] 问题如下,时不时出现,有时还怎么都关不掉,很烦: 解决方法一:命令行输入 dbus-send --typemethod_call --destorg.gnome.Shell /org/gnome/Shell org.gn…...

python学习笔记 - 标准库常量

Python 中有一些内置的常量,它们是一些特殊的值,通常不会改变。以下是其中一些常见的内置常量及其详细解释以及使用示例: True: 表示布尔值真。给 True 赋值是非法的并会引发 SyntaxError。 x True print(x) # 输出&#xff1a…...

视频和音频使用ffmpeg进行合并和分离(MP4)

1.下载ffmpeg 官网地址:https://ffmpeg.org/download.html 2.配置环境变量 此电脑右键点击 属性 - 高级系统配置 -高级 -环境变量 - 系统变量 path 新增 文件的bin路径 3.验证配置成功 ffmpeg -version 返回版本信息说明配置成功4.执行合并 ffmpeg -i 武家坡20…...

02| JVM堆中垃圾回收的大致过程

如果一直在创建对象,堆中年轻代中Eden区会逐渐放满,如果Eden放满,会触发minor GC回收,创建对象的时GC Roots,如果存在于里面的对象,则被视为非垃圾对象,不会被此次gc回收,就会被移入…...

R语言数据可视化之美专业图表绘制指南(增强版):第1章 R语言编程与绘图基础

第1章 R语言编程与绘图基础 目录 第1章 R语言编程与绘图基础前言1.1 学术图表的基本概念1.1.1 学术图表的基本作用1.1.2基本类别1.1.3 学术图表的绘制原则 1.2 你为什么要选择R1.3 安装 前言 这是我第一次在博客里展示学习中国作者的教材的笔记。我选择这本书的依据是作者同时…...

网站添加pwa操作和配置manifest.json后,没有效果排查问题

pwa技术官网:https://web.dev/learn/pwa 应用清单manifest.json文件字段说明:https://web.dev/articles/add-manifest?hlzh-cn Web App Manifest:Web App Manifest | MDN 当网站添加了manifest.json文件后,也引入到html中了&a…...

MongoDB聚合运算符:$cosh

文章目录 语法使用举例双曲余弦值角度双曲余弦值弧度 $cosh聚合运算符用来计算双曲余弦值&#xff0c;返回指定表达式的双曲余弦值。 语法 { $cosh: <expression> }<expression>为可被解析为数值的表达式$cosh返回弧度&#xff0c;使用$radiansToDegrees运算符可…...

Jenkins配置在远程服务器上执行shell脚本(两种方式)

Jenkins配置在远程服务器上执行shell脚本 方式一&#xff1a;通过SSH免密方式执行 说明&#xff1a;Jenkins部署在ServerA&#xff1a;10.1.1.74上&#xff0c;要运行的程序在ServerB&#xff1a;10.1.1.196 分两步 第一步&#xff1a;Linux Centos7配置SSH免密登录 Linux…...

Java+SpringBoot,打造社区疫情信息新生态

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…...

js ES6判断字符串是否以某个字符串开头或者结尾startsWith、endsWith

1.前言 startsWith&#xff1a;startsWith方法用于检查字符串是否以指定的字符串开头。 endsWith&#xff1a;endsWith方法用于检查字符串是否以指定的字符串结尾。 2.用法示例 const str Hello, world!;console.log(str.startsWith(Hello)); // true console.log(str.starts…...

预研项目完成后小批量验证(技术变更流程)

...

Bert-as-service 实战

参考&#xff1a;bert-as-service 详细使用指南写给初学者-CSDN博客 GitHub - ymcui/Chinese-BERT-wwm: Pre-Training with Whole Word Masking for Chinese BERT&#xff08;中文BERT-wwm系列模型&#xff09; 下载&#xff1a;https://storage.googleapis.com/bert_models/…...

微信小程序(四十七)多个token存储

注释很详细&#xff0c;直接上代码 新增内容&#xff1a; 1.基础存储模板 2.中括号实现变量名匹配 源码&#xff1a; app.js App({//提前声明的变量名token:wx.getStorageSync(toke),refreshToken:wx.getSystemInfoAsync(refreshToken),setToken(key,token){//保存token到全局…...

机器学习(II)--样本不平衡

现实中&#xff0c;样本&#xff08;类别&#xff09;样本不平衡&#xff08;class-imbalance&#xff09;是一种常见的现象&#xff0c;如&#xff1a;金融欺诈交易检测&#xff0c;欺诈交易的订单样本通常是占总交易数量的极少部分&#xff0c;而且对于有些任务而言少数样本更…...

几个好用的 VUE Table

Vue easytable - 功能恰到好处 无学习成本 上手就用Vue good table - UI 清新 功能直给 适合小项目Vxe table - 宝藏级 table 组件 高级功能低调好用 维护频率高tabulator - 元老级 table 组件 高级功能平民化AG Grid - 媲美 Excel 的 Table 组件 能想到的复杂功能它都能做到...

Vue源码系列讲解——实例方法篇【三】(生命周期相关方法)

目录 0. 前言 1. vm.$mount 1.1 用法回顾 1.2 内部原理 2. vm.$forceUpdate 2.1 用法回顾 2.2 内部原理 3. vm.$nextTick 3.1 用法回顾 3.2 JS的运行机制 3.3 内部原理 能力检测 执行回调队列 4. vm.$destory 4.1 用法回顾 4.2 内部原理 0. 前言 与生命周期相关…...

百度SEO工具,自动更新网站的工具

在网站SEO的过程中&#xff0c;不断更新网站内容是提升排名和吸引流量的关键之一。而对于大多数网站管理员来说&#xff0c;频繁手动更新文章并进行SEO优化可能会是一项繁琐且耗时的任务。针对这一问题&#xff0c;百度自动更新文章SEO工具应运而生&#xff0c;它能够帮助网站管…...

RNA-seq新手必看:raw_count、tpm、fpkm、rpkm到底怎么选?附实战代码示例

RNA-seq数据标准化方法全解析&#xff1a;从理论到实战的精准选择指南 刚接触RNA-seq分析的生物信息学研究者&#xff0c;往往会被各种标准化方法搞得晕头转向。实验室前辈可能随口甩出一句"用TPM就行"&#xff0c;而文献中又频繁出现raw count结合DESeq2的分析流程。…...

从MATLAB到Tecplot:ASCII格式PLT文件的结构化数据转换实战

1. Tecplot ASCII格式PLT文件基础解析 第一次接触Tecplot的PLT文件格式时&#xff0c;我被它灵活的ASCII结构深深吸引。与二进制格式相比&#xff0c;ASCII格式虽然读取速度稍慢&#xff0c;但它的可读性和可调试性为工程师和科研人员提供了极大的便利。记得我刚开始处理CFD数据…...

RabbitMQ 核心角色:什么是生产者和消费者?全流程图解+实战详解

RabbitMQ 核心角色&#xff1a;什么是生产者和消费者&#xff1f;全流程图解实战详解前言一、核心概念定义&#xff1a;什么是 RabbitMQ 生产者和消费者&#xff1f;1.1 生产者&#xff08;Producer&#xff09;&#xff1a;定义与作用1.2 消费者&#xff08;Consumer&#xff…...

朱雀AI检测56%降到0%:推荐嘎嘎降AI等3款靠谱工具

朱雀AI检测56%降到0%&#xff1a;推荐嘎嘎降AI等3款靠谱工具 先说一个真实数据&#xff1a;朱雀AI检测率从56.83%降到0%。 这不是编出来的&#xff0c;是用降AI工具实际处理后的检测结果。下面这两张截图&#xff0c;左边是处理前的朱雀检测报告&#xff0c;右边是处理后的。56…...

实战指南:如何利用TSNE实现高维数据的可视化与聚类分析

1. 什么是TSNE&#xff1f;为什么我们需要它&#xff1f; 想象一下你手里有一份包含上百个特征的数据集&#xff0c;比如一组图片&#xff0c;每张图片由1024个像素值组成。这时候你想看看这些图片在特征空间中的分布情况&#xff0c;但1024维的空间远远超出了人类的理解范围。…...

避坑指南:STM32WLE5CCU6移植LoRaWAN节点,搞定BSP报错、信道配置与OTAA入网参数

STM32WLE5CCU6 LoRaWAN节点移植实战&#xff1a;从BSP报错到OTAA入网的完整避坑手册 去年第一次接触STM32WLE5系列芯片时&#xff0c;我花了整整三天时间才让LoRaWAN节点成功入网。期间遇到的BSP缺失、信道配置错误、OTAA参数无效等问题&#xff0c;几乎踩遍了所有新手可能遇到…...

【仅限头部AI产品团队内部流通】:生成式AI A/B测试SOP 2.3版(含GPT-4o/ Claude-3实测对比模板与统计功效计算器)

第一章&#xff1a;生成式AI应用A/B测试方法论概览 2026奇点智能技术大会(https://ml-summit.org) 生成式AI应用的A/B测试远非传统Web界面实验的简单迁移——其核心挑战在于评估不可预测、多模态、上下文敏感的输出质量&#xff0c;而非仅统计点击率或转化率。需同步度量功能…...

Educoder计算机数据表示实验(HUST)实战:GB2312编码与区位码转换原理详解

1. GB2312编码的前世今生 第一次接触GB2312编码是在大学计算机组成原理实验课上&#xff0c;当时看着屏幕上密密麻麻的区位码表格&#xff0c;完全不明白这些数字和汉字有什么关系。直到后来参与了一个中文信息处理项目&#xff0c;才真正搞懂这套编码体系的精妙之处。 GB2312是…...

GNSS数据处理第一步:手把手教你用Python脚本自动下载CDDIS和IGN的数据

GNSS数据处理自动化&#xff1a;Python脚本高效下载CDDIS与IGN数据指南 在GNSS数据处理的工作流中&#xff0c;数据下载往往是第一步也是最耗时的环节。传统的手动点击网页、复制FTP链接的方式不仅效率低下&#xff0c;还容易出错。本文将带你用Python构建一个自动化下载系统&a…...

PyCharm 2025.1 新版本遇坑记:手把手教你找回‘消失’的Conda虚拟环境

PyCharm 2025.1 新版本遇坑记&#xff1a;手把手教你找回"消失"的Conda虚拟环境 作为一名长期使用PyCharm进行Python开发的工程师&#xff0c;每次IDE大版本更新都让我既期待又忐忑。2025.1版本发布后&#xff0c;我第一时间进行了升级&#xff0c;却意外遭遇了一个令…...