当前位置：首页 > news >正文

YOLOv11融合针对小目标FFCA-YOPLO中的FEM模块及相关改进思路

news 2025/7/15 22:55:56

YOLOv11v10v8使用教程： YOLOv11入门到入土使用教程

YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总

《FFCA-YOLO for Small Object Detection in Remote Sensing Images》

一、模块介绍

论文链接：https://ieeexplore.ieee.org/document/10423050

代码链接：yemu1138178251/FFCA-YOLO (github.com)

论文速览：

特征表示不足、背景混淆等问题使得遥感中小目标的探测任务变得艰巨。特别是当算法将部署在机上进行实时处理时，这需要在有限的计算资源下对准确性和速度进行广泛的优化。为了解决这些问题，本文提出了一种称为特征增强、融合和上下文感知 YOLO （FFCA-YOLO）的高效检测器。FFCA-YOLO 包括三个创新的轻量级和即插即用模块：功能增强模块（FEM）、功能融合模块（FFM）和空间上下文感知模块（SCAM）。这三个模块分别提高了局域网感知、多尺度特征融合和全局关联跨信道和空间的网络能力，同时尽可能避免增加复杂性。因此，小物体的弱特征表示得到了增强，并且抑制了可能混淆的背景。此外，为了在保证效率的同时进一步减少计算资源消耗，通过基于部分卷积（PConv）重建 FFCA-YOLO 的主干和颈部，优化了 FFCA-YOLO （L-FFCA-YOLO）的精简版。

总结：文章提出几个针对小目标的特征提取模块，有一定效果。

二、加入到YOLO中

2.1 创建脚本文件

首先在ultralytics->nn路径下创建blocks.py脚本，用于存放模块代码。

2.2 复制代码

复制代码粘到刚刚创建的blocks.py脚本中，如下图所示：

import torch
import torch.nn as nn
from ultralytics.nn.modules.conv import Convclass BasicConv_FFCA(nn.Module):def __init__(self, in_planes, out_planes, kernel_size, stride=1, padding=0, dilation=1, groups=1, relu=True,bn=True, bias=False):super(BasicConv_FFCA, self).__init__()self.out_channels = out_planesself.conv = nn.Conv2d(in_planes, out_planes, kernel_size=kernel_size, stride=stride, padding=padding,dilation=dilation, groups=groups, bias=bias)self.bn = nn.BatchNorm2d(out_planes, eps=1e-5, momentum=0.01, affine=True) if bn else Noneself.relu = nn.ReLU(inplace=True) if relu else Nonedef forward(self, x):x = self.conv(x)if self.bn is not None:x = self.bn(x)if self.relu is not None:x = self.relu(x)return xclass FEM(nn.Module):def __init__(self, in_planes, out_planes, stride=1, scale=0.1, map_reduce=8):super(FEM, self).__init__()self.scale = scaleself.out_channels = out_planesinter_planes = in_planes // map_reduceself.branch0 = nn.Sequential(BasicConv_FFCA(in_planes, 2 * inter_planes, kernel_size=1, stride=stride),BasicConv_FFCA(2 * inter_planes, 2 * inter_planes, kernel_size=3, stride=1, padding=1, relu=False))self.branch1 = nn.Sequential(BasicConv_FFCA(in_planes, inter_planes, kernel_size=1, stride=1),BasicConv_FFCA(inter_planes, (inter_planes // 2) * 3, kernel_size=(1, 3), stride=stride, padding=(0, 1)),BasicConv_FFCA((inter_planes // 2) * 3, 2 * inter_planes, kernel_size=(3, 1), stride=stride, padding=(1, 0)),BasicConv_FFCA(2 * inter_planes, 2 * inter_planes, kernel_size=3, stride=1, padding=5, dilation=5, relu=False))self.branch2 = nn.Sequential(BasicConv_FFCA(in_planes, inter_planes, kernel_size=1, stride=1),BasicConv_FFCA(inter_planes, (inter_planes // 2) * 3, kernel_size=(3, 1), stride=stride, padding=(1, 0)),BasicConv_FFCA((inter_planes // 2) * 3, 2 * inter_planes, kernel_size=(1, 3), stride=stride, padding=(0, 1)),BasicConv_FFCA(2 * inter_planes, 2 * inter_planes, kernel_size=3, stride=1, padding=5, dilation=5, relu=False))self.ConvLinear = BasicConv_FFCA(6 * inter_planes, out_planes, kernel_size=1, stride=1, relu=False)self.shortcut = BasicConv_FFCA(in_planes, out_planes, kernel_size=1, stride=stride, relu=False)self.relu = nn.ReLU(inplace=False)def forward(self, x):x0 = self.branch0(x)x1 = self.branch1(x)x2 = self.branch2(x)out = torch.cat((x0, x1, x2), 1)out = self.ConvLinear(out)short = self.shortcut(x)out = out * self.scale + shortout = self.relu(out)return out

2.3 更改task.py文件

打开ultralytics->nn->modules->task.py，在脚本空白处导入函数。

from ultralytics.nn.blocks import *

之后找到模型解析函数parse_model（约在tasks.py脚本中940行左右位置，可能因代码版本不同变动），在该函数的最后一个else分支上面增加相关解析代码。

        elif m is FEM:c2 = args[0]args = [ch[f], *args]

2.4 更改yaml文件

yam文件解读：YOLO系列 “.yaml“文件解读_yolo yaml文件-CSDN博客

打开更改ultralytics/cfg/models/11路径下的YOLOv11.yaml文件，替换原有模块。（放在该位置仅能插入该模块，具体效果未知。博主精力有限，仅完成与其他模块二次创新融合的测试，结构图见文末，代码见群文件更新。）

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLO11 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parameters
nc: 80 # number of classes
scales: # model compound scaling constants, i.e. 'model=yolo11n.yaml' will call yolo11.yaml with scale 'n'# [depth, width, max_channels]n: [0.50, 0.25, 1024] # summary: 319 layers, 2624080 parameters, 2624064 gradients, 6.6 GFLOPss: [0.50, 0.50, 1024] # summary: 319 layers, 9458752 parameters, 9458736 gradients, 21.7 GFLOPsm: [0.50, 1.00, 512] # summary: 409 layers, 20114688 parameters, 20114672 gradients, 68.5 GFLOPsl: [1.00, 1.00, 512] # summary: 631 layers, 25372160 parameters, 25372144 gradients, 87.6 GFLOPsx: [1.00, 1.50, 512] # summary: 631 layers, 56966176 parameters, 56966160 gradients, 196.0 GFLOPs# YOLO11n backbone
backbone:# [from, repeats, module, args]- [-1, 1, Conv, [64, 3, 2]] # 0-P1/2- [-1, 1, Conv, [128, 3, 2]] # 1-P2/4- [-1, 2, C3k2, [256, False, 0.25]]- [-1, 1, Conv, [256, 3, 2]] # 3-P3/8- [-1, 2, C3k2, [512, False, 0.25]]- [-1, 1, Conv, [512, 3, 2]] # 5-P4/16- [-1, 2, FEM, [512]]- [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32- [-1, 2, C3k2, [1024, True]]- [-1, 1, SPPF, [1024, 5]] # 9- [-1, 2, C2PSA, [1024]] # 10# YOLO11n head
head:- [-1, 1, nn.Upsample, [None, 2, "nearest"]]- [[-1, 6], 1, Concat, [1]] # cat backbone P4- [-1, 2, C3k2, [512, False]] # 13- [-1, 1, nn.Upsample, [None, 2, "nearest"]]- [[-1, 4], 1, Concat, [1]] # cat backbone P3- [-1, 2, C3k2, [256, False]] # 16 (P3/8-small)- [-1, 1, Conv, [256, 3, 2]]- [[-1, 13], 1, Concat, [1]] # cat head P4- [-1, 2, C3k2, [512, False]] # 19 (P4/16-medium)- [-1, 1, Conv, [512, 3, 2]]- [[-1, 10], 1, Concat, [1]] # cat head P5- [-1, 2, C3k2, [1024, True]] # 22 (P5/32-large)- [[16, 19, 22], 1, Detect, [nc]] # Detect(P3, P4, P5)

2.5 修改train.py文件

创建Train脚本用于训练。

from ultralytics.models import YOLO
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'if __name__ == '__main__':model = YOLO(model='ultralytics/cfg/models/11/yolo11.yaml')# model.load('yolov8n.pt')model.train(data='./data.yaml', epochs=2, batch=1, device='0', imgsz=640, workers=2, cache=False,amp=True, mosaic=False, project='runs/train', name='exp')

在train.py脚本中填入修改好的yaml路径，运行即可训练，数据集创建教程见下方链接。

YOLOv11入门到入土使用教程(含结构图)_yolov11使用教程-CSDN博客

三、相关改进思路（2024/11/23日群文件）

该模块可替换C2f、C3模块中的BottleNeck部分，代码见群文件，结构如图。自研模块与该模块融合代码及yaml文件见群文件。

⭐另外，融合上百种深度学习改进模块的YOLO项目仅79.9（含百种改进的v9），RTDETR79.9,含高性能自研模型，更易发论文，代码每周更新，欢迎点击下方小卡片加我了解。⭐

⭐⭐平均每个文章对应4-6个二创及自研融合模块⭐⭐

YOLOv11融合针对小目标FFCA-YOPLO中的FEM模块及相关改进思路

YOLOv11v10v8使用教程： YOLOv11入门到入土使用教程 YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总《FFCA-YOLO for Small Object Detection in Remote Sensing Images》一、模块介绍论文链接：https://ieeexplore.ieee.org/document/10…...

编程日记 2024/11/23 19:34:11

qt+opengl 三维物体加入摄像机

1 在前几期的文章中，我们已经实现了三维正方体的显示了，那我们来实现让物体的由远及近，和由近及远。这里我们需要了解一个概念摄像机。 1.1 摄像机定义：在世界空间中位置、观察方向、指向右侧向量、指向上方的向量。如下图所示: …...

编程日记 2024/11/23 19:32:08

day05（单片机高级）PCB基础

目录 PCB基础什么是PCB？PCB的作用？ PCB的制作过程 PCB板的层数 PCB设计软件安装立创EDA PCB基础什么是PCB？PCB的作用？ PCB（Printed Circuit Board），中文名称为印制电路板，又称印刷…...

编程日记 2024/11/23 19:31:07

全球天气预报5天-经纬度版免费API接口教程

接口简介： 获取全球任意地区未来5天天气预报，必须传经纬度参数。可先调用【位置坐标】分类下相关接口获取地区经纬度坐标。请求地址： https://cn.apihz.cn/api/tianqi/tqybjw5.php 请求方式： POST或GET。请求参数&#xff1a…...

编程日记 2024/11/23 19:30:06

Shell编程8

声明！ 学习视频来自B站up主 **泷羽sec** 有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关&a…...

编程日记 2024/11/23 19:25:01

python语言基础-5 进阶语法-5.5 上下文管理协议（with语句）

声明：本内容非盈利性质，也不支持任何组织或个人将其用作盈利用途。本内容来源于参考书或网站，会尽量附上原文链接，并鼓励大家看原文。侵删。 5.5 上下文管理协议（with语句）（参考链接&#xff1…...

编程日记 2024/11/23 19:21:58

自动驾驶3D目标检测综述（三）

前两篇综述阅读理解放在这啦，有需要自行前往观看： 第一篇：自动驾驶3D目标检测综述（一）_3d 目标检测-CSDN博客第二篇：自动驾驶3D目标检测综述（二）_子流行稀疏卷积 gpu实现-CSDN博客…...

编程日记 2024/11/23 19:20:57

【GESP】C++三级练习 luogu-B3661, [语言月赛202209] 排排

三级知识点一维数组练习，除了应用了数组以外，其余逻辑比较简单，适合初学者。题目题解详见：https://www.coderli.com/gesp-3-luogu-b3661/ 【GESP】C三级练习 luogu-B3661, [语言月赛202209] 排排队 | OneCoder三级知识点一维数…...

编程日记 2024/11/23 19:19:55

【PPTist】添加PPT模版

前言：这篇文章来探索一下如何应用其他的PPT模版，给一个下拉菜单，列出几个项目中内置的模版 PPT模版数据 （一）增加菜单项首先在下面这个菜单中增加一个“切换模版”的菜单项，点击之后在弹出框中显示所有的…...

编程日记 2024/11/23 19:16:51

大疆上云api开发

目前很多公司希望使用上云api开发自己的无人机平台,但是官网资料不是特别全,下面浅谈一下本人开发过程中遇到的一系列问题。本人使用机场为大疆机场2，飞机为M3TD，纯内网使用部署链接: 上云api代码. 首先从github上面拉去代码上云api代码github. 后…...

编程日记 2024/11/23 19:15:48

IDEA2023 SpringBoot整合MyBatis（三）

一、数据库表 CREATE TABLE students (id INT AUTO_INCREMENT PRIMARY KEY,name VARCHAR(100) NOT NULL,age INT,gender ENUM(Male, Female, Other),email VARCHAR(100) UNIQUE,phone_number VARCHAR(20),address VARCHAR(255),date_of_birth DATE,enrollment_date DATE,cours…...

编程日记 2024/11/23 19:12:42

【Apache Paimon】-- 6 -- 清理过期数据

目录 1、简要介绍 2、操作方式和步骤 2.1、调整快照文件过期时间 2.2、设置分区过期时间 2.2.1、举例1 2.2.2、举例2 2.3、清理废弃文件 3、参考 1、简要介绍清理 paimon （表）过期数据可以释放存储空间，优化资源利用并提升系统运行效率等。本文将介绍如何清理 Paim…...

编程日记 2024/11/23 19:11:41

C语言数据结构——详细讲解双链表

从单链表到双链表：数据结构的演进与优化前言一、单链表回顾二、单链表的局限性三、什么是双链表四、双链表的优势1.双向遍历2.不带头双链表的用途3.带头双链表的用途五、双链表的操作双链表的插入操作（一）双链表的尾插操作（二&a…...

编程日记 2024/11/23 19:09:38

Shell脚本基础（4）：条件判断

内容预览 ≧∀≦ゞ Shell脚本基础（4）：条件判断声明导语基本的if语句结构数值比较运算符文件测试运算符扩展：使用elif和else使用&&和||结合条件判断小结 Shell脚本基础（4）：条件判断声明…...

编程日记 2024/11/23 19:07:34

在 Swift 中实现字符串分割问题：以字典中的单词构造句子

文章目录前言摘要描述题解答案题解代码题解代码分析示例测试及结果时间复杂度空间复杂度总结前言本题由于没有合适答案为以往遗留问题，最近有时间将以往遗留问题一一完善。 LeetCode - #140 单词拆分 II 不积跬步，无以至千里；不积小流&…...

编程日记 2024/11/23 19:05:32

win10中使用ffmpeg和MediaMTX 推流rtsp视频

在win10上测试下ffmpeg推流rtsp视频，需要同时用到流媒体服务器MediaMTX 。ffmpeg推流到流媒体服务器MediaMTX ，其他客户端从流媒体服务器拉流。步骤如下： 1 下载MediaMTX github: Release v1.9.3 bluenviron/mediamtx GitHub…...

编程日记 2024/11/23 19:04:30

16. 【.NET 8 实战--孢子记账--从单体到微服务】--汇率获取定时器

这篇文章我们将一起编写这个系列专栏中第一个和外部系统交互的功能：获取每日汇率。下面我们一起来编写代码吧。一、需求根据文章标题可知，在这片文章中我们只进行汇率的获取和写入数据库。编号需求说明1获取每日汇率1. 从第三方汇率API中获取汇率信…...

编程日记 2024/11/23 19:01:28

C#元组详解：创建、访问与解构

在C#中，元组（Tuple）是一种数据结构，用于将多个元素组合成一个单一的对象。元组可以包含不同类型的元素，并且每个元素都有一个指定的位置（索引）。元组在需要临时组合多个值而不想创建自定义类时非…...

编程日记 2024/11/23 19:00:27

wsl2安装

Windows Subsystem for Linux 2 (WSL2) 是 Windows 10 和 Windows 11 中用于运行 Linux 二进制可执行文件的兼容层。WSL2 是 WSL 的最新版本，提供了更快的文件系统性能和完整的系统调用兼容性。本教程将指导你如何在 Windows 系统上安装 WSL2。前提条件操作系统要…...

编程日记 2024/11/23 18:58:26

android studio无法下载，Could not GET xxx, Received status code 400

-- 1. 使用下面的地址代替原地址: distributionUrlhttps\://services.gradle.org/distributions/gradle-6.5-all.zip 镜像地址: distributionUrlhttps\://downloads.gradle-dn.com/distributions/gradle-6.5-all.zips 上面的已经不好用了 https\://mirrors.cloud.tencent.c…...

编程日记 2024/11/23 18:57:25

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2025/7/15 12:01:02

工程地质软件市场：发展现状、趋势与策略建议

一、引言在工程建设领域，准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具，正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

编程新知 2025/6/17 23:10:20

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2025/7/15 2:21:07

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测；从基础到高级，涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等

🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术，可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势，还能有效评价重大生态工程…...

编程新知 2025/7/6 4:52:27

微信小程序云开发平台MySQL的连接方式

注：微信小程序云开发平台指的是腾讯云开发先给结论：微信小程序云开发平台的MySQL，无法通过获取数据库连接信息的方式进行连接，连接只能通过云开发的SDK连接，具体要参考官方文档： 为什么？ 因为…...

编程新知 2025/7/13 7:00:10

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系坐标体系-介绍坐标原点位于左上角，以像素为单位。在Java坐标系中,第一个是x坐标,表示当前位置为水平方向，距离坐标原点x个像素;第二个是y坐标，表示当前位置为垂直方向，距离坐标原点y个像素。坐标体系-像素 …...

编程新知 2025/7/15 4:16:55

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/7/7 17:43:40

中医有效性探讨

文章目录西医是如何发展到以生物化学为药理基础的现代医学？传统医学奠基期（远古 - 17 世纪）近代医学转型期（17 世纪 - 19 世纪末）现代医学成熟期（20世纪至今） 中医的源远流长和一脉相承远古至…...

编程新知 2025/7/14 21:42:19

Docker 本地安装 mysql 数据库

Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ；并安装。基础操作不再赘述。打开 macOS 终端，开始 docker 安装mysql之旅第一步 docker search mysql 》〉docker search mysql NAME DE…...

编程新知 2025/7/15 4:52:59

保姆级教程：在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama（有网络的电脑）2.2.3 安装Ollama（无网络的电脑）2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

编程新知 2025/7/13 23:07:00