当前位置：首页 > news >正文

零基础教程：Yolov5模型改进-添加13种注意力机制

news 2025/12/17 1:55:52

1.准备工作

先给出13种注意力机制的下载地址：

https://github.com/z1069614715/objectdetection_script

2.加入注意力机制

1.以添加SimAM注意力机制为例（不需要接收通道数的注意力机制）

1.在models文件下新建py文件，取名叫SimAM.py

将以下代码复制到SimAM.py文件种

import torch
import torch.nn as nnclass SimAM(torch.nn.Module):# 不需要接收通道数输入def __init__(self, e_lambda=1e-4):super(SimAM, self).__init__()self.activaton = nn.Sigmoid()self.e_lambda = e_lambdadef __repr__(self):s = self.__class__.__name__ + '('s += ('lambda=%f)' % self.e_lambda)return s@staticmethoddef get_module_name():return "simam"def forward(self, x):b, c, h, w = x.size()n = w * h - 1x_minus_mu_square = (x - x.mean(dim=[2, 3], keepdim=True)).pow(2)y = x_minus_mu_square / (4 * (x_minus_mu_square.sum(dim=[2, 3], keepdim=True) / n + self.e_lambda)) + 0.5return x * self.activaton(y)

2.在yolo.py头部导入SimAM这个类

3.然后复制yolov5s.yaml到同级目录，取名为yolov5s-SimAM.yaml

在某一层添加注意力机制

[from,number,module,args]

注意：！！！！！！！！！！！！！！！！！！！

添加完一层注意力机制之后，会对后面层数造成影响，记得在检测头那里要改层数

2.添加SE注意力机制（需要接收通道数的注意力机制）

1.新建SE.py

import numpy as np
import torch
from torch import nn
from torch.nn import initclass SEAttention(nn.Module):def __init__(self, channel=512,reduction=16):super().__init__()self.avg_pool = nn.AdaptiveAvgPool2d(1)self.fc = nn.Sequential(nn.Linear(channel, channel // reduction, bias=False),nn.ReLU(inplace=True),nn.Linear(channel // reduction, channel, bias=False),nn.Sigmoid())def init_weights(self):for m in self.modules():if isinstance(m, nn.Conv2d):init.kaiming_normal_(m.weight, mode='fan_out')if m.bias is not None:init.constant_(m.bias, 0)elif isinstance(m, nn.BatchNorm2d):init.constant_(m.weight, 1)init.constant_(m.bias, 0)elif isinstance(m, nn.Linear):init.normal_(m.weight, std=0.001)if m.bias is not None:init.constant_(m.bias, 0)def forward(self, x):b, c, _, _ = x.size()y = self.avg_pool(x).view(b, c)y = self.fc(y).view(b, c, 1, 1)return x * y.expand_as(x)

2.修改yolo.py

添加这两行代码

        elif m is SEAttention:args = [ch[f]]

3.models下新建yolov5s-SE.yaml

# YOLOv5 🚀 by Ultralytics, AGPL-3.0 license# Parameters
nc: 80  # number of classes  coco数据集的种类
depth_multiple: 0.33  # model depth multiple  用来控制模型的大小  与每一层的number相乘再取整
width_multiple: 0.50  # layer channel multiple  与每一层的channel相乘 例如64*0.5、128*0.5
# anchors指的是我们使用的anchor的大小，anchor分为3组，每组3个
anchors:- [10,13, 16,30, 33,23]  # P3/8 第一组anchor作用在feature,feature大小是原图的1/8的stride大小。anchor比较小。因为是浅层的特征，感受野比较小。- [30,61, 62,45, 59,119]  # P4/16- [116,90, 156,198, 373,326]  # P5/32# YOLOv5 v6.0 backbone
backbone:# [from, number, module, args]  args:参数 arg是argument（参数）的缩写，是每一层输出的一个参数[[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2  arguments 输出通道数为64（也是卷积核的个数），Conv卷积核的大小为6*6 stride=2 padding=2 此时特征图大小为原图的1/2[-1, 1, Conv, [128, 3, 2]],  # 1-P2/4[-1, 3, C3, [128]],[-1, 1, Conv, [256, 3, 2]],  # 3-P3/8[-1, 6, C3, [256]],[-1, 1, Conv, [512, 3, 2]],  # 5-P4/16[-1, 9, C3, [512]],[-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32[-1, 3, C3, [1024]],[-1, 1, SPPF, [1024, 5]],  # 9  对于SPP(不同尺度特征层的融合)的改进-SPPF]# YOLOv5 v6.0 head  bottleneck（除了检测以外的部分）+detect 瓶颈+检测
head:[[-1, 1, Conv, [512, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 6], 1, Concat, [1]],  # cat backbone P4[-1, 1,SEAttention, [16]],      # ----------这一层添加了SEAttention注意力机制,此注意力的通道数512也不用写在这里，[]里面写除了通道数以外的其他参数：reduction=16[-1, 3, C3, [512, False]],  # 14 -------从原来的13层改成14层[-1, 1, Conv, [256, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 4], 1, Concat, [1]],  # cat backbone P3[-1, 3, C3, [256, False]],  # 17 (P3/8-small)[-1, 1, Conv, [256, 3, 2]],[[-1, 15], 1, Concat, [1]],  # cat head P4   ------这里从原来的14改成15[-1, 3, C3, [512, False]],  # 20 (P4/16-medium)[-1, 1, Conv, [512, 3, 2]],[[-1, 10], 1, Concat, [1]],  # cat head P5  ------注意力机制加在10层之后，所以不会对第10层有影响[-1, 3, C3, [1024, False]],  # 23 (P5/32-large)[[18, 21, 24], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5) ----从原来的17,20,23改成18,21,24]

注意：添加了SEAttention注意力机制,此注意力的通道数512也不用写在这里，[]里面写除了通道数以外的其他参数：reduction=16

零基础教程：Yolov5模型改进-添加13种注意力机制

1.准备工作先给出13种注意力机制的下载地址： https://github.com/z1069614715/objectdetection_script 2.加入注意力机制 1.以添加SimAM注意力机制为例（不需要接收通道数的注意力机制） 1.在models文件下新建py文件，取名叫Sim…...

编程日记 2023/9/25 20:04:04

const getQueryValueFn () >{// 获取当前页面的URLconst currentURL window.location.href;//创建一个URL对象来解析当前URL。URL对象提供了方便的属性和方法来处理URL的各个部分const url new URL(currentURL);// 使用URLSearchParams获取查询参数const queryParams ne…...

编程日记 2023/9/25 20:03:03

ubuntu 14.04更新GCC版本

按最基本的apt-get install gcc-8，不成功，提示如下。按网上说的：apt-get update ,apt-get upgrade 后都无效果。 apt-cache search get 搜索后，发现资源链接里最新的也只有4.8.4所以不行。需要更新资源链接，镜像地…...

编程日记 2023/9/25 20:02:02

AndroidUtil - 强大易用的安卓工具类库

官网 https://github.com/Blankj/AndroidUtilCode/blob/master/README-CN.md 项目介绍 AndroidUtilCode 🔥 是一个强大易用的安卓工具类库，它合理地封装了安卓开发中常用的函数，具有完善的 Demo 和单元测试，利用其封装好的 API…...

编程日记 2023/9/25 20:01:01

[多态设计模式]枚举

背景： 游戏服务器中，多态可以说体现的淋漓尽致。如： 1.开启条件。有的系统是根据玩家等级，有的是根据通关第几关。 2.商店可能有不同类型的商店。 3.任务系统中，不同的计数类型，不同的任务目标类型。…...

编程日记 2023/9/25 20:00:00

【QT】QRadioButton的使用（17）

QRadioButton这个控件在实际项目中多用于多个QRadioButton控件选择其中一个这样的方式去执行，那么，今天这节就通过几个简单的例子来好好了解下QRadioButton的一个使用。一.环境配置 1.python 3.7.8 可直接进入官网下载安装：Download Pyt…...

编程日记 2023/9/25 19:56:57

力扣：105. 从前序与中序遍历序列构造二叉树（Python3）

题目： 给定两个整数数组 preorder 和 inorder ，其中 preorder 是二叉树的先序遍历， inorder 是同一棵树的中序遍历，请构造二叉树并返回其根节点。来源：力扣（LeetCode） 链接：力扣&am…...

编程日记 2023/9/25 19:54:55

【含java2023面试题】HashMap、HashTable、ConcurrentHashMap

作为Java中最常用的Map集合，HashMap、HashTable和ConcurrentHashMap都是线程安全的，但它们之间有什么区别呢？在本文中，我们将深入探讨这三种Map集合的区别，并通过Java代码示例来演示它们之间的差异。 AI绘画关于SD,MJ…...

编程日记 2023/9/25 19:53:54

AT24C02芯片

AT24C02简介： AT24C01/02/04/08/16...是一个 1K/2K/4K/8K/16K 位串行 CMOS内部有9个字节； 该器件通过 I2C 总线接口进行操作，它有一个专门的写保护功能； 基于51 他有这个芯片操作时序： AT24C02软件编程： …...

编程日记 2023/9/25 19:51:52

Python+Django前后端分离

程序示例精选 PythonDjango前后端分离如需安装运行环境或远程调试，见文章底部个人QQ名片，由专业技术人员远程协助！ 前言这篇博客针对《PythonDjango前后端分离》编写代码，代码整洁，规则，易读。学习与应…...

编程日记 2023/9/25 19:50:51

win11系统固定到快速访问的文件夹无法调整顺序的问题

最近在使用win11系统时，固定到快速访问的文件夹无法调整顺序。网上搜了一大圈没有对应的解决方法，柳暗花明，在博主yin0hao的一篇文章中找到了类似的，跟着做了一下，结果问题也解决了。在此记录。在文件资源管理器地址…...

编程日记 2023/9/25 19:49:49

短视频矩阵系统，短视频矩阵源码技术开发

开发短视频矩阵系统的源码需要以下步骤： 确定系统需求：根据客户的需求，确定系统的功能和特点，例如用户注册登录、视频上传、视频浏览、评论点赞等。设计系统架构：根据系统需求，设计系统的整体架构&#x…...

编程日记 2023/9/25 19:48:48

Flask 数据库连接池、DBUtils、http 连接池

1、DBUtils 简介、使用 DBUtils 简介 DBUtils 是一套用于管理数据库 "连接池" 的Python包，为 "高频度、高并发" 的数据库访问提供更好的性能，可以自动管理连接对象的创建和释放。并允许对非线程安全的数据库接口进行线程安全包装…...

编程日记 2023/9/25 19:47:46

Day 01 python学习笔记

1、引入让我们先写第一个python程序（如果是纯小白的话） 因为我们之前安装了python解释器所以我们直接win r ---->输入cmd（打开运行终端） >python #（在终端中打开python解释器）>>>pri…...

编程日记 2023/9/25 19:46:45

CSharp Library develop histroy

1. .NET FRAMEWORK 发展版本版本完整版本号发行日期 Visual Studio Windows 默认安装 1.0 1.0.3705.0 2002-02-13 Visual Studio .NET 2002 Windows XP Media Center Edition Windows XP Tablet PC Edition 1.1 1.1.4322.573 2003-04-24 Visual Studio .NET 2…...

编程日记 2023/9/25 19:45:44

林木种苗生产vr虚拟实训教学降低培训等待周期

林业种植管理在保护水土流失、气候变化及经济社会发展中发挥重要的作用，林业教学往往需要进入林区进行实操察验，在安全性、时间及效率上难以把控，因此有更多林业畜牧院校创新性地引进VR虚拟现实技术。在林业领域，实地调查是获取准…...

编程日记 2023/9/25 19:44:43

LabVIEW在运行时调整表控件列宽

LabVIEW在运行时调整表控件列宽如何在LabIEW中运行时调整表控件的列宽大小？ 在VI运行时，有两种不同的方法可以更改表中列的宽度。首先，可以使用鼠标手动更改它们;其次，可以从框图中以编程方式更改它们。手动更改列宽只有在…...

编程日记 2023/9/25 19:43:42

【6 ElementUI Tabs控件第二个tab页签Div宽度缩小的问题】

背景在使用ElementUI的Tabs 控件时，发现第二个tabs 内容的Div宽度用的百分比，然后就会缩小，导致内容变形，这边的处理方法就是拿到一个tabs 内容的div的offsetWidth，然后将这个width赋值给第二个Div的width即可。代…...

编程日记 2023/9/25 19:42:40

读写分离MySQL

利用Mycat控制后台数据库的读写分离和负载均衡利用主从复制思想,实现读写分离,主库写,从库读从库最好不要写,因为从库写入的数据不能同步到主库,只有主库写的数据才能同步到从库 balance属性值对应的含义(负载均衡) 一主一从读写分离的弊端主节点Master宕机以后,业务系统…...

编程日记 2023/9/25 19:39:37

MySQL数据库用户管理

MySQL数据库用户管理 1、数据库权限1.1什么是数据库权限1.2数据库权限分类1.3用户管理 2、用户授权2.1grant提权2.2查看权限2.3撤销权限 3、修改密码3.1修改当前用户密码3.2修改其他用户密码3.3修改root密码 4、远程登录4.1远程登录4.2软件远程登录 5、总结 1、数据库权限 1.1…...

编程日记 2023/9/25 19:38:37

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目：3442. 奇偶频次间的最大差值 I 思路 ：哈希，时间复杂度0(n)。用哈希表来记录每个字符串中字符的分布情况，哈希表这里用数组即可实现。 C版本： class Solution { public:int maxDifference(string s) {int a[26]…...

编程新知 2025/12/15 18:50:20

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性，不同版本的Docker对内核版本有不同要求。例如，Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本，Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

编程新知 2025/12/12 8:27:30

数据库分批入库

今天在工作中，遇到一个问题，就是分批查询的时候，由于批次过大导致出现了一些问题，一下是问题描述和解决方案： 示例： // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...

编程新知 2025/7/18 1:50:27

认识CMake并使用CMake构建自己的第一个项目

1.CMake的作用和优势跨平台支持：CMake支持多种操作系统和编译器，使用同一份构建配置可以在不同的环境中使用简化配置：通过CMakeLists.txt文件，用户可以定义项目结构、依赖项、编译选项等，无需手动编写复杂的构建脚本…...

编程新知 2025/12/14 2:15:52

鸿蒙HarmonyOS 5军旗小游戏实现指南

1. 项目概述本军旗小游戏基于鸿蒙HarmonyOS 5开发，采用DevEco Studio实现，包含完整的游戏逻辑和UI界面。 2. 项目结构 /src/main/java/com/example/militarychess/├── MainAbilitySlice.java // 主界面├── GameView.java // 游戏核…...

编程新知 2025/12/8 9:32:22

【Java多线程从青铜到王者】单例设计模式(八)

wait和sleep的区别我们的wait也是提供了一个还有超时时间的版本，sleep也是可以指定时间的，也就是说时间一到就会解除阻塞，继续执行 wait和sleep都能被提前唤醒(虽然时间还没有到也可以提前唤醒)，wait能被notify提前唤醒&#xf…...

编程新知 2025/12/12 22:57:27

深入解析 ReentrantLock：原理、公平锁与非公平锁的较量

ReentrantLock 是 Java 中 java.util.concurrent.locks 包下的一个重要类，用于实现线程同步，支持可重入性，并且可以选择公平锁或非公平锁的实现方式。下面将详细介绍 ReentrantLock 的实现原理以及公平锁和非公平锁的区别。 ReentrantLock 实现原理基本架构 ReentrantLo…...

编程新知 2025/10/12 23:48:51

性能优化中，多面体模型基本原理

1）多面体编译技术是一种基于多面体模型的程序分析和优化技术，它将程序中的语句实例、访问关系、依赖关系和调度等信息映射到多维空间中的几何对象，通过对这些几何对象进行几何操作和线性代数计算来进行程序的分析和优化。其中&#xff0…...

编程新知 2025/12/13 17:46:46

C#中用于控制自定义特性（Attribute）

我们来详细解释一下 [AttributeUsage(AttributeTargets.Class, AllowMultiple false, Inherited false)] 这个 C# 属性。在 C# 中，Attribute（特性）是一种用于向程序元素（如类、方法、属性等）添加元数据的机制。Attr…...

编程新知 2025/12/8 20:14:30

MyBatis-Plus 常用条件构造方法

1.常用条件方法方法说明eq等于 ne不等于 <>gt大于 >ge大于等于 >lt小于 <le小于等于 <betweenBETWEEN 值1 AND 值2notBetweenNOT BETWEEN 值1 AND 值2likeLIKE %值%notLikeNOT LIKE %值%likeLeftLIKE %值likeRightLIKE 值%isNull字段 IS NULLisNotNull字段…...

编程新知 2025/11/4 22:42:32