当前位置：首页 > news >正文

YOLOv7添加注意力机制和各种改进模块

news 2026/4/1 10:37:23

YOLOv7添加注意力机制和各种改进模块代码免费下载：完整代码

添加的部分模块代码：

########CBAM
class ChannelAttentionModule(nn.Module):def __init__(self, c1, reduction=16):super(ChannelAttentionModule, self).__init__()mid_channel = c1 // reductionself.avg_pool = nn.AdaptiveAvgPool2d(1)self.max_pool = nn.AdaptiveMaxPool2d(1)self.shared_MLP = nn.Sequential(nn.Linear(in_features=c1, out_features=mid_channel),nn.LeakyReLU(0.1, inplace=True),nn.Linear(in_features=mid_channel, out_features=c1))self.act = nn.Sigmoid()# self.act=nn.SiLU()def forward(self, x):avgout = self.shared_MLP(self.avg_pool(x).view(x.size(0), -1)).unsqueeze(2).unsqueeze(3)maxout = self.shared_MLP(self.max_pool(x).view(x.size(0), -1)).unsqueeze(2).unsqueeze(3)return self.act(avgout + maxout)class SpatialAttentionModule(nn.Module):def __init__(self):super(SpatialAttentionModule, self).__init__()self.conv2d = nn.Conv2d(in_channels=2, out_channels=1, kernel_size=7, stride=1, padding=3)self.act = nn.Sigmoid()def forward(self, x):avgout = torch.mean(x, dim=1, keepdim=True)maxout, _ = torch.max(x, dim=1, keepdim=True)out = torch.cat([avgout, maxout], dim=1)out = self.act(self.conv2d(out))return outclass CBAM(nn.Module):def __init__(self, c1, c2):super(CBAM, self).__init__()self.channel_attention = ChannelAttentionModule(c1)self.spatial_attention = SpatialAttentionModule()def forward(self, x):out = self.channel_attention(x) * xout = self.spatial_attention(out) * outreturn out
##############CBAM
########SE
class SEAttention(nn.Module):def __init__(self, channel=512,reduction=16):super().__init__()self.avg_pool = nn.AdaptiveAvgPool2d(1)self.fc = nn.Sequential(nn.Linear(channel, channel // reduction, bias=False),nn.ReLU(inplace=True),nn.Linear(channel // reduction, channel, bias=False),nn.Sigmoid())def init_weights(self):for m in self.modules():if isinstance(m, nn.Conv2d):init.kaiming_normal_(m.weight, mode='fan_out')if m.bias is not None:init.constant_(m.bias, 0)elif isinstance(m, nn.BatchNorm2d):init.constant_(m.weight, 1)init.constant_(m.bias, 0)elif isinstance(m, nn.Linear):init.normal_(m.weight, std=0.001)if m.bias is not None:init.constant_(m.bias, 0)def forward(self, x):b, c, _, _ = x.size()y = self.avg_pool(x).view(b, c)y = self.fc(y).view(b, c, 1, 1)return x * y.expand_as(x)
########SE
#######GAM
class GAMAttention(nn.Module):# https://paperswithcode.com/paper/global-attention-mechanism-retain-informationdef __init__(self, c1, c2, group=True, rate=4):super(GAMAttention, self).__init__()self.channel_attention = nn.Sequential(nn.Linear(c1, int(c1 / rate)),nn.ReLU(inplace=True),nn.Linear(int(c1 / rate), c1))self.spatial_attention = nn.Sequential(nn.Conv2d(c1, c1 // rate, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(c1, int(c1 / rate),kernel_size=7,padding=3),nn.BatchNorm2d(int(c1 / rate)),nn.ReLU(inplace=True),nn.Conv2d(c1 // rate, c2, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(int(c1 / rate), c2,kernel_size=7,padding=3),nn.BatchNorm2d(c2))def forward(self, x):b, c, h, w = x.shapex_permute = x.permute(0, 2, 3, 1).view(b, -1, c)x_att_permute = self.channel_attention(x_permute).view(b, h, w, c)x_channel_att = x_att_permute.permute(0, 3, 1, 2)x = x * x_channel_attx_spatial_att = self.spatial_attention(x).sigmoid()x_spatial_att = channel_shuffle(x_spatial_att, 4)  # last shuffleout = x * x_spatial_attreturn outdef channel_shuffle(x, groups=2):  ##shuffle channel# RESHAPE----->transpose------->FlattenB, C, H, W = x.size()out = x.view(B, groups, C // groups, H, W).permute(0, 2, 1, 3, 4).contiguous()out = out.view(B, C, H, W)return out
#######GAM
#####NAMAttention  该注意力机制只有通道注意力机制的代码，空间的没有
import torch.nn as nn
import torch
from torch.nn import functional as Fclass Channel_Att(nn.Module):def __init__(self, channels, t=16):super(Channel_Att, self).__init__()self.channels = channelsself.bn2 = nn.BatchNorm2d(self.channels, affine=True)def forward(self, x):residual = xx = self.bn2(x)weight_bn = self.bn2.weight.data.abs() / torch.sum(self.bn2.weight.data.abs())x = x.permute(0, 2, 3, 1).contiguous()x = torch.mul(weight_bn, x)x = x.permute(0, 3, 1, 2).contiguous()x = torch.sigmoid(x) * residual  #return xclass NAMAttention(nn.Module):def __init__(self, channels, out_channels=None, no_spatial=True):super(NAMAttention, self).__init__()self.Channel_Att = nn.Sequential(*(Channel_Att(channels)for _ in range(1)))def forward(self, x):# print(x.device)## device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')x_out1 = self.Channel_Att(x)return x_out1
#####NAMAttentionclass RepGhostBottleneck1(nn.Module):# RepGhostNeXt Bottleneckdef __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):  # ch_in, ch_outsuper().__init__()self.c_ = int(c2 * e)  # hidden channels# attention mechanism can be usedself.m = nn.Sequential(*(RepGhostBottleneck(c1, c2, 2*self.c_) for _ in range(n)))def forward(self, x):return self.m(x)

YOLOv7添加注意力机制和各种改进模块

YOLOv7添加注意力机制和各种改进模块代码免费下载：完整代码添加的部分模块代码： ########CBAM class ChannelAttentionModule(nn.Module):def __init__(self, c1, reduction16):super(ChannelAttentionModule, self).__init__()mid_channel c1 // red…...

编程日记 2024/5/29 20:51:08

【OpenGL第一个程序】

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、OpenGL第一个程序前言本文介绍了OpenGL入门的第一个程序，有详细的注释，便于大家理解其中的逻辑。一、OpenGL第一个程序 #inclu…...

编程日记 2024/5/29 20:50:07

GPT-4O神器来袭！自动生成Figma设计稿，移动端开发瞬间加速！

2024年5月29日- 近日，一款基于GPT-4O技术的创新工具成功实现根据产品需求文档（PRD）自动生成Figma设计稿的功能，为移动端应用开发者带来革命性的便捷。据悉，该功能主要针对移动端应用进行优化，并支持使用高质…...

编程日记 2024/5/29 20:49:06

清华大学提出IFT对齐算法，打破SFT与RLHF局限性

监督微调（Supervised Fine-Tuning, SFT）和基于人类反馈的强化学习（Reinforcement Learning from Human Feedback, RLHF）是预训练后提升语言模型能力的两大基础流程，其目标是使模型更贴近人类的偏好和需求。考虑到监督…...

编程日记 2024/5/29 20:48:05

TS（TypeScript）中Array数组无法调出使用includes方法，显示红色警告

解决方法打开tsconfig.json文件，添加"lib": ["es7", "dom"]即可。如下图所示。...

编程日记 2024/5/29 20:47:04

基于Kafka的日志采集

目录前言架构图资源列表基础环境关闭防护墙关闭内核安全机制修改主机名添加hosts映射一、部署elasticsearch 修改limit限制部署elasticsearch 修改配置文件启动二、部署filebeat 部署filebeat 添加配置文件启动三、部署kibana 部署kibana 修…...

编程日记 2024/5/29 20:46:02

某烟草企业数字化转型物流信息化咨询项目规划方案（117页PPT）

方案介绍： 烟草企业数字化转型物流信息化咨询项目规划方案将为企业带来多方面的价值，包括提升物流运营效率、降低物流成本、优化供应链管理、增强企业竞争力和促进可持续发展等。这些价值的实现将有助于企业在激烈的市场竞争中保持领先地位并实现可持续…...

编程日记 2024/5/29 20:45:01

失落的方舟命运方舟台服封号严重游戏封IP怎么办

步入《失落的方舟》（Lost Ark），这款由Smilegate精心打造的宏大规模在线角色扮演游戏（MMORPG），您将启程前往阿克拉西亚这片饱经沧桑的奇幻大陆，展开一场穿越时空的壮阔探索。在这里，一…...

编程日记 2024/5/29 20:44:00

2.10 mysql设置远程访问权限

2.10 mysql设置远程访问权限目录1. 管理员运行mysql命令窗口2. 使用 root 用户重新登录 MySQL3. 修改用户权限4. 修改mysql安装目录下的my.ini 目录说明： Mysql8.0 设置远程访问权限一、Mysql8.0 设置远程访问权限 1. 管理员运行mysql命令窗口 2. 使用 root 用…...

编程日记 2024/5/29 20:42:59

C# 证件照替换底色与设置背景图---PaddleSegSharp

PaddleSegSharp 是一个基于百度飞桨PaddleSeg项目的人像分割模块而开发的.NET的工具类库。 PaddleSegSharp 中PaddleSeg.dll文件是基于开源项目最新发布版本PaddleSeg PaddleSeg的版本修改而成的C动态库，基于opencv的x64编译而成的。 PaddleSeg是基于飞桨PaddlePa…...

编程日记 2024/5/29 20:40:57

HCIA-HarmonyOS Device Developer 课程大纲

一：OpenHarmony 介绍 - （ 3 课时） - OpenHarmony 简介；OpenHarmony 设计理念；OpenHarmony 设计理念概述； - OpenHarmony 试图解决的问题；应用生态割裂问题；用户数据割裂问题&#…...

编程日记 2024/5/29 20:39:55

洗地机哪个牌子最好用？十大名牌洗地机排行榜

作为一种新兴的智能家居产品，洗地机的市场规模已经突破了百亿大关。如此庞大的市场自然吸引了大量资本的涌入，许多品牌纷纷推出自己的洗地机产品，试图在这个竞争激烈的市场中占据一席之地。然而，面对如此多的品牌和型号&#xff0…...

编程日记 2024/5/29 20:38:55

Unity开发——XLua热更新之Hotfix配置（包含xlua获取与导入）

一、Git上获取xlua 最新的xlua包，下载地址链接：https://github.com/Tencent/xLua 二、Unity添加xlua 解压xlua压缩包后，将xlua里的Assets里的文件直接复制进Unity的Assets文件夹下。成功导入后，unity工具栏会出现xlua选项。 …...

编程日记 2024/5/29 20:36:53

Qt 基于FFmpeg的视频转换器 - 转GIF动图

Qt 基于FFmpeg的视频转换器 - 转GIF动图引言一、设计思路二、核心源码三、参考链接引言 gif格式的动图可以通过连续播放一系列图像或视频片段来展示动态效果，使信息更加生动形象，可以很方便的嵌入到网页或者ppt中。上图展示了视频的前几帧转为gif动图的…...

编程日记 2024/5/29 20:35:51

HTML新春烟花盛宴

目录写在前面烟花盛宴完整代码修改文字...

编程日记 2024/5/29 20:32:49

第十四届蓝桥杯c++研究生组

A 混乘数字关键思路是求每个十进制数的数字以及怎么在一个数组中让判断所有的数字次数相等。求每个十进制的数字 while(n!0){int x n%10;//x获取了n的每一个位数字n/10;}扩展：求二进制的每位数字 （注意：进制转换、1的个数、位运算&#…...

编程日记 2024/5/29 20:31:48

KDD 2024｜基于隐空间因果推断的微服务系统根因定位

简介：本文介绍了由清华大学、南开大学、eBay、微软、中国科学院计算机网络信息中心等单位共同合作的论文《基于隐空间因果推断的受限可观测性场景的微服务系统根因定位》。该论文已被KDD 2024会议录用。论文标题：Microservice Root Cause Analysis Wit…...

编程日记 2024/5/29 20:30:47

白鹭群优化算法，原理详解，MATLAB代码免费获取

白鹭群优化算法（Egret Swarm Optimization Algorithm，ESOA）是一种受自然启发的群智能优化算法。该算法从白鹭和白鹭的捕食行为出发，由三个主要部分组成:坐等策略、主动策略和判别条件。将ESOA算法与粒子群算法(PSO)、遗传算法(GA)…...

编程日记 2024/5/29 20:29:45

【源码】2024完美运营版商城/拼团/团购/秒杀/积分/砍价/实物商品/虚拟商品等全功能商城

后台可以自由拖曳修改前端UI页面还支持虚拟商品自动发货等功能前端UNIAPP 后端PHP 一键部署版本获取方式： 微：uucodes...

编程日记 2024/5/29 20:28:44

Java-数组内存解析

文章目录 1.内存的主要结构：栈、堆2.一维数组的内存解析3.二维数组的内存解析 1.内存的主要结构：栈、堆 2.一维数组的内存解析举例1：基本使用举例2：两个变量指向一个数组 3.二维数组的内存解析举例1： 举例2&am…...

编程日记 2024/5/29 20:27:42

Qwen3-ASR-1.7B惊艳效果：自动识别中英文技术文档朗读中的公式/代码块

Qwen3-ASR-1.7B惊艳效果：自动识别中英文技术文档朗读中的公式/代码块你有没有遇到过这样的场景？听一场技术分享的录音，讲师在讲解代码逻辑时，你一边听一边手忙脚乱地记录，生怕漏掉一个括号或一个变量名。或者&#x…...

编程新知 2026/4/1 10:20:44

FLUX.2-klein-base-9b-nvfp4进阶：利用LSTM时序理解优化视频连贯风格转换

FLUX.2-klein-base-9b-nvfp4进阶：利用LSTM时序理解优化视频连贯风格转换最近在折腾视频风格转换时，发现一个挺让人头疼的问题：用那些单帧处理的模型，出来的视频总是一闪一闪的，风格也忽明忽暗，看着特别不…...

编程新知 2026/4/1 8:26:23

信创协同办公价格与成本：这样选，性价比直接拉满！

“一套信创协同办公到底多少钱？”“是按人头收费，还是按项目打包算？”“前期买着便宜，后期维护会不会无底洞？”不管是政企单位采购，还是企业选型，这三个问题几乎是所有人的核心顾虑。毕竟信创办…...

编程新知 2026/4/1 7:51:49

BetterJoy终极指南：让Switch手柄在Windows上完美运行

BetterJoy终极指南：让Switch手柄在Windows上完美运行【免费下载链接】BetterJoy Allows the Nintendo Switch Pro Controller, Joycons and SNES controller to be used with CEMU, Citra, Dolphin, Yuzu and as generic XInput 项目地址: https://gitcode.com/g…...

编程新知 2026/4/1 7:41:29

技术Lead：不亲手解决问题，你的位置还稳吗？

做到技术Lead这个位置，很多人开始纠结一件事——到底该不该自己动手？技术Lead的尴尬，其实很具体比如前端设计阶段，团队在讨论一个时序收敛问题，工程师说某条路径的slack是-0.3ns，建议加pipeline。这时候Lea…...

编程新知 2026/4/1 7:08:45

Phi-3-mini-4k-instruct-gguf一文详解：GGUF模型加载机制与内存映射优化原理

Phi-3-mini-4k-instruct-gguf一文详解：GGUF模型加载机制与内存映射优化原理 1. GGUF模型格式概述 GGUF（GPT-Generated Unified Format）是llama.cpp团队设计的新一代模型文件格式，专门为大型语言模型优化。相比之前的GGML格式&am…...

编程新知 2026/4/1 5:45:06

伯克利Octo机器人框架实战：5步搞定跨平台任务迁移（附代码）

伯克利Octo机器人框架实战：5步搞定跨平台任务迁移（附代码） 在机器人开发领域，硬件平台的多样性一直是阻碍算法快速部署的主要瓶颈。想象一下，你花费数月为WidowX机械臂开发的抓取算法，当实验室新购入UR5工业…...

编程新知 2026/4/1 5:39:02

Gemma-3-270m多场景落地：政务热线知识库问答、医疗术语解释系统

Gemma-3-270m多场景落地：政务热线知识库问答、医疗术语解释系统 1. 快速上手：部署你的第一个Gemma-3-270m服务想要快速体验Gemma-3-270m的强大能力？通过Ollama部署只需几个简单步骤。 1.1 环境准备与模型选择首先确保你已经安装了Ollam…...

编程新知 2026/4/1 4:15:50

Qt网络编程实战：基于QTcpSocket构建带进度反馈的可靠文件传输系统

1. 为什么需要带进度反馈的文件传输系统在开发桌面应用时，文件传输是个绕不开的刚需功能。特别是传输大文件时，用户最怕的就是看着界面发呆——不知道传输进行到哪一步了，也不知道还要等多久。我做过一个医疗影像传输系统，医生们…...

编程新知 2026/4/1 3:45:33

【立煌】友达10.1寸G101STN01.C工业液晶屏LCD

G101STN01.C是AUO一款10.1英寸、1024600的工控液晶屏，走LVDS单通道40pin（1ch，6/8-bit），逻辑电压3.3V，公开流通参数里常见亮度500cd/㎡、对比度500:1、视角70/70/60/60、背光WLED且带LEDDriver，背…...

编程新知 2026/4/1 1:47:47

相关文章：