当前位置: 首页 > article >正文

【即插即用完整代码】CVPR 2026新方法归一化空间与通道注意力,无额外参数,轻量且高效,超越CBAM,快速涨点,发表论文!

专栏内提供试读感兴趣的小伙伴可以订阅一下哈适用于所有的CV二维任务图像分割、超分辨率、目标检测、图像识别、低光增强、遥感检测等每日分享最新的前沿技术助力快速发论文、模型涨点摘要本文提出了一种新型的基于归一化的注意力模块NAM通过抑制不重要的权重来提高模型的计算效率同时保持性能。与SE、BAM、CBAM等其他注意力机制相比NAM在ResNet和MobileNet上均实现了更高的准确率。代码已公开。引言注意力机制是近年来的研究热点它帮助深度神经网络抑制不重要的像素或通道从而提高模型性能。然而现有方法大多关注于捕获显著特征而忽视了权重对特征的贡献。本文提出了一种基于归一化的注意力模块NAM利用批量归一化Batch Normalization的缩放因子来衡量权重的重要性从而进一步抑制不重要的通道或像素。创新点基于归一化的注意力机制NAM利用批量归一化的缩放因子来衡量权重的重要性避免了添加全连接层或卷积层从而减少了参数数量。轻量且高效NAM在不增加额外参数的情况下通过抑制不重要的权重来提高计算效率。超越现有方法实验表明NAM在ResNet和MobileNet上均优于SE、BAM、CBAM等现有注意力机制。主要方法归一化注意力模块NAMNAM的核心在于利用批量归一化的缩放因子来衡量权重的重要性。具体来说通道注意力子模块通过批量归一化的缩放因子来衡量每个通道的重要性并生成通道注意力权重。空间注意力子模块类似地通过像素归一化来衡量每个像素的重要性并生成空间注意力权重。正则化项为了进一步抑制不重要的权重NAM在损失函数中添加了一个L1范数惩罚项以平衡通道和空间注意力权重的稀疏性。架构集成NAM模块被嵌入到每个网络块的末尾对于残差网络它被嵌入到残差结构的末尾。这种设计使得NAM可以与现有的网络架构无缝集成而不需要对网络结构进行重大修改。实验细节数据集和模型CIFAR-100使用ResNet50进行实验与SE、BAM、CBAM等方法进行比较。ImageNet使用MobileNet V2进行实验与SE、BAM、CBAM等方法进行比较。训练配置CIFAR-100使用4个Nvidia Tesla V100 GPU进行训练训练配置与CBAM相同正则化参数p设置为0.0001。ImageNet使用4个Nvidia Tesla V100 GPU进行训练训练配置与CBAM相同正则化参数p设置为0.001。实验结果分析CIFAR-100ResNet50 NAM通道注意力参数数量为23.74MFLOPs为1.31GTop-1错误率为19.09%Top-5错误率为4.5%。ResNet50 NAM空间注意力参数数量为23.71MFLOPs为1.31GTop-1错误率为19.38%Top-5错误率为4.72%。ResNet50 CBAM参数数量为26.24MFLOPs为1.31GTop-1错误率为19.44%Top-5错误率为4.66%。ImageNetMobileNet V2 NAM参数数量为3.51MFLOPs为0.32GTop-1错误率为29.34%Top-5错误率为10.18%。MobileNet V2 CBAM参数数量为3.54MFLOPs为0.32GTop-1错误率为29.74%Top-5错误率为10.66%。结论NAM通过抑制不重要的权重显著提高了模型的计算效率同时保持了与现有方法相当的性能。实验结果表明NAM在ResNet和MobileNet上均优于SE、BAM、CBAM等现有注意力机制。未来作者计划进一步优化NAM的性能探索其在其他深度学习架构和应用中的效果。主要代码展示class Channel_Att(nn.Module): def __init__(self, channels, t16): super(Channel_Att, self).__init__() self.channels channels self.bn2 nn.BatchNorm2d(self.channels, affineTrue) def forward(self, x): residual x x self.bn2(x) weight_bn self.bn2.weight.data.abs() / torch.sum(self.bn2.weight.data.abs()) x x.permute(0, 2, 3, 1).contiguous() x torch.mul(weight_bn, x) x x.permute(0, 3, 1, 2).contiguous() x torch.sigmoid(x) * residual return x def __init__(self, kernel_size7): super(Spatial_Att, self).__init__() self.kernel_size kernel_size self.softmax nn.Softmax(dim-1) def forward(self, x): # 输入特征x形状为 (B, C, H, W) residual x # 计算每个像素的权重 (Pixel Normalization) pixel_weight x.mean(dim1, keepdimTrue) # 按通道求均值形状为 (B, 1, H, W) normalized_weight pixel_weight / pixel_weight.sum(dim(2, 3), keepdimTrue) # 像素归一化 # 加权输入特征 x x * normalized_weight # 按像素位置加权 x torch.sigmoid(x) * residual # 与原输入相乘 return x class NAM(nn.Module): def __init__(self, channels): super(NAM, self).__init__() self.Channel_Att Channel_Att(channels) self.Spatial_Att Spatial_Att() def forward(self, x): x_out1 self.Channel_Att(x) x_out2 self.Spatial_Att(x_out1) return x_out2 if __name__ __main__: device torch.device(cuda if torch.cuda.is_available() else cpu) print(fUsing device: {device}) nam NAM(channels32).to(device) # 将模型移动到设备 input torch.rand(1, 32, 256, 256).to(device) # 将输入数据移动到设备 # # 参数量计算可注释 # print(Model Summary:) # print(summary(nam, input_size(1, 32, 256, 256), devicedevice.type)) # # 计算量计算可注释 # flops FlopCountAnalysis(nam, input) # print(\nFlop Count Table:) # print(flop_count_table(flops)) output nam(input) print(f\nInput shape: {input.shape}) print(fOutput shape: {output.shape})运行结果展示每日分享最新的前沿技术助力快速发论文、模型涨点欢迎点赞关注评论转发添加下方个人微信

相关文章:

【即插即用完整代码】CVPR 2026新方法归一化空间与通道注意力,无额外参数,轻量且高效,超越CBAM,快速涨点,发表论文!

专栏内提供试读,感兴趣的小伙伴可以订阅一下哈!适用于所有的CV二维任务:图像分割、超分辨率、目标检测、图像识别、低光增强、遥感检测等每日分享最新的前沿技术,助力快速发论文、模型涨点!摘要本文提出了一种新型的基…...

ROS2安卓应用-ROS2-Mobile-Android

一.简介 ROS2-Mobile-Android 是一个基于 Android 的 ROS2 移动端控制与可视化应用,使用ros2-java开发,面向移动机器人场景,支持在手机端进行话题查看、发布/订阅交互与可视化控件操作,帮助机器人工程师更好地方便地调试机器人。可…...

C语言入门(顺序表)

目录 引言 代码结构概览 三、头文件(ST.h)深度解析 关键解析 四、源文件(ST.c)核心函数实现 前置定义(解决 VS 编译器警告) 1. 顺序表初始化(SeqListInit) 2. 顺序表销毁&am…...

Maven工具的下载,安装与使用

Maven的下载,安装配置与使用 文章目录Maven的下载,安装配置与使用前言一、Maven简介1.什么是 Maven?2.Maven的核心概念二、Maven 安装与配置(以Windows为例,Linux/macOS类似)1.下载Maven2. 安装 Maven3. 验…...

pwn刷题记录

NSS-[CISCN 2023 初赛]funcanary【canary】 NSSCTF | 在线CTF平台 下载附件,直接去checksec文件,查看文件二进制保护机制再通过file命令查看文件的信息 ida64打开,首先查看main函数 void __fastcall __noreturn main(__int64 a1, char **a2, char **a3) {__pid_t v3; //…...

git管理github上的repository(二)

本文章主要介绍如何使用git管理一个project,并更新到github上1. 创建github仓库登录github账户;在右上角点击“”号,选择“New repository”;填写仓库名称、描述(可选),选择是否为公共或私有仓库…...

ubuntu vnc 问题汇总

第一部分:使用虚拟显示管理器 如何让树莓派不连接显示器,也能在windows上用vnc访问? 如题配置完成后,树莓派就可以在不连接物理显示器的情况下通过VNC远程访问了。 1. 安装必要的包 sudo apt install xserver-xorg-video-dumm…...

Camera:实时监控与数据交互的智能设备服务

Camera:实时监控与数据交互的智能设备服务 【免费下载链接】Camera The EdgeX Camera Device Service is developed to control/communicate ONVIF-compliant cameras accessible via http in an EdgeX deployment 项目地址: https://gitcode.com/gh_mirrors/came…...

AnOpc:轻松实现OPC操作的利器

AnOpc:轻松实现OPC操作的利器 【免费下载链接】AnOpc An Opc Library and a command line to perform OPC operations with ease and transparency among different protocols. Currently supports synchronous operation over UA and DA protocols. 项目地址: ht…...

python实现鸟类识别系统实现方案

鸟类识别系统实现方案 1. 系统概述 本系统使用两种机器学习模型(线性判别分析和卷积神经网络)实现鸟类识别,支持识别10种常见鸟类。系统包含数据预处理、特征提取、模型训练和预测评估等完整流程。 2. 数据集准备 使用CUB-200-2011鸟类数据集子集(10类),每类包含60张…...

Kong/mashape-oauth项目中的OAuth协议详解

Kong/mashape-oauth项目中的OAuth协议详解 【免费下载链接】mashape-oauth OAuth Modules for Node.js - Supporting RSA, HMAC, PLAINTEXT, 2,3-Legged, 1.0a, Echo, XAuth, and 2.0 项目地址: https://gitcode.com/gh_mirrors/ma/mashape-oauth 前言 OAuth协议是现代…...

URLImage源码解读:如何设计高效的图片缓存系统

URLImage源码解读:如何设计高效的图片缓存系统 【免费下载链接】url-image AsyncImage before iOS 15. Lightweight, pure SwiftUI Image view, that displays an image downloaded from URL, with auxiliary views and local cache. 项目地址: https://gitcode.c…...

Laravel Sweet Alert与SweetAlert2深度整合:功能扩展与最佳实践

Laravel Sweet Alert与SweetAlert2深度整合:功能扩展与最佳实践 【免费下载链接】sweet-alert A BEAUTIFUL, RESPONSIVE, CUSTOMIZABLE, ACCESSIBLE (WAI-ARIA) REPLACEMENT FOR JAVASCRIPTS POPUP BOXES FOR LARAVEL 项目地址: https://gitcode.com/gh_mirrors/s…...

LNbits资金来源配置:支持多种闪电网络后端的灵活选择

LNbits资金来源配置:支持多种闪电网络后端的灵活选择 【免费下载链接】lnbits LNbits, free and open-source Lightning wallet and accounts system. 项目地址: https://gitcode.com/gh_mirrors/ln/lnbits LNbits是一款免费开源的闪电网络钱包和账户系统&am…...

SimpleLightbox入门教程:从安装到实现响应式图片画廊的5个步骤

SimpleLightbox入门教程:从安装到实现响应式图片画廊的5个步骤 【免费下载链接】simplelightbox Touch-friendly image lightbox for mobile and desktop 项目地址: https://gitcode.com/gh_mirrors/si/simplelightbox SimpleLightbox是一款轻量级且功能强大…...

制作专业级CHM文档:cppreference2mshelp关键词索引与目录生成技巧

制作专业级CHM文档:cppreference2mshelp关键词索引与目录生成技巧 【免费下载链接】cppreference2mshelp cppreference.com html archive converter to microsoft help (for Visual Studio 2012) and chm help (for Windows) 项目地址: https://gitcode.com/gh_m…...

FALCONN性能调优指南:如何为不同数据集选择最佳参数

FALCONN性能调优指南:如何为不同数据集选择最佳参数 【免费下载链接】FALCONN FAst Lookups of Cosine and Other Nearest Neighbors (based on fast locality-sensitive hashing) 项目地址: https://gitcode.com/gh_mirrors/fa/FALCONN FALCONN(…...

Patching插件架构深度剖析:Keystone引擎如何赋能二进制修补

Patching插件架构深度剖析:Keystone引擎如何赋能二进制修补 【免费下载链接】patching An Interactive Binary Patching Plugin for IDA Pro 项目地址: https://gitcode.com/gh_mirrors/pa/patching Patching是一款专为IDA Pro设计的交互式二进制修补插件&am…...

Flyimg高级配置指南:自定义ImageMagick参数实现专业级图片优化

Flyimg高级配置指南:自定义ImageMagick参数实现专业级图片优化 【免费下载链接】flyimg Dockerized application to resize and crop images on the fly. Get optimised images with AVIF, WebP, MozJPEG or PNG using ImageMagick, with an efficient caching syst…...

Secator常见问题解决:工具安装失败、任务卡死与性能优化的实用技巧

Secator常见问题解决:工具安装失败、任务卡死与性能优化的实用技巧 【免费下载链接】secator secator - the pentesters swiss knife 项目地址: https://gitcode.com/gh_mirrors/se/secator Secator作为渗透测试人员的瑞士军刀,集成了多种安全测试…...

告别配置噩梦:Archon环境检查神器帮你秒定位问题

告别配置噩梦:Archon环境检查神器帮你秒定位问题 【免费下载链接】Archon Archon is an AI agent that is able to create other AI agents using an advanced agentic coding workflow and framework knowledge base to unlock a new frontier of automated agents…...

一文读懂:银行接口对接中的P10文件、证书与安全通信

在与银行进行API接口对接时,安全是头等大事。您一定会遇到“提供P10文件”这个要求。本文将从零开始,清晰解释P10是什么、为什么需要它、以及它如何在整个安全链条中发挥作用。一、P10文件是什么?P10文件,正式名称为证书签名请求&…...

使用SSHamble检测弱密钥:badkeys集成与实战案例

使用SSHamble检测弱密钥:badkeys集成与实战案例 【免费下载链接】sshamble SSHamble: Unexpected Exposures in SSH 项目地址: https://gitcode.com/gh_mirrors/ss/sshamble SSHamble是一款专注于SSH安全检测的工具,能够帮助用户发现SSH服务中存在…...

性能优化与最佳实践:避免常见陷阱

性能优化与最佳实践:避免常见陷阱 【免费下载链接】android-floating-action-button Floating Action Button for Android based on Material Design specification 项目地址: https://gitcode.com/gh_mirrors/an/android-floating-action-button 本文详细分…...

扩展与集成:Gradle依赖与ProGuard配置

扩展与集成:Gradle依赖与ProGuard配置 【免费下载链接】android-floating-action-button 项目地址: https://gitcode.com/gh_mirrors/se/sell-android-floating-action-button 本文详细介绍了Android FloatingActionButton库的Gradle依赖配置、版本管理策略…...

知识图谱生成工具knowledge_graph:如何将任意文本转化为可视化知识网络

知识图谱生成工具knowledge_graph:如何将任意文本转化为可视化知识网络 【免费下载链接】knowledge_graph Convert any text to a graph of knowledge. This can be used for Graph Augmented Generation or Knowledge Graph based QnA 项目地址: https://gitcode…...

Atmosphere核心组件解析:Broadcaster与Transport如何实现跨浏览器实时通信

Atmosphere核心组件解析:Broadcaster与Transport如何实现跨浏览器实时通信 【免费下载链接】atmosphere Event Driven WebSockets Framework with Cross-Browser Fallbacks 项目地址: https://gitcode.com/gh_mirrors/atm/atmosphere Atmosphere作为一款强大…...

X-CMD安全沙箱使用教程:在隔离环境中安全运行第三方工具

X-CMD安全沙箱使用教程:在隔离环境中安全运行第三方工具 【免费下载链接】x-cmd Opensource lightweight posix script for tools (500) management and classic command extensions 项目地址: https://gitcode.com/gh_mirrors/xc/x-cmd X-CMD(Gi…...

optimize-js实战教程:如何在Webpack和Browserify中集成使用

optimize-js实战教程:如何在Webpack和Browserify中集成使用 【免费下载链接】optimize-js Optimize a JS file for faster parsing (UNMAINTAINED) 项目地址: https://gitcode.com/gh_mirrors/op/optimize-js optimize-js是一个强大的JavaScript优化工具&…...

7大核心技术揭秘:数据科学如何彻底变革农业精准种植与产量预测

7大核心技术揭秘:数据科学如何彻底变革农业精准种植与产量预测 【免费下载链接】awesome-datascience awesome-datascience: 是一个包含各种数据科学资源、工具和实践的汇总列表。适合数据科学家、分析师和开发者查找和学习数据科学的知识和技术。 项目地址: http…...