当前位置：首页 > news >正文

(即插即用模块-Attention部分) 四十四、(ICIP 2022) HWA 半小波注意力

news 2026/2/9 16:02:03

在这里插入图片描述

文章目录

1、Half Wavelet Attention
2、代码实现

paper：HALFWAVELET ATTENTION ON M-NET+ FOR LOW-LIGHT IMAGE ENHANCEMENT

Code：https://github.com/FanChiMao/HWMNet

1、Half Wavelet Attention

传统的图像增强方法主要关注图像在空间域的特征信息，而忽略了时频域上的特征信息。而小波变换能够将图像分解为不同频率的子带，从而在时频域上分析图像特征，捕获图像的细节信息。所以，这篇论文提出一种 半小波注意力（Half Wavelet Attention），旨在利用小波变换的优势，从另一个维度提取图像特征，丰富特征表达，从而提升低光图像增强的效果。

HWA 的核心思想是利用小波变换在时频域的特性，提取图像在另一维度上的特征信息，从而丰富图像的特征表达，提升低光图像增强的效果。HWA 模块通过将输入特征图分为两部分，一部分保持不变，另一部分进行离散小波变换，得到小波域特征图。

对于输入X，HWA 的实现过程：

特征分割：将输入特征图沿通道维度分为两部分，一部分保持不变，另一部分进行离散小波变换。
注意力机制：对小波域特征图进行通道注意力和空间注意力操作，提取加权特征图。
逆小波变换：将加权小波域特征图进行逆小波变换，得到加权空间域特征图。
特征融合：将加权空间域特征图与保持不变的特征图进行拼接，并进行残差连接和跳跃连接，得到最终的输出特征图。

HWA 的主要优势：

丰富特征表达： HWA 模块能够从另一个维度提取图像特征，丰富特征表达，从而提升低光图像增强的效果。
提升细节信息：小波变换能够捕获图像的细节信息，HWA 模块能够有效提升图像的细节信息。
降低计算复杂度： HWA 模块中只有一半的特征图需要进行注意力机制操作，从而降低计算复杂度。

Half Wavelet Attention 结构图：
在这里插入图片描述

2、代码实现

import torch
import torch.nn as nndef dwt_init(x):x01 = x[:, :, 0::2, :] / 2x02 = x[:, :, 1::2, :] / 2x1 = x01[:, :, :, 0::2]x2 = x02[:, :, :, 0::2]x3 = x01[:, :, :, 1::2]x4 = x02[:, :, :, 1::2]x_LL = x1 + x2 + x3 + x4x_HL = -x1 - x2 + x3 + x4x_LH = -x1 + x2 - x3 + x4x_HH = x1 - x2 - x3 + x4# print(x_HH[:, 0, :, :])return torch.cat((x_LL, x_HL, x_LH, x_HH), 1)def iwt_init(x):r = 2in_batch, in_channel, in_height, in_width = x.size()out_batch, out_channel, out_height, out_width = in_batch, int(in_channel / (r ** 2)), r * in_height, r * in_widthx1 = x[:, 0:out_channel, :, :] / 2x2 = x[:, out_channel:out_channel * 2, :, :] / 2x3 = x[:, out_channel * 2:out_channel * 3, :, :] / 2x4 = x[:, out_channel * 3:out_channel * 4, :, :] / 2h = torch.zeros([out_batch, out_channel, out_height, out_width]).cuda() #h[:, :, 0::2, 0::2] = x1 - x2 - x3 + x4h[:, :, 1::2, 0::2] = x1 - x2 + x3 - x4h[:, :, 0::2, 1::2] = x1 + x2 - x3 - x4h[:, :, 1::2, 1::2] = x1 + x2 + x3 + x4return hclass DWT(nn.Module):def __init__(self):super(DWT, self).__init__()self.requires_grad = Truedef forward(self, x):return dwt_init(x)class IWT(nn.Module):def __init__(self):super(IWT, self).__init__()self.requires_grad = Truedef forward(self, x):return iwt_init(x)def conv(in_channels, out_channels, kernel_size, bias=False, stride=1):return nn.Conv2d(in_channels, out_channels, kernel_size,padding=(kernel_size // 2), bias=bias, stride=stride)class SALayer(nn.Module):def __init__(self, kernel_size=5, bias=False):super(SALayer, self).__init__()self.conv_du = nn.Sequential(nn.Conv2d(2, 1, kernel_size=kernel_size, stride=1, padding=(kernel_size - 1) // 2, bias=bias),nn.Sigmoid())def forward(self, x):# torch.max will output 2 things, and we want the 1st onemax_pool, _ = torch.max(x, dim=1, keepdim=True)avg_pool = torch.mean(x, 1, keepdim=True)channel_pool = torch.cat([max_pool, avg_pool], dim=1)  # [N,2,H,W]  could add 1x1 conv -> [N,3,H,W]y = self.conv_du(channel_pool)return x * yclass CALayer(nn.Module):def __init__(self, channel, reduction=16, bias=False):super(CALayer, self).__init__()# global average pooling: feature --> pointself.avg_pool = nn.AdaptiveAvgPool2d(1)# feature channel downscale and upscale --> channel weightself.conv_du = nn.Sequential(nn.Conv2d(channel, channel // reduction, 1, padding=0, bias=bias),nn.ReLU(inplace=True),nn.Conv2d(channel // reduction, channel, 1, padding=0, bias=bias),nn.Sigmoid())def forward(self, x):y = self.avg_pool(x)y = self.conv_du(y)return x * yclass HWB(nn.Module):def __init__(self, n_feat, o_feat, kernel_size=3, reduction=16, bias=False, act=nn.ReLU()):super(HWB, self).__init__()self.dwt = DWT()self.iwt = IWT()modules_body = \[conv(n_feat*2, n_feat, kernel_size, bias=bias),act,conv(n_feat, n_feat*2, kernel_size, bias=bias)]self.body = nn.Sequential(*modules_body)self.WSA = SALayer()self.WCA = CALayer(n_feat*2, reduction, bias=bias)self.conv1x1 = nn.Conv2d(n_feat*4, n_feat*2, kernel_size=1, bias=bias)self.conv3x3 = nn.Conv2d(n_feat, o_feat, kernel_size=3, padding=1, bias=bias)self.activate = actself.conv1x1_final = nn.Conv2d(n_feat, o_feat, kernel_size=1, bias=bias)def forward(self, x):residual = x# Split 2 partwavelet_path_in, identity_path = torch.chunk(x, 2, dim=1)# Wavelet domain (Dual attention)x_dwt = self.dwt(wavelet_path_in)res = self.body(x_dwt)branch_sa = self.WSA(res)branch_ca = self.WCA(res)res = torch.cat([branch_sa, branch_ca], dim=1)res = self.conv1x1(res) + x_dwtwavelet_path = self.iwt(res)out = torch.cat([wavelet_path, identity_path], dim=1)out = self.activate(self.conv3x3(out))out += self.conv1x1_final(residual)return outif __name__ == '__main__':x = torch.randn(1, 64, 128, 128).cuda()model = HWB(64, 64).cuda()output = model(x)print(output.shape)

(即插即用模块-Attention部分) 四十四、(ICIP 2022) HWA 半小波注意力

文章目录 1、Half Wavelet Attention2、代码实现 paper：HALFWAVELET ATTENTION ON M-NET FOR LOW-LIGHT IMAGE ENHANCEMENT Code：https://github.com/FanChiMao/HWMNet 1、Half Wavelet Attention 传统的图像增强方法主要关注图像在空间域的特征信息&am…...

编程日记 2025/1/16 20:24:08

Linux第二课：LinuxC高级学习记录day04

6、shell中的语句 6.3、结构性语句 6.3.1、if if…then…fi 1、结构 1）基本结构 if 表达式 then 命令表 fi if [ 表达式 ] // 【】两侧有空格 then 命令表 fi 2）分层结构 if 表达式 then 命令表1 else 命令表2 fi 3）嵌套结构 if …...

编程日记 2025/1/16 20:23:03

occ的开发框架

occ的开发框架 1.Introduction This manual explains how to use the Open CASCADE Application Framework (OCAF). It provides basic documentation on using OCAF. 2.Purpose of OCAF OCAF (the Open CASCADE Application Framework) is an easy-to-use platform for ra…...

编程日记 2025/1/16 20:20:59

Redis 如何解决大 key 问题

前言嗨👋，大家好，我是雪荷。做为一个后端开发，Redis 是我们经常接触到的一个非关系行数据库。其对我们系统开发和优化有着举足轻重的作用，但是随着业务和用户迅速增长，也会滋生许多的问题，而大…...

编程日记 2025/1/16 20:19:49

驱动开发系列33 - Linux Graphics mesa Intel驱动介绍

一：概述 mesa 中的 Intel 驱动体系是为支持 Intel GPU 提供图形 API 的硬件实现部分，主要包括 OpenGL、Vulkan等图形接口，Intel驱动实现整体上分为四层：第一层：API 层，实现 OpenGL 和 Vulkan 接口, src/mesa/main、src/vulkan。第二层：驱动层，实现 OpenGL 和 Vulkan…...

编程日记 2025/1/16 20:15:32

【华为OD-E卷 - 整数编码 100分（python、java、c++、js、c）】

【华为OD-E卷 - 整数编码 100分（python、java、c、js、c）】题目实现一种整数编码方法，使得待编码的数字越小，编码后所占用的字节数越小。编码规则如下: 编码时7位一组，每个字节的低7位用于存储待编码数字的补码字…...

编程日记 2025/1/16 20:14:22

vue3 uniapp封装一个瀑布流组件

新增组件m-waterfall 这样就可以在页面直接使用不用在引入了 <template><view class"m-waterfall"><view id"m-left-column" class"m-column"><slot name"left" :leftList"leftList"></slot&…...

编程日记 2025/1/16 20:09:15

Android Room 持久化库的介绍及使用方法

Android Room 是 Android Jetpack 组件之一，是 Google 官方推出的用于简化 SQLite 数据库操作的持久化库。它提供了一个抽象层，允许开发者在 SQLite 数据库上执行常见的 CRUD 操作，同时处理数据库连接、数据迁移和查询优化等底层细节。 Andr…...

编程日记 2025/1/16 20:08:14

Go语言中http.Transport的Keep-Alive配置与性能优化方法

在Go语言中，http.Transport是一个用于发送HTTP或HTTPS请求的客户端工具，它提供了许多可配置的参数以优化性能。其中，Keep-Alive配置是性能优化的关键部分。以下是对http.Transport的Keep-Alive配置与性能优化方法的详细解释： 一、…...

编程日记 2025/1/16 20:06:12

设计模式03：行为型设计模式之策略模式的使用情景及其基础Demo

1.策略模式好处：动态切换算法或行为场景：实现同一功能用到不同的算法时和简单工厂对比：简单工厂是通过参数创建对象，调用同一个方法（实现细节不同）；策略模式是上下文切换对象，调用…...

编程日记 2025/1/16 20:04:09

C# 多线程 Task TPL任务并行

先总结一下之前发展过程的要点 1： 为了保证多线程正确顺序执行线程同步 2： 为了节省操作系统线程资源线程池异步方式管理正常来讲使用这俩个要点进行使用多线程可以满足开发使用需求但是新的问题产生了那就是多个异步操作需要编写大量的代…...

编程日记 2025/1/16 20:01:06

【matlab】matlab知识点及HTTP、TCP通信

1、矩阵运算点乘：对于两个同维度的向量，点乘结果是这两个向量对应分量的乘积之和。点除：是指对两个数组的对应元素进行除法运算。点幂：表示元素对元素的幂运算。 >> A[1,2,3;4,5,6]; B[1,1,1;2,2,2]>> D1B.*AD…...

编程日记 2025/1/16 19:56:58

kalilinux - msf和永恒之蓝漏洞

Kali最强渗透工具 - metasploit metasploit是什么？ msf是一款开源安全漏洞利用和测试工具，集成了各种平台上常见的溢出漏洞和流行的sheelcode，并持续保持更新。具体操作 1、先切换到root用户，使用msfdb init命令初始化metaspl…...

编程日记 2025/1/16 19:52:52

网络安全测评质量管理与标准解读

大家读完觉得有帮助记得关注和点赞！！！ 注意说明刚开始写过一些比较专业的分享，较多粉丝反应看不懂，本次通过大众的通俗易懂的词汇先了解概念然后再分享规范和详细的技术原理一、网络安全测评质量管理网络安全测…...

编程日记 2025/1/16 19:50:50

Cesium根据地图的缩放zoom实现不同级别下geojson行政边界的对应展示

实现效果： 随着地图的缩放，展示对应缩放级别下的行政边界。准备数据： 1.国家行政边界数据 （country.json） 2.省级行政边界数据 （province.json） 3.市级行政边界数据（city.json&…...

编程日记 2025/1/16 19:47:47

Linux初识：【shell命令以及运行原理】【Linux权限的概念与权限管理】

目录一.shell命令以及运行原理二.Linux权限的概念与权限管理 2.1Linux权限的概念 sudo普通用户提权 2.2Linux权限管理 2.2.1文件访问者的分类（人） 2.2.2文件类型和访问权限（事物属性） 2.2.3文件权限值的表示方法字符…...

编程日记 2025/1/16 19:46:46

深入剖析 Wireshark：网络协议分析的得力工具

在网络技术的广阔领域中，网络协议分析是保障网络正常运行、优化网络性能以及进行网络安全防护的关键环节。而 Wireshark 作为一款开源且功能强大的网络协议分析工具，在网络工程师、安全专家以及网络技术爱好者中广受欢迎。本文将深入介绍 Wireshark 的功…...

编程日记 2025/1/16 19:45:41

【AIGC】SYNCAMMASTER：多视角多像机的视频生成

标题：SYNCAMMASTER: SYNCHRONIZING MULTI-CAMERA VIDEO GENERATION FROM DIVERSE VIEWPOINTS 主页：https://jianhongbai.github.io/SynCamMaster/ 代码：https://github.com/KwaiVGI/SynCamMaster 文章目录摘要一、引言二、使用步骤2.1 TextT…...

编程日记 2025/1/16 19:35:27

PyTorch框架——基于深度学习YOLOv5神经网络水果蔬菜检测识别系统

基于深度学习YOLOv5神经网络水果蔬菜检测识别系统，其能识别的水果蔬菜有15种，# 水果的种类 names: [黑葡萄, 绿葡萄, 樱桃, 西瓜, 龙眼, 香蕉, 芒果, 菠萝, 柚子, 草莓, 苹果, 柑橘, 火龙果, 梨子, 花生, 黄瓜, 土豆, 大蒜, 茄子, 白萝卜, 辣椒, 胡萝卜,…...

编程日记 2025/1/16 19:33:24

Redisson中红锁（RedLock）的实现

一、什么是红锁当在单点redis中实现redis锁时，一旦redis服务器宕机，则无法进行锁操作。因此会考虑将redis配置为主从结构，但在主从结构中，数据复制是异步实现的。假设在主从结构中，master会异步将数据复制到slave中…...

编程日记 2025/1/16 19:28:12

铭豹扩展坞 USB转网口突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别，但在其他电脑上正常工作时，问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤，帮助你快速找到故障原因：背景：一个M-pard（铭豹）扩展坞的网卡突然无法识别了，扩展出来的三个USB接口正常。…...

编程新知 2026/2/8 4:37:22

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

C++：std::is_convertible

C++标志库中提供is_convertible，可以测试一种类型是否可以转换为另一只类型： template <class From, class To> struct is_convertible; 使用举例： #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

编程新知 2025/6/11 15:23:57

线程与协程

1. 线程与协程 1.1. “函数调用级别”的切换、上下文切换 1. 函数调用级别的切换 “函数调用级别的切换”是指：像函数调用/返回一样轻量地完成任务切换。举例说明： 当你在程序中写一个函数调用： funcA() 然后 funcA 执行完后返回&…...

编程新知 2025/10/31 17:25:40

2021-03-15 iview一些问题

1.iview 在使用tree组件时，发现没有set类的方法，只有get，那么要改变tree值，只能遍历treeData，递归修改treeData的checked，发现无法更改，原因在于check模式下，子元素的勾选状态跟父节…...

编程新知 2026/2/5 3:29:13

Python爬虫（一）：爬虫伪装

一、网站防爬机制概述在当今互联网环境中，具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类： 身份验证机制：直接将未经授权的爬虫阻挡在外反爬技术体系：通过各种技术手段增加爬虫获取数据的难度…...

编程新知 2026/1/30 20:42:46

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述大规模语言模型的训练通常需要分布式计算技术，以解决单机资源不足的问题。分布式训练主要分为两种模式：数据并行：将数据分片到不同设备，每个设备拥有完整的模型副本模型并行：将模型分割到不同设备，每个设备处理部分模型计算现代大模型训练通常结合…...

编程新知 2025/12/10 20:45:02

【OSG学习笔记】Day 16: 骨骼动画与蒙皮（osgAnimation）

骨骼动画基础骨骼动画是 3D 计算机图形中常用的技术，它通过以下两个主要组件实现角色动画。骨骼系统 (Skeleton)：由层级结构的骨头组成，类似于人体骨骼蒙皮 (Mesh Skinning)：将模型网格顶点绑定到骨骼上，使骨骼移动…...

编程新知 2026/2/1 5:42:50

JVM虚拟机：内存结构、垃圾回收、性能优化

1、JVM虚拟机的简介 Java 虚拟机（Java Virtual Machine 简称：JVM）是运行所有 Java 程序的抽象计算机，是 Java 语言的运行环境，实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息，使得 Java 程序只需生成在 JVM 上运行的目标代码（字节码），就可以…...

编程新知 2026/2/7 0:37:40

push [特殊字符] present

push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示前言在 iOS 开发中，push 和 present 是两种不同的视图控制器切换方式，它们有着显著的区别。 present和dismiss 特点在当前控制器上方新建视图层级需要手动调用…...

编程新知 2026/1/31 4:26:17

文章目录

1、Half Wavelet Attention

2、代码实现

相关文章：