当前位置: 首页 > article >正文

深度学习水论文:mamba+图像增强

🧀当前视觉领域对高效长序列建模需求激增,对Mamba+图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。

 

 🧀因此短时间内,就有不少Mamba+图像增强的成果陆续发表,比较突出的有字节等团队提出的图像恢复网络VmambaIR,仅使用26%的计算成本就实现了超越SOTA的重建精度,还有华为诺亚方舟实验室等提出的基于Mamba的图像增强方法TAMambaIR,计算效率起飞。 

 

为帮助大家紧跟领域发展,我总结了11篇热点研究成果,有代码的也都有

我还整理出了相关的论文+开源代码,以下是精选部分论文

 

 

论文1

标题:

MambaUIE: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs

仅用2.8 GFLOPs解开海洋秘密的MambaUIE

法:

          • Mamba架构:基于状态空间模型(SSM)的Mamba架构,能够以线性复杂度对长距离依赖关系进行建模。

          • 动态交互-视觉状态空间块(DI-VSS):引入视觉状态空间(VSS)块来捕获全局上下文信息,同时挖掘局部信息。

          • 空间前馈网络(SGFN):设计SGFN来处理DI-VSS获得的特征图,进一步增强Mamba的局部建模能力。

          • 动态交互块(DIB):通过空间交互(S-I)和通道交互(C-I)操作,动态地对两个分支的特征图进行加权,以更好地融合全局和局部信息。

          创新点:

            • 首次将Mamba应用于UIE任务:打破了FLOPs对UIE准确性的限制,为未来探索更高效的UIE提供了新的基准。

            • 性能提升:相比之前的方法,MambaUIE在UIEB数据集上将GFLOPs降低了67.4%(从2.715G降低到2.8 GFLOPs),同时在PSNR和SSIM指标上取得了最佳性能。

            • 全局与局部信息融合:通过DI-VSS和DIB的设计,有效地将全局和局部信息结合在一起,提高了模型的准确性和效率。

             

            论文2

            标题:

            Mamba-UIE: Enhancing Underwater Images with Physical Model Constraint 

            Mamba-UIE:用物理模型约束增强水下图像

            法:

            • 物理模型约束框架:基于修订的水下图像形成模型,将输入图像分解为四个组件:水下场景辐射度、直接传输图、后向散射传输图和全局背景光。

            • Mamba-UIE网络:结合CNN和Mamba的混合架构,利用Mamba在通道和空间层面上对长距离依赖关系进行建模,同时保留CNN主干以恢复局部特征和细节。

            • 重建一致性约束:在重建图像和原始图像之间应用重建一致性约束,以实现对水下图像增强过程的有效物理约束。

            创新点:

                      • 物理模型约束:通过引入物理形成模型,考虑了图像形成过程中的物理定律和现实世界特征,提高了生成图像的真实性和鲁棒性。

                      • 性能提升:在UIEB数据集上,Mamba-UIE实现了27.13的PSNR和0.93的SSIM,超越了现有的最先进方法。

                      • 全局与局部依赖关系建模:通过结合CNN和Mamba,同时实现了全局和局部依赖关系的建模,提高了图像增强的效果

                       

                      论文3

                      标题:

                      O-Mamba: O-shape State-Space Model for Underwater Image Enhancement

                      O-Mamba:O型状态空间模型用于水下图像增强

                      方法:

                            • O型双分支网络:采用O型双分支网络分别对空间和跨通道信息进行建模,利用状态空间模型的高效全局感受野。

                            • 多尺度双向促进模块(MSBMP):设计MSBMP模块以增强两个分支之间的信息交互,并有效利用多尺度信息。

                            • 多尺度混合专家(MS-MoE):在每个分支内融合多尺度信息,通过多个Mamba专家学习不同尺度的特征表示。

                            • 循环多尺度优化策略(CMS):通过循环优化不同尺度的损失,减少同时优化多个尺度损失时的潜在冲突。

                            创新点:

                                    • 双分支结构:通过空间Mamba分支和通道Mamba分支,从不同维度对水下图像增强过程进行建模,空间分支起主导作用,通道分支从通道维度进行补充。

                                    • 性能提升:在多个数据集上实现了SOTA性能,例如在LSUI数据集上,PSNR从29提升到30,SSIM从0.9139提升到0.9245。

                                    • 多尺度信息利用:通过MS-MoE和CMS策略,充分利用多尺度信息,提高了模型对不同尺度特征的建模能力。

                                     

                                     

                                    论文4

                                    标题:

                                    PixMamba: Leveraging State Space Models in a Dual-Level Architecture for Underwater Image Enhancement

                                    PixMamba:利用状态空间模型的双层架构进行水下图像增强

                                    法:

                                          • 双层架构:PixMamba包含两个关键组件:用于重建增强图像特征的Efficient Mamba Net(EMNet)和用于确保增强图像全局一致性的PixMamba Net(PixNet)。

                                          • Efficient Mamba Net(EMNet):结合Efficient Mamba Block(EMB)进行高效的块级特征提取和依赖关系建模,以及Mamba Upsampling Block(MUB)进行细节保留的上采样。

                                          • PixMamba Net(PixNet):在像素级别处理整个图像,捕获全局视图中的详细特征,通过Block-wise Positional Embedding(BPE)提供空间信息。

                                          • 状态空间模型(SSM):利用SSM的线性复杂度和长距离建模能力,实现高效的全局依赖关系建模。

                                          创新点:

                                                  • 双层处理:通过结合块级和像素级处理,PixMamba能够同时增强微观细节和宏观图像质量,性能优于仅依赖跳过连接的方法。

                                                  • 性能提升:在C60数据集上,UIQM从2.667提升到2.868,UCIQE从0.574提升到0.586;在UCCS数据集上,UCIQE从0.55提升到0.561。

                                                  • 计算效率:通过引入Mamba Upsampling Block(MUB)和Block-wise Positional Embedding(BPE),在保持高效计算的同时,提高了图像增强的质量。

                                                   

                                                   

                                                   

                                                   

                                                   

                                                  相关文章:

                                                  深度学习水论文:mamba+图像增强

                                                  🧀当前视觉领域对高效长序列建模需求激增,对Mamba图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。 🧀因此短时间内,就有不…...

                                                  AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机

                                                  这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...

                                                  现有的 Redis 分布式锁库(如 Redisson)提供了哪些便利?

                                                  现有的 Redis 分布式锁库(如 Redisson)相比于开发者自己基于 Redis 命令(如 SETNX, EXPIRE, DEL)手动实现分布式锁,提供了巨大的便利性和健壮性。主要体现在以下几个方面: 原子性保证 (Atomicity)&#xff…...

                                                  【Redis】笔记|第8节|大厂高并发缓存架构实战与优化

                                                  缓存架构 代码结构 代码详情 功能点: 多级缓存,先查本地缓存,再查Redis,最后才查数据库热点数据重建逻辑使用分布式锁,二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

                                                  C/C++ 中附加包含目录、附加库目录与附加依赖项详解

                                                  在 C/C 编程的编译和链接过程中,附加包含目录、附加库目录和附加依赖项是三个至关重要的设置,它们相互配合,确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中,这些概念容易让人混淆,但深入理解它们的作用和联…...

                                                  【从零学习JVM|第三篇】类的生命周期(高频面试题)

                                                  前言: 在Java编程中,类的生命周期是指类从被加载到内存中开始,到被卸载出内存为止的整个过程。了解类的生命周期对于理解Java程序的运行机制以及性能优化非常重要。本文会深入探寻类的生命周期,让读者对此有深刻印象。 目录 ​…...

                                                  Mysql8 忘记密码重置,以及问题解决

                                                  1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

                                                  C++.OpenGL (20/64)混合(Blending)

                                                  混合(Blending) 透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...

                                                  Linux 中如何提取压缩文件 ?

                                                  Linux 是一种流行的开源操作系统,它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间,使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的,要在 …...

                                                  纯 Java 项目(非 SpringBoot)集成 Mybatis-Plus 和 Mybatis-Plus-Join

                                                  纯 Java 项目(非 SpringBoot)集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

                                                  Java求职者面试指南:计算机基础与源码原理深度解析

                                                  Java求职者面试指南:计算机基础与源码原理深度解析 第一轮提问:基础概念问题 1. 请解释什么是进程和线程的区别? 面试官:进程是程序的一次执行过程,是系统进行资源分配和调度的基本单位;而线程是进程中的…...

                                                  Java数值运算常见陷阱与规避方法

                                                  整数除法中的舍入问题 问题现象 当开发者预期进行浮点除法却误用整数除法时,会出现小数部分被截断的情况。典型错误模式如下: void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

                                                  GitFlow 工作模式(详解)

                                                  今天再学项目的过程中遇到使用gitflow模式管理代码,因此进行学习并且发布关于gitflow的一些思考 Git与GitFlow模式 我们在写代码的时候通常会进行网上保存,无论是github还是gittee,都是一种基于git去保存代码的形式,这样保存代码…...

                                                  AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别

                                                  【导读】 野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而,传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案,能够实现大范围覆盖并远程采集数据。尽管具备这些优势&#xf…...

                                                  MFC 抛体运动模拟:常见问题解决与界面美化

                                                  在 MFC 中开发抛体运动模拟程序时,我们常遇到 轨迹残留、无效刷新、视觉单调、物理逻辑瑕疵 等问题。本文将针对这些痛点,详细解析原因并提供解决方案,同时兼顾界面美化,让模拟效果更专业、更高效。 问题一:历史轨迹与小球残影残留 现象 小球运动后,历史位置的 “残影”…...

                                                  云原生安全实战:API网关Kong的鉴权与限流详解

                                                  🔥「炎码工坊」技术弹药已装填! 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、基础概念 1. API网关(API Gateway) API网关是微服务架构中的核心组件,负责统一管理所有API的流量入口。它像一座…...

                                                  【C++特殊工具与技术】优化内存分配(一):C++中的内存分配

                                                  目录 一、C 内存的基本概念​ 1.1 内存的物理与逻辑结构​ 1.2 C 程序的内存区域划分​ 二、栈内存分配​ 2.1 栈内存的特点​ 2.2 栈内存分配示例​ 三、堆内存分配​ 3.1 new和delete操作符​ 4.2 内存泄漏与悬空指针问题​ 4.3 new和delete的重载​ 四、智能指针…...

                                                  vulnyx Blogger writeup

                                                  信息收集 arp-scan nmap 获取userFlag 上web看看 一个默认的页面,gobuster扫一下目录 可以看到扫出的目录中得到了一个有价值的目录/wordpress,说明目标所使用的cms是wordpress,访问http://192.168.43.213/wordpress/然后查看源码能看到 这…...

                                                  基于IDIG-GAN的小样本电机轴承故障诊断

                                                  目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) ​梯度归一化(Gradient Normalization)​​ (2) ​判别器梯度间隙正则化(Discriminator Gradient Gap Regularization)​​ (3) ​自注意力机制(Self-Attention)​​ 3. 完整损失函数 二…...

                                                  【JVM面试篇】高频八股汇总——类加载和类加载器

                                                  目录 1. 讲一下类加载过程? 2. Java创建对象的过程? 3. 对象的生命周期? 4. 类加载器有哪些? 5. 双亲委派模型的作用(好处)? 6. 讲一下类的加载和双亲委派原则? 7. 双亲委派模…...

                                                  push [特殊字符] present

                                                  push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中,push 和 present 是两种不同的视图控制器切换方式,它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…...

                                                  虚拟电厂发展三大趋势:市场化、技术主导、车网互联

                                                  市场化:从政策驱动到多元盈利 政策全面赋能 2025年4月,国家发改委、能源局发布《关于加快推进虚拟电厂发展的指导意见》,首次明确虚拟电厂为“独立市场主体”,提出硬性目标:2027年全国调节能力≥2000万千瓦&#xff0…...

                                                  LLMs 系列实操科普(1)

                                                  写在前面: 本期内容我们继续 Andrej Karpathy 的《How I use LLMs》讲座内容,原视频时长 ~130 分钟,以实操演示主流的一些 LLMs 的使用,由于涉及到实操,实际上并不适合以文字整理,但还是决定尽量整理一份笔…...

                                                  RabbitMQ入门4.1.0版本(基于java、SpringBoot操作)

                                                  RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发,后来由Pivotal Software Inc.(现为VMware子公司)接管。RabbitMQ 是一个开源的消息代理和队列服务器,用 Erlang 语言编写。广泛应用于各种分布…...

                                                  DingDing机器人群消息推送

                                                  文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人,点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置,详见说明文档 成功后,记录Webhook 2 API文档说明 点击设置说明 查看自…...

                                                  [免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

                                                  大家好,我是java1234_小锋老师,看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...

                                                  Selenium常用函数介绍

                                                  目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...

                                                  在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)

                                                  考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…...

                                                  华为OD机考-机房布局

                                                  import java.util.*;public class DemoTest5 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseSystem.out.println(solve(in.nextLine()));}}priv…...

                                                  莫兰迪高级灰总结计划简约商务通用PPT模版

                                                  莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...