28、论文阅读:基于像素分布重映射和多先验Retinex变分模型的水下图像增强
A Pixel Distribution Remapping and Multi-Prior Retinex Variational Model for Underwater Image Enhancement
- 摘要
- 介绍
- 相关工作
- 基于模型的水下图像增强方法:
- 无模型水下图像增强方法:
- 基于深度学习的水下图像增强方法:
- 论文方法
- 概述
- 像素分布重映射(PDR)模块
- 1、像素预补偿
- 2、通道拉伸
- 3、像素分布重映射
- 多先验亮度补偿(MPLC)模块
Retinex Variational Model for Underwater Image Enhancement)
摘要
高质量的水下成像对水下探索至关重要。然而,由于海水的颗粒散射和光吸收,图像清晰度显著降低。为了解决这些问题,我们提出了一种结合像素分布重映射(PDR)和多优先级Retinex变分模型的新型水下图像增强(UIE)方法。我们设计了一种针对严重衰减通道的预补偿方法,有效防止了颜色校正过程中产生新的颜色伪影。通过结合通道间的耦合关系,我们计算了一个限制因子,用于重映射像素分布曲线以提高图像对比度。此外,考虑到显著的噪声干扰,我们在构建变分模型时引入了先验知识,包括水下噪声和纹理先验,并设计了符合水下特征的惩罚项,以去除反射分量中的过多噪声。我们的方法通过快速求解器高效地解耦了光照和反射分量。随后,利用伽马校正调整光照分量,并融合校正后的光照和反射分量,重建出最终自然的输出图像。通过对各种数据集的全面评估,我们的方法显著超越了当前的最新技术(SOTA)方法。结果表明,我们的方法在纠正颜色偏差和补偿水下图像的亮度损失方面具有良好的效果。
介绍


【强衰减通道补偿对颜色校正的结果。(a)-(f)中的顶行示出了没有补偿强衰减的颜色校正结果,导致显著的伪像。底行展示了在我们的方法对强衰减通道进行补偿之后的增强结果。】
清晰的水下图像是探索海底资源、水体污染监测和广泛科学研究的基本前提。因此,获得清晰的水下图像已成为一个重大挑战 [1], [2], [3]。然而,由于水下环境的复杂性和光照条件的变化,水下图像可能由于光衰减和悬浮颗粒散射而面临颜色失真、亮度损失和对比度低的问题 [4], [5], [6]。因此,各种方法已被探索以应对分析水下图像的挑战。
图1(b) 表明,不同光波长在水中衰减率不同。较长的波长,如红光,衰减得更快,而较短的波长,如蓝光,衰减较慢。这种衰减差异通常给水下图像带来蓝绿偏色,正如以往研究 [7] 所讨论的。传统的颜色偏差校正方法通常在强衰减通道上进行处理,而没有预补偿,从而导致增强后的明显伪影(见图2)。此外,也有基于物理模型的方法试图逆转水下环境中图像退化过程,通过建立先验条件 [8], [9], [10]。然而,这些方法在复杂的水下环境中通常表现不佳,正如我们早期的研究 [11] 所强调的。
水下图像传播的亮度退化,主要是由于颗粒散射和光吸收,提出了显著挑战 [12], [13], [14], [15]。一种常见的解决方案是应用Retinex理论,这涉及分解光照分量以增强图像亮度,如图1(a)所示。Retinex理论旨在去除或减少入射图像对原始图像的影响,保留物体的反射特性。基于Retinex的图像增强解耦了亮度分量和反射分量,然后调整亮度分量以消除不均匀照明的影响,从而提高图像的视觉效果。然而,传统的基于Retinex的方法忽略了水下特定先验知识在分解过程中的作用。这种忽视导致照明和反射分量之间的高度耦合,导致增强后的图像曝光过度和细节丢失。
在本文中,我们提出了一种新颖的水下图像增强方法来解决颜色偏移和亮度损失。我们的方法的关键贡献总结如下:
-
我们提出了一种新的颜色校正方法,与传统的颜色恒常性方法不同,通过对强衰减通道的像素值进行预补偿来防止颜色伪影。此外,该方法采用了一种创新的直方图均衡化来重新分配像素值,增强图像对比度并减少过度或欠增强区域的差异,从而获得均匀的最终增强图像。
-
我们采用Retinex理论进行水下成像,通过将水下噪声、纹理和梯度的先验知识集成到带有噪声项的变分模型中。我们设计了针对水下场景的具体惩罚项,成功解耦了照明和反射分量,同时减少了噪声的放大。
-
我们将UIE复杂过程分解为三个子任务,通过块坐标下降 [16]、最小二乘法 [17] 和预条件共轭梯度 (PCG) [18] 方法来解决每个子问题。我们通过高效的像素级处理来解决这些子问题。
本文的组织结构如下:第 II 节回顾了水下图像增强的相关工作。第 III 节详细描述了我们的方法。第 IV 节展示了我们方法的广泛实验验证结果。最后,第 V 节讨论了结论与未来的建议。
相关工作
近年来,许多努力集中在改善退化水下图像的可见性上,现有技术大致分为三类:基于模型的水下图像增强(UIE)方法、无模型水下图像增强方法和基于深度学习的水下图像增强方法。
基于模型的水下图像增强方法:
这些方法通常依赖于基于先验假设建立物理成像模型。关键参数被估计以逆转水下成像的退化过程。例如,文献 [19] 使用偏斜梯度运算符生成准确的透射图,并通过四叉树细分法估计背景光,关注平滑度和颜色变化。Ke 等人 [20] 通过景深和边缘图初步估计透射,并基于波长与散射系数的关系调整通道特定的透射图。为了处理复杂的水下散射,他们引入了具有可变平滑参数的加权最小二乘滤波器进行局部背景光估计。Zhou 等人 [21] 开发了一种色线模型来处理光散射和吸收问题,通过交替迭代算法解决水下环境中的传输问题。此外,另一项研究 [22] 采用通道强度先验(CIP)和自适应暗像素(ADP)来减弱回散现象,精确处理不同水下场景中的不均匀照明问题。尽管这些物理模型方法在增强效果上表现良好,但它们忽略了人的视觉感知,同时需要复杂的参数设置,这可能限制其适应性并影响增强图像的视觉吸引力。
无模型水下图像增强方法:
这些方法通常避免构建显式的物理成像模型,而是专注于图像像素的空间域调整。例如,Fu 等人 [23] 通过变分方法利用Retinex模型来分离照明分量,并通过交替方向优化进一步增强图像。文献 [24] 提出了一个BayesianRetinex算法,该算法在多尺度梯度先验的基础上进行反射率和亮度的修复。文献 [25] 研发了一种在变分框架内利用照明通道稀疏先验的方法。此外,另一种创新的方法 [26] 采用加权小波视觉感知融合(WWPF),通过衰减地图引导的颜色校正和基于小波的视觉感知融合,实现有效的水下图像增强。然而,这些方法仍然面临噪声放大、伪影出现和过度颜色校正等挑战。
基于深度学习的水下图像增强方法:
深度学习在各种视觉任务中取得了显著突破 [27], [28]。在这一领域,通常采用两种主要策略。一种是构建端到端架构或使用深度模型直接估计物理参数,以恢复退化图像。Wu 等人 [29] 提出了一个多尺度融合生成网络,能够矫正颜色失衡并增强图像对比度。此外,另一种创新发展 [30] 是一种反射率引导的水下图像增强网络,通过整合原始编码器和反射率编码器的输入来减弱不同场景对修复任务的影响,从而提升了严重退化图像的处理能力。Jiang 等人 [31] 通过多尺度密集增强模块、深度美学渲染模块和双通道注意模块,旨在通过处理浑浊和色差来改善水下图像的对比度和颜色偏移。然而,基于深度学习的方法通常需要大量的训练数据,通常需要真实的水下图像。训练阶段不仅耗费资源,而且耗时,这可能限制其在实际水下图像增强场景中的适用性。
论文方法

【概述了所提出的结合变分模型的UIE方法,包括像素分布重映射子方法(PDR)和多优先级亮度补偿子方法(MPLC)。**在PDR中,首先对输入图像的强衰减通道像素进行预补偿以避免引入色彩伪影,然后通过调整通道像素分布曲线来校正图像的色彩偏差,使其更符合人眼的视觉效果。**该算法结合PDR方法的结果图像和多种先验知识构建优化模型,通过快速求解器求解得到强解耦后的亮度分量,调整亮度曲线以补偿图像的亮度损失。最后,融合反射率和调整后的光照分量重建水下图像。】
概述
我们的方法由两个主要模块组成:像素分布重映射(Pixel Distribution Remapping, PDR)模块和多先验亮度补偿(Multi-Prior Luminance Compensation, MPLC)模块。其中,PDR模块旨在校正水下图像的颜色偏移并增强对比度,而MPLC模块旨在对抗亮度衰减,从而提升图像的清晰度。图3展示了我们方法的详细工作流程。
像素分布重映射(PDR)模块
水下环境和光照条件是导致水下图像质量失真的重要因素,如图 1(b) 所示。这种现象是由水中不同波长的光衰减速率差异引起的。较长波长(如红光)衰减迅速,而较短波长(如蓝光和绿光)在更大深度下更占主导地位。因此,退化的水下图像通常表现为绿色或蓝色调,显著影响视觉质量。
1、像素预补偿

2、通道拉伸


3、像素分布重映射



多先验亮度补偿(MPLC)模块

相关文章:
28、论文阅读:基于像素分布重映射和多先验Retinex变分模型的水下图像增强
A Pixel Distribution Remapping and Multi-Prior Retinex Variational Model for Underwater Image Enhancement 摘要介绍相关工作基于模型的水下图像增强方法:无模型水下图像增强方法:基于深度学习的水下图像增强方法: 论文方法概述像素分布…...
5.interview-self-introduction
1.保证电话面试来的时候,可以接听,保持电话通常 interviews will be arranged recently.please keep your phone line open and make sure you can answer th call when the phone interview comes. speak loudly and slow down your speaking voice &a…...
高性能MySQL-查询性能优化
查询性能优化 1、为什么查询这么慢2、慢查询基础:优化数据访问2.1 是否向数据库请求了不需要的数据2.2 MySQL是否存在扫描额外的记录 3、重构查询方式3.1 一个复杂查询还是多个简单查询3.2 切分查询3.3 分解联接查询 4、查询执行的基础4.1 MySQL的客户端/服务器通信…...
如何有效修复ffmpeg.dll错误:一站式解决方案指南
当您遇到提示“ffmpeg.dll文件丢失”的错误时,这可能导致相关的应用程序无法启动或运行异常。本文将详细介绍如何有效地解决ffmpeg.dll文件丢失的问题,确保您的应用程序能够恢复正常运行。 ffmpeg.dll是什么?有哪些功能? ffmpeg.…...
8086汇编(16位汇编)学习笔记00.DEBUG命令使用解析及范例大全
8086汇编(16位汇编)学习笔记00.DEBUG命令使用解析及范例大全-C/C基础-断点社区-专业的老牌游戏安全技术交流社区 - BpSend.net[md]启动 Debug,它是可用于测试和调试 MS-DOS 可执行文件的程序。 Debug [[drive:][path] filename [parameters]] 参数 [drive:…...
查看mysql的冷数据配置比例
查看mysql的冷数据配置比例 -- 真正的LRU链表,会被拆分为两个部分,一部分是热数据,一部分是冷数据,这个冷热数据的比例是由innodb_old_blocks_pct参数控制的,它默认是37,也就是说冷数据占比37%。 show GLO…...
【Java基础面试题028】Java中的hashCode和equals方法,与==操作符有什么区别?
回答重点 hashcode、equals 和 都是Java中用于比较对象的三种方式,但是它们的用途和实现还是有挺大区别的。 hashcode用于散列存储结构中确定对象的存储位置。可用于快速比较两个对象是否不同,因为如果它们的哈希码不同,那么它们肯定不相等…...
在C#中测试比较目录的不同方法以查看它们有哪些共同的文件
C# 中的示例“比较目录以查看它们有哪些共同的文件”使用Directory.GetFiles获取两个目录中的文件。它对文件进行排序,并比较两个排序后的列表以查看哪些文件位于第一个目录中、第二个目录中或两个目录中。有关其工作原理的详细信息,请参阅该示例。 Kur…...
harbor离线安装 配置https 全程记录
1. 下载harbor最新版本 下载网址: 找最新的版本: https://github.com/goharbor/harbor/releases/download/v2.11.2/harbor-offline-installer-v2.11.2.tgz 这里我直接使用迅雷下载, 然后上传 1.1解压 sudo tar -xf harbor-offline-installer-v2.11.2.tgz -C /opt/ 2. 配置Harb…...
C++简明教程(文章要求学过一点C语言)(5)
在开始之前必须阅读这个文章 https://blog.csdn.net/weixin_45100742/article/details/135152562 这篇文章完全是对C语言的补课,如果C语言学的好,可跳过。 变量、数据类型与运算符 在 C 编程中,理解变量、数据类型和运算符是构建程序的基石…...
Halcon单相机+机器人=眼在手上#标定心得
首先,这个标定板肯定是放在我们要作业的工作台上的 目的 **1,得到标定物(工作台)与机器人底座之间的pose转换关系。2,得到相机与机器人末端tool的的转换关系。 两个不确定的定量 1,标定板与机器人底座b…...
【hackmyvm】Diophante 靶场
1. 基本信息^toc 这里写目录标题 1. 基本信息^toc2. 信息收集2.1. 端口扫描2.2. 目录扫描2.3. knock 3. WordPress利用3.1. wpscan扫描3.2. smtp上传后门 4. 提权4.1. 提权leonard用户4.2. LD劫持提权root 靶机链接 https://hackmyvm.eu/machines/machine.php?vmDiophante 作者…...
C++类的继承关系中什么时候要用到上行转换和下行转换
一、C类继承关系中的上行转换 1. 多态性实现 在C中,上行转换(将派生类转换为基类)是实现多态性的关键。例如,当有一个基类Animal,以及派生类Dog和Cat。如果有一个函数接受Animal类型的参数,我们可以将Dog或…...
Ubuntu 22.04永久保存路由
在 Ubuntu 22.04 上,可以按照以下方式配置让流量访问 172.19.201.207 走指定的路由。 1. 临时添加路由 临时路由规则只在当前系统会话中有效,重启后会丢失。 添加路由规则 运行以下命令: sudo ip route add 172.19.201.207 via 192.168.2…...
数据结构十大排序之(冒泡,快排,并归)
接上期: 数据结十大排序之(选排,希尔,插排,堆排)-CSDN博客 前言: 在计算机科学中,排序算法是最基础且最重要的算法之一。无论是大规模数据处理还是日常的小型程序开发,…...
OpenFeign源码
openfeign是通过FeignClientFactoryBean生成动态代理对象的方式实现http客户端无感调用,可以做到像定义接口一样写http客户端调用代码。 配置Feign接口后,我们通常会在SpringBoot项目启动类上标记EnableFeignClients,这个是生成动态代理对象的…...
sql server索引优化语句
第一步 建一个测试表 --create table TestUsers --( -- Id int primary key identity(1,1), -- Username varchar(30) not null, -- Password varchar(10) not null, -- CreateDateTime datetime not null --)第二步 插入100w数据 大概1分钟执行时间 ----插入数据…...
深度学习之超分辨率算法——SRGAN
更新版本 实现了生成对抗网络在超分辨率上的使用 更新了损失函数,增加先验函数 SRresnet实现 import torch import torchvision from torch import nnclass ConvBlock(nn.Module):def __init__(self, kernel_size3, stride1, n_inchannels64):super(ConvBlock…...
16.2、网络安全风险评估技术与攻击
目录 网络安全风险评估技术方法与工具 网络安全风险评估技术方法与工具 资产信息收集,可以通过调查表的形式把我们各类的资产信息进行一个统计和收集,掌握被评估对象的重要资产分布,进而分析这些资产关联的业务面临的安全威胁以及存在的安全…...
【项目管理】GDB调试
gdb(GNU Debugger) 是 Linux 和嵌入式开发中最常用的调试工具之一,可以用来调试 C/C 程序、排查崩溃、分析程序流程等。在嵌入式开发中,gdb 还可以通过远程调试(gdbserver)调试目标设备上的程序。 这篇文章…...
气动元器件选型(工业自动化场景实战指南)
1. 气动技术基础与工业自动化适配性 气动技术作为工业自动化领域的核心驱动方式之一,其本质是通过压缩空气实现能量传递。想象一下,就像我们用吸管吹动纸团一样简单直接——空压机将电动机的旋转动能转化为气压能,再通过各类阀门控制气流方向…...
Python项目依赖管理:如何用pipreqs精准生成requirements.txt(附常见问题解决)
Python项目依赖管理实战:从pipreqs到高效协作的全链路优化 在Python项目开发中,依赖管理就像建筑的地基——它不显眼却决定了整个项目的稳定性。想象一下这样的场景:你花了三天时间调试一个诡异的问题,最后发现只是因为测试环境缺…...
新疆某工程围岩等级,包含以下7列,均为数值型数据
一、文件结构 文件包含1个工作表:Sheet1仅 Sheet1 包含数据,其余为空表。二、数据列说明 Sheet1 包含以下7列,均为数值型数据:列名(英文)列名(中文推测)数据类型说明VPR未知参数1数值…...
隐私优先方案:OpenClaw+Qwen3-14B镜像处理敏感数据的5层防护
隐私优先方案:OpenClawQwen3-14B镜像处理敏感数据的5层防护 1. 为什么需要本地化隐私方案 去年处理一批客户调研数据时,我犯过一个致命错误——把包含联系方式的原始表格上传到某公有云AI平台进行清洗。三天后,公司邮箱突然收到匿名勒索邮件…...
大模型岗位大揭秘:面试官从不说的5个秘密!
本文作者通过自身经历,详细解析了五大与大模型相关的岗位区别,包括大模型算法工程师、大模型应用工程师、云厂商解决方案架构师、云厂商大模型解决方案架构师以及云厂商FDE大模型前沿部署工程师。文章从工作重心(模型vs客户)、面试…...
从85分到95+:复盘我在科大奥锐虚拟仿真实验平台踩过的那些‘坑’
从85分到95:科大奥锐虚拟仿真实验平台的实战避坑指南 第一次接触科大奥锐虚拟仿真实验平台时,我和大多数同学一样,以为这不过是传统实验的电子版。直到连续三次实验分数卡在85分上下,才意识到这个平台对操作细节的严苛程度远超预期…...
STM32CubeMX + EG2131预驱芯片:搞定无刷电机六步换向的硬件配置避坑指南
STM32CubeMX与EG2131预驱芯片的无刷电机六步换向实战解析 引言 在嵌入式电机控制领域,无刷直流电机(BLDC)因其高效率、长寿命和低维护成本等优势,正逐步取代传统有刷电机。然而,当工程师们从理论转向实践时,…...
开源字体完全指南:免费商用与跨平台优化实践
开源字体完全指南:免费商用与跨平台优化实践 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 在当今数字化设计领域,选择合适的字体不仅关乎视觉呈现,…...
基于MATLAB的齿轮系统非线性动力学特性分析:参数阻尼比变化调节下的输出结果
基于matlab的齿轮系统非线性动力学特性分析 基于matlab的齿轮系统非线性动力学特性分析,综合考虑齿侧间隙、时变啮合刚度、综合啮合误差等因素下,参数阻尼比变化调节下,输出位移、相图、载荷、频率幅值结果 程序已调通,可直接运行…...
一款实用汉化工具快速安装使用指南 -- cheat-engine中文版安装教程入口
文章目录安装方式安装后在哪里找到?(重点补全)使用说明温馨提示首先呢,大家可能在用 cheat engine (CE修改器)的时候呢,可能总是使用的是英文版,用的不太舒服啊,这个时候呢ÿ…...
