【零参考GAN:Pansharpening】
ZeRGAN: Zero-Reference GAN for Fusion of Multispectral and Panchromatic Images
(用于多光谱和全色图像融合的零参考GAN)
本文提出了一种融合低空间分辨率多光谱(LR MS)和高空间分辨率全色(PAN)图像的新的全色锐化方法–零参考生成对抗网络(ZeRGAN)。在该方法中,零参考表示它不需要使用成对的缩小尺度图像或未成对的全尺度图像进行训练。为了得到准确的融合结果,我们在一组多尺度生成器和它们对应的鉴别器之间建立了一个对抗性博弈。通过多尺度生成器,融合的高空间分辨率MS(HRMS)图像逐步从LR MS和PAN图像产生,而鉴别器的目的是区分HRMS图像和PAN图像之间的空间信息的差异。换句话说,在优化ZeRGAN之后,从LR MS和PAN图像生成HR MS图像。此外,我们构建了一个非参考损失函数,包括对抗性损失,空间和光谱重建损失,空间增强损失和平均恒定性损失。通过最小化总损失,可以有效地增强HRMS图像中的空间细节。在不同卫星采集的数据集上进行了大量的实验。
INTRODUCTION
近年来,不同的地球观测卫星,如QuickBird,GeoEye-1和WorldView-2收集了大量的遥感图像。这些卫星可以同时获取低空间分辨率多光谱图像和全色图像。目前,所捕获的图像已广泛且成功地用于目标发现、土地覆盖分析和环境监测。然而,由于空间和光谱分辨率之间的固有权衡,难以获得上述卫星的高空间和光谱分辨率MS(HR MS)图像。一方面,LR MS图像包含丰富的光谱信息,但空间分辨率低于PAN图像。另一方面,PAN图像仅由一个高空间分辨率带组成。因此,通过将LR MS图像中的光谱信息与PAN图像中的空间细节整合在一起,应用图像融合(也称为泛锐化)来产生融合的HR MS图像。
在过去的二十年中,已经提出并开发了各种算法来科普全色锐化任务。它们可以分为四种类型:1)组分替代(CS)方法; 2)多分辨率分析(MRA)方法; 3)基于退化模型(DM)的方法;以及4)基于深度神经网络(DNN)的方法。CS方法因其原理简单、实现速度快而得到了广泛的应用。他们将插值的LR MS图像投影到一个新的域中以估计合适的空间分量。然后用PAN图像代替空间分量,并通过相应的逆投影生成融合的HR MS图像。例如,在这种情况下使用的典型变换是强度-色调-饱和度(IHS)变换、主成分分析(PCA)和Gram-Schmidt(GS)变换。此外,提出了频带相关空间细节(BDSD)算法,以更准确地估计增益参数。然而,由于在图像之间考虑了全局变换,因此在融合结果中产生了显著的光谱失真。
基于MRA的方法假设要添加到LR MS图像中的空间信息是从PAN图像中获取的,这被称为结构注入空间分辨率改善(ARSIS)。在这些方法中,空间细节的提取和注入增益的计算对融合结果有重要影响。通过许多MRA工具提取空间细节,例如contourlet和广义拉普拉斯金字塔。Otazu等人提出了一种加性小波亮度比例(AWLP)方法来估计PAN图像中的高频分量。由于只有PAN图像的空间细节被注入到LR MS图像中,因此基于MRA的融合结果在光谱保真度方面具有良好的性能。
基于DM的方法假设所观察到的LR MS和PAN图像分别是空间域和谱域中的HR MS图像的退化版本。例如,Li和Yang通过将空间和光谱DM视为测量矩阵,将图像融合任务重新表述为压缩感知问题。此外,融合模型通过其他有效先验进行正则化,例如稀疏性,非负性和低秩先验。虽然这些方法在空间和光谱信息保持方面表现良好,但它们的计算复杂度远高于前两类方法。
如今,DNN已经在各个领域取得了巨大的成功,还被用于全息锐化。例如,Huang等人采用堆叠式改进稀疏去噪自动编码器进行全息锐化。Masi等人受文献[24]中超分辨率模型的启发,提出了一种基于卷积神经网络(CNN)的全息锐化方法–PNN。在[25]中,PANet是通过将特定问题的先验与残差网络(ResNet)相结合而建立的。该算法能较好地保持融合图像的光谱和空间保持性。随后,Fu等人引入了分组多尺度扩张网络,以提高空间信息的多尺度表示能力。Zhang等人提出了一种双向金字塔网络,将PAN图像中的空间细节逐层注入LR MS图像中。在[29]中,在分组贴片上构建了堆叠稀疏自动编码器。根据这些补丁的几何结构,他们被分类,然后送入自动编码器。此外,生成对抗网络(GAN)也被用于融合LR MS和PAN图像。例如,Liu等人首先利用GAN生成融合图像,然后在[32]中扩展。然后,Ma等人采用两个鉴别器来保持融合图像中的空间和光谱信息,这可以避免在训练期间需要HR MS图像。此外,在MDSSC-GAN中使用了生物多样性框架。在这种方法中,第一个滤波器由图像的亮度和近红外波段馈送,而第二个滤波器的输入是光谱分量的级联。在[35]中,提出了一种基于无监督GAN的方法,包括监督预训练和无监督微调。然而,基于DNN的泛锐化方法可能倾向于过拟合成对的训练数据。因此,当分析由其他卫星获得的新数据时,泛化能力降低。此外,需要考虑与训练数据有关的两个问题。一方面,大多数基于DNN的泛锐化方法通常使用成对图像进行训练,如图1(a)所示。但是,HR MS图像在真实的场景中不可用。因此,成对图像由空间退化后的LR MS和PAN图像的缩小比例版本组成。因此,原始LR MS图像直接被视为参考数据。然而,在全尺寸图像的空间细节不能有效地从缩小规模的图像对学习。另一方面,一些基于GAN的泛锐化方法被提出用于全尺度图像的显式训练,其中包含原始尺度的LR MS和PAN图像。它们也被称为未配对图像,如图1(b)所示。然而,这些网络需要重复训练,以获得理想的结果,因为不同的卫星图像之间的不同分布。此外,它们需要大量的训练数据。
基于这两个方面,本文提出了一种基于GAN的零参考GAN(ZeRGAN)方法,用于由PAN图像锐化LR MS图像。如图1(c)所示,ZeRGAN不需要任何成对的缩小比例图像或未成对的全比例图像进行训练。因此,在对该方法的损失函数进行优化后,可以直接由多尺度发生器得到融合图像。特别是,我们采用了一组级联的多尺度生成器,逐步增加MS图像中的空间信息,同时保留光谱信息。在每个尺度上,残差学习被嵌入到生成器中,以改善中间HR MS图像中的空间细节。同时,在相同的尺度下,相应的缩放被用来进一步区分中间和真实的PAN图像中的空间信息。通过光谱响应滤波(SSF),从中间HR MS图像生成中间PAN图像。此外,为了确保零参考训练的融合性能,我们设计了一个无监督损失函数,其中包含对抗损失,空间和光谱重建损失,空间增强损失和平均恒定性损失,用于在每个尺度上优化生成器和滤波器。实验结果表明,即使没有任何训练集,ZeRGAN仍然具有竞争力的性能相比,依赖于配对或不配对的图像进行训练的方法。
贡献
1)ZeRGAN不需要任何训练数据。通过优化GAN并结合空间和光谱DM,实现了LR MS和PAN图像的融合。一个多尺度生成器架构被用来增强空间细节的LR MS图像协作。
2)一个任务驱动的非参考损失函数制定了一个有效的措施,融合图像中的空间和光谱信息,这减轻了大量的训练数据的需要。
3)对于光谱保存,我们引入了一个新的损失项,平均恒定性损失,它假设LR MS图像中的频带的平均值应相应地等于HR MS图像中的频带。
GENERATIVE ADVERSARIAL NETWORKS
自从GAN由Goodfellow等人提出以来由于其强大的生成能力,在图像处理和图像合成等各个领域的性能都有了显着的提高。GAN主要通过最小-最大对抗游戏学习生成器G和BND。生成器G可以学习数据分布,并创建真实的样本来欺骗CMDD。相反地,CNOD的目的是分类样本是由生成器G合成的还是来自真实的数据。然后,上述两个玩家的游戏可以在数学上表示为:
然而,原始GAN遭受训练不稳定性。然后,提出了深度卷积GAN(DCGAN)来稳定GAN的训练,其中生成器和卷积神经网络都由CNN组成。Mao等人在最小二乘损失的约束下,惩罚假样本的分布更接近真实的数据的分布。Wasserstein GAN(WGAN)采用具有更好理论特性的Wasserstein距离来衡量真实的和虚假数据之间的差异。然而,WGAN的收敛是缓慢的,有时不稳定。因此,Gulrajani等人提出了WGAN-GP损失并引入梯度惩罚来直接保证Lipschitz条件,其目标函数为
PROPOSED METHOD
ZeRGAN的框架如图2所示,其中生成器和鉴别器分别主要负责注入和区分HR MS图像中的真实空间信息。更具体地说,一系列的生成器被设计为增强在不同尺度的中间HR MS图像的空间细节,同时保留光谱信息。此外,在每个尺度上的缩放还负责中间PAN图像和真实的PAN图像中的空间信息的一致性。通过SSF从中间HR MS图像产生中间PAN图像。此外,通过以不同比率下采样原始PAN图像来合成对应于不同尺度的真实的PAN图像。此外,一个无监督的损失来自空间光谱模型和先验知识,使零参考训练成为可能。虽然已经提出了许多基于GAN的泛锐化方法,例如PSGAN和MDSSC-GAN,但这些方法需要大量的成对图像进行训练。所提出的ZeRGAN不需要任何配对或未配对的数据,这消除了训练数据的问题。此外,现有的基于GAN的方法通常使用单个生成器来合成融合结果。ZeRGAN提出了由多个生成器组成的多尺度框架,从粗到细生成融合图像,以提高融合效果。
Multiscale Generator
多尺度发生器由L个级联的生成器组成,其中生成器Gl在尺度l处的输出是Hl ∈ R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,生成器Gl+1在尺度l + 1处的输入。M × N × B是原始LR MS图像H0的大小。rl是H0和H1之间的空间分辨率比。因此,我们可以将LR MS图像在不同尺度下的连续增强写为:
其中Hl-1和Pl都被馈送到发生器Gl。通过下采样从原始PAN图像生成Pl。注意,Pl的大小与Hl的大小一致。然后,期望的HR MS图像是HL ∈ R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,即GL在尺度L下的输出。通常,在全色锐化任务中rL等于4。
不同规模的生成器的架构如图3所示。对于生成器的输入,我们首先通过双三次算子将MS图像Hl-1直接上采样到真实的PAN图像P1的大小。然后,将上采样的MS图像与PAN图像连接在一起作为生成器的输入。生成器由五个卷积层组成。过滤器大小为3 × 3,步长为1。对于前四个卷积层,滤波器的数量设置为n。在最后一个卷积层中使用了四个滤波器。Leaky ReLU激活函数应用于前四个卷积层。批量归一化(BN)也被级联以防止梯度消失。为了充分利用以前的功能,在生成器中引入了密集连接。通过密集连接,可以加强不同层中的特征传播,从而有效地将空间细节注入HRMS图像。
Spatial Discriminator
在ZeRGAN的架构中,鉴别器{D1,D2,.,DL }被设计为由于SSF的引入而间接地区分HR MS图像中的空间信息。SSF被建模为
其中 H b H^b Hbl是Hl的第b个频带,并且ωb是固定的光谱响应权重。经由SSF从MS图像Hl-1产生中间PAN图像~P 1。
为了有效地捕获真实的和中间PAN图像的分布之间的差异,构造完全卷积网络,其结构在图4中示出。卷积Dl由五个卷积层组成,其中前四层中的每一层都包含n个大小为3 × 3的内核。最后一个卷积层只包含一个大小为3 × 3的滤波器。此外,前四个卷积层与BN和Leaky ReLU连接。完全卷积设置用于有效地对图像中的空间细节进行建模。在所提出的方法中,所有不同尺度的所有鉴别器共享相同的架构。
Nonreference Loss Function
在ZeRGAN中,多尺度生成器和鉴别器是通过无监督训练过程依次学习的。在所提出的方法中,生成的HR MS图像不仅要欺骗鉴别器,而且要满足与源图像的退化关系和其他约束。因此,我们在生成器上施加额外的损失以实现有效的学习。考虑以下损失来训练所提出的模型。
Spatial and Spectral Reconstruction Losses: 通常,LR MS和PAN图像分别被视为HR MS图像的空间和光谱退化结果。具体地,尺度l的空间和光谱观测模型被定义为:
滤波器是钟形的,可以近似为高斯滤波器[46]。n1和n2是加性噪声。因此,空间和光谱退化损失可以公式化为:
其中α和β是正则化参数。(7)中的两个约束分别是空间保真度项和光谱保真度项。然后, L l L^{l} Llsr可以保留空间和光谱信息,并在这两项之间进行折衷,由α和β值进行调整。
1) Spatial Enhancement Loss: 对于不同波段的MS图像,由于其光谱响应,边缘或纹理有明显的差异。使用相同的空间增强策略将导致不同频带上的伪影。在所提出的方法中,假设Hl中的高频信息遵循与(6)相同的谱退化关系,其类似地表示为
其中▽梯度算子用于高频信息提取。然后,可以通过以下方式实现空间增强:
2) Average Constancy Loss: 受[47]中的颜色恒定性损失的启发,我们提出了平均恒定性损失来保留HR MS图像中的光谱信息。假设LR MS图像中的谱带的平均值应相应地等于HR MS图像中的谱带的平均值。通过这一假设,LR MS图像的波段之间的关系可以继承到HR MS图像的波段之间的关系。然后,平均恒定性损失被建模为
3) Adversarial Loss: 在所提出的方法中,利用从Hl生成的中间PAN图像~ Pl来欺骗鉴别器Dl。为了保证训练的稳定性,该方法考虑了WGAN-GP损失
将上述所有损失合并在一起,第l级的总损失总结为:
相关文章:

【零参考GAN:Pansharpening】
ZeRGAN: Zero-Reference GAN for Fusion of Multispectral and Panchromatic Images (用于多光谱和全色图像融合的零参考GAN) 本文提出了一种融合低空间分辨率多光谱(LR MS)和高空间分辨率全色(PAN)图像的新的全色锐化方法–零参考生成对抗网络(ZeRGAN…...

Nacos 注册中心介绍与实操
前言 本文为个人SpringCloud学习笔记,主要记录Nacos的注册中心实操、SpringBoot多模块编程实操等 注册中心 注册中心介绍 注册中心是微服务的一个重要组件,用于实现服务的注册与发现,主要作用包括以下: 服务注册:…...

基于51单片机的智能手机充电器设计
**单片机设计介绍,1660【毕设课设】基于51单片机和MAX1898的智能手机充电器设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 51单片机智能手机充电器设计介绍 51单片机智能手机充电器是一种可以实现智能快速充电的…...
nginx 和gateway配置实现动静分离和反向代理
这两个配置文件分别是Nginx和Spring Cloud Gateway的配置文件,它们用于构建网关服务,进行请求的路由和转发。 前端发送请求的时候为了不暴露服务器地址,所以会使用nginx做反向代理的一个主要作用是隐藏后端服务器的真实地址,从而增加网络安全…...

【深度学习实验】网络优化与正则化(二):基于自适应学习率的优化算法详解:Adagrad、Adadelta、RMSprop
文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 随机梯度下降SGD算法a. PyTorch中的SGD优化器b. 使用SGD优化器的前馈神经网络 2.随机梯度下降的改进方法a. 学习率调整b. 梯度估计修正 3. 梯度估计修正:动量法Momen…...

系统韧性研究(3)| 工程系统韧性要求
从最基本的层面上说,系统韧性指的是系统在逆境中继续执行其任务的程度。虽然对操作连续性至关重要,但系统的服务(能力)只是系统继续执行其任务所必须保护的一些资产。该系统必须检测不利因素,对其作出反应,…...

.net 5 发布后swagger页面不显示问题
1:项目右键属性-》生成xml--用于swagger文件读取 2:开启文件配饰swagger读取指定文件...

Spring Boot 3 整合 xxl-job 实现分布式定时任务调度,结合 Docker 容器化部署(图文指南)
目录 前言初始化数据库Docker 部署 xxl-job下载镜像创建容器并运行访问调度中心 SpringBoot 整合 xxl-jobpom.xmlapplication.ymlXxlJobConfig.java执行器注册查看 定时任务测试添加测试任务配置定时任务测试结果 结语附录xxl-job 官方文档xxl-job 源码测试项目源码 前言 xxl-…...

1985-2020年我国30m土地利用覆盖数据介绍
土地覆盖(LC)决定了地球各圈层之间的能量交换、水和碳循环。准确的 LC 信息是环境和气候研究的基本参数。考虑到在过去几十年中,随着经济建设的发展,中国发生了巨大的变化,连续和精细的 LC 监测是迫切需要的。然而,目前࿰…...

Django 社区志愿者管理系统
摘 要 随着社会的发展,社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 社区志愿者服务管理系统,主要的模块包括查看首页、个人中心、通知公告管理、志愿者管理、普通管理员管理、志愿活动管理、活动宣…...
wordpress如何修改数据库里用户ID下一个自增值的开始数字
有时候我们为了让别人认为网站有很多注册用户,会想把网站用户ID的起始数改大一点,因为WP默认的用户ID是从1开始,注册一个就加1,这样别人就很容易知道网站的用户量。 那么如何改呢?首先进phpmyadmin,找到wp…...
利用chatgpt大语言模型来做数据预处理
数据预处理是机器学习中的一个重要步骤,包括数据清洗、数据转换、特征选择等。这些步骤通常需要人工进行,或者使用专门的数据预处理工具和库,如Python的Pandas库、Scikit-learn库等。 今天我们将利用chatgpt(国内版本-小策智能问答)的辅助帮…...

【机器学习】五、贝叶斯分类
我想说:“任何事件都是条件概率。”为什么呢?因为我认为,任何事件的发生都不是完全偶然的,它都会以其他事件的发生为基础。换句话说,条件概率就是在其他事件发生的基础上,某事件发生的概率。 条件概率是朴…...
k8s 资源管理方式
k8s中资源管理方式可以划分为下面的几种:命令式对象管理、命令式对象配置、声明式对象配置。 命令式对象管理 命令式对象管理:直接使用命令的方式来操作k8s资源, 这种方式操作简单,但是无法审计和追踪。 kubectl run nginx-pod --imagengi…...

Golang Gin 接口返回 Excel 文件
文章目录 1.Web 页面导出数据到文件由后台实现还是前端实现?2.Golang Excel 库选型3.后台实现示例4.xlsx 库的问题5.小结参考文献 1.Web 页面导出数据到文件由后台实现还是前端实现? Web 页面导出表数据到 Excel(或其他格式)可以…...

实战之巧用header头
案例: 遇到过三次 一次是更改accept,获取到tomcat的绝对路径,结合其他漏洞获取到shell。 一次是更改accept,越权获取到管理员的MD5加密,最后接管超管权限。 一次是更改accept,结合参数获取到key。 这里以越…...
[AUTOSAR][诊断管理][ECU][$36] 数据传输
文章目录 一、简介二、服务请求报文定义三、服务请求报文中参数定义(1)blockSequenceCounter(2)transferRequestParameterRecord三、肯定响应(1)blockSequenceCounter(2)transferResponseParameterRecord四、支持的NRC五、示例代码36_transfer_data.c一、简介 这个服务…...

sw 怎么装新版本
我们在安装solidworks时,有时候会提示A newer version of this applic ation is already installed. Installation stopped.如下图所示 这时候需要点继续安装 然后会出现下图所示情况,vba7.1安装未成功 这是因为我们电脑中以前安装过更高版本的solidw…...

正点原子嵌入式linux驱动开发——Linux 音频驱动
音频是最常用到的功能,音频也是linux和安卓的重点应用场合。STM32MP1带有SAI接口,正点原子的STM32MP1开发板通过此接口外接了一个CS42L51音频DAC芯片,本章就来学习一下如何使能CS42L51驱动,并且CS42L51通过芯片来完成音乐播放与录…...
conda相关的命令操作
准备切换conda环境 cd C:\ProgramData\Anaconda3\Scripts查看所有环境 conda info --envs选择环境 activate pytorch安装torch pip install D:\installPackage\torch-1.2.0-cp36-cp36m-win_amd64.whl安装torchvision pip install D:\installPackage\torchvision-0.4.0-cp3…...

2025软件供应链安全最佳实践︱证券DevSecOps下供应链与开源治理实践
项目背景:近年来,云计算、AI人工智能、大数据等信息技术的不断发展、各行各业的信息电子化的步伐不断加快、信息化的水平不断提高,网络安全的风险不断累积,金融证券行业面临着越来越多的威胁挑战。特别是近年以来,开源…...

Qt/C++学习系列之Excel使用记录
Qt/C学习系列之Excel使用记录 前言The process was ended forcefully.解决方式断点查语句问题 总结 前言 在项目中解析条目达50多条,并且都需要将对应的结果进行显示。为了将结果显示的更加清晰,考虑采用QTableWidget进行表格设置,而在使用过…...

(LeetCode 每日一题)3170. 删除星号以后字典序最小的字符串(贪心+栈)
题目:3170. 删除星号以后字典序最小的字符串 思路:贪心栈,时间复杂度0(n)。 对于每一个‘ * ’,优先选最右边的最小字符,才会使最终得到的字符串最小。 用栈,来记录每个字符的位置下标。细节看注释。 C版本…...

如何查看自己电脑安装的Java——JDK
开始->运行->然后输入cmd进入dos界面 (快捷键windows->输入cmd) 输入java -version,回车 出现了一下信息就是安装了jdk 输入java -verbose,回车 查看安装目录...
宝塔面板安装nodejs后,通过node -v获取不到版本号,报错node: command not found
如果在 宝塔面板 安装了 Node.js,但运行 node -v 或 npm -v 时提示 command not found,通常是因为 Node.js 的路径未正确添加到系统环境变量。以下是解决方法: 1. 确认 Node.js 是否安装成功 (1)检查宝塔面板的 Node.…...

chili3d 笔记17 c++ 编译hlr 带隐藏线工程图
这个要注册不然emscripten编译不起来 --------------- 行不通 ---------------- 结构体 using LineSegment std::pair<gp_Pnt, gp_Pnt>;using LineSegmentList std::vector<LineSegment>; EMSCRIPTEN_BINDINGS(Shape_Projection) {value_object<LineSegment&g…...
结构体和指针1
#include <iostream> using namespace std; #include <string> struct Student{ int age; string name; double score; }; int main() { //静态分配 Student s1 {18,"小明",88.5}; //cout << s1.name<<"的成绩为…...

【WPF】WPF 项目实战:用ObservableCollection构建一个可增删、排序的管理界面(含源码)
💡WPF 项目实战:构建一个可增删、排序的光源类型管理界面(含源码) 在实际的图像处理项目中,我们经常需要对“光源类型”进行筛选或管理。今天我们来一步步构建一个实用的 WPF 界面,实现以下功能࿱…...

【办公类-104-01】20250606通义万相50分一天用完,通义万相2.1专业版测试
背景需求: 昨天打开通义万相,发现分数降低到3位数,原来时1500.仔细看,原来每天的50分,只有1天有效期了。 用掉试试,用的是之前的30天积分,还是今天的1天积分 纯白色背景,卡通简笔画…...
Prompt Engineering Notes
TOC LLM output configurationOutput length LLM output configuration Output length 仅仅起到截断作用,不会让模型的输出更简洁。...