【零参考GAN:Pansharpening】
ZeRGAN: Zero-Reference GAN for Fusion of Multispectral and Panchromatic Images
(用于多光谱和全色图像融合的零参考GAN)
本文提出了一种融合低空间分辨率多光谱(LR MS)和高空间分辨率全色(PAN)图像的新的全色锐化方法–零参考生成对抗网络(ZeRGAN)。在该方法中,零参考表示它不需要使用成对的缩小尺度图像或未成对的全尺度图像进行训练。为了得到准确的融合结果,我们在一组多尺度生成器和它们对应的鉴别器之间建立了一个对抗性博弈。通过多尺度生成器,融合的高空间分辨率MS(HRMS)图像逐步从LR MS和PAN图像产生,而鉴别器的目的是区分HRMS图像和PAN图像之间的空间信息的差异。换句话说,在优化ZeRGAN之后,从LR MS和PAN图像生成HR MS图像。此外,我们构建了一个非参考损失函数,包括对抗性损失,空间和光谱重建损失,空间增强损失和平均恒定性损失。通过最小化总损失,可以有效地增强HRMS图像中的空间细节。在不同卫星采集的数据集上进行了大量的实验。
INTRODUCTION
近年来,不同的地球观测卫星,如QuickBird,GeoEye-1和WorldView-2收集了大量的遥感图像。这些卫星可以同时获取低空间分辨率多光谱图像和全色图像。目前,所捕获的图像已广泛且成功地用于目标发现、土地覆盖分析和环境监测。然而,由于空间和光谱分辨率之间的固有权衡,难以获得上述卫星的高空间和光谱分辨率MS(HR MS)图像。一方面,LR MS图像包含丰富的光谱信息,但空间分辨率低于PAN图像。另一方面,PAN图像仅由一个高空间分辨率带组成。因此,通过将LR MS图像中的光谱信息与PAN图像中的空间细节整合在一起,应用图像融合(也称为泛锐化)来产生融合的HR MS图像。
在过去的二十年中,已经提出并开发了各种算法来科普全色锐化任务。它们可以分为四种类型:1)组分替代(CS)方法; 2)多分辨率分析(MRA)方法; 3)基于退化模型(DM)的方法;以及4)基于深度神经网络(DNN)的方法。CS方法因其原理简单、实现速度快而得到了广泛的应用。他们将插值的LR MS图像投影到一个新的域中以估计合适的空间分量。然后用PAN图像代替空间分量,并通过相应的逆投影生成融合的HR MS图像。例如,在这种情况下使用的典型变换是强度-色调-饱和度(IHS)变换、主成分分析(PCA)和Gram-Schmidt(GS)变换。此外,提出了频带相关空间细节(BDSD)算法,以更准确地估计增益参数。然而,由于在图像之间考虑了全局变换,因此在融合结果中产生了显著的光谱失真。
基于MRA的方法假设要添加到LR MS图像中的空间信息是从PAN图像中获取的,这被称为结构注入空间分辨率改善(ARSIS)。在这些方法中,空间细节的提取和注入增益的计算对融合结果有重要影响。通过许多MRA工具提取空间细节,例如contourlet和广义拉普拉斯金字塔。Otazu等人提出了一种加性小波亮度比例(AWLP)方法来估计PAN图像中的高频分量。由于只有PAN图像的空间细节被注入到LR MS图像中,因此基于MRA的融合结果在光谱保真度方面具有良好的性能。
基于DM的方法假设所观察到的LR MS和PAN图像分别是空间域和谱域中的HR MS图像的退化版本。例如,Li和Yang通过将空间和光谱DM视为测量矩阵,将图像融合任务重新表述为压缩感知问题。此外,融合模型通过其他有效先验进行正则化,例如稀疏性,非负性和低秩先验。虽然这些方法在空间和光谱信息保持方面表现良好,但它们的计算复杂度远高于前两类方法。
如今,DNN已经在各个领域取得了巨大的成功,还被用于全息锐化。例如,Huang等人采用堆叠式改进稀疏去噪自动编码器进行全息锐化。Masi等人受文献[24]中超分辨率模型的启发,提出了一种基于卷积神经网络(CNN)的全息锐化方法–PNN。在[25]中,PANet是通过将特定问题的先验与残差网络(ResNet)相结合而建立的。该算法能较好地保持融合图像的光谱和空间保持性。随后,Fu等人引入了分组多尺度扩张网络,以提高空间信息的多尺度表示能力。Zhang等人提出了一种双向金字塔网络,将PAN图像中的空间细节逐层注入LR MS图像中。在[29]中,在分组贴片上构建了堆叠稀疏自动编码器。根据这些补丁的几何结构,他们被分类,然后送入自动编码器。此外,生成对抗网络(GAN)也被用于融合LR MS和PAN图像。例如,Liu等人首先利用GAN生成融合图像,然后在[32]中扩展。然后,Ma等人采用两个鉴别器来保持融合图像中的空间和光谱信息,这可以避免在训练期间需要HR MS图像。此外,在MDSSC-GAN中使用了生物多样性框架。在这种方法中,第一个滤波器由图像的亮度和近红外波段馈送,而第二个滤波器的输入是光谱分量的级联。在[35]中,提出了一种基于无监督GAN的方法,包括监督预训练和无监督微调。然而,基于DNN的泛锐化方法可能倾向于过拟合成对的训练数据。因此,当分析由其他卫星获得的新数据时,泛化能力降低。此外,需要考虑与训练数据有关的两个问题。一方面,大多数基于DNN的泛锐化方法通常使用成对图像进行训练,如图1(a)所示。但是,HR MS图像在真实的场景中不可用。因此,成对图像由空间退化后的LR MS和PAN图像的缩小比例版本组成。因此,原始LR MS图像直接被视为参考数据。然而,在全尺寸图像的空间细节不能有效地从缩小规模的图像对学习。另一方面,一些基于GAN的泛锐化方法被提出用于全尺度图像的显式训练,其中包含原始尺度的LR MS和PAN图像。它们也被称为未配对图像,如图1(b)所示。然而,这些网络需要重复训练,以获得理想的结果,因为不同的卫星图像之间的不同分布。此外,它们需要大量的训练数据。
基于这两个方面,本文提出了一种基于GAN的零参考GAN(ZeRGAN)方法,用于由PAN图像锐化LR MS图像。如图1(c)所示,ZeRGAN不需要任何成对的缩小比例图像或未成对的全比例图像进行训练。因此,在对该方法的损失函数进行优化后,可以直接由多尺度发生器得到融合图像。特别是,我们采用了一组级联的多尺度生成器,逐步增加MS图像中的空间信息,同时保留光谱信息。在每个尺度上,残差学习被嵌入到生成器中,以改善中间HR MS图像中的空间细节。同时,在相同的尺度下,相应的缩放被用来进一步区分中间和真实的PAN图像中的空间信息。通过光谱响应滤波(SSF),从中间HR MS图像生成中间PAN图像。此外,为了确保零参考训练的融合性能,我们设计了一个无监督损失函数,其中包含对抗损失,空间和光谱重建损失,空间增强损失和平均恒定性损失,用于在每个尺度上优化生成器和滤波器。实验结果表明,即使没有任何训练集,ZeRGAN仍然具有竞争力的性能相比,依赖于配对或不配对的图像进行训练的方法。
贡献
1)ZeRGAN不需要任何训练数据。通过优化GAN并结合空间和光谱DM,实现了LR MS和PAN图像的融合。一个多尺度生成器架构被用来增强空间细节的LR MS图像协作。
2)一个任务驱动的非参考损失函数制定了一个有效的措施,融合图像中的空间和光谱信息,这减轻了大量的训练数据的需要。
3)对于光谱保存,我们引入了一个新的损失项,平均恒定性损失,它假设LR MS图像中的频带的平均值应相应地等于HR MS图像中的频带。
GENERATIVE ADVERSARIAL NETWORKS
自从GAN由Goodfellow等人提出以来由于其强大的生成能力,在图像处理和图像合成等各个领域的性能都有了显着的提高。GAN主要通过最小-最大对抗游戏学习生成器G和BND。生成器G可以学习数据分布,并创建真实的样本来欺骗CMDD。相反地,CNOD的目的是分类样本是由生成器G合成的还是来自真实的数据。然后,上述两个玩家的游戏可以在数学上表示为:
然而,原始GAN遭受训练不稳定性。然后,提出了深度卷积GAN(DCGAN)来稳定GAN的训练,其中生成器和卷积神经网络都由CNN组成。Mao等人在最小二乘损失的约束下,惩罚假样本的分布更接近真实的数据的分布。Wasserstein GAN(WGAN)采用具有更好理论特性的Wasserstein距离来衡量真实的和虚假数据之间的差异。然而,WGAN的收敛是缓慢的,有时不稳定。因此,Gulrajani等人提出了WGAN-GP损失并引入梯度惩罚来直接保证Lipschitz条件,其目标函数为
PROPOSED METHOD
ZeRGAN的框架如图2所示,其中生成器和鉴别器分别主要负责注入和区分HR MS图像中的真实空间信息。更具体地说,一系列的生成器被设计为增强在不同尺度的中间HR MS图像的空间细节,同时保留光谱信息。此外,在每个尺度上的缩放还负责中间PAN图像和真实的PAN图像中的空间信息的一致性。通过SSF从中间HR MS图像产生中间PAN图像。此外,通过以不同比率下采样原始PAN图像来合成对应于不同尺度的真实的PAN图像。此外,一个无监督的损失来自空间光谱模型和先验知识,使零参考训练成为可能。虽然已经提出了许多基于GAN的泛锐化方法,例如PSGAN和MDSSC-GAN,但这些方法需要大量的成对图像进行训练。所提出的ZeRGAN不需要任何配对或未配对的数据,这消除了训练数据的问题。此外,现有的基于GAN的方法通常使用单个生成器来合成融合结果。ZeRGAN提出了由多个生成器组成的多尺度框架,从粗到细生成融合图像,以提高融合效果。
Multiscale Generator
多尺度发生器由L个级联的生成器组成,其中生成器Gl在尺度l处的输出是Hl ∈ R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,生成器Gl+1在尺度l + 1处的输入。M × N × B是原始LR MS图像H0的大小。rl是H0和H1之间的空间分辨率比。因此,我们可以将LR MS图像在不同尺度下的连续增强写为:
其中Hl-1和Pl都被馈送到发生器Gl。通过下采样从原始PAN图像生成Pl。注意,Pl的大小与Hl的大小一致。然后,期望的HR MS图像是HL ∈ R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,即GL在尺度L下的输出。通常,在全色锐化任务中rL等于4。
不同规模的生成器的架构如图3所示。对于生成器的输入,我们首先通过双三次算子将MS图像Hl-1直接上采样到真实的PAN图像P1的大小。然后,将上采样的MS图像与PAN图像连接在一起作为生成器的输入。生成器由五个卷积层组成。过滤器大小为3 × 3,步长为1。对于前四个卷积层,滤波器的数量设置为n。在最后一个卷积层中使用了四个滤波器。Leaky ReLU激活函数应用于前四个卷积层。批量归一化(BN)也被级联以防止梯度消失。为了充分利用以前的功能,在生成器中引入了密集连接。通过密集连接,可以加强不同层中的特征传播,从而有效地将空间细节注入HRMS图像。
Spatial Discriminator
在ZeRGAN的架构中,鉴别器{D1,D2,.,DL }被设计为由于SSF的引入而间接地区分HR MS图像中的空间信息。SSF被建模为
其中 H b H^b Hbl是Hl的第b个频带,并且ωb是固定的光谱响应权重。经由SSF从MS图像Hl-1产生中间PAN图像~P 1。
为了有效地捕获真实的和中间PAN图像的分布之间的差异,构造完全卷积网络,其结构在图4中示出。卷积Dl由五个卷积层组成,其中前四层中的每一层都包含n个大小为3 × 3的内核。最后一个卷积层只包含一个大小为3 × 3的滤波器。此外,前四个卷积层与BN和Leaky ReLU连接。完全卷积设置用于有效地对图像中的空间细节进行建模。在所提出的方法中,所有不同尺度的所有鉴别器共享相同的架构。
Nonreference Loss Function
在ZeRGAN中,多尺度生成器和鉴别器是通过无监督训练过程依次学习的。在所提出的方法中,生成的HR MS图像不仅要欺骗鉴别器,而且要满足与源图像的退化关系和其他约束。因此,我们在生成器上施加额外的损失以实现有效的学习。考虑以下损失来训练所提出的模型。
Spatial and Spectral Reconstruction Losses: 通常,LR MS和PAN图像分别被视为HR MS图像的空间和光谱退化结果。具体地,尺度l的空间和光谱观测模型被定义为:
滤波器是钟形的,可以近似为高斯滤波器[46]。n1和n2是加性噪声。因此,空间和光谱退化损失可以公式化为:
其中α和β是正则化参数。(7)中的两个约束分别是空间保真度项和光谱保真度项。然后, L l L^{l} Llsr可以保留空间和光谱信息,并在这两项之间进行折衷,由α和β值进行调整。
1) Spatial Enhancement Loss: 对于不同波段的MS图像,由于其光谱响应,边缘或纹理有明显的差异。使用相同的空间增强策略将导致不同频带上的伪影。在所提出的方法中,假设Hl中的高频信息遵循与(6)相同的谱退化关系,其类似地表示为
其中▽梯度算子用于高频信息提取。然后,可以通过以下方式实现空间增强:
2) Average Constancy Loss: 受[47]中的颜色恒定性损失的启发,我们提出了平均恒定性损失来保留HR MS图像中的光谱信息。假设LR MS图像中的谱带的平均值应相应地等于HR MS图像中的谱带的平均值。通过这一假设,LR MS图像的波段之间的关系可以继承到HR MS图像的波段之间的关系。然后,平均恒定性损失被建模为
3) Adversarial Loss: 在所提出的方法中,利用从Hl生成的中间PAN图像~ Pl来欺骗鉴别器Dl。为了保证训练的稳定性,该方法考虑了WGAN-GP损失
将上述所有损失合并在一起,第l级的总损失总结为:
相关文章:

【零参考GAN:Pansharpening】
ZeRGAN: Zero-Reference GAN for Fusion of Multispectral and Panchromatic Images (用于多光谱和全色图像融合的零参考GAN) 本文提出了一种融合低空间分辨率多光谱(LR MS)和高空间分辨率全色(PAN)图像的新的全色锐化方法–零参考生成对抗网络(ZeRGAN…...

Nacos 注册中心介绍与实操
前言 本文为个人SpringCloud学习笔记,主要记录Nacos的注册中心实操、SpringBoot多模块编程实操等 注册中心 注册中心介绍 注册中心是微服务的一个重要组件,用于实现服务的注册与发现,主要作用包括以下: 服务注册:…...

基于51单片机的智能手机充电器设计
**单片机设计介绍,1660【毕设课设】基于51单片机和MAX1898的智能手机充电器设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 51单片机智能手机充电器设计介绍 51单片机智能手机充电器是一种可以实现智能快速充电的…...
nginx 和gateway配置实现动静分离和反向代理
这两个配置文件分别是Nginx和Spring Cloud Gateway的配置文件,它们用于构建网关服务,进行请求的路由和转发。 前端发送请求的时候为了不暴露服务器地址,所以会使用nginx做反向代理的一个主要作用是隐藏后端服务器的真实地址,从而增加网络安全…...

【深度学习实验】网络优化与正则化(二):基于自适应学习率的优化算法详解:Adagrad、Adadelta、RMSprop
文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 随机梯度下降SGD算法a. PyTorch中的SGD优化器b. 使用SGD优化器的前馈神经网络 2.随机梯度下降的改进方法a. 学习率调整b. 梯度估计修正 3. 梯度估计修正:动量法Momen…...

系统韧性研究(3)| 工程系统韧性要求
从最基本的层面上说,系统韧性指的是系统在逆境中继续执行其任务的程度。虽然对操作连续性至关重要,但系统的服务(能力)只是系统继续执行其任务所必须保护的一些资产。该系统必须检测不利因素,对其作出反应,…...

.net 5 发布后swagger页面不显示问题
1:项目右键属性-》生成xml--用于swagger文件读取 2:开启文件配饰swagger读取指定文件...

Spring Boot 3 整合 xxl-job 实现分布式定时任务调度,结合 Docker 容器化部署(图文指南)
目录 前言初始化数据库Docker 部署 xxl-job下载镜像创建容器并运行访问调度中心 SpringBoot 整合 xxl-jobpom.xmlapplication.ymlXxlJobConfig.java执行器注册查看 定时任务测试添加测试任务配置定时任务测试结果 结语附录xxl-job 官方文档xxl-job 源码测试项目源码 前言 xxl-…...

1985-2020年我国30m土地利用覆盖数据介绍
土地覆盖(LC)决定了地球各圈层之间的能量交换、水和碳循环。准确的 LC 信息是环境和气候研究的基本参数。考虑到在过去几十年中,随着经济建设的发展,中国发生了巨大的变化,连续和精细的 LC 监测是迫切需要的。然而,目前࿰…...

Django 社区志愿者管理系统
摘 要 随着社会的发展,社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 社区志愿者服务管理系统,主要的模块包括查看首页、个人中心、通知公告管理、志愿者管理、普通管理员管理、志愿活动管理、活动宣…...
wordpress如何修改数据库里用户ID下一个自增值的开始数字
有时候我们为了让别人认为网站有很多注册用户,会想把网站用户ID的起始数改大一点,因为WP默认的用户ID是从1开始,注册一个就加1,这样别人就很容易知道网站的用户量。 那么如何改呢?首先进phpmyadmin,找到wp…...
利用chatgpt大语言模型来做数据预处理
数据预处理是机器学习中的一个重要步骤,包括数据清洗、数据转换、特征选择等。这些步骤通常需要人工进行,或者使用专门的数据预处理工具和库,如Python的Pandas库、Scikit-learn库等。 今天我们将利用chatgpt(国内版本-小策智能问答)的辅助帮…...

【机器学习】五、贝叶斯分类
我想说:“任何事件都是条件概率。”为什么呢?因为我认为,任何事件的发生都不是完全偶然的,它都会以其他事件的发生为基础。换句话说,条件概率就是在其他事件发生的基础上,某事件发生的概率。 条件概率是朴…...
k8s 资源管理方式
k8s中资源管理方式可以划分为下面的几种:命令式对象管理、命令式对象配置、声明式对象配置。 命令式对象管理 命令式对象管理:直接使用命令的方式来操作k8s资源, 这种方式操作简单,但是无法审计和追踪。 kubectl run nginx-pod --imagengi…...

Golang Gin 接口返回 Excel 文件
文章目录 1.Web 页面导出数据到文件由后台实现还是前端实现?2.Golang Excel 库选型3.后台实现示例4.xlsx 库的问题5.小结参考文献 1.Web 页面导出数据到文件由后台实现还是前端实现? Web 页面导出表数据到 Excel(或其他格式)可以…...

实战之巧用header头
案例: 遇到过三次 一次是更改accept,获取到tomcat的绝对路径,结合其他漏洞获取到shell。 一次是更改accept,越权获取到管理员的MD5加密,最后接管超管权限。 一次是更改accept,结合参数获取到key。 这里以越…...
[AUTOSAR][诊断管理][ECU][$36] 数据传输
文章目录 一、简介二、服务请求报文定义三、服务请求报文中参数定义(1)blockSequenceCounter(2)transferRequestParameterRecord三、肯定响应(1)blockSequenceCounter(2)transferResponseParameterRecord四、支持的NRC五、示例代码36_transfer_data.c一、简介 这个服务…...

sw 怎么装新版本
我们在安装solidworks时,有时候会提示A newer version of this applic ation is already installed. Installation stopped.如下图所示 这时候需要点继续安装 然后会出现下图所示情况,vba7.1安装未成功 这是因为我们电脑中以前安装过更高版本的solidw…...

正点原子嵌入式linux驱动开发——Linux 音频驱动
音频是最常用到的功能,音频也是linux和安卓的重点应用场合。STM32MP1带有SAI接口,正点原子的STM32MP1开发板通过此接口外接了一个CS42L51音频DAC芯片,本章就来学习一下如何使能CS42L51驱动,并且CS42L51通过芯片来完成音乐播放与录…...
conda相关的命令操作
准备切换conda环境 cd C:\ProgramData\Anaconda3\Scripts查看所有环境 conda info --envs选择环境 activate pytorch安装torch pip install D:\installPackage\torch-1.2.0-cp36-cp36m-win_amd64.whl安装torchvision pip install D:\installPackage\torchvision-0.4.0-cp3…...
uniapp 对接腾讯云IM群组成员管理(增删改查)
UniApp 实战:腾讯云IM群组成员管理(增删改查) 一、前言 在社交类App开发中,群组成员管理是核心功能之一。本文将基于UniApp框架,结合腾讯云IM SDK,详细讲解如何实现群组成员的增删改查全流程。 权限校验…...

CMake基础:构建流程详解
目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...

srs linux
下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口 默认RTMP接收推流端口是1935,SRS管理页面端口是8080,可…...

现代密码学 | 椭圆曲线密码学—附py代码
Elliptic Curve Cryptography 椭圆曲线密码学(ECC)是一种基于有限域上椭圆曲线数学特性的公钥加密技术。其核心原理涉及椭圆曲线的代数性质、离散对数问题以及有限域上的运算。 椭圆曲线密码学是多种数字签名算法的基础,例如椭圆曲线数字签…...
Spring AI与Spring Modulith核心技术解析
Spring AI核心架构解析 Spring AI(https://spring.io/projects/spring-ai)作为Spring生态中的AI集成框架,其核心设计理念是通过模块化架构降低AI应用的开发复杂度。与Python生态中的LangChain/LlamaIndex等工具类似,但特别为多语…...
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南 在数字化营销时代,邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天,我们将深入解析邮件打开率、网站可用性、页面参与时…...
2023赣州旅游投资集团
单选题 1.“不登高山,不知天之高也;不临深溪,不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...
python报错No module named ‘tensorflow.keras‘
是由于不同版本的tensorflow下的keras所在的路径不同,结合所安装的tensorflow的目录结构修改from语句即可。 原语句: from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后: from tensorflow.python.keras.lay…...

C++:多态机制详解
目录 一. 多态的概念 1.静态多态(编译时多态) 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1).协变 2).析构函数的重写 5.override 和 final关键字 1&#…...