当前位置: 首页 > news >正文

读《Multi-level Wavelet-CNN for Image Restoration》

Multi-level Wavelet-CNN for Image Restoration:MWCNN

  • 摘要
  • 一. 介绍
  • 二.相关工作
  • 三.方法

摘要

存在的问题:

  • 在低级视觉任务中,对于感受野尺寸与效率之间的平衡是一个关键的问题;
  • 普通卷积网络通常以牺牲计算成本去扩大感受野;

解决办法:

  • 使用膨胀卷积代理普通卷积方式,以此扩大感受野;此方式缺点:其使用棋盘模式对输入图像进行稀疏采样,导致处理结果会存在网格效应;

本文提出的方法MWCNN:

  • 在改进的U-Net架构之上,引入小波变换去减少压缩子网络中的特征尺寸;
  • 使用一个单独的卷积层去减少特征的通道数目;
  • 在扩大子网络中使用小波逆变换重构高分辨率特征;

效果:

  • 可应用于许多图像恢复任务,比如去噪、单一图像超分辨任务等;
  • 可将MWCNN视为膨胀滤波和子采样的泛化形式;

原文链接:《Multi-level Wavelet-CNN for Image Restoration》

一. 介绍

图像恢复:

  • 目的是从质量退化的图像y中恢复出干净图像x;
  • 传统方法有基于先验建模和鉴别学习的,近些年卷积神经网络(CNNs)广泛应用于许多具有代表性的图像恢复任务,并展现出了优越的性能;

为什么CNN在图像恢复领域比较受欢迎?

  • 基于CNN的方法在一些图像恢复任务上的表现比传统方法好,且有很大的超越;
  • 研究表明可将现有的基于CNN的去噪器插入基于模型的优化方法,以此解决更复杂的图像恢复任务;

基于CNN进行研究:

  • 感受野越大,对于图像的空间上下文则考虑的越多,因此更大的感受野有助于提升网络性能;

  • 由于输入图像和输出图像通常需保持一样的尺寸,所以一个经典方案是使用移除池化层的全卷积网络(FCN);

  • FCN可通过加深网络或者使用尺寸更大的卷积核,以此扩大模型感受野,但显而易见的是这种方式会带来更大的计算成本消耗;

  • 使用膨胀卷积代理普通卷积方式,以此扩大感受野;此方式缺点:其使用棋盘模式对输入图像进行稀疏采样,导致处理结果会存在网格效应;

  • 在这里插入图片描述
    通常随着感受野的扩大,网络模型的性能也会随之提升,但可看出这种推论也可能存在特殊情况(FSRCNN)。所以在进行感受野增大时,需要考虑如何避免增加计算成本以及性能提升的潜在牺牲。

Multi-level Wavelet-CNN for Image Restoration:MWCNN

  • 目的:扩大感受野,对网络性能和效率之间做一个更好的平衡;
  • 采用改进的U-Net,U-Net中包含一个压缩子网络、一个扩大子网络:MWCNN采用小波变化替换压缩子网络中的池化操作;
  • DWT可逆,故可保证在下采样过程中保留所有信息;DWT可捕捉特征的所有频率信息和位置信息,故有助于保存细节纹理信息;
  • 在扩大子网络中使用小波逆变换对低分辨率特征进行上采样, 重构高分辨率特征;
  • 为了丰富特征表示以及减少计算成本,在连接同层压缩-扩大子网络的特征图时,使用元素级加法;
  • 可将MWCNN视为膨胀滤波和子采样的泛化形式,MWCNN在扩大感受野方面更有效;

本文贡献:

  1. 提出MWCNN用于扩大感受野,对网络性能和网络效率做了更好的均衡;
  2. 由于DWT良好的空间-频域定位能力,该网络可以保存更好的纹理细节信息;
  3. MWCNN在许多图像恢复任务上展现出良好的性能;

二.相关工作

  • 之前的研究比如WaveResNet、DWSR表明将DWT应用于CNN有利于CNN学习;
  • 之前的工作通常只考虑一级小波变换,而忽略了子带之间的依赖影响;
  • 本文提出的MWCNN考虑了多级小波变换,再扩大感受野的同时保证无信息损失;MWCNN可以将DWT嵌入到任何具有池化的CNN中,更有效地对空间上下文和子带之间的依赖进行建模。

三.方法

WPT VS MWCNN:

  • MWCNN受多级小波变换(WPT)的启发,引入CNN搭建;

  • WPT采用二级小波变换,MWCNN在WPT基础上引入CNN块;

  • 在每级小波变换后引入CNN块,将其分解的子带作为CNN块的输入,进而将CNN块的输出作为下一级小波变换的输入;
    MWCNN可视为WPT的通用模式,当CNN块变为一致性映射时,MWCNN则退化为WPT了; 骨干网络采用改进的U-Net:

    分解阶段使用DWT进行下采样,实现池化的功能; 重构阶段使用IWT+卷积实现重构操作;

在这里插入图片描述
网络结构:

  • CNN块为无池化的4层FCN;
  • 每次完整的卷积过程包括:卷积核为3*3的卷积层、BatchNormalization层以及ReLU层;
  • 需要注意的是,扩张子网络中最后一个卷积块的最后一个卷积过程只有卷积操作,丢弃了BatchNormalization层以及ReLU层;
  • 整个网络共涉及24个网络层,图中可看到最终MWCNN借助三级小波变换/逆变换实现下采样、上采样操作;
  • MWCNN默认采用哈尔小波进行小波变换/逆变换;

在这里插入图片描述

MWCNN对U-Net做的改进:

  • U-Net中的下采样、上采样操作分别被DWT和IWT代替;
  • MWCNN中除了第一个卷积块对特征图通道进行了增加,其他的卷积块都是减少特征图通道,以此学习压缩表示;
  • 采用元素级加法连接同层的压缩子网与扩张子网的特征图;

损失函数:
在这里插入图片描述
其中xi为真实干净图像(标签),yi为退化图像(网络输入),F(yi,θ)为网络输出,θ为网络参数。
这里我不知道他右下角这个F表示F范数还是啥意思?

DWT为啥可以实现下采样,实现池化:
以2维哈尔小波为例,有四个滤波核分别为:
在这里插入图片描述
在这里插入图片描述
以fLL为例,类似卷积操作,对应位置求和,一个大小为4*4的特征即可变为2*2,实现下采样,IWT反向操作,实现上采样,将低分辨率图像重构为高分辨率图像。

DWT为啥可以近似膨胀滤波,扩大感受野:
原文中这么描述二者的关系,我举个例子:
3*3卷积核在膨胀率为2的膨胀卷积中,可看做一个5*5的卷积核,所以在进行隔点采样,如果原始特征大小为5*5,则膨胀卷积结果为1*1;
而使用DWT先对5*5特征进行滤波会得到3*3特征,再对其进行3*3卷积即可得到1*1结果;
在这里插入图片描述
上图中的公式可按照下图的例子进行理解,区别在于作者对于特征图的下标从1开始计算,我这里是从0开始,x1为对x进行fLL滤波后的结果,其中一个像素点对应原图中的4领域像素。
在这里插入图片描述

相关文章:

读《Multi-level Wavelet-CNN for Image Restoration》

Multi-level Wavelet-CNN for Image Restoration:MWCNN摘要一. 介绍二.相关工作三.方法摘要 存在的问题: 在低级视觉任务中,对于感受野尺寸与效率之间的平衡是一个关键的问题;普通卷积网络通常以牺牲计算成本去扩大感受野&#…...

【Linux】安装DHCP服务器

1、先检测网络是否通 get dhcp.txt rpm -qa //查看软件包 rpm -qa |grep dhcp //确定是否安装 yum install dhcp //进行安装 安装完成后 查询 rpm -ql dhcp 进行配置 cd /etc/dhcp 查看是否有遗留dhcpd.conf.rpmsave 删除该文件 cp /usr/share/doc/dhcp-4.1.1/dhcpd.conf.sampl…...

功能测试转型测试开发年薪27W,又一名功能测试摆脱点点点,进了大厂

咱们直接开门见山,没错我的粉丝向我投来了喜报,从功能测试转型测试开发,进入大厂,摆脱最初级的点点点功能测试,拿到高薪,遗憾的是,这名粉丝因为个人原因没有经过指导就去面试了,否则…...

数据结构之哈希表

常见的三种哈希结构 数组set(集合)map(映射) set(集合) 集合底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率std::set红黑树有序否否O(log n)O(log n)std::multiset红黑树有序是否O(log n)O(log n)std::unordere…...

linux信号理解

linux信号:用户、系统或进程发送给目标进程的信息,以通知目标进程中某个状态的改变或是异常。 信号产生原因:软中断或者硬中断。可细分为如下几种原因: ①系统终端Terminal中输入特殊的字符来产生一个信号,比如按下&am…...

HC小区管理系统window系统安装教程

实操视频 HC小区管理系统局域网window物理机部署教程_哔哩哔哩_bilibili 一、下载安装包 百度网盘: 链接:https://pan.baidu.com/s/1XAjxtpeBjHIQUZs4M7TsRg 提取码:hchc 或者 123盘 hc-window.zip官方版下载丨最新版下载丨绿色版下…...

自动化测试工具软测界的不二之选,还不快速来了解

目录 引言: 前言: 一.龙测AI-TestOps云平台使用教程 1.如何登录龙测AI-TestOps云平台 登录方法① 登录方法② 2.龙测AI-TestOps云平台界面布局 3.龙测AI-TestOps云平台菜单功能 ①创建项目 ②应用管理 ③设备管理 ④订单 二.总结 引言&#…...

centos系统/dev/mapper/centos-root目录被占满的解决方式

最近在做虚拟机部署docker微服务时,发现磁盘内存占满,无法进行操作。open /var/lib/dpkg/info/libc6:amd64.templates: no space left on device接下来就写下我在备份虚拟机上如何解决根目录被占满的问题:1、查看虚拟机磁盘使用情况df -h可以…...

【C++】STL容器、算法的简单认识

几种模板首先认识一下函数模板、类模板、栈模板。函数模板函数模板就是一个模型&#xff0c;而模板函数是函数模板经过类型实例化的函数。如下template<class T>是一个简单的函数模板&#xff1a;template<class T> T Max(T a, T b) {return a > b ? a : b; } …...

把python开发的web服务,打包成docker镜像的方法

要将Python开发的服务打成Docker镜像&#xff0c;可以按照以下步骤操作&#xff1a;1. 创建一个Dockerfile文件&#xff0c;该文件描述了如何构建Docker镜像。例如&#xff0c;以下是一个简单的Dockerfile文件&#xff0c;用于构建一个基于Python的Web应用程序&#xff1a; FRO…...

【Linux】多线程

进程和线程进程&#xff1a;一个正在运行的程序。状态&#xff1a;就绪&#xff0c;运行&#xff0c;阻塞&#xff1b;线程是进程中的一个执行路径&#xff0c;一个进程中至少有一个主线程&#xff08;main函数&#xff09;&#xff1b;有多条执行路径为多线程。创建一个线程用…...

Qt 设置窗口背景图片的几种方法实例

1.在paintEvent事件中绘制图片 void Widget::paintEvent(QPaintEvent * ev) {QPainter painter(this);painter.drawPixmap(rect(),QPixmap(":/bg.jpg"),QRect()); } drawPixmap在Widget的整个矩形区域绘制背景图片&#xff0c;第三个参数为要绘制的图片区域&#x…...

springcloud微服务架构搭建过程

项目地址&#xff1a;源代码 仅作为学习用例使用&#xff0c;是我开发过程中的总结、实际的一部分使用方式 开发环境&#xff1a; jdk11 springboot2.7.6 springcloud2021.0.5 alibabacloud 2021.0.4.0 redis6.0 mysql8.0 一、项目搭建 wdz-api&#xff1a;存放远程服务调用相关…...

LeetCode:215. 数组中的第K个最大元素

&#x1f34e;道阻且长&#xff0c;行则将至。&#x1f353; &#x1f33b;算法&#xff0c;不如说它是一种思考方式&#x1f340;算法专栏&#xff1a; &#x1f449;&#x1f3fb;123 一、&#x1f331;215. 数组中的第K个最大元素 题目描述&#xff1a;给定整数数组nums和整…...

vue面试题(day06)

文章目录前言请谈谈WXML与标准的html的异同&#xff1f;请谈谈WXSS和CSS的异同&#xff1f;请谈谈微信小程序主要目录和文件的作用&#xff1f;请谈谈小程序的双向绑定和vue的异同&#xff1f;简单描述下微信小程序的相关文件类型&#xff1f;微信小程序有哪些传值(传递数据)方…...

22 k8s常用命令

一、k8s网络 service网络 pod网络 节点网络 》 svc、pod网络都是虚拟机网络&#xff0c;真实网络是节点网络 二、内核升级 因为coentos系统3.10存在一些bug&#xff0c;docker、kubernetes不稳定&#xff0c;建议升级到4.4版本以上 三、集群资源分类 名称空间级别&#xff1…...

基于ESP32做低功耗墨水屏时钟

基于ESP32做低功耗墨水屏时钟电子墨水屏概述ESP32实验低功耗电子时钟功能描述接线开发实验结果电子墨水屏 概述 电子墨水是一种革新信息显示的新方法和技术。和传统纸差异是电子墨水在通电时改变颜色&#xff0c;并且可以显示变化的图象&#xff0c;像计算器或手机那样的显示。…...

常见路由器开源系统(固件)简介

前段时间在折腾如何通过 SD-WAN 组网方式打通办公室和家里的异地局域网。需要用到路由器的静态路由表功能&#xff0c;但是遍历整个家用路由器市场几乎没有支持这个功能的路由器&#xff08;只有华硕 RT-AX57 有这个功能&#xff0c;但是成本超出了我的预算&#xff09;。所有就…...

HCIE-Cloud Computing LAB备考第二步:逐题攻破--第二题:FusionAccess-搭建FA实验环境之安装基础组件和初始化ITA组件

HCIE-Cloud Computing LAB备考第二步:逐题攻破–第二题:FusionAccess-思维导图+题目=建立逻辑 专业术语 名词描述备注FusionAccess华为推出的桌面云产品,是一种虚拟桌面应用,它主要通过在硬件上部署FusionAccess配套的软件基础上,虚拟化出相互隔离的桌面,用户通过瘦客户端…...

Android APP检查设备是否为平板

正文 Android APP判断设备是否为平板的三种方法&#xff1a; 通过屏幕尺寸判断。一般来说&#xff0c;平板电脑的屏幕尺寸比手机大很多&#xff0c;可以根据屏幕的长宽比和尺寸等信息来区分设备类型。通过屏幕像素密度判断。一般来说&#xff0c;平板电脑的屏幕像素密度比手机…...

测试微信模版消息推送

进入“开发接口管理”--“公众平台测试账号”&#xff0c;无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。 获取access_token: 自定义模版消息&#xff1a; 关注测试号&#xff1a;扫二维码关注测试号。 发送模版消息&#xff1a; import requests da…...

React第五十七节 Router中RouterProvider使用详解及注意事项

前言 在 React Router v6.4 中&#xff0c;RouterProvider 是一个核心组件&#xff0c;用于提供基于数据路由&#xff08;data routers&#xff09;的新型路由方案。 它替代了传统的 <BrowserRouter>&#xff0c;支持更强大的数据加载和操作功能&#xff08;如 loader 和…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

CMake 从 GitHub 下载第三方库并使用

有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...

保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama&#xff08;有网络的电脑&#xff09;2.2.3 安装Ollama&#xff08;无网络的电脑&#xff09;2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

莫兰迪高级灰总结计划简约商务通用PPT模版

莫兰迪高级灰总结计划简约商务通用PPT模版&#xff0c;莫兰迪调色板清新简约工作汇报PPT模版&#xff0c;莫兰迪时尚风极简设计PPT模版&#xff0c;大学生毕业论文答辩PPT模版&#xff0c;莫兰迪配色总结计划简约商务通用PPT模版&#xff0c;莫兰迪商务汇报PPT模版&#xff0c;…...

淘宝扭蛋机小程序系统开发:打造互动性强的购物平台

淘宝扭蛋机小程序系统的开发&#xff0c;旨在打造一个互动性强的购物平台&#xff0c;让用户在购物的同时&#xff0c;能够享受到更多的乐趣和惊喜。 淘宝扭蛋机小程序系统拥有丰富的互动功能。用户可以通过虚拟摇杆操作扭蛋机&#xff0c;实现旋转、抽拉等动作&#xff0c;增…...

mac:大模型系列测试

0 MAC 前几天经过学生优惠以及国补17K入手了mac studio,然后这两天亲自测试其模型行运用能力如何&#xff0c;是否支持微调、推理速度等能力。下面进入正文。 1 mac 与 unsloth 按照下面的进行安装以及测试&#xff0c;是可以跑通文章里面的代码。训练速度也是很快的。 注意…...