当前位置：首页 > news >正文

DiffIR论文阅读笔记

news 2026/2/10 13:39:21

在这里插入图片描述

ICCV2023的一篇用diffusion模型做Image Restoration的论文，一作是清华的教授，还在NIPS2023上一作发表了Hierarchical Integration Diffusion Model for Realistic Image Deblurring，作者里甚至有Luc Van Gool大佬。
模型分三个部分，一个是CPEN用来提取IPR，一个是DIRformer，用来完成restoration任务，一个是denoising network，用diffusion的方式来预测IPR。分两阶段训练，第一阶段先train CPEN和DIRformer，第二阶段再train denoising network。如此看来其实思想和stable diffusion很像，就是不在图像域上diffusion，这样size太大而且step太多，而是在特征域上diffusion，本文就是在IPR上diffusion

在这里插入图片描述

方法的细节上图都有。首先CPEN是一个从输入和GT的concatenate中提取一维向量，用这个一维向量参与到用于restoration的transformer中的channel-wise调制过程。第一阶段是这个restoration network和这个CPEN的联合训练，损失是restoration结果和GT之间的L1损失。这里引进GT是为了这个向量能提取得更好一点，从而使得整个过程的PSNR更高一点。
但实际应用中我们不可能有GT来作为输入，所以第二阶段我们需要train一个diffusion model来从LQ图片中预测z。这里diffusion还是老一套，认为一阶段train好的CPEN提取的z是x0，然后加噪到xt，reverse的过程就是从xt去噪预测x0的过程。diffusion模型的输入由3部分组成，首先当然是上一步的Zt，然后是t，接着是作为条件输入的D，这个D是用一个新的CPEN从LQ中提取的，称为CPEN2，他和第一阶段的CPEN在网络结构上是一样的（除了输入层）。这个很好理解，如果没有D作为条件，那不就相当于要diffusion模型从噪声预测一个z出来，那这个z当然和input无关，所以需要额外添加一个D作为条件，这也是很多用diffusion做restoration的思路。第二阶段需要混合训练CPEN2，denoising network和restoration network，损失函数是restoration结果和GT之间的L1损失，以及diffusion预测的IPR和第一阶段的CPEN预测的IPR之间的L1损失。
感觉这个工作怪怪的，restoraion一般比较关注的去噪没有做，居然做了inpainting。选的三个任务是超分，inpainting和deblurring这三个任务。此外，这个IPR向量仅仅是通道调制，在我看来更多可能影响风格信息，用diffusion模型来预测这个IPR向量真的有必要吗？对这个工作实际效果持怀疑态度，到时候跑代码看一下。

DiffIR论文阅读笔记

ICCV2023的一篇用diffusion模型做Image Restoration的论文，一作是清华的教授，还在NIPS2023上一作发表了Hierarchical Integration Diffusion Model for Realistic Image Deblurring，作者里甚至有Luc Van Gool大佬。模型分三个部分&#xff0c…...

编程日记 2024/6/4 20:00:32

prometheus+alertmanager+webhook钉钉机器人告警

版本：centos7.9 python3.9.5 alertmanager0.25.0 prometheus2.46.0 安装alertmanager prometheus 配置webhook # 解压： tar -xvf alertmanager-0.25.0.linux-amd64.tar.gz tar -xvf prometheus-2.46.0.linux-amd64.tar.gz mv alertmanager-0.25.0.linu…...

编程日记 2024/6/4 19:59:30

ctfshow 年CTF web

除夕 Notice: Undefined index: year in /var/www/html/index.php on line 16 <?phpinclude "flag.php";$year $_GET[year];if($year2022 && $year1!2023){echo $flag; }else{highlight_file(__FILE__); } 弱比较绕过很简单，连函数都没有直…...

编程日记 2024/6/4 19:58:29

原型链、闭包、手写一个闭包函数、闭包有哪些优缺点、原型链继承

什么是原型链？ 原型链是一种查找规则为对象成员查找机制提供一个方向因为构造函数的 prototype 和其实例的 __ proto __ 都是指向原型对象的所以可以通过__proto__ 查找当前的原型对象有没有该属性, 没有就找原型的原型, 依次类推一直找到Object( null ) 为…...

编程日记 2024/6/4 19:54:25

linux中SSH_ASKPASS全局变量的作用

在工作中遇到一段代码，通过SSH_ASKPASS全局变量实现了ssh登录远程IP时的密码输入，chatgpt搜索了一下，其解释大致如下所示： SSH_ASKPASS 是一个环境变量，它在 SSH 客户端需要用户输入密码时起作用。当 SSH 客户端检测到…...

编程日记 2024/6/4 19:53:24

9 -力扣高频 SQL 50 题（基础版)

9 - 上升的温度 -- 找出与之前（昨天的）日期相比温度更高的所有日期的 id -- DATEDIFF(2007-12-31,2007-12-30); # 1 -- DATEDIFF(2010-12-30,2010-12-31); # -1select w1.id from Weather w1, Weather w2 wheredatediff(w1.recordDate,w2.recordDat…...

编程日记 2024/6/4 19:52:23

TCP的重传机制

TCP 是一个可靠的传输协议，解决了IP层的丢包、乱序、重复等问题。这其中，TCP的重传机制起到重要的作用。序列号和确认号之前我们在讲解TCP三次握手时，提到过TCP包头结构，其中有序列号和确认号， 而TCP 实现可靠传输…...

编程日记 2024/6/4 19:51:22

pg 数据库，获取时间字段值的具体小时，赋值给其他字段

目录 1 问题2 实现 1 问题 pg 数据库，有一个表，其中有2个字段一个是时间字段obstime ，一个是时次ltime字段，int 类型，现在这个表里面是obstime 里面有数据，ltime字段没有数据，现在就是批量获…...

编程日记 2024/6/4 19:50:20

做视频号小店什么类目最容易爆单？其实，弄懂这三点就会选品了

大家好，我是电商花花。我们做视频号小店做什么类目最容易爆单？ 其实任何类目都有属于自己的受众人群和客户，都非常容易爆单，我们想要爆单，就要选对类目，选对产品。视频号上所有的类目基本上可以分为标…...

编程日记 2024/6/4 19:47:16

Nginx作为下载站点

grep -Ev ^$|# /usr/local/nginx/conf/nginx.conf > /opt/nginx.txt cat /opt/nginx.txt > /usr/local/nginx/conf/nginx.conf用上面的指令提取最小化的配置文件 vim /usr/local/nginx/conf/nginx.conf [rootlocalhost ~]# cat /usr/local/nginx/conf/nginx.conf worker…...

编程日记 2024/6/4 19:46:15

vue3简单快速实现主题切换功能

⛰️个人主页: 蒾酒 🔥系列专栏：《vue3实战》目录内容概要实现步骤 1.定义不同主题的css样式变量 2.入口main.ts中引入这个样式文件 3.主题样式css变量引用 4.设置默认主题样式 5.实现点击按钮主题切换总结最近发现了一个巨牛的人工智…...

编程日记 2024/6/4 19:44:13

国联易安:网络反不正当竞争，要防患于未然

据市场监管总局官网消息，为预防和制止网络不正当竞争，维护公平竞争的市场秩序，鼓励创新，保护经营者和消费者的合法权益，促进数字经济规范健康持续发展，市场监管总局近日发布《网络反不正当竞争暂行规定》&a…...

编程日记 2024/6/4 19:43:12

Linux 网络配置 01

基本命令 1、查看网络接口信息ifconfig ifconfig：当前设备正在工作的网卡，启动的设备 ifconfig -a ：所网络设备 ifconfig信息解析： ens33: flags4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500inet 192.168.10.10 n…...

编程日记 2024/6/4 19:42:11

快速入门C++正则表达式

正则表达式（Regular Expression，简称 Regex）是一种强大的文本处理工具，广泛用于字符串的搜索、替换、分析等操作。它基于一种表达式语言，使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式不仅在…...

编程日记 2024/6/4 19:40:09

java —— 缓冲字符输入流/缓冲字符输出流

缓冲字符输入流/缓冲字符输出流是对字符输入流/字符输出流的加强，在使用中仍旧要借助于字符输入流/字符输出流才能完成实现。与字符输入流/字符输出流按照字符为单位进行输入/输出不同的是，缓冲字符输入流/缓冲字符输出流能够以行为单位进行读取和写入。…...

编程日记 2024/6/4 19:38:08

blender从视频中动作捕捉，绑定到人物模型

总共分为3个步骤： 1、从视频中捕捉动作模型小K动画网-AIGC视频动捕平台地址：https://xk.yunbovtb.com/ 需要注册生成的FBX文件，不能直接导入到blender中， 方法有2种： 第一种：需要转换一下&#x…...

编程日记 2024/6/4 19:37:06

掘金滑块验证码安全升级，继续破解

去年发过一篇文章，《使用前端技术破解掘金滑块验证码》，我很佩服掘金官方的气度，不但允许我发布这篇文章，还同步发到了官方公众号。最近发现掘金的滑块验证码升级了，也许是我那篇文章起到了一些作用，逼迫官…...

编程日记 2024/6/4 19:36:05

数据结构练习题——Java实现

20240531-时间复杂度 1、消失的数字方法一：位运算两个数字一样的数组，其中一个数组中少了一个数字，定义一个变量分别异或两个数组，结果即为缺少的数字 class Solution {public int missingNumber(int[] nums) {int xor 0;int…...

编程日记 2024/6/4 19:34:02

行为设计模式之状态模式

文章目录概述定义结构图 2.代码示例小结概述定义状态模式(state pattern)的定义: 允许一个对象在其内部状态改变时改变它的行为。对象看起来似乎修改了它的类。状态模式就是用于解决系统中复杂对象的状态转换以及不同状态下行为的封装问题.。状态模式将一个对象的状态…...

编程日记 2024/6/4 19:33:01

找回以前的视频：技术与实践3个指南

你们有没有发现现在视频已经成为我们生活中不可或缺的一部分了？不管是在工作场合做演示、在学习时看教学视频，还是在休闲娱乐时追剧看电影，视频都扮演着超级重要的角色。然而误删或手机故障的发生很可能将以前的视频清除。本文将深入探讨手…...

编程日记 2024/6/4 19:31:59

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2026/2/8 20:42:46

golang循环变量捕获问题

在 Go 语言中，当在循环中启动协程（goroutine）时，如果在协程闭包中直接引用循环变量，可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下： 问题背景看这个代码片段： fo…...

编程新知 2026/1/21 14:29:57

在四层代理中还原真实客户端ngx_stream_realip_module

一、模块原理与价值 PROXY Protocol 回溯第三方负载均衡（如 HAProxy、AWS NLB、阿里 SLB）发起上游连接时，将真实客户端 IP/Port 写入 PROXY Protocol v1/v2 头。Stream 层接收到头部后，ngx_stream_realip_module 从中提取原始信息…...

编程新知 2026/1/4 5:02:00

ETLCloud可能遇到的问题有哪些？常见坑位解析

数据集成平台ETLCloud，主要用于支持数据的抽取（Extract）、转换（Transform）和加载（Load）过程。提供了一个简洁直观的界面，以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

编程新知 2026/2/3 12:56:31

WEB3全栈开发——面试专业技能点P2智能合约开发（Solidity）

一、Solidity合约开发下面是 Solidity 合约开发的概念、代码示例及讲解，适合用作学习或写简历项目背景说明。 🧠 一、概念简介：Solidity 合约开发 Solidity 是一种专门为以太坊（Ethereum）平台编写智能合约的高级编…...

编程新知 2026/1/27 9:33:09

蓝桥杯3498 01串的熵

问题描述对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798， 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

编程新知 2026/2/6 2:05:50

论文笔记——相干体技术在裂缝预测中的应用研究

目录相关地震知识补充地震数据的认识地震几何属性相干体算法定义基本原理第一代相干体技术：基于互相关的相干体技术（Correlation）第二代相干体技术：基于相似的相干体技术（Semblance）基于多道相似的相干体…...

编程新知 2026/2/7 1:51:12

SQL Server 触发器调用存储过程实现发送 HTTP 请求

文章目录需求分析解决第 1 步：前置条件，启用 OLE 自动化方式 1：使用 SQL 实现启用 OLE 自动化方式 2：Sql Server 2005启动OLE自动化方式 3：Sql Server 2008启动OLE自动化第 2 步：创建存储过程第 3 步：创建触发器扩展 - 如何调试？第 1 步：登录 SQL Server 2008第 2 步…...

编程新知 2025/9/11 6:56:11

鸿蒙（HarmonyOS5）实现跳一跳小游戏

下面我将介绍如何使用鸿蒙的ArkUI框架，实现一个简单的跳一跳小游戏。 1. 项目结构 src/main/ets/ ├── MainAbility │ ├── pages │ │ ├── Index.ets // 主页面 │ │ └── GamePage.ets // 游戏页面 │ └── model │ …...

编程新知 2025/11/20 18:21:59

DiffIR论文阅读笔记

相关文章：

DiffIR论文阅读笔记

prometheus+alertmanager+webhook钉钉机器人告警

ctfshow 年CTF web

原型链、闭包、手写一个闭包函数、闭包有哪些优缺点、原型链继承

linux中SSH_ASKPASS全局变量的作用

9 -力扣高频 SQL 50 题（基础版)

TCP的重传机制

pg 数据库，获取时间字段值的具体小时，赋值给其他字段

做视频号小店什么类目最容易爆单？其实，弄懂这三点就会选品了

Nginx作为下载站点

vue3简单快速实现主题切换功能

国联易安:网络反不正当竞争，要防患于未然

Linux 网络配置 01

快速入门C++正则表达式

java —— 缓冲字符输入流/缓冲字符输出流

blender从视频中动作捕捉，绑定到人物模型

掘金滑块验证码安全升级，继续破解

数据结构练习题——Java实现

行为设计模式之状态模式

找回以前的视频：技术与实践3个指南

Linux 文件类型，目录与路径，文件与目录管理

golang循环变量捕获问题

在四层代理中还原真实客户端ngx_stream_realip_module

ETLCloud可能遇到的问题有哪些？常见坑位解析

WEB3全栈开发——面试专业技能点P2智能合约开发（Solidity）

蓝桥杯3498 01串的熵

论文笔记——相干体技术在裂缝预测中的应用研究

SQL Server 触发器调用存储过程实现发送 HTTP 请求

鸿蒙（HarmonyOS5）实现跳一跳小游戏

相关类相关的可视化图像总结