当前位置：首页 > news >正文

自监督去噪：Recorrupted-to-Recorrupted原理分析与总结

news 2026/2/11 2:46:37

文章目录

- 1. 方法原理
- - 1.1 相关研究
  - 1.2 研究思路
  - 1.3 小结
- 2. 实验结果
- 3. 总结

文章地址: https://ieeexplore.ieee.org/document/9577798/footnotes#footnotes

参考博客: https://github.com/PangTongyao/Recorrupted-to-Recorrupted-Unsupervised-Deep-Learning-for-Image-Denoising

1. 方法原理

1.1 相关研究

Noise2Noise的问题

噪声图像对不好获取
同一场景不同图像怎么对齐？

解决N2N配对问题的工作可以分为两类

数据增强方法：
- Noise2Void 和 Noise2Self使用盲点网络的方法避免过拟合（直接点到点映射）
- Noiser2Noise 和 Noise-as-Clean 是采样额外的噪声数据配对进行训练
正则化去噪的DNN：
- Stein’s Unbiased Risk Estimator（SURE）通过添加对预测结果散度的惩罚添加正则
- Deep Image Prior 使用 early-stopping 防止过拟合
- Self2Self中使用 Dropout引入不确定性估计，提高去噪的鲁棒性。

研究动机

无监督/自监督学习在实际工作、缺少干净数据的时候是非常有效的
现有的无监督方法还无法和监督学习媲美

1.2 研究思路

从可加性的高斯噪声出发，配对的噪声数据对科比表示为
$\begin{aligned} y &= x + n ~~~~ n \sim N(0,\sigma_1^2 I) \\ y' &= x + n' ~~~~ n' \sim N(0,\sigma_2^2 I) \end{aligned}$

Noise2Noise的L2损失函数需要优化
$E_{n,n'}\{ ||F_{\theta}(y) - y'||_2^2\}$

将其展开进行推导
$\begin{aligned} &E_{n,n'}\{ ||F_{\theta}(y) - y'||_2^2\} \\ &= E_{n,n'}\{ ||F_{\theta}(y) - x - n'||_2^2\} \\ &= E_{n,n'}\{ ||F_{\theta}(y) - x||_2^2 - 2(n')^T(F_{\theta}(y) -x) + (n')^Tn' \} \\ &= E_{n,n'}\{ ||F_{\theta}(y) - x||_2^2\} - 2E_{n,n'}\{ (n')^T F_{\theta}(y)\} + const \end{aligned}$

如果噪声 $n$ 和 $n^{'}$ 是独立的，那么 $E_{n,n'} \{(n')^T F_{\theta}(y)\} = 0$ ，也就是说噪声对监督学习和噪声-干净数据的监督学习可以得到相同的优化结果。现在的问题就是如何从一张噪声图片（ $y$ ）中构建出一对具有独立噪声的数据( $\widehat{y},\widetilde{y}$ )

根据假设，噪声的分布是 AWGN（additive white Gaussian noise），那么噪声服从分布 $\sim N(0,\sigma_1^2 I)$ 。现在根据下方的方法进行采样
$\widehat{y} = y + D^Tz,~~~ \widetilde{y} = y - D^{-1}z,~~~ z \sim N(0,\sigma_1^2 I)$

其中D可以是任何可逆矩阵，文章中证明了噪声样本 $\widehat{y}$ 和 $\widetilde{y}$ 相互独立，所以根据这两个样本训练的网络满足
$E_{n,z}\{||F_{\theta}(\widehat{y}) - \widetilde{y}||_2^2\} = E_{\widehat{n}} \{ ||F_{\theta}(x + \widehat{n}) - x||_2^2 \}$

其中 $\widehat{n} = n + D^Tz$

那么对于这种无结构噪声数据：
$y^k = x^k + n^k,~~~ x^k \sim X , ~~~ n^k \sim ~ N(0,\sigma^2I)$

用噪声数据对 { $(\widehat{y}^k, \widetilde{y}^k)$ }定义的损失函数为也就等价于下面这个损失函数了
$E_{x,\widehat{n}}\{ ||F_{\theta}(x + \widehat{n}) - x||_2^2\}$

对于结构化的噪声数据，可以调整噪声数据的表示形式：比如噪声的分布和干净数据相关
n服从 $N(0,\sum_x)$ 的正态分布，可以将噪声对表示为

$\widehat{y} = y + \sqrt{\sum_x}D^Tz , ~~~ \widetilde{y} = y - \sqrt{\sum_x}D^{-1}z, z \sim N(0,I)$

其中协方差差矩阵 $\sum_x$ 是正定矩阵，其满足 $\sqrt{\sum_x}^T = \sqrt{\sum_x}, ~~~ \sqrt{\sum_x}\sqrt{\sum_x} = \sum_x$

1.3 小结

从数学推导上证明了 R2R的方法和监督学习的可比性
相比其他无监督去噪方法，该方法简单且灵活，也可以直接在噪声图像上进行处理
去噪效果很好，在真实数据中也应用非常好

2. 实验结果

去除高斯噪声效果对比，R2R的效果比当前最好的 SURE 效果还要好。这里的 $\alpha I$ 和 $D^{-1} = I/\alpha$ ,其中 $\alpha = 0.5$
去除真实图片中的噪声：噪声水平函数（noisy level function）给定，噪声函数建模为 heteroscedastic signle dependent Gaussian single, 其协方差为
$\sum_x = diag(\beta_1 x + \beta_2)$
设置 $D = 2I , D^{-1} = I/2$ 。训练的结果展示R2R的效果在各种传统方法和无监督中是最好的，但是和监督学习仍然存在一定的差距。分析原因是：噪声模式和噪声水平函数的估计不准确
消融实验：比如对比不同的噪声水平的预测结果

3. 总结

优势：

相比Noise2Noise：不需要配对噪声图片，而是根据一张噪声图片加噪
相比Noiser2Noise：都是采样加噪，都需要估计噪声模式，但是本文的方法从数学上的推导更加严谨一些，同时也给定了如何加噪声的方式。
相比Noise2Void，Noise2Self：作者对比了效果，会更好（我自己还需要补一个实验证明）
这种方法可以应用到实际噪声之中，但是如何估计噪声模式是个大问题
可以处理结构噪声和无结构噪声

缺点：

需要估计噪声模式，网络会继承噪声模式估计的误差
对于不同的噪声模式，其构建噪声对的方法会有所不同；
对于不同的损失函数，这种方法是否也是需要修改？比如现在想要去除图片中的文字，那么使用L1损失函数明显是会比L2损失函数更有优势的。那么上面的推导是不是也需要相应地修改？

自监督去噪：Recorrupted-to-Recorrupted原理分析与总结

文章目录

1. 方法原理

1.1 相关研究

1.2 研究思路

1.3 小结

2. 实验结果

3. 总结

相关文章：

自监督去噪：Recorrupted-to-Recorrupted原理分析与总结

【css】css实现水平和垂直居中

常见Charles在Windows10抓包乱码问题

汽车维修保养记录查询API：实现车辆健康状况一手掌握

正则表达式学习记录（Python）

Ubuntu20.04操作系统安装Docker

python制作小程序制作流程,用python编写一个小程序

Github 创建自己的博客网站

Windows上安装 jdk 环境并配置环境变量（超详细教程）

高效构建 vivo 企业级网络流量分析系统

认识awk

【C#学习笔记】数组和索引器

常见距离计算的Python实现

开发运营监控

食品小程序的制作教程

Kubernetes(K8s)从入门到精通系列之十三：软件负载平衡选项

数据特征选择 | Matlab实现具有深度度量学习的时频特征嵌入

浅谈webpack

【 stable diffusion LORA模型训练最全最详细教程】

蓝桥杯上岸每日N题第八期 (全球变暖)！！！

【Linux】shell脚本忽略错误继续执行

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

Python爬虫实战：研究feedparser库相关技术

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍，多层嵌套定位示例

苍穹外卖--缓存菜品

力扣-35.搜索插入位置

Hive 存储格式深度解析：从 TextFile 到 ORC，如何选对数据存储方案？

C++ 设计模式《小明的奶茶加料风波》

基于Uniapp的HarmonyOS 5.0体育应用开发攻略

spring boot使用HttpServletResponse实现sse后端流式输出消息