当前位置：首页 > article >正文

采样算法二：去噪扩散隐式模型（DDIM）采样算法详解教程

article 2026/4/2 3:16:57

参考

https://arxiv.org/pdf/2010.02502
在这里插入图片描述

一、背景与动机

去噪扩散隐式模型（DDIM） 是对DDPM的改进，旨在加速采样过程同时保持生成质量。DDPM虽然生成效果优异，但其采样需迭代数百至数千次，效率较低。DDIM通过以下关键创新解决该问题：

非马尔可夫反向过程：打破严格的马尔可夫链假设，允许跳步采样。
确定性生成路径：通过设定参数σ=0，实现确定性采样，减少随机性带来的不确定性。
兼容性：使用与DDPM相同的训练模型，无需重新训练。

二、DDIM与DDPM的核心区别

特性	DDPM	DDIM
反向过程	严格马尔可夫链	非马尔可夫，允许跳跃式采样
采样速度	慢（需完整迭代所有时间步）	快（可跳过中间步，如50步代替1000步）
随机性控制	固定方差调度（βₜ）	可调参数σₜ（σ=0时为确定性采样）
训练目标	需完整训练噪声预测模型	直接复用DDPM的预训练模型

三、数学推导与关键公式

1. 前向过程的一致性

DDIM沿用DDPM的前向扩散过程定义，任意时刻( x_t )可表示为：
$x_t = \sqrt{\bar{\alpha}_t} x_0 + \sqrt{1 - \bar{\alpha}_t} \epsilon, \quad \epsilon \sim \mathcal{N}(0, \mathbf{I})$
其中 $\bar{\alpha}_t = \prod_{i=1}^t \alpha_i$ , $\alpha_t = 1 - \beta_t$ 。

2. 反向过程的重新参数化

DDIM将反向过程定义为非马尔可夫链，允许从任意时间步( t )直接推断( x_{t-Δ} )（Δ为跳跃步长）。其核心公式为：
$x_{t-Δ} = \sqrt{\bar{\alpha}_{t-Δ}} \underbrace{\left( \frac{x_t - \sqrt{1 - \bar{\alpha}_t} \epsilon_\theta(x_t, t)}{\sqrt{\bar{\alpha}_t}} \right)}_{\text{预测的 } x_0} + \sqrt{1 - \bar{\alpha}_{t-Δ} - \sigma_t^2} \cdot \epsilon_\theta(x_t, t) + \sigma_t z$

第一项：基于当前 $x_t$ 和预测噪声 $\epsilon_\theta$ 估计的原始数据 $x_0$ 。
第二项：沿预测噪声方向的确定性更新。
第三项：可控的随机噪声项， $\sim \mathcal{N}(0, \mathbf{I})$ 。

3. 参数σₜ的作用

σₜ=0：完全确定性采样（DDIM的标准设定），生成结果唯一。
σₜ=√[(1−αₜ₋₁)/(1−αₜ)] · √(1−αₜ/αₜ₋₁)：恢复DDPM的采样过程。

四、DDIM采样算法步骤

输入：
- 预训练噪声预测模型 $\epsilon_\theta$
- 总时间步 $T$ ，子序列步数 $S$ （如 $S = 50$ ）
- 方差调度参数 $\{\alpha_t\}$
- 随机性控制参数 $\sigma_t$
生成时间步子序列：
选择递减的子序列 $\{\tau_1, \tau_2, ..., \tau_S\}$ ，例如均匀间隔或余弦调度。
初始化：采样初始噪声 $x_T \sim \mathcal{N}(0, \mathbf{I})$ 。
迭代去噪（从 $\tau_S$ 到 $\tau_1$ ）：
- 预测噪声： $\epsilon = \epsilon_\theta(x_{\tau_s}, \tau_s)$
- 估计原始数据：
  $\hat{x}_0 = \frac{x_{\tau_s} - \sqrt{1 - \bar{\alpha}_{\tau_s}} \epsilon}{\sqrt{\bar{\alpha}_{\tau_s}}}$
- 计算下一步状态：
  $x_{\tau_{s-1}} = \sqrt{\bar{\alpha}_{\tau_{s-1}}} \hat{x}_0 + \sqrt{1 - \bar{\alpha}_{\tau_{s-1}} - \sigma_{\tau_s}^2} \cdot \epsilon + \sigma_{\tau_s} z$
  - 当 $\sigma_{\tau_s}=0$ 时，最后一项消失，变为确定性更新。
输出： $x_0$ 为生成的数据。

五、伪代码示例

def ddim_sample(model, T, S, alphas_bar, sigmas):# 生成时间步子序列（如从T到0每隔k步取一次）tau = np.linspace(T, 0, S+1, dtype=int)  # 示例：线性间隔x = torch.randn_like(data)  # x_T ~ N(0, I)for s in range(S, 0, -1):t_current = tau[s]t_prev = tau[s-1]# 预测噪声epsilon = model(x, t_current)# 估计x0x0_hat = (x - np.sqrt(1 - alphas_bar[t_current]) * epsilon) / np.sqrt(alphas_bar[t_current])# 计算系数coeff1 = np.sqrt(alphas_bar[t_prev])coeff2 = np.sqrt(1 - alphas_bar[t_prev] - sigmas[t_current]**2)# 更新xx = coeff1 * x0_hat + coeff2 * epsilon + sigmas[t_current] * torch.randn_like(x)return x

采样算法二：去噪扩散隐式模型（DDIM）采样算法详解教程

参考 https://arxiv.org/pdf/2010.02502 一、背景与动机去噪扩散隐式模型（DDIM） 是对DDPM的改进，旨在加速采样过程同时保持生成质量。DDPM虽然生成效果优异，但其采样需迭代数百至数千次，效率较低。DDIM通过以下关键…...

编程日记 2026/4/2 3:16:57

各种类型网络安全竞赛有哪些网络安全大赛的简称

本文是对入门学习的一些概念了解和一些常规场景记录 1.CTF（capture the flag）是夺旗赛的意思。是网络安全技术人员之间进行攻防的比赛。起源1996年DEFCON全球黑客大会，替代之前真实攻击的技术比拼。 (DEFCON极客大会诞生1993，…...

编程日记 2026/2/23 2:13:40

包子凑数——蓝桥杯真题Python

包子凑数输入输出样例示例 1 输入 2 4 5输出 6样例说明凑不出的数目包括：1, 2, 3, 6, 7, 11。示例 2 输入 2 4 6输出 INF样例说明所有奇数都凑不出来，所以有无限多个运行限制最大运行时间：1s最大运行内存: 256M 最大公约数最大公…...

编程日记 2026/3/9 18:45:44

网络通信/IP网络划分/子网掩码的概念和使用

文章目录概述子网的考题子网掩码的历史有/无类地址子网划分!子网掩码超网技术/CIDR子网掩码和路由IP子网掩码定义网络规划网络规划-拆子网网络规划-组超网子网划分案例区分于其他特殊IP地址IP地址和网络地址子网掩码和网络地址子网掩码和广播地址子网间的通信其他概述本…...

编程日记 2026/3/29 4:25:05

【前端】简单原生实例合集html,css,js

长期补充，建议关注收藏点赞。目录分栏input各种类型iframe表单拖拽分栏区分fieldset和framesetframeset是把浏览器窗口分成几个区域，每个区域分别放置一个html文档到对应的frame中，而且这个比例可以按住边栏进行调整col指定左右边栏的宽…...

编程日记 2026/3/3 2:25:38

MySQL--》如何在MySQL中打造高效优化索引

目录初识索引索引结构性能分析索引使用最左前缀法则 SQL提示使用覆盖索引使用前缀索引使用索引失效情况初识索引索引(index)：是帮助MySQL高效获取数据的数据结构(有序)，在数据之外数据库系统还维护着满足特定查找算法的数据结构&…...

编程日记 2026/3/11 5:21:37

盛京开源社区加入 GitCode，书写东北开源生态新篇章

在数字化转型与开源技术蓬勃发展的浪潮下，开源社区已成为推动技术创新的核心力量。盛京开源社区（SJOSC）作为沈阳地区的开源交流平台，始终致力于连接开发者、企业及高校，构建区域技术生态圈。现在，盛京开源…...

编程日记 2026/3/29 8:56:58

HTML转义和反转义工具类

HTML转义和反转义工具类 package com.common.utils;import cn.hutool.http.HTMLFilter; import org.apache.commons.lang3.StringUtils;/*** 转义和反转义工具类** author lxx*/ public class EscapeUtil {public static final String RE_HTML_MARK "(<[^<]*?>…...

编程日记 2026/3/2 8:50:41

网络运维学习笔记（DeepSeek优化版）005网工初级（HCIA-Datacom与CCNA-EI）链路层发现协议与VLAN技术

文章目录一、链路层发现协议1.1 思科CDP协议1.2 华为LLDP协议二、VLAN（Virtual Local Area Network，虚拟局域网）技术详解2.1 基本概念2.2 技术特性2.3 接口工作原理2.3.1 Access模式2.3.2 Trunk模式 2.4 厂商配置对比思科配置华为配置 2.5 …...

编程日记 2026/3/20 6:55:48

DeepSeek开源周Day4：三连发！突破 AI 训练瓶颈的立体解决方案，并行计算三剑客DualPipe、EPLB与Profile-data

项目地址： https://github.com/deepseek-ai/DualPipehttps://github.com/deepseek-ai/eplbhttps://github.com/deepseek-ai/profile-data 开源日历：2025-02-24起每日9AM(北京时间)更新，持续五天 (4/5)！ 一、背景概述 …...

编程日记 2026/4/2 6:13:12

树莓百度百科更新！宜宾园区业务再添新篇

树莓集团宜宾园区业务不断拓展，主要体现在以下几个方面： 产业布局 -聚焦数字经济核心领域：涵盖软件开发、人工智能、大数据等，吸引众多上下游企业入驻，形成从芯片研发、软件开发到系统集成的完整产业链条。 -推进“双…...

编程日记 2026/3/20 5:00:33

RabbitMQ操作实战

1.RabbitMQ安装 RabbitMQ Windows 安装、配置、使用 - 小白教程-腾讯云开发者社区-腾讯云下载erlang：http://www.erlang.org/downloads/https://cloud.tencent.com/developer/article/2192340 Windows 10安装RabbitMQ及延时消息插件rabbitmq_delayed_message_exch…...

编程日记 2026/3/15 19:43:39

IO 和 NIO 有什么区别？

文章目录阻塞模式与非阻塞模式数据处理方式通信模型应用场景阻塞模式与非阻塞模式 IO：是阻塞式的 IO 操作。在传统的 IO 中，当一个线程执行读操作或者写操作时，该线程会被阻塞，直到操作完成。例如，在从文件读取数据…...

编程日记 2025/3/22 20:55:17

OpenWebUI配置异常的外部模型导致页面无法打开

一、使用Ollama关闭OpenAI OpenWebUI自带OpenAI的API设置，且默认是打开的，默认情况下，启动后，会不断的去连https://api.openai.com/v1，但是无法连上，会报错，但是不会影响页面，能正常…...

编程日记 2026/3/11 10:26:15

2025年度福建省职业院校技能大赛高职组“信息安全管理与评估”赛项规程样题模块二

模块二网络安全事件响应、数字取证调查、应用程序安全竞赛项目赛题本文件为信息安全管理与评估项目竞赛-第二阶段样题，内容包括：网络安全事件响应、数字取证调查。本次比赛时间为90分钟。介绍竞赛有固定的开始和结束时间，参赛队伍必须…...

编程日记 2026/2/25 8:05:29

鸿蒙兼容Mapbox地图应用测试

鸿蒙Next已经发布一段时间了，很多之前的移动端地图应用，纷纷都要求适配鸿蒙Next。作为开发者都清楚，所谓的适配其实都是重新开发，鸿蒙的开发语言和纯前端的Javascript不同，也可以Android原始开发的语言不同。鸿蒙自带的…...

编程日记 2026/3/15 15:24:32

java练习（45）

ps:题目来自力扣两数相除给你两个整数，被除数 dividend 和除数 divisor。将两数相除，要求不使用乘法、除法和取余运算。整数除法应该向零截断，也就是截去（truncate）其小数部分。例如，8.345 将被截断…...

编程日记 2026/3/4 6:24:10

面试之《前端开发者如何优化页面的加载时间？》

前端开发者可以从多个方面入手优化页面的加载时间，以下是一些常见且有效的方法： 优化资源加载压缩资源文件：对 HTML、CSS、JavaScript 文件进行压缩，去除不必要的空格、注释等，减小文件体积，加快下载速度…...

编程日记 2026/3/12 1:40:59

部署Flink1.20.1

1、设置环境变量 export JAVA_HOME/cluster/jdk export CLASSPATH.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jarp #export HIVE_HOME/cluster/hive export MYSQL_HOME/cluster/mysql export HADOOP_HOME/cluster/hadoop3 export HADOOP_CONF_DIR$HADOOP_HOME/etc/hadoop …...

编程日记 2026/3/15 5:48:34

参考