当前位置：首页 > news >正文

Consistency Models 阅读笔记

news 2026/2/9 9:53:46

简介

Diffusion models需要多步迭代采样才能生成一张图片，这导致生成速度很慢。一致性模型（Consistency models）的提出是为了加速生成过程。
Consistency models可以直接一步采样就生成图片，但是也允许进行多步采样来提高生成的质量。
Consistency models可以从预训练的扩散模型蒸馏得到，也可以作为独立的生成模型从头训练得到。

PF ODE

论文中考虑的PF ODE(Probability Flow Ordinary Differential Equation)形式如下：
$\frac{d \mathbf x_t}{d t} = -ts_\phi(\mathbf x_t, t)$ 其中 $s_\phi(\mathbf x_t, t) \approx \nabla\log p_t(\mathbf x)$ 是分数函数， $\in [0, T]$ 。
从初始分布 $\mathbf{\hat x_T} \sim \mathcal N(\mathbf 0, T^2 \mathbf I)$ 中采样，然后逆向求解ODE，得到的 $\mathbf{\hat x_0}$ 是近似服从数据分布的样本。值得注意的是，为了保证数值稳定，在本文中用 $\mathbf{\hat x_\epsilon}$ 当做最后的近似样本， $\epsilon$ 是一个接近0的小正数。

一致性模型（Consistency models）

给定一个PF ODE(Probability Flow Ordinary Differential Equation) $\{\mathbf x_t\}_{t\in[\epsilon, T]}$ ，一致性函数（consistency function）被定义为 $f:(\mathbf x_t, t) \rightarrow \mathbf x_\epsilon$ ，其中 $\epsilon$ 是一个接近0的小正数，是ODE求解器停止的位置。一致性函数具有self-consistency性质，即对于PF ODE轨迹上的任意点输出都是一样的。一致性模型 $f_\theta$ 的是从数据中估计的一致性函数。

给一个训练好的一致性模型 $f_\theta(\cdot, \cdot)$ ，可以通过一致性模型一步生成了结果：首先从初始分布中采样 $\mathbf{\hat x_T} \sim \mathcal N(\mathbf 0, T^2 \mathbf I)$ ，然后用一致性模型计算 $\mathbf{\hat x_\epsilon} = f_\theta(\mathbf{\hat x_T}, T)$ 。也可以调用一致性模型多次生成更准确的结果，如Algorithm 1所示，迭代的去噪和添加噪声。
在这里插入图片描述
Consistency models的训练算法有两种，一种是从预训练的扩散模型蒸馏（Algorithm 2），一种是作为独立的生成模型从头训练（Algorithm 3）。

感觉一致性模型和EDM¹有共同之处，在每一步中都想恢复出 $\mathbf x_0$ ，但是一致性模型训练时优化的目标是self-consistency性质，通过self-consistency性质来在保证每一步中都能直接恢复出 $\mathbf x_0$ 。

《Elucidating the design space of diffusion-based generative models》 ↩︎

Consistency Models 阅读笔记

简介

PF ODE

一致性模型（Consistency models）

相关文章：

Consistency Models 阅读笔记

杭电oj 2034 人见人爱A-B C语言

springboot(ssm大学生成绩管理系统成绩管理平台Java(codeLW)

SOME/IP 协议介绍（五）指南

Python调用企微机器人: 发送常用格式汇总

论文阅读——DiffusionDet

elmenetui表格二次封装包含查询框和分页

【机器学习Python实战】线性回归

做外贸这么久，为什么一直做不好？

IPv4数据报格式

搭建网关服务器实现DHCP自动分配、HTTP服务和免密登录

【18年扬大真题】给定有m个整数的递增有序数组a和有n个整数的递减有序数组b，将a数组和b数组归并为递增有序的数组c

图片叠加_图片压缩

Mybatis-Plus《学习笔记 22版尚硅谷》——感谢【尚硅谷】官方文档

git安装后报git: ‘remote-https‘ is not a git command. See ‘git --help‘.

场景交互与场景漫游-交运算与对象选取（8-1）

Vue中动态Class实战

B站短视频如何去水印？一键解析下载B站视频！

最大子段和（分治法+动态规划法）

内置函数和消息传递API

基于大模型的 UI 自动化系统

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

1.3 VSCode安装与环境配置

BCS 2025｜百度副总裁陈洋：智能体在安全领域的应用实践

【OSG学习笔记】Day 16: 骨骼动画与蒙皮（osgAnimation）

SpringCloudGateway 自定义局部过滤器

.Net Framework 4/C# 关键字（非常用，持续更新...）

Reasoning over Uncertain Text by Generative Large Language Models

【无标题】路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论

【C++特殊工具与技术】优化内存分配(一)：C++中的内存分配