当前位置: 首页 > article >正文

一文讲透扩散模型采样器:DDPM、DDIM、Euler、Heun、DPM-Solver、UniPC、LCM 全面对比

下面我把范围先说清楚:你问的“类似 Euler、Heun、DPM-Solver 这种定位的求解器”,我这里按扩散模型 / Flow Matching 推理阶段的通用采样器(scheduler / solver)来整理,而不把任务专用或模型专用的东西混进来,比如 RePaint、DDIM inverse、VQDiffusion、CogVideoX/Helios 专用调度器。这也是目前 Diffusers 文档对主流 scheduler 的组织方式:它把 Euler、Heun、LMS、PNDM、KDPM2、DPM-Solver、DEIS、UniPC、EDM、FlowMatch、LCM、TCD 等都放在同一类推理 scheduler 里。严格说不可能把学术史上“所有数值法”穷举完,所以下面给你的是今天主流生态里真正会用到的、比较完整的通用清单。(Hugging Face)先给一句总判断:老牌通用型:DDIM、Euler、Heun、LMS、PNDM、IPNDM、KDPM2扩散特化高阶型:DEIS、DPM-Solver、DPM-Solver++、UniPC、DPM-Solver-v3随机 / SDE / VE 型:Euler a、KDPM2 a、Karras VE、Score SDE VE/VP、SA-Solver模型家族特化型:EDM Euler、EDM DPM-Solver、FlowMatch Euler/Heun、CM、LCM、TCD这些方法的区别,主要不在“能不能生成图”,而在于:是 ODE 还是 SDE、是单步还是多步、是通用还是为某一模型家族特化、在 few-step 下是否更强。(Hugging Face)1)通用确定性 ODE 求解器 / 历史基线这一组最像“数值分析课里的通用 ODE 方法搬到扩散里来”。DDIM 是一阶隐式/确定性基线;Euler、Heun 来自 EDM 设计空间;LMS、PNDM、IPNDM 属于线性多步或伪数值方法;KDPM2 则是 k-diffusion 里 DPM2 那一路的二阶方法。它们共同特点是:兼容性强、容易理解、很多旧 UI / 老教程都能看到。(Hugging Face)求解器方法类型随机性核心特点更适合的应用场景不太适合DDIM一阶、隐式、非 Markov低/可近似无老牌快速基线,逻辑清楚,兼容广做基线对比、复现实验、旧模型兼容极少步数时通常不如新高阶法Euler一阶 ODE低简单、稳、快,很多框架默认好使通用文生图、20~30 步左右的稳妥选择5~8 步这种超低步数Heun二阶预测-修正低比 Euler 更准,但每步更贵质量优先、愿意多花一点算力极致追求吞吐量LMS线性多步低老牌多步法,历史上很常见中等步数、老生态兼容现在 few-step 常被新方法超过PNDM / PLMS伪数值法,RK + 线性多步低比早期 DDIM 更“数值法味儿”老的 latent diffusion / 老教程复现现代 few-step 主战场IPNDM四阶改进伪线性多步低比 PNDM/PLMS 更高阶想保留 PLMS 风格但更高阶主流 UI 支持不如 DPM++ 普遍KDPM2二阶 DPM2 路线低二阶、通常比一阶法更“讲究”中等步数下追求更好精度超低步数未必占优KDPM2 a二阶 + ancestral高在二阶基础上保留随机性想要更多纹理感、风格发散严格可复现、完全确定性场景2)扩散特化的高阶快速求解器这一组是现在最值得单独记住的。核心思想是:不要再把 diffusion ODE 完全当黑盒来解,而是利用它的特殊结构做高阶快速求解。DEIS 走的是 exponential integrator;DPM-Solver / DPM-Solver++ 是扩散专用高阶 ODE solver;UniPC 是统一的 predictor-corrector;DPM-Solver-v3 又在此基础上往 few-step 和大 guidance 做了进一步优化。总体上,这一组最适合“少步数还想保质量”。(Hugging Face)求解器方法类型随机性核心特点更适合的应用场景不太适合DEIS高阶 exponential integrator低利用半线性结构减小离散误差5~15 步 few-step 采样生态支持不如 DPM++ 普及DPM-Solver (single-step)扩散专用高阶 ODE低10~20 步就能出不错质量无引导或轻引导的快速采样强 guidance 下通常不如 ++ 稳DPM-Solver++扩散专用高阶 ODE低对 guided sampling 更友好文生图、CFG 较高、现代通用默认首选之一某些实现里参数较多,新手会迷糊DPMSolverMultistep / DPM++ 2M多步高阶低现在最常见的实战强项之一日常文生图、图像质量和速度平衡需要极强随机性的场景DPMSolverSinglestep / DPM++ 2S单步高阶低历史上常见,逻辑更直接少步快速推理、便于理解一般不如 2M 普遍DPM-Solver SDE / DPM++ SDE扩散特化 SDE 高阶中/高把高阶快解和随机性结合想保留一点随机探索又想快完全确定性复现UniPC统一预测-校正框架低尤其擅长极少步数5~10 步的 few-step 采样老旧框架不一定有DPM-Solver-v3改进版高阶 ODE低对 5~10 NFE、大 guidance 更强追求 cutting-edge few-step 质量工程落地还没 DPM++ 那么普及Cosine DPM-SolverDPM-Solver 的 cosine 变体低面向 cosine/noise schedule 友好音频扩散、Stable Audio Open 一类一般图像模型默认首选并不是它3)随机 / SDE / VE 家族求解器这一组的思路是:不要完全走确定性 ODE,而是保留 SDE / ancestral 的随机性。它们常见于“我不只想稳,我还想要多样性、纹理感、发散感”的场景。Karras VE、Score SDE VE/VP 更偏 score-based / VE/VP 研究线;SA-Solver 则是把多步随机采样这件事做得更系统。(Hugging Face)求解器方法类型随机性核心特点更适合的应用场景不太适合Euler aancestral 一阶高简单直接,随机性足想让结果更活、更有偶然性严格复现、完全稳定Karras VEVE 模型专用随机采样高专门给 variance-expanding 模型用VE 模型、需要 stochastic churnVP / Flow Matching 模型Score SDE VEVE-SDE高score-based VE 路线标准做法研究 / 复现 VE score model主流 latent diffusion 实战Score SDE VPVP-SDE高score-based VP 路线标准做法研究 / 复现 VP score modelA1111/ComfyUI 日常出图SA-Solver随机 Adams 多步 SDE中/高随机 few-step 的代表方法想在少步数里兼顾质量与多样性生态支持不如 DPM++ 普及4)模型家族特化:EDM / Flow Matching / Consistency这组非常重要,因为它们不是“万能黑盒 solver”,而是跟模型训练范式高度绑定。EDM 系:更适合按 Karras/EDM 参数化训练出来的模型。FlowMatch 系:更适合 SD3、FLUX 这类 Flow Matching / rectified flow 风格模型。CM / LCM / TCD 系:更适合 consistency / distilled few-step 模型,本来就是为“一步或极少步”服务的。(Hugging Face)求解器绑定的模型家族随机性核心特点更适合的应用场景不太适合EDMEulerEDM / Karras 公式化低EDM 里非常经典,20~30 步很稳EDM 训练模型的标准默认之一非 EDM 模型硬套EDMDPMSolverMultistepEDM + DPM-Solver++低把高阶快解放到 EDM 公式化里EDM 模型 + few-step普通 VP 模型不一定最优FlowMatch EulerFlow Matching低FM 模型最自然的默认选项之一SD3/FLUX/LTX-Video 一类 FM 模型非 FM 模型FlowMatch HeunFlow Matching低比 FM Euler 更精细FM 模型里偏质量优先极限吞吐量CM Stochastic IterativeConsistency Models中原生支持一步和少步原生 consistency model普通扩散模型直接换 solverLCM SchedulerLatent Consistency Models低/中1~8 步非常快LCM / LCM-LoRA 极少步出图追求最高保真、很多步慢慢磨TCD SchedulerTrajectory Consistency Distillation中比 LCM 更强调低步清晰度和细节TCD 模型、few-step 质量优先非 TCD 权重直接套用DDIM(若放到这里看)扩散基线低很多蒸馏/一致性工作会拿它作老师或对照做老师模型、做速度对照现代强 few-step 首选5)怎么选:直接给你实战版结论如果你在普通文生图里只想先选一个稳妥默认,通常先试DPM-Solver++ 多步(DPM++ 2M)或UniPC。前者是现代扩散采样里的常用强基线,后者在少步数时尤其强。(Hugging Face)如果你想要更多随机性、更多风格发散,通常会优先试Euler a、KDPM2 a、SA-Solver;如果模型本身是 VE 路线,再看Karras VE / Score SDE VE。(Hugging Face)如果你的预算极低,只给 5~10 步,优先关注UniPC、DEIS、DPM-Solver++、DPM-Solver-v3;如果模型本来就是蒸馏好的 few-step 模型,那就直接上LCM / TCD / CM。(Hugging Face)如果你的模型是 Flow Matching,别再优先想 DPM++,通常先试FlowMatch Euler,想更稳一点再试FlowMatch Heun。(Hugging Face)如果你的模型是 EDM 训练出来的,先看EDMEuler或EDMDPMSolverMultistep,因为它们就是按 EDM 公式化写的。(Hugging Face)6)一句话记忆版你可以把这些求解器粗暴记成下面四句:Euler / Heun / LMS / PNDM / IPNDM / KDPM2:通用数值法系DEIS / DPM-Solver / UniPC / DPM-Solver-v3:扩散特化高阶快解系Euler a / Karras VE / Score SDE / SA-Solver:随机 / SDE 系EDM / FlowMatch / CM / LCM / TCD:模型家族绑定系如果你愿意,我下一条可以继续给你整理一版“这些 solver 在 A1111 / ComfyUI / Diffusers 里的对应关系表”。二、以上哪些是Diffusion、哪些属于Flow-matching,哪些两者都能用?可以,最不容易混淆的分法是:按“实际模型家族兼容性”来分,不按数学名字来分。因为像Euler、Heun这种名字,本质上是通用 ODE 数值法;但在工程里,通常会分成:Diffusion 版实现:EulerDiscreteScheduler、HeunDiscreteSchedulerFlow-Matching 版实现:FlowMatchEulerDiscreteScheduler、FlowMatchHeunDiscreteScheduler所以如果只看“Euler”这两个字,会误判。Hugging Face 的 scheduler 总览把这些实现明确分开列出;Flow Matching 原论文也明确说,FM 采样可以用现成的 ODE solver。(Hugging Face)一句话总结属于 Diffusion 的大部分你上面提到的求解器,默认都属于 Diffusion 生态:DDIMEulerDiscrete / EDMEulerHeunDiscreteLMSPNDM / IPNDMKDPM2 / KDPM2 aDEISDPM-Solver / DPM-Solver++DPM-Solver SDEUniPCDPM-Solver-v3Cosine DPM-SolverEuler aKarras VEScore SDE VE / VPSA-SolverEDMDPMSolverMultistepCM / LCM / TCD(它们不是 FM,更接近 consistency / distillation 路线,通常仍站在 diffusion 这边)这些方法的官方文档或论文都直接写明是给diffusion ODE / diffusion models / VE/VP diffusion / score-based models用的。(Hugging Face)属于 Flow-Matching 的明确属于 FM 的,是名字里就写了FlowMatch的这两个:FlowMatch EulerFlowMatch HeunDiffusers 文档把它们单独作为 FlowMatch scheduler 列出来;FlowMatchEulerDiscreteScheduler文档还直接写了它基于 Stable Diffusion 3 的 flow-matching sampling。(Hugging Face)两者都能用的如果你说的是数学方法层面,那真正“两边都能用”的主要是:EulerHeun原因是它们本来就是通用 ODE solver,而 Flow Matching 论文明确说 FM 可以用现成的 ODE solver 来采样。与此同时,Diffusion 侧也早就有 Euler / Heun 版本。(arXiv)但要特别注意:“两者都能用”说的是数学方法,不代表你在代码里可以把同一个 scheduler 类直接乱套到两种模型上。实际工程里一般还是要选对应实现:Diffusion 模型 →EulerDiscreteScheduler/HeunDiscreteSchedulerFlow-Matching 模型 →FlowMatchEulerDiscreteScheduler/FlowMatchHeunDiscreteScheduler(Hugging Face)按你上面那一整份清单重新分类名称分类说明DDIMDiffusion来自 DDPM/DDIM 扩散采样线,不是 FM (Hugging Face)Euler两者都能用数学上是通用 ODE solver;工程上分 Diffusion 版和 FlowMatch 版 (arXiv)Heun两者都能用和 Euler 一样,数学上通用;工程上有 Diffusion 版和 FlowMatch 版 (arXiv)LMSDiffusionDiffusers 放在 diffusion schedulers 里,历史上用于扩散采样 (Hugging Face)PNDMDiffusion伪数值法扩散采样器 (Hugging Face)IPNDMDiffusionPNDM 改进版,仍属 diffusion 线 (Hugging Face)

相关文章:

一文讲透扩散模型采样器:DDPM、DDIM、Euler、Heun、DPM-Solver、UniPC、LCM 全面对比

下面我把范围先说清楚: 你问的“类似 Euler、Heun、DPM-Solver 这种定位的求解器”,我这里按扩散模型 / Flow Matching 推理阶段的通用采样器(scheduler / solver)来整理,而不把任务专用或模型专用的东西混进来,比如 RePaint、DDIM inverse、VQDiffusion、CogVideoX/Hel…...

Qwen-Image-2512-Pixel-Art-LoRA 结合YOLOv8:为生成的像素画智能添加检测框标注

Qwen-Image-2512-Pixel-Art-LoRA 结合YOLOv8:为生成的像素画智能添加检测框标注 你有没有想过,自己生成的像素画,能不能像游戏里的场景一样,自动识别出里面的房子、树木和人物?最近我在尝试一个挺有意思的组合&#x…...

Qwen3-0.6B-FP8部署全攻略:环境配置+模型调用一步到位

Qwen3-0.6B-FP8部署全攻略:环境配置模型调用一步到位 想快速体验一个轻量级但能力不俗的大语言模型吗?Qwen3-0.6B-FP8镜像为你提供了一个开箱即用的解决方案。这个镜像基于通义千问最新的Qwen3-0.6B模型,通过vLLM进行高效部署,并…...

谁能按那个按钮?——美国EAS系列(三):权限、授权链与对国内应急广播的启示

「美国EAS系列」收官篇。第一篇讲了EAS的历史与五桩事故,第二篇讲了它的分发架构和多级管理。这一篇我们把最后一层门推开:谁有资格签发一条警报、权限在端侧如何崩塌、以及中国正在落地的CDR应急广播体系能从这七十年的血泪里直接抄到哪几条作业。 一个…...

生态系统NPP及碳源、碳汇模拟:土地利用变化、未来气候变化、空间动态模拟

查看原文>>> https://mp.weixin.qq.com/s/OlIHIKED91-KI2vaXK8B9g 前言 由于全球变暖、大气中温室气体浓度逐年增加等问题的出现,“双碳”行动特别是碳中和已经在世界范围形成广泛影响。碳中和可以从碳排放(碳源)和碳固定&#xf…...

CISSP 域4知识点 无线与移动网络安全

CISSP考点速记|Domain4 无线与移动网络安全 📶🔐 官方定位:域4通信与网络安全的核心模块,占Domain4权重25%左右;对应OSG第十版第10、11章无线与移动专项内容。是企业网络边界延伸&混合办公安全的核心考…...

Node.js-安装部署

1 需求 …… 2 接口 …… 3 示例 …… 4 参考资料 https://zhuanlan.zhihu.com/p/2004975759790477711...

避坑指南:Xilinx Aurora IP核多核例化时,GT_RESET信号必须保持10个时钟周期的原因

Xilinx Aurora IP核多核例化中GT_RESET信号的时序陷阱与实战解决方案 在FPGA高速串行通信领域,Xilinx的Aurora 8B/10B协议IP核因其简洁高效的特性,成为多通道数据交互的首选方案。但当工程师尝试在单个QUAD中例化多个Aurora IP核以实现高密度链路时&…...

工业缺陷检测应用:结合YOLOv5与PyTorch 2.8实现高精度识别

工业缺陷检测应用:结合YOLOv5与PyTorch 2.8实现高精度识别 1. 工业质检的痛点与AI解决方案 在制造业生产线上,零件表面缺陷检测一直是个老大难问题。传统的人工检测方式不仅效率低下(每小时最多检测几百个零件),而且…...

STM32 FatFS连续写入SD卡数据丢失?3个常见坑点与实战修复方案

STM32 FatFS连续写入SD卡数据丢失?3个常见坑点与实战修复方案 最近在调试STM32的SD卡数据记录功能时,遇到了一个让人头疼的问题:使用FatFS库连续写入数据时,SD卡中的文件要么是空的,要么全是乱码。经过一番折腾&#x…...

面试官问你做过几层板,这么回才加分

前几天有个学生跟我吐槽,说面试的时候被问到"你做过几层板",当时脑子一片空白,随便回了句"做过4层的",结果面试官哦了一声就跳到下一个问题了。他回来后越想越慌,问我是不是答砸了。说实话&#x…...

2026 全球 AI 大模型全景榜单:国产强势崛起,国际格局重塑

2026 年,全球 AI 大模型产业正式步入技术深耕与规模化落地并行的关键阶段。国际顶尖模型持续在超大参数、全模态融合、智能体协作上突破;国产模型则凭借本土场景适配、垂直领域深耕、算力自主可控实现快速追赶,在政务、制造、教育、电商等领域…...

​从CNN到Transformer:基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类

我国高分辨率对地观测系统重大专项已全面启动,高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全的基础性和战略性资源。随着小卫星星座的普及,对地观测已具备多次以上的全球覆盖…...

宝宝益生菌,这2大品牌必须了解

引言在宝宝的成长过程中,肠道健康至关重要。益生菌作为调节肠道菌群、增强免疫力的“小卫士”,成为众多家长关注的焦点。市场上宝宝益生菌品牌众多,如何挑选成为了家长们头疼的问题。今天,就为大家深度分析两个值得了解的宝宝益生…...

Embedding算法入门到精通:拆解腾讯二面必考题,收藏这一篇就够了!

👔面试官:RAG 里用的 Embedding 算法有哪些?你了解过几代演进? 🙋‍♂️我:Embedding 算法我知道,Word2Vec 嘛,把词变成向量。 👔面试官:Word2Vec 是 2013 …...

DeepSeek-R1 1.5B使用技巧:这样提问,AI回答更准确更详细

DeepSeek-R1 1.5B使用技巧:这样提问,AI回答更准确更详细 1. 引言:提问方式决定回答质量 你是否遇到过这样的情况:向AI提问后,得到的回答要么过于简略,要么偏离主题?这很可能不是模型能力的问题…...

2026高性价比协作工具盘点:如何兼顾文件管理与数据安全?

在2026年的数字化办公时代,企业网盘早已不仅是简单的“存储仓库”,而是团队协作、文件流转和保障数据资产安全的核心基础设施。针对市面上眼花缭乱的产品,企业IT和管理者如何找到匹配业务需求且具备高性价比的云盘方案? 本文将从…...

DeerFlow深度研究助理5分钟快速上手:零基础搭建个人AI研究助手

DeerFlow深度研究助理5分钟快速上手:零基础搭建个人AI研究助手 1. 认识DeerFlow:您的智能研究伙伴 DeerFlow是一款基于LangStack技术框架开发的深度研究助理工具。它能像专业研究员一样帮您完成信息搜集、数据分析、报告撰写甚至播客制作等工作。想象一…...

企业网盘哪个品牌好用?2026年企业高效办公网盘TOP5产品全景测评

“信息创造了人类,而信息流通与共享塑造了文明。”在数字化协作成为企业命脉的今天,这句预言愈发显现其前瞻性。过去几年中,远程协同办公逐渐常态化,当团队分散在各地、项目文件版本混乱、重要数据面临泄露风险时,传统…...

W-TRS-5.5D7红外测温传感器:电饭煲智能化测温的革新力量

在健康饮食与智能烹饪需求日益增长,电饭煲作为厨房的核心设备之一,其测温技术的革新直接关系到米饭的口感、营养保留以及特殊饮食需求的满足。W-TRS-5.5D7红外测温传感器的出现,以非接触式测温技术为核心,结合定制化算法实现智能化…...

储能BMS数据语境化采集架构解析与边缘计算网关选型推荐

摘要:在新能源场站的系统集成中,面对各厂家互不兼容的BMS/PCS总线协议,传统的硬编码接入模式存在扩展性差、联调耗时长的问题。本文分享一种在底层计算节点中利用数据语境化机制与动态映射解析器实现零代码接入的高阶架构,探讨通用…...

GEE-PIE遥感大数据处理与典型案例实践

随着航空、航天、近地空间等多个遥感平台的不断发展,近年来遥感技术突飞猛进。由此,遥感数据的空间、时间、光谱分辨率不断提高,数据量也大幅增长,使其越来越具有大数据特征。对于相关研究而言,遥感大数据的出现为其提…...

Claude Code Routines功能深度解析:24小时云端自动化开发指南

引言:为什么需要Routines功能? 随着AI开发工具的普及,开发者面临一个新的挑战:如何让AI助手在无人值守的情况下持续工作?Claude Code Routines正是为解决这一问题而生。 核心价值: 🚀 24小时…...

2026 想转网络安全?一文看懂:薪资结构 + 工作安排 + 发展前景(新人必备)

2026年,数字化转型进入深水区,网络威胁呈现复杂化、智能化特征,APT攻击、数据泄露等安全事件频发,叠加《网络安全法》《数据安全法》的刚性合规要求,网络安全已成为政企单位、互联网大厂的“刚需板块”[6]。对于想转行…...

告别终端管理:5款Claude Code管理工具深度对比与实战指南

引言:为什么需要Claude Code管理工具? 随着Claude Code功能的日益强大,开发者面临一个新的挑战:如何高效管理多个并行运行的AI Agent?传统的终端窗口管理方式已经无法满足现代开发需求。 痛点分析: &…...

告别卡顿!用PaddleSeg的PP-LiteSeg模型在边缘设备上实现实时语义分割(附保姆级部署教程)

边缘设备实时语义分割实战:PP-LiteSeg部署全指南与性能优化 在智能摄像头、移动机器人和工业质检等边缘计算场景中,实时语义分割技术正成为关键突破口。传统分割模型往往需要强大的GPU支持,而边缘设备如Jetson Nano、树莓派甚至智能手机的算力…...

2026年4月亲测:宠物智能猫砂盆哪家强?

行业痛点分析在宠物智能猫砂盆领域,尽管市场上已有多种自动铲屎产品,但用户仍然面临一些核心问题。普通猫砂盆即便具备自动铲屎功能,底部仍会残留沾了尿液的结团猫砂,需要用户每周手动拆洗,实际上并未完全解放双手。数…...

华硕天选2 FA506Q FA706Q 原厂Win11 22H2系统分享下载-宇程系统站

华硕天选2 FA506Q和FA706Q系列笔记本自带一键恢复功能,即使系统出现问题或更换硬盘后也能通过原厂工厂文件恢复到出厂状态。支持多种型号如FA506QR、FA506QM等,用户可轻松恢复Windows 11 22H2家庭版系统及隐藏的恢复分区,确保设备稳定运行。 …...

从Gotham到Foundry:一文读懂Palantir三大产品线(Gotham/Foundry/Apollo)的核心差异与适用场景

从Gotham到Foundry:Palantir三大产品线的深度解析与选型指南 当企业面对海量数据时,如何选择合适的数据分析平台往往成为技术决策者的难题。Palantir作为大数据分析领域的标杆企业,其三大产品线——Gotham、Foundry和Apollo——各自针对不同场…...

幼儿园自主游戏:核心内涵、实践体系与发展价值

幼儿园自主游戏是幼儿在安全环境下,依兴趣自主选择内容、材料、伙伴与玩法,自发探索、自由表达的主体性活动,是学前教育的基本形态与幼儿发展的核心路径。它彻底区别于教师主导的指令式游戏,核心是尊重幼儿主体地位,让…...