当前位置：首页 > article >正文

ComfyUI v0.20.1 更新：SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

article 2026/4/29 6:39:53

ComfyUI v0.20.1 于 2026年4月28日发布这次更新覆盖模型支持、视频处理、音频处理、API、执行引擎、前端、工作流模板、文档与伙伴节点等多个方面整体升级非常密集。这个版本的核心关键词可以概括为更强的模型支持、更完善的视频音频能力、更规范的 API、更稳定的执行逻辑以及更丰富的节点生态。一、版本说明与整体特点本次版本标注为Immutable release也就是说只有发布标题和发布说明可以修改。这意味着该版本的发布内容是相对稳定和固定的适合直接作为生产环境升级参考。从更新条目来看v0.20.1 不是单点修复而是一次覆盖面很广的综合升级尤其集中在以下几个方向新增多种模型支持音频与视频相关能力增强API 与内部接口更规范工作流模板持续更新前端包持续迭代执行器稳定性和异常机制优化伙伴节点持续扩展二、模型能力新增与增强1. SUPIR 模型支持本版本加入了SUPIR model support。这项更新意味着 ComfyUI 在模型生态上的覆盖进一步扩大为相关图像处理场景带来新的支持能力。2. Ernie 推理优化本次更新对Ernie inference做了一些优化使其推理速度更快一些。虽然描述中使用的是“a bit faster”但这类优化通常意味着推理链路中有一定效率提升对实际使用体验会产生积极影响。3. LTX 音频 VAE 更原生化更新中提到Make the ltx audio vae more native说明 LTX 音频 VAE 的处理方式更加贴近原生支持逻辑这有助于提升音频相关节点的统一性和兼容性。4. 支持独立的 LTXV 音频 VAE本次新增了Support standalone LTXV audio VAEs意味着 LTXV 音频 VAE 不再完全依赖既有绑定方式而是可以作为独立对象进行支持。这对于音频处理工作流的灵活性有直接帮助。5. RIFE 与 FILM 帧插值模型支持这次版本加入了RIFE and FILM frame interpolation model support属于非常实用的能力扩展。帧插值模型支持意味着视频相关工作流在帧间补偿、平滑处理方面可以获得更多模型选择。6. SAM 3.1 支持版本新增了SAM (segment anything) 3.1 support。这表示分割能力进一步更新适用于更广泛的图像分割相关流程。7. 启用 SD2 real human 支持伙伴节点中新增了SD2 real human support为相关节点使用场景补充了新的模型能力。8. HappyHorse 模型伙伴节点中还新增了HappyHorse model继续扩展可用模型范围。三、视频相关能力强化1. ByteDance 2 节点支持自动下采样伙伴节点新增了optional auto-downscaling of videos用于 ByteDance 2 节点。这个功能允许视频在处理时根据需要自动进行降采样提升处理灵活性。2. Veo 模型支持 4K 分辨率伙伴节点中增加了4K resolution for Veo models并且还加入了Veo 3 Lite model。这说明 Veo 相关工作流在分辨率和模型版本上都更丰富了。3. 修复 Veo 3.0 模型的 4K 分辨率拒绝问题同时也修复了一个与 Veo 有关的问题reject 4K resolution for veo-3.0 models。也就是说针对 veo-3.0 模型系统会拒绝不适配的 4K 分辨率设置避免错误使用。4. Kling 节点增加 4K 分辨率伙伴节点中还为Kling nodes增加了 4K 分辨率支持使视频生成相关节点能力更进一步。5. 更好地加载高位深视频本次更新修复了Properly load higher bit depth videos让高位深视频的加载更可靠。6. 支持视频 alpha 通道版本还新增了Support loading the alpha channel of videos。这意味着视频透明通道可以被加载这在更复杂的视频合成和编辑场景中非常有用。四、音频相关能力增强1. LTX 音频 VAE 更原生前面已经提到这次更新让 LTX 音频 VAE 更加原生化这属于音频支持基础设施上的增强。2. 支持独立 LTXV 音频 VAE这一条与上面配套说明音频 VAE 的使用更灵活更适合独立部署和组合式工作流。3. 修复 LTXV Reference Audio 节点本次更新还修复了LTXV Reference Audio node提升相关音频节点的可用性。五、前端与界面包更新1. comfyui-frontend-package 多次升级本次版本中前端包经历了多次更新包括升级到1.42.12升级到1.42.14升级到1.42.15这说明前端层面在持续迭代涉及的可能是交互体验、组件修复、性能优化和兼容性调整等。2. 预览任意节点时打印更多 tensor 值更新中加入了Print more tensor values in the preview any node。这意味着在预览节点时可以看到更多 tensor 值有助于调试和分析数据流。3. 修复模糊/锐化 shader 的 texel size 计算本次修复了 shader 中的一个实现细节use textureSize instead of u_resolution for texel size in blur/sharpen shaders。这类修复通常会影响视觉效果计算的准确性。六、API、内部接口与规范性增强1. 为内部 files endpoint 增加目录类型标注本次修复了append directory type annotation to internal files endpoint。这说明内部文件接口在返回目录类型时更加规范有助于减少接口歧义。2. 添加 OpenAPI 3.1 规范版本新增了OpenAPI 3.1 specification for ComfyUI API。这是非常重要的接口升级意味着 API 文档和规范化能力更强更利于第三方接入和自动生成接口说明。3. 允许在 comfy app files 中记录日志本次更新还加入了Allow logging in comfy app files。这对于应用文件相关的调试、追踪和问题定位有帮助。4. 提高无效版本格式的日志级别更新中提到Update logging level for invalid version format说明系统在处理非法版本格式时日志提示更合理。七、执行引擎与稳定性改进1. InterruptProcessingException 继承自 BaseException本次更新将InterruptProcessingException改为继承自BaseException。这通常意味着异常处理逻辑更符合底层中断类异常的特性也可能减少一些被普通异常处理捕获的情况。2. 加入反循环验证执行层新增了anti-cycle validation。这项能力对工作流执行非常关键可以更早发现循环依赖问题提升执行安全性。3. 对 stray weights 强制类型转换本次修复了force cast stray weights on comfy layers。这类调整通常与模型权重加载和兼容性有关能减少异常权重导致的问题。4. Stable_Zero123 cc_projection 权重赋值修复更新中修复了use Parameter assignment for Stable_Zero123 cc_projection weights属于模型权重赋值方式的修正。5. EmptySD3LatentImage 节点使用中间 dtype本次还更新了Make EmptySD3LatentImage node use intermediate dtype说明该节点在中间数据类型使用上更合理能改善处理稳定性。八、嵌入文档、模板与蓝图更新1. 工作流模板持续升级本次版本对工作流模板进行了多次更新依次为v0.9.59v0.9.61v0.9.62v0.9.63这说明模板内容在持续演进便于用户使用更接近最新版本的流程结构。2. 新增 ComfyUI blueprints 并修复 subgraph 命名更新中加入了new ComfyUI blueprints同时修复了subgraph naming。这类改动有助于让工作流结构更清晰蓝图使用更友好。3. 更新嵌入文档到 v0.4.4本次版本还将embedded docs更新到了v0.4.4。这意味着内置文档内容同步到了新的版本方便用户在使用 ComfyUI 时直接参考更完整、更及时的说明信息。对于需要快速查阅节点、流程、接口或功能说明的用户来说这类更新能明显提升使用便利性。九、伙伴节点扩展内容本次更新里伙伴节点的变化非常多而且覆盖视频、图像、模型、价格展示等多个方向是 v0.20.1 的一大看点。1. ByteDance 2 节点支持自动下采样如前所述伙伴节点增加了视频自动下采样功能提升视频处理灵活性。2. Veo 模型增加 4K 分辨率与 Veo 3 Lite 模型伙伴节点继续为 Veo 系列增强支持使其更适配不同分辨率与模型版本的需求。3. Kling 节点增加 4K 分辨率这同样是视频生成场景的重要增强。4. GPTImage 增加版本选项本次更新中还为gpt-image-2增加了version option。这意味着 GPTImage 相关节点在版本选择上更灵活适配不同使用需要。5. GPTImage 修复价格徽标并添加新分辨率伙伴节点还修复了price badges并且增加了新的分辨率选项增强了展示与可选参数能力。6. Sora 节点增加即将弃用提示更新中为Sora nodes添加了upcoming-deprecation notice。这类提示能让用户提前知晓相关节点的后续变化安排便于调整工作流。十、其他细节修复与调整1. Range type本次更新中还包含了一个range type的调整。这类类型定义修正往往属于底层类型系统或参数处理上的改进虽然表述简短但对整体一致性有帮助。2. 修复 preview any node 中 tensor 值显示与前端预览相关的调试输出增强能更好地帮助用户观察节点数据状态。3. 更新日志级别与版本格式校验对无效版本格式的日志级别进行了调整说明系统在处理版本相关输入时更规范。4. 其他节点与权重处理修正包括Stable_Zero123 的 cc_projection 权重赋值修复stray weights 的强制类型转换EmptySD3LatentImage 的中间 dtype 调整LTXV Reference Audio 的修复这些内容都属于提高稳定性和可用性的基础性更新。十一、版本要点总结如果要用一句话概括 ComfyUI v0.20.1那么它不是单纯的小修小补而是一次围绕模型支持、音视频能力、API 规范、执行稳定性和生态扩展的集中强化版本。这次更新的重点可以整理为新增 SUPIR、RIFE、FILM、SAM 3.1 等模型支持强化 Ernie 推理性能音频 VAE 与 LTXV 音频链路更原生、更独立视频处理能力明显增强包括高位深、alpha 通道、4K、自动下采样等API 增加 OpenAPI 3.1 规范接口更标准执行引擎增加 anti-cycle validation稳定性更强前端包持续升级预览与 shader 细节优化工作流模板、蓝图、嵌入文档持续更新伙伴节点新增多项模型与功能支持并包含多个修复项十二、结语代码地址github.com/Comfy-Org/ComfyUIComfyUI v0.20.1 这次更新给人的直观感受就是覆盖广、改动实、节奏快。从模型到视频、从音频到 API、从前端到执行层再到工作流模板和伙伴节点几乎每个关键模块都有涉及。对于日常使用 ComfyUI 的用户来说这种版本更新意味着可用能力更丰富稳定性更高接口更规范生态也更活跃。

ComfyUI v0.20.1 更新：SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

相关文章：

ComfyUI v0.20.1 更新：SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

回合策略手游【船长请开炮代金券内购版】服务端搭建教程（含资源下载+部署过程）

2026-04-29：二进制交换后的最大分数。用go语言，给定一个长度为 n 的整数数组 nums 和一个长度相同的二进制字符串 s。初始得分为 0。对于字符串中每个位置上字符为 ‘1‘ 的下标 i

流程型制造业生产优化，未来将如何被大模型技术重构？2026智造深研：实在Agent驱动端到端生产闭环

GitHub爆火！国内首个大模型实践教程《Dive into LLMs》，带你从零掌握大模型核心技术

vLLM-v0.11.0对比评测：为什么说它是LLM推理的“性能王者”？

打包 Android beeware briefcase

一年读完12本书，硬核搞定AI大模型入门！建议收藏！

算法第十八天

Real-Anime-Z训练数据准备：YOLOv8辅助的动漫图像自动标注方案

终极Windows图像查看器：为什么90%的用户选择ImageGlass替代自带软件？

Qwen3-14B私有部署镜像：使用Visio进行系统架构图智能设计与文档生成

凌晨两点数据库主从延迟告警，我用 binlog + pt-query-digest 在十分钟内还原了事故链

OMC - 16 让 Claude 真正“记住你”：oh-my-claudecode 的多层记忆与状态管理实践

企业安全风险管理新方法：RRR框架解析与应用

HunyuanVideo-Foley 性能调优：基于YOLOv11思想优化模型推理流程

Spring Boot 异步任务调度

DeEAR在有声书制作中的应用：主播语音韵律丰富度自动评分与优化建议

2025届毕业生推荐的降AI率方案推荐榜单

AMD Ryzen嵌入式单板计算机PCSF51工业应用解析

ai学习之在云端训练一个模型

远程容器SSH调试失败、端口转发异常、GPU无法调用？（Dev Containers 生产就绪 checklist v2.3.1）

为什么92%的MCP插件在VS Code 1.89+版本崩溃？——基于17个真实生产环境日志的协议兼容性根因分析

变量声明改成文本格式

Phi-3.5-mini-instruct多场景落地：覆盖办公、教育、政务、研发四大高频需求

TC39x芯片SRAM守护神MTU全解析：从SSH硬件结构到ECC/MBIST的避坑指南

大语言模型推理的硬件优化与HBF技术解析

告别点灯！用LVGL在ESP32上快速打造智能家居UI（基于LVGL官方ESP32端口）

real-anime-z多场景落地：同人创作、轻小说配图、社交平台头像批量生成

代码随想录算法训练营第四十二天|LeetCode 188 买卖股票的最佳时机 IV、LeetCode 309 最佳买卖股票时机含冷冻期、LeetCode 714 买卖股票的最佳时机含手续费