当前位置: 首页 > article >正文

ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

ComfyUI v0.20.1 于 2026年4月28日发布这次更新覆盖模型支持、视频处理、音频处理、API、执行引擎、前端、工作流模板、文档与伙伴节点等多个方面整体升级非常密集。这个版本的核心关键词可以概括为更强的模型支持、更完善的视频音频能力、更规范的 API、更稳定的执行逻辑以及更丰富的节点生态。一、版本说明与整体特点本次版本标注为Immutable release也就是说只有发布标题和发布说明可以修改。这意味着该版本的发布内容是相对稳定和固定的适合直接作为生产环境升级参考。从更新条目来看v0.20.1 不是单点修复而是一次覆盖面很广的综合升级尤其集中在以下几个方向新增多种模型支持音频与视频相关能力增强API 与内部接口更规范工作流模板持续更新前端包持续迭代执行器稳定性和异常机制优化伙伴节点持续扩展二、模型能力新增与增强1. SUPIR 模型支持本版本加入了SUPIR model support。这项更新意味着 ComfyUI 在模型生态上的覆盖进一步扩大为相关图像处理场景带来新的支持能力。2. Ernie 推理优化本次更新对Ernie inference做了一些优化使其推理速度更快一些。虽然描述中使用的是“a bit faster”但这类优化通常意味着推理链路中有一定效率提升对实际使用体验会产生积极影响。3. LTX 音频 VAE 更原生化更新中提到Make the ltx audio vae more native说明 LTX 音频 VAE 的处理方式更加贴近原生支持逻辑这有助于提升音频相关节点的统一性和兼容性。4. 支持独立的 LTXV 音频 VAE本次新增了Support standalone LTXV audio VAEs意味着 LTXV 音频 VAE 不再完全依赖既有绑定方式而是可以作为独立对象进行支持。这对于音频处理工作流的灵活性有直接帮助。5. RIFE 与 FILM 帧插值模型支持这次版本加入了RIFE and FILM frame interpolation model support属于非常实用的能力扩展。帧插值模型支持意味着视频相关工作流在帧间补偿、平滑处理方面可以获得更多模型选择。6. SAM 3.1 支持版本新增了SAM (segment anything) 3.1 support。这表示分割能力进一步更新适用于更广泛的图像分割相关流程。7. 启用 SD2 real human 支持伙伴节点中新增了SD2 real human support为相关节点使用场景补充了新的模型能力。8. HappyHorse 模型伙伴节点中还新增了HappyHorse model继续扩展可用模型范围。三、视频相关能力强化1. ByteDance 2 节点支持自动下采样伙伴节点新增了optional auto-downscaling of videos用于 ByteDance 2 节点。这个功能允许视频在处理时根据需要自动进行降采样提升处理灵活性。2. Veo 模型支持 4K 分辨率伙伴节点中增加了4K resolution for Veo models并且还加入了Veo 3 Lite model。这说明 Veo 相关工作流在分辨率和模型版本上都更丰富了。3. 修复 Veo 3.0 模型的 4K 分辨率拒绝问题同时也修复了一个与 Veo 有关的问题reject 4K resolution for veo-3.0 models。也就是说针对 veo-3.0 模型系统会拒绝不适配的 4K 分辨率设置避免错误使用。4. Kling 节点增加 4K 分辨率伙伴节点中还为Kling nodes增加了 4K 分辨率支持使视频生成相关节点能力更进一步。5. 更好地加载高位深视频本次更新修复了Properly load higher bit depth videos让高位深视频的加载更可靠。6. 支持视频 alpha 通道版本还新增了Support loading the alpha channel of videos。这意味着视频透明通道可以被加载这在更复杂的视频合成和编辑场景中非常有用。四、音频相关能力增强1. LTX 音频 VAE 更原生前面已经提到这次更新让 LTX 音频 VAE 更加原生化这属于音频支持基础设施上的增强。2. 支持独立 LTXV 音频 VAE这一条与上面配套说明音频 VAE 的使用更灵活更适合独立部署和组合式工作流。3. 修复 LTXV Reference Audio 节点本次更新还修复了LTXV Reference Audio node提升相关音频节点的可用性。五、前端与界面包更新1. comfyui-frontend-package 多次升级本次版本中前端包经历了多次更新包括升级到1.42.12升级到1.42.14升级到1.42.15这说明前端层面在持续迭代涉及的可能是交互体验、组件修复、性能优化和兼容性调整等。2. 预览任意节点时打印更多 tensor 值更新中加入了Print more tensor values in the preview any node。这意味着在预览节点时可以看到更多 tensor 值有助于调试和分析数据流。3. 修复模糊/锐化 shader 的 texel size 计算本次修复了 shader 中的一个实现细节use textureSize instead of u_resolution for texel size in blur/sharpen shaders。这类修复通常会影响视觉效果计算的准确性。六、API、内部接口与规范性增强1. 为内部 files endpoint 增加目录类型标注本次修复了append directory type annotation to internal files endpoint。这说明内部文件接口在返回目录类型时更加规范有助于减少接口歧义。2. 添加 OpenAPI 3.1 规范版本新增了OpenAPI 3.1 specification for ComfyUI API。这是非常重要的接口升级意味着 API 文档和规范化能力更强更利于第三方接入和自动生成接口说明。3. 允许在 comfy app files 中记录日志本次更新还加入了Allow logging in comfy app files。这对于应用文件相关的调试、追踪和问题定位有帮助。4. 提高无效版本格式的日志级别更新中提到Update logging level for invalid version format说明系统在处理非法版本格式时日志提示更合理。七、执行引擎与稳定性改进1. InterruptProcessingException 继承自 BaseException本次更新将InterruptProcessingException改为继承自BaseException。这通常意味着异常处理逻辑更符合底层中断类异常的特性也可能减少一些被普通异常处理捕获的情况。2. 加入反循环验证执行层新增了anti-cycle validation。这项能力对工作流执行非常关键可以更早发现循环依赖问题提升执行安全性。3. 对 stray weights 强制类型转换本次修复了force cast stray weights on comfy layers。这类调整通常与模型权重加载和兼容性有关能减少异常权重导致的问题。4. Stable_Zero123 cc_projection 权重赋值修复更新中修复了use Parameter assignment for Stable_Zero123 cc_projection weights属于模型权重赋值方式的修正。5. EmptySD3LatentImage 节点使用中间 dtype本次还更新了Make EmptySD3LatentImage node use intermediate dtype说明该节点在中间数据类型使用上更合理能改善处理稳定性。八、嵌入文档、模板与蓝图更新1. 工作流模板持续升级本次版本对工作流模板进行了多次更新依次为v0.9.59v0.9.61v0.9.62v0.9.63这说明模板内容在持续演进便于用户使用更接近最新版本的流程结构。2. 新增 ComfyUI blueprints 并修复 subgraph 命名更新中加入了new ComfyUI blueprints同时修复了subgraph naming。这类改动有助于让工作流结构更清晰蓝图使用更友好。3. 更新嵌入文档到 v0.4.4本次版本还将embedded docs更新到了v0.4.4。这意味着内置文档内容同步到了新的版本方便用户在使用 ComfyUI 时直接参考更完整、更及时的说明信息。对于需要快速查阅节点、流程、接口或功能说明的用户来说这类更新能明显提升使用便利性。九、伙伴节点扩展内容本次更新里伙伴节点的变化非常多而且覆盖视频、图像、模型、价格展示等多个方向是 v0.20.1 的一大看点。1. ByteDance 2 节点支持自动下采样如前所述伙伴节点增加了视频自动下采样功能提升视频处理灵活性。2. Veo 模型增加 4K 分辨率与 Veo 3 Lite 模型伙伴节点继续为 Veo 系列增强支持使其更适配不同分辨率与模型版本的需求。3. Kling 节点增加 4K 分辨率这同样是视频生成场景的重要增强。4. GPTImage 增加版本选项本次更新中还为gpt-image-2增加了version option。这意味着 GPTImage 相关节点在版本选择上更灵活适配不同使用需要。5. GPTImage 修复价格徽标并添加新分辨率伙伴节点还修复了price badges并且增加了新的分辨率选项增强了展示与可选参数能力。6. Sora 节点增加即将弃用提示更新中为Sora nodes添加了upcoming-deprecation notice。这类提示能让用户提前知晓相关节点的后续变化安排便于调整工作流。十、其他细节修复与调整1. Range type本次更新中还包含了一个range type的调整。这类类型定义修正往往属于底层类型系统或参数处理上的改进虽然表述简短但对整体一致性有帮助。2. 修复 preview any node 中 tensor 值显示与前端预览相关的调试输出增强能更好地帮助用户观察节点数据状态。3. 更新日志级别与版本格式校验对无效版本格式的日志级别进行了调整说明系统在处理版本相关输入时更规范。4. 其他节点与权重处理修正包括Stable_Zero123 的 cc_projection 权重赋值修复stray weights 的强制类型转换EmptySD3LatentImage 的中间 dtype 调整LTXV Reference Audio 的修复这些内容都属于提高稳定性和可用性的基础性更新。十一、版本要点总结如果要用一句话概括 ComfyUI v0.20.1那么它不是单纯的小修小补而是一次围绕模型支持、音视频能力、API 规范、执行稳定性和生态扩展的集中强化版本。这次更新的重点可以整理为新增 SUPIR、RIFE、FILM、SAM 3.1 等模型支持强化 Ernie 推理性能音频 VAE 与 LTXV 音频链路更原生、更独立视频处理能力明显增强包括高位深、alpha 通道、4K、自动下采样等API 增加 OpenAPI 3.1 规范接口更标准执行引擎增加 anti-cycle validation稳定性更强前端包持续升级预览与 shader 细节优化工作流模板、蓝图、嵌入文档持续更新伙伴节点新增多项模型与功能支持并包含多个修复项十二、结语代码地址github.com/Comfy-Org/ComfyUIComfyUI v0.20.1 这次更新给人的直观感受就是覆盖广、改动实、节奏快。从模型到视频、从音频到 API、从前端到执行层再到工作流模板和伙伴节点几乎每个关键模块都有涉及。对于日常使用 ComfyUI 的用户来说这种版本更新意味着可用能力更丰富稳定性更高接口更规范生态也更活跃。

相关文章:

ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

ComfyUI v0.20.1 于 2026年4月28日发布,这次更新覆盖模型支持、视频处理、音频处理、API、执行引擎、前端、工作流模板、文档与伙伴节点等多个方面,整体升级非常密集。这个版本的核心关键词可以概括为:更强的模型支持、更完善的视频音频能力、…...

回合策略手游【船长请开炮代金券内购版】服务端搭建教程(含资源下载+部署过程)

游戏截图搭建环境信息 系统:Centos 7.6 内存:8G 处理器:2核 注意事项 建议直接复制代码避免出错 搭建资源获取 资源获取:www.woniuyxdj.cn 宝塔面板安装 通用自动安装命令 if [ -f /usr/bin/curl ];then curl -sSO https://downlo…...

2026-04-29:二进制交换后的最大分数。用go语言,给定一个长度为 n 的整数数组 nums 和一个长度相同的二进制字符串 s。 初始得分为 0。对于字符串中每个位置上字符为 ‘1‘ 的下标 i

2026-04-29:二进制交换后的最大分数。用go语言,给定一个长度为 n 的整数数组 nums 和一个长度相同的二进制字符串 s。 初始得分为 0。对于字符串中每个位置上字符为 ‘1’ 的下标 i,分数都会加上 nums[i]。 你可以进行任意次操作,…...

流程型制造业生产优化,未来将如何被大模型技术重构?2026智造深研:实在Agent驱动端到端生产闭环

在2026年的工业版图中,流程型制造业——涵盖化工、冶金、石化、能源等支柱产业,正经历着自工业4.0以来最深刻的范式转移。过去,这些行业依赖于高度确定的工艺包和基于规则的自动化系统;而现在,大模型技术正从底层逻辑上…...

GitHub爆火!国内首个大模型实践教程《Dive into LLMs》,带你从零掌握大模型核心技术

最近,GitHub上一个名为"Dive into LLMs"的项目火了!短短时间内获得数千星标,成为大模型学习者的新宠。这究竟是什么样的神仙项目?为什么能在众多教程中脱颖而出?Dive into LLMs简介 Dive into LLMs 是由上海…...

vLLM-v0.11.0对比评测:为什么说它是LLM推理的“性能王者”?

vLLM-v0.11.0对比评测:为什么说它是LLM推理的"性能王者"? 1. 引言:大模型推理的新标杆 在大语言模型应用爆发的今天,推理效率直接决定了产品的用户体验和运营成本。传统推理框架在处理高并发请求时,往往会…...

打包 Android beeware briefcase

#安装 Android SDK,然后执行: briefcase create android briefcase build android *briefcase run android #连接安卓手机或模拟器运行 briefcase package android #打包为.APK...

一年读完12本书,硬核搞定AI大模型入门!建议收藏!

本文推荐了12本AI大模型入门必读好书,涵盖GPT系列、Transformer架构、大模型应用开发、AIGC、LangChain等核心技术,适合深度学习基础者及研究生。书籍内容从基础理论到前沿进展,结合实际案例,帮助读者全面了解大模型技术&#xff…...

算法第十八天

20. 有效的括号 题目链接:https://leetcode.cn/problems/valid-parentheses/ 视频讲解链接:https://www.bilibili.com/video/BV1AF411w78g 1.看到题目第一想法:我想着可以用一个东西来存左括号,等遇到右括号的时候,…...

Real-Anime-Z训练数据准备:YOLOv8辅助的动漫图像自动标注方案

Real-Anime-Z训练数据准备:YOLOv8辅助的动漫图像自动标注方案 1. 引言 动漫角色识别与生成一直是AI领域的热门研究方向,但高质量的训练数据获取却是个令人头疼的问题。传统的人工标注方式不仅耗时费力,成本也居高不下。以Real-Anime-Z这样的…...

终极Windows图像查看器:为什么90%的用户选择ImageGlass替代自带软件?

终极Windows图像查看器:为什么90%的用户选择ImageGlass替代自带软件? 【免费下载链接】ImageGlass 🏞 A lightweight, versatile image viewer 项目地址: https://gitcode.com/gh_mirrors/im/ImageGlass 在数字图像日益丰富的今天&…...

Qwen3-14B私有部署镜像:使用Visio进行系统架构图智能设计与文档生成

Qwen3-14B私有部署镜像:使用Visio进行系统架构图智能设计与文档生成 1. 场景痛点:传统架构设计的效率瓶颈 在系统架构设计工作中,工程师们常常面临这样的困境:明明脑海中有清晰的架构思路,却要花费大量时间在Visio中…...

凌晨两点数据库主从延迟告警,我用 binlog + pt-query-digest 在十分钟内还原了事故链

凌晨两点数据库主从延迟告警,我用 binlog pt-query-digest 在十分钟内还原了事故链 凌晨两点十七分,手机震醒我的不是闹钟,是 PagerDuty。主从延迟 38 秒,还在涨。我第一反应不是慌张,是兴奋——终于来了个能写进简历…...

OMC - 16 让 Claude 真正“记住你”:oh-my-claudecode 的多层记忆与状态管理实践

文章目录Pre一、问题背景:LLM 的“记忆错觉”二、整体架构:四种记忆表面 生命周期编排2.1 四个记忆子系统2.2 生命周期驱动的记忆流水线三、项目记忆:让模型真正理解你的项目3.1 核心数据模型:对项目环境的结构化刻画3.2 启动时的…...

企业安全风险管理新方法:RRR框架解析与应用

1. 企业安全风险管理的新视角:Riches, Ruins & Regulations方法解析在当今数字化时代,企业安全团队面临着一个根本性挑战:如何在有限的资源下,有效保护那些真正可能摧毁企业的关键业务风险?传统安全评估方法往往陷…...

HunyuanVideo-Foley 性能调优:基于YOLOv11思想优化模型推理流程

HunyuanVideo-Foley 性能调优:基于YOLOv11思想优化模型推理流程 1. 效果亮点开场 在音频生成领域,推理速度往往是决定用户体验的关键因素。最近我们尝试将YOLOv11视觉模型中的优化思想迁移到HunyuanVideo-Foley音频生成模型上,取得了令人惊…...

Spring Boot 异步任务调度

Spring Boot 异步任务调度:提升应用性能的利器 在现代Web应用中,高并发和快速响应是开发者追求的核心目标之一。Spring Boot作为Java生态中最流行的框架之一,其异步任务调度功能为开发者提供了一种高效处理耗时任务的解决方案。通过异步执行…...

DeEAR在有声书制作中的应用:主播语音韵律丰富度自动评分与优化建议

DeEAR在有声书制作中的应用:主播语音韵律丰富度自动评分与优化建议 1. 引言:有声书制作中的语音质量挑战 有声书行业近年来蓬勃发展,但高质量的有声内容制作面临一个关键瓶颈:如何快速评估和提升主播的语音表现力。传统方法依赖…...

2025届毕业生推荐的降AI率方案推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对准维普系统展现出的 AI 检测特征,我方用心选用文本重组跟术语替换策略。具体来…...

AMD Ryzen嵌入式单板计算机PCSF51工业应用解析

1. DFI PCSF51工业级单板计算机概述DFI PCSF51是一款采用AMD Ryzen Embedded R2000系列处理器的1.8英寸工业级单板计算机(SBC)。这款名片大小的板卡专为空间受限的工业应用场景设计,在仅8455mm的紧凑尺寸内集成了强大的计算性能与丰富的I/O接口。作为DFI GHF51的升级…...

ai学习之在云端训练一个模型

平台:魔塔 https://www.modelscope.cn/ 在上面创建一个notebook 配置环境 pip install "transformers>4.57" "qwen_vl_utils>0.0.14" pip install "ms-swift>3.9.1" pip install modelscope 下载模型 modelscope download …...

远程容器SSH调试失败、端口转发异常、GPU无法调用?(Dev Containers 生产就绪 checklist v2.3.1)

更多请点击: https://intelliparadigm.com 第一章:远程容器SSH调试失败、端口转发异常、GPU无法调用?(Dev Containers 生产就绪 checklist v2.3.1) 当 Dev Containers 在远程开发场景中出现 SSH 连接中断、本地端口无…...

为什么92%的MCP插件在VS Code 1.89+版本崩溃?——基于17个真实生产环境日志的协议兼容性根因分析

更多请点击: https://intelliparadigm.com 第一章:MCP协议演进与VS Code 1.89版本兼容性断层全景图 MCP(Microsoft Code Protocol)并非官方命名,而是开发者社区对 VS Code 扩展宿主通信机制的泛称,特指自 …...

变量声明改成文本格式

开题日期:2026.4.28 更新日期:2026.4.28 文章目录一、常规的显示界面二、设置后的显示界面三、设置方法前言 SCL 一、常规的显示界面 二、设置后的显示界面 FUNCTION_BLOCK "块_2"VAR_INPUTEND_VARVAR_OUTPUTEND_VARVAR_IN_OUTEND_VARVAREND_V…...

Phi-3.5-mini-instruct多场景落地:覆盖办公、教育、政务、研发四大高频需求

Phi-3.5-mini-instruct多场景落地:覆盖办公、教育、政务、研发四大高频需求 1. 模型简介与核心能力 Phi-3.5-mini-instruct是一款专为中文场景优化的轻量级文本生成模型,采用网页封装设计,用户无需编写任何代码即可直接使用。该模型在保持轻…...

TC39x芯片SRAM守护神MTU全解析:从SSH硬件结构到ECC/MBIST的避坑指南

TC39x芯片SRAM守护神MTU全解析:从SSH硬件结构到ECC/MBIST的避坑指南 在汽车电子领域,TC39x系列芯片凭借其高可靠性和强大的功能安全特性,已成为众多高端汽车电子控制单元的核心。作为芯片内存系统的"守护神",MTU&#x…...

大语言模型推理的硬件优化与HBF技术解析

1. 大语言模型推理的硬件挑战现状大语言模型(LLM)推理正面临前所未有的硬件挑战。作为从业超过15年的AI基础设施工程师,我见证了从早期神经网络到如今千亿参数模型的演进过程。当前最先进的GPT-4类模型,单次推理需要处理高达数万亿…...

告别点灯!用LVGL在ESP32上快速打造智能家居UI(基于LVGL官方ESP32端口)

告别点灯!用LVGL在ESP32上快速打造智能家居UI 在智能家居设备井喷的今天,一块反应灵敏、界面友好的控制面板往往能成为产品的核心竞争力。但传统嵌入式UI开发需要从底层寄存器开始配置显示屏,再逐个像素绘制界面元素——这种"点灯式&quo…...

real-anime-z多场景落地:同人创作、轻小说配图、社交平台头像批量生成

real-anime-z多场景落地:同人创作、轻小说配图、社交平台头像批量生成 1. 平台介绍与核心价值 real-anime-z是一款专为二次元内容创作设计的文生图工具,基于Tongyi-MAI/Z-Image基础模型和Devilworld/real-anime-z风格模型构建。这个开箱即用的解决方案让…...

代码随想录算法训练营第四十二天|LeetCode 188 买卖股票的最佳时机 IV、LeetCode 309 最佳买卖股票时机含冷冻期、LeetCode 714 买卖股票的最佳时机含手续费

参考文章均来自代码随想录 LeetCode 188 买卖股票的最佳时机 IV 参考文章链接 给你一个整数数组 prices 和一个整数 k ,其中 prices[i] 是某支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。也就是说&#xf…...