ComfyUI简单介绍
🍓什么是ComfyUI
ComfyUI是一个为Stable Diffusion专门设计的基于节点的图形用户界面,可以通过各种不同的节点快速搭建自己的绘图工作流程。
软件打开之后是长这个样子:

同时软件本身是github上的一个开源项目,开源地址为:https://github.com/comfyanonymous/ComfyUI,也就是说是完全免费的。

🍬为什么要学习ComfyUI
ComfyUI使用户能够通过链接不同的块(称为节点)来构建复杂的图像生成工作流程。这些节点可以包括各种任务,如加载检查点模型(checkpoint loader)、输入提示、指定采样器等。
ComfyUI以其快速、流畅的图像生成能力,以及对低配置设备的友好性,迅速在创作者中流行起来。
ComfyUI的一个亮点是能够一键加载别的创作者分享的工作流,让用户轻松实现人像生成、背景替换和图片动画化等功能。它提供了极高的自由度和灵活性,支持高度的定制化和工作流复用,同时对系统配置的要求较低,生成速度相对较快。
ComfyUI的节点分为官方原生节点和用户开发的自定义节点。官方原生节点是ComfyUI开发团队提供的一系列基础节点,而自定义节点则可以根据自己的需求开发,目前社区成员已经贡献了大量的自定义节点。
ComfyUI适合以下人群使用:
- 图像生成与编辑:数字艺术家、设计师和摄影师
- AI研究与实验:AI研究人员和开发者
- 个性化内容创作:视频制作者、博客作者和社交媒体影响者
- 教育与培训:教育工作者
- 游戏开发与动画制作:游戏和动画制作人员
- 产品设计与模拟:产品设计师
🌸Midjourney和ComfyUI对比
Midjourney,官方网站:https://www.midjourney.com/
是一款大家比较熟悉的AI绘画工具,这里不是Midjorney的课程,就不展开讲了,感兴趣的朋友可以自行百度下,有海量内容。

Midjourney最初是通过Discord社区上的工具提供服务,用户可以通过与机器人交互来生成图像。
特点:
- 快速生成图像:输入文字后,AI能在大约一分钟内生成图像;
- 图像质量高:出片质量相当高,美学评分一直都是高于其他几款绘图软件的;
- 艺术风格多样:可以选择不同画家的艺术风格;
- 社区互动:最初版本在Discord上,具有较强的社区互动性;
- 需要“网络通畅”才能访问,否则网站是登录不上去的;
- 收费,而且还不便宜,以下是2024.5月时的报价:

ComfyUI
特点:
- 节点式工作流:通过组合不同的节点来创建工作流;
- 高度可配置:用户可以根据自己的需求调整节点参数;
- 支持多种功能:包括文本到图像、图像修复、使用LoRA等;
- 易于共享和重复使用:每个文件都是一个可重复的工作流程;
- 可控性强,emm,这点很重要;
- 免费,当然,这点也很重要;
对比
- 设计理念:
- Midjourney更侧重于快速生成和艺术创作;
- ComfyUI更注重提供灵活的工作流和高度的可定制性;
- 用户交互:
- Midjourney最初通过Discord与用户交互,具有较强的社区属性;
- ComfyUI则提供了一个独立的GUI,用户可以在本地环境中构建和执行工作流;
- 功能范围:
- ComfyUI提供了更广泛的功能和更高的灵活性,适合需要进行复杂图像生成和编辑的用户;
- Midjourney则更专注于快速生成具有特定艺术风格的图像;
- 使用门槛:
- Midjourney可能更适合初学者,因为它的使用更直接、简单;
- ComfyUI可能需要用户对节点和工作流有一定的了解;
- 电脑要求:
- Midjourney是在线的,电脑能上网就行,对于显卡或者内存等没有太多要求;
- ComfyUI本地运行,所以对于显卡的要求相对会高一点,至少需要有4G独立显存;其他配置后边的章节我们再详细讲;
- 费用:
- Midjorney是收费的,按月付费,最低每个月10美金;
- ComfyUI是开源的免费软件;
🍒SD WebUI和ComfyUI对比
WebUI和ComfyUI都是围绕Stable Diffusion模型构建的用户界面,它们各有特点和优势。以下是两者的对比:
WebUI
概述:WebUI是由AUTOMATIC1111开发的,提供了一个图形化界面,允许用户通过网页操作Stable Diffusion模型生成图片。
使用方式:用户通过网页界面与模型交互,可以通过文本提示生成图像,也支持上传图片进行图像到图像的转换。
界面示意:

我们用一个表格做WebUI和ComfyUI对比
| 项目/软件 | webUI | ComfyUI |
|---|---|---|
| 用户界面 | 网页操作,比较好理解 | 节点操作,相对难理解 |
| 上手难度 | 相对简单 | 相对复杂 |
| 社区支持 | 丰富,有大量的插件可以使用 | 超级丰富,几乎每天都会更新,海量的自定义插件,就连ComfyUI本身更新频次都非常高 |
| 性能 | 两者相差不大,略低 | 两者相差不大,略高 |
| 电脑要求 | 较高,4G以上显存 | 较高,4G以上显存 |
| 费用 | 免费 | 免费 |
总的来说,如果需要快速简单的操作,WebUI可能是更好的选择;如果需要进行高级的定制和复杂的工作流构建,ComfyUI可能更加合适。
🍓SD/Stable Diffusion/webUI/ComfyUI关系是什么
Stable Diffusion(稳定扩散)是一种基于深度学习的文本到图像生成模型。它使用扩散过程来生成图像,能够根据用户提供的文本描述生成相应的图像内容。Stable Diffusion模型因其生成图像的高质量和多样性而受到关注,并且是开源的,这意味着任何人都可以使用和修改这个模型。
SD其实就是Stable Diffusion(稳定扩散)的英文简称。
WebUI,在AI绘图这个圈子里,通常是说Stable Diffusion WebUI的简称。
ComfyUI是专门为Stable Diffusion模型设计的基于节点的图形用户界面(GUI)。
总的来说,Stable Diffusion是核心的图像生成模型,WebUI和ComfyUI两个都是UI界面,所以大家不需要纠结WebUI和ComfyUI本身谁出图效果会更好,因为本身他俩只是界面而已,背后使用的技术都是Stable Diffusion这种模型。
🍀学习ComfyUI的好处
前边讲了很多,貌似ComfyUI上手难度比WebUI高,出图效果没有Midjourney好,那为什么还非要学习ComfyUI这个软件呢?
这个问题当然见仁见智了,我给出的答案是:
1、可控性强,可以使用stable diffuison的所有controlnet、图生图、文生图、视频生成等等的能力,还有大量图像放大、图像对比度增强、根据语义抠图等等的节点,都连在一起,可以实现非常复杂的操作一键生成,而如果用webui生成类似的复杂效果,有可能需要手工操作十几步,每一步都要修改大量参数才能实现;
2、生态强大,大量的开源模型和开源节点,让节点式的ComfyUI有了无限的拓展性,很多新出的开源模型,都可以通过自定义节点引入到comfyui的工作流中,甚至闭源的模型也可以通过API接入进来;另外,由于ComfyUI的团队被Stablity.ai收编了,所以有些时候Stability.ai公开新模型的前几天,ComfyUI就能实现提前兼容,这样新模型一发布,ComfyUI就可以使用了,而WebUI可能要等几周甚至几个月才能用;
3、可以使用别人现成的工作流,如果通过WebUI复现别人的作品,或者实现类似的效果,可能需要了解每一步详细的步骤和过程,自己一点点对参数,如果是复杂作品,就更麻烦了,而ComfyUI可以使用别人搭建好的工作流,一键生成类似的作品,甚至你可以不了解中间实现的具体方法都可以;
好了,本节课就到这里,接下来我们进入安装和电脑配置要求的章节;
相关文章:
ComfyUI简单介绍
🍓什么是ComfyUI ComfyUI是一个为Stable Diffusion专门设计的基于节点的图形用户界面,可以通过各种不同的节点快速搭建自己的绘图工作流程。 软件打开之后是长这个样子: 同时软件本身是github上的一个开源项目,开源地址为&#…...
【内存泄漏Bug】animation未释放
问题描述 一个页面做了动画特效,这个页面有可能跳转到其他页面,并长时间不返回,该页面此时已经不活跃了,该页面的对象为无用对象,存在内存泄漏风险 问题分析 这个activity的特性是 1. 有可能跳转到其他页面 2. 有可…...
《异常检测——从经典算法到深度学习》28 UNRAVEL ANOMALIES:基于周期与趋势分解的时间序列异常检测端到端方法
《异常检测——从经典算法到深度学习》 0 概论1 基于隔离森林的异常检测算法 2 基于LOF的异常检测算法3 基于One-Class SVM的异常检测算法4 基于高斯概率密度异常检测算法5 Opprentice——异常检测经典算法最终篇6 基于重构概率的 VAE 异常检测7 基于条件VAE异常检测8 Donut: …...
Python正则模块re方法介绍
Python 的 re 模块提供了多种方法来处理正则表达式。以下是一些常用的方法及其功能介绍: 1. re.match() 在字符串的开始位置进行匹配。 import repattern r\d string "123abc456"match re.match(pattern, string) if match:print(f"匹配的字符…...
pdf使用pdfbox切割pdf文件MultipartFile
引入依赖: <dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.25</version></dependency>测试代码: import io.choerodon.core.iam.ResourceLevel; impo…...
力扣HOT100 - 31. 下一个排列
解题思路: 数字是逐步增大的 步骤如下: class Solution {public void nextPermutation(int[] nums) {int i nums.length - 2;while (i > 0 && nums[i] > nums[i 1]) i--;if (i > 0) {int j nums.length - 1;while (j > 0 &&…...
设计模式 20 中介者模式 Mediator Pattern
设计模式 20 中介者模式 Mediator Pattern 1.定义 中介者模式(Mediator Pattern)是一种行为型设计模式,它通过封装对象之间的交互,促进对象之间的解耦合。中介者模式的核心思想是引入一个中介者对象,将系统中对象之间…...
在 C++ 中,p->name 和 p.name 的效果并不相同。它们用于不同的情况,取决于你是否通过指针访问结构体成员。
p->name:这是指针访问运算符(箭头运算符)。当 p 是一个指向结构体的指针时,用 p->name 来访问结构体的成员。 student* p &stu; // p 是一个指向 student 类型的指针 cout << p->name << endl; // 通过…...
C++基础:多态
多态相关 多态继承重写父类的虚函数多态的体现,父类的引用指向子类对象的空间虚函数可以实现,也可以不实现,不实现必须要有初始值存在未定义的虚函数的类为抽象类.抽象类不能实例化对象;(animal父类不能实例化对象)如果父类中的函数非虚函数,则会调用父类中的函数//多态的体现…...
移除元素(算法题)
文章目录 移除元素解题思路 移除元素 给你一个数组 nums 和一个值 val,你需要原地移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,你必须仅使用 O(1) 额外空间并原地修改输入数组。 元素的顺序可以改变。…...
电商场景的视频动效
AtomoVideo:AIGC赋能下的电商视频动效生成本文分享阿里妈妈视频 AIGC(AtomoVideo等) 赋能视频广告创意的探索和实践。通过基于扩散模型的视频生成技术,结合可控生成技术,使静态电商图片能够栩栩如生地“动”起来,实现了在电商领域的视频 AIGC 应用落地。https://mp.weixi…...
Windows操作系统基本知识整理
目录 引言 一、Windows操作系统的发展历史 1.1 Windows 1.0到Windows 3.0 1.2 Windows 95到Windows Me 1.3 Windows NT到Windows 2000 1.4 Windows XP到Windows 7 1.5 Windows 8到Windows 10 二、Windows操作系统的核心组件 2.1 内核 2.2 文件系统 2.3 图形用户界面&…...
Vue 状态管理深入研究:Vuex 和 Pinia 的原理与实践对比
推荐一个AI网站,免费使用豆包AI模型,快去白嫖👉海鲸AI 👋 引言 在 Vue.js 应用程序中,状态管理是一个至关重要的方面。它有助于集中管理应用的状态,使组件之间的数据共享更加高效和可维护。Vuex 和 Pinia …...
【三数之和】python,排序+双指针
暴力搜索3次方的时间复杂度,大抵超时 遇到不会先排序 排序双指针 上题解 照做 class Solution:def threeSum(self, nums: List[int]) -> List[List[int]]:res[]nlen(nums)#排序降低复杂度nums.sort()k0#留两个位置给双指针i,jfor k in range(n-2):if nums[k]…...
TCP通信实现(服务端与客户端)
TCP通信实现(服务器端) 案例 // TCP 通信的服务器端#include <stdio.h> #include <arpa/inet.h> #include <unistd.h> #include <string.h> #include <stdlib.h>int main() {// 1.创建socket(用于监听的套接字)int lfd socket(AF_…...
安装appium自动化测试环境,我自己的版本信息
教程来自:Appium原理与安装 - 白月黑羽 我的软件的版本: 安装是选择为自己安装而不是选all user pip install appium-python-client命令在项目根目录下安装appium-python-client sdk的话最简单的安装方式就是去Android官网下一个android studio然后在…...
【讲解下Web前端三大主流的框架】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...
视频监控平台AS-V1000产品介绍:账户或用户数据的导入和导出功能介绍
目录 一、功能描述 (一)导入功能定义 (二)导出功能定义 二、用户数据的导入导出的作用 三、AS-V1000新版本的导出和导入功能介绍 (一)功能主界面 (二)导出功能 1、导出操作 …...
markdown画时序图的时候,如何自动显示每一条时序的序号
1: 现象描述 今天画时序图的时候,发现时序上面没有显示序号,看起来不够清晰,只有单纯的说明; 如下图所示 刚测试CSDN的时序图,默认是带序号的,看起来和实际使用的markdown工具有关系; 2:解决办…...
朴素贝叶斯
经典三门问题 问题 一种说法(直觉派) 另一种说法(贝叶斯派) 注意P(B)1, 已经知道路人抽中的就是绿豆 三门问题在网上争端比较大,分为直觉派和贝叶斯派,最后一个程序员出来写程序跑了一遍,发现就是贝叶斯派 朴素贝叶斯的直观理解 在X的条件下分别等于0~9的概率 注意之前我们讲的…...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...
3.3.1_1 检错编码(奇偶校验码)
从这节课开始,我们会探讨数据链路层的差错控制功能,差错控制功能的主要目标是要发现并且解决一个帧内部的位错误,我们需要使用特殊的编码技术去发现帧内部的位错误,当我们发现位错误之后,通常来说有两种解决方案。第一…...
深入理解JavaScript设计模式之单例模式
目录 什么是单例模式为什么需要单例模式常见应用场景包括 单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量 惰性单例通用的惰性单例 结语 什么是单例模式 单例模式(Singleton Pattern&#…...
MMaDA: Multimodal Large Diffusion Language Models
CODE : https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA,它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构…...
多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验
一、多模态商品数据接口的技术架构 (一)多模态数据融合引擎 跨模态语义对齐 通过Transformer架构实现图像、语音、文字的语义关联。例如,当用户上传一张“蓝色连衣裙”的图片时,接口可自动提取图像中的颜色(RGB值&…...
srs linux
下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口 默认RTMP接收推流端口是1935,SRS管理页面端口是8080,可…...
DBAPI如何优雅的获取单条数据
API如何优雅的获取单条数据 案例一 对于查询类API,查询的是单条数据,比如根据主键ID查询用户信息,sql如下: select id, name, age from user where id #{id}API默认返回的数据格式是多条的,如下: {&qu…...
【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分
一、项目背景回顾 前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。 本弹重点聚焦于服务端的模块划分与架构设计,提升代码结构的可维护性与扩展性。 二、服务端模块设计目标 高内聚低耦合:各模块职责清晰,便于独立开发…...
Mobile ALOHA全身模仿学习
一、题目 Mobile ALOHA:通过低成本全身远程操作学习双手移动操作 传统模仿学习(Imitation Learning)缺点:聚焦与桌面操作,缺乏通用任务所需的移动性和灵活性 本论文优点:(1)在ALOHA…...
NPOI操作EXCEL文件 ——CAD C# 二次开发
缺点:dll.版本容易加载错误。CAD加载插件时,没有加载所有类库。插件运行过程中用到某个类库,会从CAD的安装目录找,找不到就报错了。 【方案2】让CAD在加载过程中把类库加载到内存 【方案3】是发现缺少了哪个库,就用插件程序加载进…...
