FLUX模型,或许这几点你还未曾都了解,最详细的Flux模型介绍(附模型安装包)
当我们还在沉浸在惊叹和体验快手的Kolors模型之时,SD原开发团队组成的“黑森林”出的FLUX模型就袭来了。我们不得不感叹FLUX模型给我们带来的冲击,模型所绘制的画面质感、精细度的确让我们眼前一亮,之前发布的SD3开源模型给我们带来的些许失落感顿时烟消云散。因为FLUX的出现,填补了我们对SD3的些许失望。
接下来,我们借此文跟大家交流下这个近期备受追捧的开源绘画模型FLUX1.0。
模型介绍及下载存放
在我们使用FLUX开源模型之前,需要先将FLUX这个体系的相应生图模型相关的UNET、CLIP和VAE模块用到的模型做下载存放备用。
UNET
与我们之前文章中介绍的“模型体系生图所用的模块”中提到的三个模型模块一样,在FLUX的生图流程中,也需要调用到:UNET、CLIP和VAE这三个模块的模型。我们抛开只能通过API调用的Flux-pro版的不说,就跟大家聊聊本地部署的模型使用。
我们需要先下载好flux的主模型,这里我们主要介绍六种规格的模型供大家尝试,分别是:
● 满血版的flux1-dev.sft,23.8 GB(算力要求高,出图用时长)
https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
● 快速出图版的flux1-schnell.sft,23.8 GB(4步即可出图,质感也只略逊色于满血版)
https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main
● fp8版的flux1-dev-fp8.safetensors,11.9GB(对显存要求不那么高的,建议16G以上,出图相对满血版的更快)
https://huggingface.co/Kijai/flux-fp8/tree/main
● 在Kijai大佬的这个剪枝版的下载链接中,还能下载到flux1-schnell-fp8.safetensors,这个模型,也是官方推出的快速出图版的剪枝模型,也是11.9G。
上述四种模型下载后存放在ComfyUI目录下:
ComfyUI\models\unet\FLUX
● 此外还有Comfy Org版dev模型:
https://huggingface.co/Comfy-Org/flux1-dev/tree/main
● Comfy Org版schnell模型:
https://huggingface.co/Comfy-Org/flux1-schnell/tree/main
其模型下载后,存放在ComfyUI\models\checkpoints目录中,被视为普通的基础模型来调用,它的模型里包含了clip和vae。
对于显存更小的(8G)同学,可以搜索“gguf”这个版本的FLUX模型,对显存算力的需求会更低一点,有兴趣的朋友可以自行尝试。
Flux-dev-gguf:https://huggingface.co/city96/FLUX.1-dev-gguf``GGUF节点存储库:https://github.com/city96/ComfyUI-GGUF
CLIP
将用于CLIP加载器所要调用的模型下载后存放在目录:
ComfyUI\models\clip
下载地址:
https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main
VAE
至于FLUX模型,其生态用到的VAE模型ae.sft: 335 MB,下载地址,在官方主模型下载链接中也提供了下载,下载后存放路径为:
ComfyUI\models\vae
https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
FLUX工作流使用要点
FLUX模型,取消了反向提示词的输入,在搭建工作流的时候有需要用到也只需加一个空的文本编辑器节点就好。
此外,CFG值也默认都为1.0即可,如果用到了K采样节点搭建工作流时。
加载器的选择
在FLUX的工作流中使用满血版或半血版,区别在于模型的选择和CLIP加载器的选择,如果你的ComfyUI中没有相应的可选想或节点,那么大概率是你需要更新你的ComfyUI本体了。
半血版,则是将主模型改为fp8的,权重类型为fp8的,clip1也改为fp8的t5模型,出图快,效果不会逊色多少于满血版的。
满血版,则是将主模型改为dev的,权重类型为默认的,clip1改为fp16的t5模型。
引导值
这个引导值(guidance),大家可能不太注意,这个值对于画面画风是有影响的。也就是模型的艺术表现力方面,默认3.5即可;值越小则艺术感越强,用于风格非写实时用(参考值1.5~2);值越大,则细节越多,出现更锐化清晰些(参考值4.5)。大家在不同画风绘制的时候可以加以尝试,锁定种子值后,调整这个值,自行体验。
采样器与调度器的选择组合
这里我们借用一些博主测试后的体验小结,跟大家分享推荐使用五种采样器与调度器的搭配组合:
ipdmn+simple
uni_pc_bh2+simple
euler+beta
euler+simple
dpmpp+sgm_uniform
步数
对于出图的步数,我们也做过尝试与比对,更多的步数时间会更多但细节表现也会更好些。我们可以根据需要,适当提高。
常规模型如flux1-dev.sft和flux1-dev-fp8.safetensors的比对
对于快速出图模型flux1-schnell.sft,官方默认是4步,但不妨碍我们尝试更多步。
相关资源:
最后篇末我们也会分享目前我们用过的一些FLUX相关的工作流,供大家参考与学习,主要包含:文生图、图生图、局部重绘、反推提示词图生图、带LoRA的工作流,这些是目前FLUX生态中相对成熟的可用的部分,当然最近也出了Controlnet和IPA的一些模型和用法,我们还没来及测试和体验,暂让子弹飞一会儿。相信不久的将来,包括各种LoRA、IPAdapter、InstantID、Controlnet...等生态也会慢慢更加丰富起来。 今天文章中的说明图像、模型文件和工作流文件,我们都分享在了云盘,需要的小伙伴直接扫码获取

相关文章:

FLUX模型,或许这几点你还未曾都了解,最详细的Flux模型介绍(附模型安装包)
当我们还在沉浸在惊叹和体验快手的Kolors模型之时,SD原开发团队组成的“黑森林”出的FLUX模型就袭来了。我们不得不感叹FLUX模型给我们带来的冲击,模型所绘制的画面质感、精细度的确让我们眼前一亮,之前发布的SD3开源模型给我们带来的些许失落…...

RAG(Retrieval-Augmented Generation)检索增强生成技术基础了解学习与实践
RAG(Retrieval-Augmented Generation)是一种结合了信息检索(Retrieval)和生成模型(Generation)的技术,旨在提高生成模型的性能和准确性。RAG 技术通过在生成过程中引入外部知识库,使…...
基于SpringBoot实现高性能缓存组件
1. 简介 为了体现我们的实力,首先我们要有造轮子的能力。这意味着我们不仅要熟练掌握现有的技术栈和框架,还要具备深厚的技术功底。通过自主设计和实现关键组件,如高性能缓存系统,我们能够深入理解技术背后的原理,掌握…...
【深度学习基础模型】递归神经网络 (Recurrent Neural Networks, RNN) 详细理解并附实现代码。
【深度学习基础模型】递归神经网络 (Recurrent Neural Networks, RNN) 【深度学习基础模型】递归神经网络 (Recurrent Neural Networks, RNN) 文章目录 【深度学习基础模型】递归神经网络 (Recurrent Neural Networks, RNN)1.算法原理介绍:递归神经网络 (Recurrent…...
python全栈学习记录(十九) hashlib、shutil和tarfile、configparser
hashlib、shutil和tarfile、configparser 文章目录 hashlib、shutil和tarfile、configparser一、hashlib二、shutil和tarfile1.shutil2.tarfile 三、configparser 一、hashlib hash是一种算法,该算法接受传入的内容,经过运算得到一串hash值。如果把hash…...
RL进阶(一):变分推断、生成模型、SAC
参考资料: 视频课程《CS285: Deep Reinforcement Learning, Decision Making, and Control》第18讲、第19讲,Sergey Levine,UCerkeley课件PDF下载:https://rail.eecs.berkeley.edu/deeprlcourse/主要内容:变分推断、生成模型、以及Soft Actor-Critic。变分推断在model-bas…...
WPF 绑定 DataGrid 里面 Button点击事件 TextBlock 双击事件
TextBlock双击事件 <DataGridTemplateColumn Width"*" Header"内标"><DataGridTemplateColumn.CellTemplate><DataTemplate><Grid><TextBlockBackground"Transparent"Tag"{Binding InternalId}"Text"…...

828华为云征文|华为云Flexus云服务器X实例Windows系统部署一键短视频生成AI工具moneyprinter
在追求创新与效率并重的今天,我们公司迎难而上,决定自主搭建一款短视频生成AI工具——MoneyPrinter,旨在为市场带来前所未有的创意风暴。面对服务器选择的难题,我们经过深思熟虑与多方比较,最终将信任票投给了华为云Fl…...

非标精密五金加工的技术要求
非标精密五金加工在现代制造业中占据着重要地位,其对于产品的精度、质量和性能有着较高的要求。以下是时利和整理的其具体的技术要求: 一、高精度的加工设备 非标精密五金加工需要先进的加工设备来保证加工精度。例如,高精度的数控机床是必不…...

新手小白怎么通过云服务器跑pytorch?
新手小白怎么通过云服务器跑pytorch?安装PyTorch的步骤可以根据不同的操作系统和需求有所差异,通过云服务器运行PyTorch的过程主要包括选择GPU云服务器平台、配置服务器环境、部署和运行PyTorch模型、优化性能等步骤。具体步骤如下: 第一步&a…...

Spring 全家桶使用教程
✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…...
Spark SQL性能优化高频面试题及答案
目录 高频面试题及答案1. 如何通过分区(Partitioning)优化Spark SQL查询性能?2. 什么是数据倾斜(Data Skew)?如何优化?3. 如何使用广播(Broadcast)优化Join操作ÿ…...
云原生链路观测平台 openobserve + fluent-bit,日志收集
grpc-opentracing https://github.com/grpc-ecosystem/grpc-opentracing openobserve fluent-bit 为啥会选择这个组合 一个 rust 写的一个是c写的,性能和内存方面不用担心,比java 那套好太多了 openobserve 文档 :https://openobserve.ai/…...

Android 车载应用开发指南 - CarService 详解(下)
车载应用正在改变人们的出行体验。从导航到娱乐、从安全到信息服务,车载应用的开发已成为汽车智能化发展的重要组成部分。而对于开发者来说,如何将自己的应用程序无缝集成到车载系统中,利用汽车的硬件和服务能力,是一个极具挑战性…...

【Linux网络 —— 网络基础概念】
Linux网络 —— 网络基础概念 计算机网络背景网络发展 初始协议协议分层协议分层的好处 OSI七层模型TCP/IP五层(或四层)模型 再识协议为什么要有TCP/IP协议?什么是TCP/IP协议?TCP/IP协议与操作系统的关系所以究竟什么是协议? 网络传输基本流程…...

el-form动态标题和输入值,并且最后一个输入框不校验
需求:给了固定的label,叫xx单位,要输入单位的信息,但是属性名称都一样的,UI画图也是表单的形式,所以改为动态添加的形式,实现方式也很简单,循环就完事了,连着表单校验也动…...

一,初始 MyBatis-Plus
一,初始 MyBatis-Plus 文章目录 一,初始 MyBatis-Plus1. MyBatis-Plus 的概述2. 入门配置第一个 MyBatis-Plus 案例3. 补充说明:3.1 通用 Mapper 接口介绍3.1.1 Mapper 接口的 “增删改查”3.1.1.1 查询所有记录3.1.1.2 插入一条数据3.1.1.3 …...

安卓13删除下拉栏中的关机按钮版本2 android13删除下拉栏关机按钮
总纲 android13 rom 开发总纲说明 文章目录 1.前言2.问题分析3.代码分析4.代码修改5.编译6.彩蛋1.前言 顶部导航栏下拉可以看到,底部这里有个设置按钮,点击可以进入设备的设置页面,这里我们将更改为删除,不同用户通过这个地方进入设置。我们之前写过一个文章也是一样的删除…...
快递物流单号识别API接口代码
官网:快递鸟 API参数 一、接口描述/说明 (1)该接口仅对运单号做出识别,识别可能属于的一家或多家快递公司。 (2)接口并不返回物流轨迹,用户可结合即时查询接口和订阅查询接口完成轨迹查询、订…...
AI时代的程序员:如何保持和提升核心竞争力
1.引言 随着AIGC(如 ChatGPT、Midjourney、Claude 等)大语言模型的快速崛起,AI辅助编程工具逐渐成为程序员工作的重要组成部分。这一转变不仅改变了工作方式,更深刻影响了程序员的职业角色和技术路径。有人担心,AI将取…...
AtCoder 第409场初级竞赛 A~E题解
A Conflict 【题目链接】 原题链接:A - Conflict 【考点】 枚举 【题目大意】 找到是否有两人都想要的物品。 【解析】 遍历两端字符串,只有在同时为 o 时输出 Yes 并结束程序,否则输出 No。 【难度】 GESP三级 【代码参考】 #i…...
工程地质软件市场:发展现状、趋势与策略建议
一、引言 在工程建设领域,准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具,正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...
leetcodeSQL解题:3564. 季节性销售分析
leetcodeSQL解题:3564. 季节性销售分析 题目: 表:sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...
Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理
引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...

2025季度云服务器排行榜
在全球云服务器市场,各厂商的排名和地位并非一成不变,而是由其独特的优势、战略布局和市场适应性共同决定的。以下是根据2025年市场趋势,对主要云服务器厂商在排行榜中占据重要位置的原因和优势进行深度分析: 一、全球“三巨头”…...

人机融合智能 | “人智交互”跨学科新领域
本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师(题目+回答)
安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 腾讯[实习]科恩实验室-安全工程师 一、网络与协议 1. TCP三次握手 2. SYN扫描原理 3. HTTPS证书机制 二…...

认识CMake并使用CMake构建自己的第一个项目
1.CMake的作用和优势 跨平台支持:CMake支持多种操作系统和编译器,使用同一份构建配置可以在不同的环境中使用 简化配置:通过CMakeLists.txt文件,用户可以定义项目结构、依赖项、编译选项等,无需手动编写复杂的构建脚本…...
前端高频面试题2:浏览器/计算机网络
本专栏相关链接 前端高频面试题1:HTML/CSS 前端高频面试题2:浏览器/计算机网络 前端高频面试题3:JavaScript 1.什么是强缓存、协商缓存? 强缓存: 当浏览器请求资源时,首先检查本地缓存是否命中。如果命…...