【AI辅助设计】没错!训练FLUX LoRA就这么简单!
前言

得益于开源社区的力量,在各位大佬的努力下,现在16G VRAM的家用电脑也可以训练FLUX的LoRA了 👏。
今天我使用fluxgym这个方法,训练LoRA,并记录过程。
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!
CSDN官方AI绘画资料合集,点击这里快速获取!
fluxgym
由cocktail peanut 整合开发的一个易用的前端LoRA训练web应用,其背后也是使用Kohya Scripts。有两大优点:
- 显著降低显存占用。支持12GB、16GB、20GB显卡;
- 超级简单的用户界面和流程;
但目前仅支持NV的卡,项目地址:https://github.com/cocktailpeanut/fluxgym

得益于其优秀的易用性,X上越来越多的推友,都用这个应用来训练LoRA。

安装fluxgym
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!
CSDN官方AI绘画资料合集,点击这里快速获取!
克隆项目
首先克隆 Fluxgym 和 kohya-ss/sd-scripts:
git clone https://github.com/cocktailpeanut/fluxgym``cd fluxgym``git clone -b sd3 https://github.com/kohya-ss/sd-scripts
您的文件夹结构将如下所示:
/fluxgym` `app.py` `requirements.txt` `/sd-scripts
创建conda环境
官方使用的是venv虚拟环境,我这里就直接使用conda环境来安装了。
conda create -n fluxgym python=3.10

激活环境
conda activate fluxgym

进入sd-scripts,并安装依赖
cd sd-scripts``pip install -r requirements.txt

然后回到根目录,在安装依赖:
cd ..``pip install -r requirements.txt
最后,安装 pytorch Nightly:
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!
CSDN官方AI绘画资料合集,点击这里快速获取!
下载模型
其实跟fp16的FLUX模型组一样的,如果已经下载过,直接复制相关模型文件到相关目录即可。
首先,在foder下下载以下模型models/clip:
-
https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/clip_l.safetensors?download=true
-
https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp16.safetensors?download=true
其次,下载文件夹下的以下模型models/vae:
- https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/ae.sft?download=true
最后下载models/unet文件夹下的以下模型:
- https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/flux1-dev.sft?download=true
结果文件结构如下:
/models` `/clip` `clip_l.safetensors` `t5xxl_fp16.safetensors` `/unet` `flux1-dev.sft` `/vae` `ae.sft``/sd-scripts``/outputs``/env``app.py``requirements.txt``...
运行
返回根fluxgym文件夹,激活 caonda环境,运行:
python app.py


训练过程
准备数据集
这次的目标是训练一个等距视角的室内模型icon。获取素材的过程,大家可以使用Midjourney,质量可控,方便快捷~😂

生成10到20张图就可以作为素材输入了。

将图片一一下载好,名字没关系,fluxgym后续可以处理。
尺寸就使用Midjourney生成的1024x1024吧,其实可以放大后再保存,这样训练出来的模型,质量更好。
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!CSDN官方AI绘画资料合集,点击这里快速获取!
训练信息
这里制作简单演示哈~。按照图片所示,输入基础的训练参数,其他先默认吧:
-
LoRA名称
-
触发词
-
上传图片素材
-
使用Florence反推打标。这个真的好用,免去了打标的步骤

值得一提的是,Florence打标必须点赞,又方便又好~👍
使用打标时,需要另外下载模型,这里需要等待一段时间。

反推得还是很准确的。

开始训练
一切就绪后,就可以点击开始训练了。

耐心等待中 ☕️

显存去到了接近20GB

最终用时36分钟。

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!
CSDN官方AI绘画资料合集,点击这里快速获取!
LoRA效果
训练好的LoRA模型就在根目录的output文件夹中。时间关系,我就不做xy图了,直接用最后产出的LoRA看看效果。
加上LoRA后,元素和细节更加明显了。使用同样的提示语,右图为加上LoRA的效果。
3d isometric interiors, a living room with a blue background, featuring a sofa with cushions, a table with various objects on it, a chair, a monitor, keyboard, mouse, lamp, and other items on the table, houseplants, windows with curtains, and toys scattered on the floor.

更多输出如下:


写在最后
还是那句话,因为开源,所以生气蓬勃! 可以说,这是我目前遇到的最易用的LoRA训练流程,大家赶紧用起来吧~。
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!
CSDN官方AI绘画资料合集,点击这里快速获取!
相关文章:
【AI辅助设计】没错!训练FLUX LoRA就这么简单!
前言 得益于开源社区的力量,在各位大佬的努力下,现在16G VRAM的家用电脑也可以训练FLUX的LoRA了 👏。 今天我使用fluxgym这个方法,训练LoRA,并记录过程。 篇幅有限,这里就不一一展示了,有需要的…...
Mac 下安装FastDFS
首先我们需要下载相对应的安装包: libfastcommonFastDFS 下载完成后我们先将其解压到桌面。 1.安装libfastcommon 我们进入到libfastcommon-master目录中执行./make.sh和sudo ./make.sh install,具体代码如下: 2.安装FastDFS 同安装libfa…...
人工智能的未来:重塑生活与工作的变革者
随着人工智能(AI)技术的快速发展,我们正处于一个前所未有的变革时代。AI不仅在医疗、企业运营和日常生活中发挥着重要作用,而且正在重新定义我们的生活和工作方式。本文将探讨人工智能技术的应用前景以及它如何改变我们的生活和工…...
【微服务】Java 对接飞书多维表格使用详解
目录 一、前言 二、前置操作 2.1 开通企业飞书账户 2.2 确保账户具备多维表操作权限 2.3 创建一张测试用的多维表 2.4 获取飞书开放平台文档 2.5 获取Java SDK 三、应用App相关操作 3.1 创建应用过程 3.2 应用发布过程 3.3 应用添加操作权限 四、多维表应用授权操作…...
学习threejs,使用粒子实现下雪特效
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.Points简介1.11 ☘️…...
unity3d——Time
在Unity3D中,Time类是一个非常重要的工具类,它提供了一系列与时间相关的属性和方法,帮助开发者在游戏中实现各种时间相关的操作。以下是一些Time类常用的方法及其示例: 一、常用属性 Time.time 含义:表示从游戏开始到…...
天地图实现海量聚合marker--uniapp后端详细实现
本文章详细的讲解了前后端代码来 实现uniapp天地图功能的实现 以及 后端海量数据的聚合查询 和网格算法实现思路。 并对当数据量增加和用户频繁请求接口时可能导致服务器负载过高做了前后端优化。 前端uniapp: 实现了天地图的行政区划边界/地图切换/比例尺/海量数…...
Bug | 项目中数据库查询问题
问题描述 理论上,点击查询后,表头应当显示中文。而不是上面的在数据库中的表头【如上图示】 正常点击查询后,如果没有输入值,应当是查询所有的信息。 原因分析: 这里是直接使用SELECT * 导致的。例如: S…...
C++入门基础知识129—【关于C 库函数 - time()】
成长路上不孤单😊😊😊😊😊😊 【14后😊///C爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C 库函数 - time()的相关内容࿰…...
大文件秒传,分片上传,断点续传
大文件分片上传 一 功能描述 1.文件通过web端分片多线程上传到服务端,然后web端发起分片合并,完成大文件分片上传功能 2.上传过的大文件,实现秒传 3.上传过程中,服务异常退出,实现断点续传 二 流程图 三 代码运行…...
多生境扩增子探秘:深度溯源与多样性解析
分析微生物组数据的组成结构的一个主要挑战是确定其潜在来源。在微生物来源分析中,随机森林、SourceTracker和FEAST都有较广泛应用。今天,小编就带大家看一篇发表在《iMeta》的文章,使用溯源技术追踪微生物的来源与去向,揭示生物在…...
Selenium4自动化测试常用函数总结,各种场景操作实战
🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 seleninum作为自动化测试的工具,自然是提供了很多自动化操作的函数,下面列举下比较常用的函数,更多可见官方文档:…...
图像生成新范式:智源推出全能视觉生成模型 OmniGen
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen&am…...
实现RPC接口的demo记录
1.Thrift RPC 接口实现 Demo Service public class DemoServiceImpl implements DemoService.Iface {private static final Logger logger LoggerFactory.getLogger(DemoServiceImpl.class);Overridepublic String sayHello(Context context, String msg) throws TException …...
Python期末题目 | 期末练习题【概念题+代码】
一、前言 Python 是一门功能强大且易于学习的编程语言,在高校中被广泛用作教学语言。Python 的期末考试通常会包含基础知识和编程实践,以考察学生的理解与应用能力。本文整理了一套 Python 期末练习题,包括选择题、填空题、判断题和代码题。…...
OpenCV基本操作(python开发)——(6)视频基本处理
OpenCV——视频基本处理 一、读取摄像头 import numpy as np import cv2cap cv2.VideoCapture(0) # 实例化VideoCapture对象, 0表示第一个摄像头 while cap.isOpened():ret, frame cap.read() # 捕获帧cv2.imshow("frame", frame)c cv2.waitKey(1) # 等待1毫…...
详解Java之Spring MVC篇一
目录 Spring MVC 官方介绍 MVC RequestMapping 传递参数 无参数 单个参数 针对String类型 针对Integer类型 针对int类型 针对自定义类型 多个参数 参数重命名 参数强制一致 参数不强制一致 传递数组 编辑传递List 编辑 传递JSON 编辑 从路径中获取参…...
ubuntu20.04上使用 Verdaccio 搭建 npm 私有仓库
安装nvm 首先安装必要的工具: apt update apt install curl下载并执行nvm安装脚本: curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh | bash添加环境变量(如果安装脚本没有自动添加)。编辑 ~/.bash…...
Python实现办公自动化的数据可视化与报表生成
在 Python 中,可以利用多个库来实现办公自动化中的数据可视化与报表生成。以下是具体的方法: 一、数据可视化 使用 matplotlib 库 matplotlib 是一个强大的 Python 绘图库,可以创建各种类型的静态、动态和交互式图表。示例代码:i…...
前端知识串联笔记(更新中...)
1.MVVM MVVM 是指 Model - View - ViewModel,Model 是数据与业务逻辑,View 是视图,ViewModel 用于连接 View 和 Model Model ---> View:将数据转化成所看到的页面,实现的方式:Data Bindings -- 数据绑定…...
洛雪音乐音源终极指南:5分钟解锁全网无损音乐资源
洛雪音乐音源终极指南:5分钟解锁全网无损音乐资源 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 洛雪音乐音源是专为洛雪音乐客户端设计的强大插件集合,能够帮助你轻松获取…...
香橙派Ubuntu镜像烧录与系统迁移实战指南
1. 香橙派与Ubuntu镜像的完美组合 香橙派作为国产开源硬件中的佼佼者,凭借其出色的性价比和丰富的接口,已经成为很多开发者和创客的首选。而Ubuntu作为最受欢迎的Linux发行版之一,以其稳定性和易用性赢得了大量用户的青睐。将这两者结合起来&…...
解决Ubuntu 22.04开发板更新源404错误的ARM架构适配指南
1. 为什么ARM开发板更新源会报404错误? 最近在树莓派上折腾Ubuntu 22.04时,遇到了一个让人抓狂的问题:无论换成阿里云、清华还是中科大的镜像源,执行apt update时总是报404错误。刚开始以为是网络问题,反复重试了好几次…...
当固体力学遇上AI:Energy-based PINN如何搞定超弹性橡胶材料仿真?
Energy-based PINN:颠覆超弹性材料仿真的无网格革命 橡胶密封圈在高压环境下的变形预测误差超过40%、人工心脏瓣膜材料的疲劳寿命仿真需要72小时计算、柔性电子器件在弯曲状态下的应力分布难以精确建模——这些困扰研究者的难题,正在被一种结合深度学习和…...
基于MATLAB的图像加密解密系统 可以正确无误的对图像进行加密和解密 带GUI界面
基于MATLAB的图像加密解密系统 可以正确无误的对图像进行加密和解密 带GUI界面,一步一步完整运行你是否有过这样的疑问——如何让一张普通图片变成外星密文?在MATLAB里玩转图像加密真的可以像搭积木一样简单。今天咱们就来捣鼓一个带界面的图像加密系统&…...
告别硬件!用Proteus8.9和VSPD虚拟串口,5分钟搞定51单片机串口通信仿真
零成本玩转51单片机串口通信:Proteus与VSPD虚拟串口实战指南 记得刚接触单片机开发时,最头疼的就是硬件问题——买开发板要钱,买USB转串口模块要钱,连杜邦线都得精打细算。直到发现ProteusVSPD这对黄金组合,才明白原来…...
MedGemma 1.5垂直场景:中医馆本地部署中药配伍禁忌推理助手
MedGemma 1.5垂直场景:中医馆本地部署中药配伍禁忌推理助手 1. 引言:当传统中医遇上现代AI 想象一下,一位经验丰富的老中医,在开方时,除了依靠毕生所学和师徒传承的记忆,还能随时向一位精通古今医典、永不…...
CK3M多轴运动控制器实战:EtherCAT总线伺服系统从零配置全解析
1. CK3M控制器与EtherCAT系统初识 第一次接触CK3M多轴运动控制器时,我完全被它强大的功能震撼到了。这款控制器就像工业自动化领域的"大脑",能够同时协调多个伺服电机精准运动。而EtherCAT总线技术则是连接这个大脑与各个执行机构(…...
Simple Comic:Mac平台的开源漫画阅读解决方案
Simple Comic:Mac平台的开源漫画阅读解决方案 【免费下载链接】Simple-Comic OS X comic viewer 项目地址: https://gitcode.com/gh_mirrors/si/Simple-Comic 你是否曾遇到这样的困扰:在Mac上尝试打开漫画文件时,不是格式不兼容就是阅…...
零基础吃透静态链表(数组模拟链表):从原理到代码,新手全疑问一次性解决
本文面向刚入门数据结构、已掌握动态链表但看不懂静态链表的新手,全程从已知到未知,循序渐进拆解所有核心知识点、代码逻辑和新手高频误区,看完就能彻底吃透静态链表。目录什么是静态链表?和动态链表的核心区别静态链表的核心规则…...
