当前位置: 首页 > article >正文

用自定义图像微调FLUX.1模型

使用自有图像微调FLUX.1模型现在可以在Replicate上使用快速FLUX训练器微调模型。该训练速度极快不到2分钟、成本低廉低于2美元并提供可运行的模型以及可下载的LoRA权重。FLUX.1是Black Forest Labs今年夏季发布的文本生成图像模型系列。FLUX.1模型为开源图像模型设立了新标准能够生成逼真的手部、清晰的文字甚至包括难度极高的搞笑表情包。现在可以使用Ostris的AI工具包在Replicate上微调FLUX.1 [dev]模型。通过向模型展示一组示例图像教会它识别并生成新概念从而针对特定风格、角色或物体定制模型输出。Ostris的工具包采用LoRA技术实现快速、轻量级的训练。如何微调FLUX.1只需上传一些图像通过网页或API即可在Replicate上微调FLUX.1。准备训练数据开始微调前需要准备一组代表要教授模型的概念的图像。这些图像应足够多样化以涵盖概念的不同方面。例如如果针对特定角色进行微调应包含不同场景、姿势和光照条件下的图像。以下是指导原则使用12-20张图像以获得最佳效果尽可能使用大尺寸图像使用JPEG或PNG格式可选为每张图像创建同名的.txt描述文件将图像及可选的描述文件打包成单个zip文件。通过网页创建训练首先选择或创建一个目标模型在模型选择器字段中输入名称。然后上传包含训练数据的zip文件作为input_images并设置训练参数。trigger_word指要训练的对象、风格或概念。选择一个非真实单词的字符串如TOK或与训练内容相关的词如CYBRPNK。指定的触发词将在训练期间与所有图像关联。之后运行微调模型时可以在提示中包含触发词来激活概念。对于训练步数1000是一个不错的起点。保持learning_rate、batch_size和resolution为默认值。除非想提供自定义描述否则保持autocaptioning启用。如果要将模型保存到Hugging Face请输入Hugging Face令牌并设置仓库ID。填写完成后点击“创建训练”开始微调。通过API创建训练确保环境中已设置REPLICATE_API_TOKEN可在账户设置中找到。importreplicate# 创建目标模型modelreplicate.models.create(owneryourusername,nameflux-your-model-name,visibilitypublic,# 或 privatehardwaregpu-t4,description微调后的FLUX.1模型)# 启动训练trainingreplicate.trainings.create(versionostris/flux-dev-lora-trainer:4ffd32160efd92e956d39c5338a9b8fbafca58e03f791f6d8011f3e20e8ea6fa,input{input_images:open(/path/to/your/local/training-images.zip,rb),steps:1000,hf_token:YOUR_HUGGING_FACE_TOKEN,# 可选hf_repo_id:YOUR_HUGGING_FACE_REPO_ID,# 可选},destinationf{model.owner}/{model.name})注意此时为模型选择何种硬件无关紧要因为所有FLUX.1微调都会路由到H100 GPU。1000步训练通常需要20-30分钟成本低于2美元。使用训练好的模型训练完成后可以直接在Replicate上使用该模型就像使用任何其他模型一样。通过API运行示例使用Python客户端importreplicate outputreplicate.run(yourusername/flux-your-model-name:version_id,input{prompt:A portrait photo of a space station, bad 70s food,num_inference_steps:28,guidance_scale:7.5,model:dev,})共享模型如果想让其他人发现并使用新的微调模型需要将其设为公开。默认情况下通过网页训练表单创建的模型是私有的。前往模型设置页面将可见性设为“公开”。使用FLUX.1 [schnell]加速生成可以使用较小的FLUX.1 [schnell]模型配合FLUX.1 [dev] LoRA以更快、更便宜地生成图像。生成时将model参数从dev改为schnell并将num_inference_steps降低到4左右。许可与商业使用如果在Replicate上使用FLUX.1模型及其微调版本生成图像则可以商业使用这些图像。如果从Replicate下载权重并在自有计算机上生成图像则不能商业使用。定价训练过程按秒计费。FLUX模型训练在Nvidia H100 GPU硬件上运行成本为每秒0.001528美元。对于20分钟的训练使用约20张训练图像和1000步预计需支付约1.85美元。模型训练完成后可以像任何其他Replicate模型一样通过API运行仅按生成图像的时间计费。与其他定制模型不同私有模型不会收取空闲时间费用。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关文章:

用自定义图像微调FLUX.1模型

使用自有图像微调FLUX.1模型 现在可以在Replicate上使用快速FLUX训练器微调模型。 该训练速度极快(不到2分钟)、成本低廉(低于2美元),并提供可运行的模型以及可下载的LoRA权重。 FLUX.1是Black Forest Labs今年夏季发布…...

spaCy v3.5新增模糊匹配与CLI命令

Introducing spaCy v3.5 Explosion 发布时间:2023年1月30日(3分钟阅读) 分类:博客 / spaCy / 基于规则的匹配 / 实体链接 spaCy自然语言处理库发布v3.5版本。该版本引入了三个新的CLI命令、增加了模糊匹配功能、改进了实体链接功…...

【技术底稿 17】DevOps 监控告警实战踩坑复盘 —— 企微机器人告警 + Milvus 向量库监控全流程验证

一、前言 本次实战围绕 DevOps 基础设施监控体系完善展开,基于现有 Docker 单机 Linux 环境、PrometheusAlertmanager 原生监控架构,开展两项核心工作: 验证 Alertmanager 对接企业微信群机器人 Webhook 移动端告警方案,提升告警…...

3个技巧快速掌握libwdi:Windows USB驱动安装的智能助手

3个技巧快速掌握libwdi:Windows USB驱动安装的智能助手 【免费下载链接】libwdi Windows Driver Installer library for USB devices 项目地址: https://gitcode.com/gh_mirrors/li/libwdi 你是否曾经遇到过这样的困扰?在Windows系统上连接USB设…...

C#怎么实现WPF MVVM框架 C#如何用CommunityToolkit.Mvvm快速搭建WPF MVVM项目【框架】

CommunityToolkit.Mvvm 通过 ObservableObject 和源生成器编译期注入 INotifyPropertyChanged 逻辑,避免手写漏通知、拼错名等问题;需严格匹配字段与属性名、禁用构造函数中 SetProperty、用泛型重载支持自定义通知;RelayCommand 需显式传 ca…...

原神游戏数据API:3分钟搭建你的专属游戏数据库

原神游戏数据API:3分钟搭建你的专属游戏数据库 【免费下载链接】api A fan-made Genshin Impact API for easy access to game data. 项目地址: https://gitcode.com/gh_mirrors/api13/api GenshinDev API 是一个专门为《原神》游戏数据提供访问接口的开源项…...

AEUX插件完全指南:从设计到动效的无缝转换

AEUX插件完全指南:从设计到动效的无缝转换 【免费下载链接】AEUX Editable After Effects layers from Sketch artboards 项目地址: https://gitcode.com/gh_mirrors/ae/AEUX AEUX是一款革命性的设计到动画转换工具,它架起了Figma、Sketch等设计工…...

FigmaCN:专业级中文汉化解决方案,高效解决设计师语言障碍

FigmaCN:专业级中文汉化解决方案,高效解决设计师语言障碍 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN FigmaCN是一款专为中文设计师开发的Figma界面汉化插件&…...

UnrealPakViewer终极指南:5分钟掌握UE4 Pak文件分析的免费神器

UnrealPakViewer终极指南:5分钟掌握UE4 Pak文件分析的免费神器 【免费下载链接】UnrealPakViewer 查看 UE4 Pak 文件的图形化工具,支持 UE4 pak/ucas 文件 项目地址: https://gitcode.com/gh_mirrors/un/UnrealPakViewer 你是否曾被UE4项目中庞大…...

3分钟彻底清理:Bulk Crap Uninstaller批量卸载工具完全指南

3分钟彻底清理:Bulk Crap Uninstaller批量卸载工具完全指南 【免费下载链接】Bulk-Crap-Uninstaller Remove large amounts of unwanted applications quickly. 项目地址: https://gitcode.com/gh_mirrors/bu/Bulk-Crap-Uninstaller 你是否曾经因为Windows系…...

海康威视第一季营收207亿:同比增12% 净利27.8亿 高毅资产减持

雷递网 乐天 4月17日杭州海康威视数字技术股份有限公司(证券代码:002415 证券简称:海康威视)今日发布截至2025年的年报。财报显示,海康威视2026年第一季度营收为207.15亿元,较上年同期的185.3亿元增长11.78…...

推荐系统实时更新

推荐系统实时更新的魅力与挑战 在信息爆炸的时代,推荐系统已成为用户获取内容的核心工具。无论是电商平台的商品推荐,还是短视频平台的个性化内容推送,实时更新的推荐系统正逐渐成为提升用户体验的关键。传统的推荐系统往往基于离线数据训练…...

Ostrakon-VL像素终端效果展示:从模糊价签到结构化JSON全过程

Ostrakon-VL像素终端效果展示:从模糊价签到结构化JSON全过程 1. 像素特工终端效果展示 1.1 视觉风格创新 Ostrakon-VL像素终端采用独特的8-bit复古游戏美学设计,将传统零售场景中的图像识别任务转化为充满趣味的"数据扫描任务"。这种高饱和…...

▲D2D通信中基于Qlearning强化学习算法的联合资源分配与功率控制算法matlab仿真

目录 📶1.引言 🧠2.系统模型 2.1 网络拓扑 2.2 信号与干扰模型 2.3 容量与吞吐量 2.4 优化目标 ✅3.基于Q学习的联合资源分配与功率控制算法原理 3.1 状态空间定义 3.2 动作空间定义 3.3 奖励函数设计 3.4 Q值更新规则 📚4.MATLA…...

Abaqus 2023保姆级教程:手把手教你搞定金属管无芯绕弯的完整仿真流程

Abaqus 2023金属管无芯绕弯仿真全流程实战指南 金属管件弯曲成形是制造业中常见的加工工艺,而有限元仿真技术能够大幅降低实际试错成本。本文将基于Abaqus 2023版本,完整演示从零开始建立金属管无芯绕弯仿真模型的全过程。不同于简单操作演示&#xff0c…...

【数字信号去噪】猫头鹰搜索算法OSA优化变分模态分解SDO-VMD数字信号去噪(优化K值 alpha值 综合指标 适应度函数包络熵)【含Matlab源码 15355期】

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab武动乾坤博客之家💞…...

tqdm进度条库安装全攻略:从报错排查到高级用法详解

tqdm进度条库安装全攻略:从报错排查到高级用法详解 在Python开发中,处理长时间运行的任务时,一个直观的进度条不仅能提升用户体验,还能帮助开发者更好地监控程序执行状态。tqdm("taqaddum"的缩写&#xff0c…...

【天线】粒子群算法PSO拟合偏置抛物面天线的数学模型【含Matlab源码 15349期】

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab武动乾坤博客之家💞…...

Photoshop、GIMP里的‘保留细节2.0’是啥?拆解Bicubic插值在主流修图软件中的应用

Photoshop与GIMP中的‘保留细节2.0’:Bicubic插值实战指南 当你需要在Photoshop或GIMP中缩放一张照片时,是否曾被"双立方"、"双三次"或"保留细节2.0"这些选项搞得一头雾水?作为设计师或摄影师,理解…...

Abaqus 2023保姆级教程:用Python脚本一键搞定悬臂梁的静力与动力分析

Abaqus 2023自动化实战:Python脚本驱动悬臂梁仿真全流程解析 在工程仿真领域,效率提升的关键往往不在于硬件性能的极限压榨,而在于工作流程的智能化改造。当我们反复执行相似的仿真任务时,GUI操作不仅耗时费力,更难以保…...

拆解IGH EtherCAT主站应用层:信号、定时器与实时任务循环的协同工作原理

IGH EtherCAT主站应用层深度解析:信号、定时器与实时任务循环的协同机制 在工业自动化领域,EtherCAT以其卓越的实时性能和高效的通信机制成为主流现场总线协议之一。而IGH EtherCAT主站作为开源实现,其应用层设计巧妙融合了Linux系统编程与实…...

告别纸上谈兵:手把手教你用AVL CRUISE M+dSPACE搭建首个硬件在环(HiL)测试环境

从零构建HiL测试台架:AVL CRUISE M与dSPACE实战指南 第一次接触硬件在环(HiL)测试的工程师常会遇到这样的困境:明明在仿真环境中运行良好的模型,一旦接入真实硬件就问题频出。去年我负责的一个混动变速箱控制单元测试项…...

LabVIEW玩转单片机:用NI-VISA做个自己的串口调试助手,还能控制小车

LabVIEW打造智能小车控制平台:从串口调试到自动化驾驶 在创客和嵌入式开发领域,LabVIEW与单片机的结合正开辟着令人兴奋的可能性。想象一下,你不仅能实时监控传感器数据,还能通过精心设计的界面控制一台智能小车完成复杂动作——这…...

从PC到手机:一文看懂高通安卓设备上的UEFI启动流程(附XBL/ABL源码结构解析)

从PC到手机:高通安卓设备UEFI启动全流程与架构解析 当按下手机电源键的瞬间,隐藏在芯片深处的精密舞蹈便悄然展开。与PC时代按下机箱按钮后熟悉的BIOS界面不同,移动设备的启动流程更像是一场精心编排的默剧——没有闪烁的光标,没有…...

失物招领|基于java + vue失物招领系统(源码+数据库+文档)

失物招领系统 目录 基于springboot vue失物招领系统 一、前言 二、系统功能演示 详细视频演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue失物招领系统 一、前言 博主介绍…...

二手交易|基于springboot + vue二手交易管理系统(源码+数据库+文档)

二手交易管理系统 目录 基于springboot vue二手交易管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue二手交易管理系统 一、前言 博主介绍&am…...

新手避坑指南:用Altium Designer给STM32F103C8T6画PCB,我踩过的那些坑

STM32F103C8T6最小系统板设计避坑手册:Altium Designer实战经验 第一次用Altium Designer给STM32F103C8T6画板子时,我对着教程一步步操作,结果还是踩了不少坑。有些问题教程里压根没提,有些细节看似简单却直接影响板子能否正常工作…...

用FPGA复刻经典数电实验:手把手教你实现一个带预置功能的十进制可逆计数器

用FPGA复刻经典数电实验:手把手教你实现一个带预置功能的十进制可逆计数器 记得大学时第一次在实验箱上搭建十进制计数器,看着LED灯随着时钟信号跳动的那种兴奋感吗?如今,一块FPGA开发板就能重现这份经典体验,还能赋予…...

从CT扫描到雷达成像:一文讲透后向投影(BP)算法的前世今生与核心思想

从CT扫描到雷达成像:后向投影算法的跨学科智慧 1971年,英国工程师Godfrey Hounsfield发明了第一台医用CT扫描仪时,或许没想到这项技术会彻底改变医学诊断方式,更不会预料到它启发了另一种完全不同的成像技术——合成孔径雷达&…...

保姆级教程:在Ubuntu 20.04上为RISC-V芯片编译运行CoreMark(含多线程配置)

RISC-V平台CoreMark性能测试全流程实战指南 在嵌入式开发领域,处理器性能评估始终是硬件选型和系统优化的关键环节。CoreMark作为当前最权威的嵌入式CPU基准测试工具,其测试结果已成为衡量RISC-V处理器性能的黄金标准。本文将完整演示如何在Ubuntu 20.04…...