Stable Diffusion绘画 | 来训练属于自己的模型:打标处理与优化
上一篇完成的打标工作,是为了获取提示词,让AI认识和学习图片的特征。
因此,合适、恰当、无误的提示词,对最终模型效果是相当重要的。
Tag 如何优化
通过软件自动生成的 Tag 只是起到快速建立大体架构的作用,里面会涉及到一些识别错误、重复的词,以及一部分没有识别出来的图片特征。
因此,我们需要在自动生成 Tag 的基础上,再来对应一个个图片进行手动调整,
从而达到减少过度拟合,提高泛用性的效果。
Tag 的保留与删除
我们可以按照 主题+静态特征+动态特征+视角+环境+其他 的公式来考虑补充提示词。

主体:1woman
静态特征:blonde hair, blue eyes, red lips
动态特征:looking at viewer, smile
视角:upper body
环境:night
其他:Blurred background
关于 Tag 的是否要保留的原则:
首先要确定哪些特征需要保留?
要保留的特征,就不要记录特征 Tag;
不需要保留,想自定义的特征,记录 Tag
如何批量修改 Tag
BooruDatasetTagManager:https://github.com/starik222/BooruDatasetTagManager/releases

下载解压后,双击 BooruDatasetTagManager.exe 运行:

首选设置,修改系统语言、翻译语言:


加载图片文件夹,读取上一篇在 cybertronfurnace 生成的打标文件夹:

翻译所有标签:

显示标签出现次数:

接下来,就是通过这个软件, 认真细致地对各个图片的便签进行优化和调整。
是一件比较枯燥的事,需要有足够的耐心。
今天先分享到这里~
开启实践:SD绘画 | 为你所做的学习过滤
相关文章:
Stable Diffusion绘画 | 来训练属于自己的模型:打标处理与优化
上一篇完成的打标工作,是为了获取提示词,让AI认识和学习图片的特征。 因此,合适、恰当、无误的提示词,对最终模型效果是相当重要的。 Tag 如何优化 通过软件自动生成的 Tag 只是起到快速建立大体架构的作用,里面会涉…...
【论文笔记】Visual Instruction Tuning
🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 基本信息 标题: Visual Instruction Tunin…...
ubuntu 设置静态IP
一、 ip addresssudo nano /etc/netplan/50-cloud-init.yaml 修改前: 修改后: # This file is generated from information provided by the datasource. Changes # to it will not persist across an instance reboot. To disable cloud-inits # ne…...
Java 每日一刊(第19期):泛型
文章目录 前言1. 泛型概述1.1 不使用泛型 vs 使用泛型1.2 泛型的作用 2. 泛型的基本语法2.1 定义带类型参数的泛型类2.2 使用泛型类2.3 泛型方法 3. 泛型类型推断与钻石操作符3.1 类型推断3.2 钻石操作符 4. 通配符的使用4.1 无界通配符 <?>4.2 上界通配符 <? exten…...
windows下安装rabbitMQ并开通管理界面和允许远程访问
如题,在windows下安装一个rabbitMQ server;然后用浏览器访问其管理界面;由于rabbitMQ的默认账号guest默认只能本机访问,因此需要设置允许其他机器远程访问。这跟mysql的思路很像,默认只能本地访问,要远程访…...
深度剖析音频剪辑免费工具的特色与优势
是热爱生活的伙伴或者想要记录美好声音的普通用户,都可能会需要对音频进行剪辑处理。而幸运的是,现在有许多优秀的音频剪辑软件提供了免费版本,让我们能够轻松地施展音频剪辑的魔法。接下来,就让我们一同深入了解这些音频剪辑免费…...
Oracle中TRUNC()函数详解
文章目录 前言一、TRUNC函数的语法二、主要用途三、测试用例总结 前言 在Oracle中,TRUNC函数用于截取或截断日期、时间或数值表达式的部分。它返回一个日期、时间或数值的截断版本,根据提供的格式进行截取。 一、TRUNC函数的语法 TRUNC(date) TRUNC(d…...
【Spring Boot 入门一】构建你的第一个Spring Boot应用
一、引言 在当今的软件开发领域,Java一直占据着重要的地位。而Spring Boot作为Spring框架的延伸,为Java开发者提供了一种更加便捷、高效的开发方式。它简化了Spring应用的搭建和配置过程,让开发者能够专注于业务逻辑的实现。无论是构建小型的…...
PPT 快捷键使用、技巧
前言: 本文操作是以office 2021为基础的,仅供参考;不同版本office 的 ppt 快捷键 以及对应功能会有差异,需要实践出真知。 shift 移动 水平/垂直 移动 ; shift 放大/缩小 等比例放大 缩小 ; 正圆 正…...
Web安全 - 文件上传漏洞(File Upload Vulnerability)
文章目录 OWASP 2023 TOP 10导图定义攻击场景1. 上传恶意脚本2. 目录遍历3. 覆盖现有文件4. 文件上传结合社会工程攻击 防御措施1. 文件类型验证2. 文件名限制3. 文件存储位置4. 文件权限设置5. 文件内容检测6. 访问控制7. 服务器配置 文件类型验证实现Hutool的FileTypeUtil使用…...
vue3中el-input在form表单按下回车刷新页面
摘要: 在input框中点击回车之后不是调用我写的回车事件,而是刷新页面! 如果表单中只有一个input 框则按下回车会直接关闭表单 所以导致刷新页面 再写一个input 表单 ,并设置style“display:none” <ElInput style"display…...
SQL Server中关于个性化需求批量删除表的做法
在实际开发中,我们常常会遇到需要批量删除表,且具有共同特征的情况,例如:找出表名中数字结尾的表之类的,本文我将以3中类似情况为例,来示范并解说此类需求如何完成: 第一种,批量删除…...
关于按键状态机解决Delay给程序带来的问题
问题产生 我在学习中断的过程中,使用EXTI15外部中断,在其中加入HAL_Delay();就会发生报错 错误地方 其它地方配置 问题原因 在中断服务例程(ISR)中使用 HAL_Delay() 会导致问题的原因是: 阻塞性: HAL_D…...
62.【C语言】浮点数的存储
目录 1.浮点数的类型 2.浮点数表示的范围 3.浮点数的特性 《计算机科学导论》的叙述 4.浮点数在内存中的存储 答案速查 分析 前置知识:浮点数的存储规则 推导单精度浮点数5.5在内存中的存储 验证 浮点数取出的分析 1.一般情况:E不全为0或不全为1 2.特殊情况:E全为0…...
GO网络编程(一):基础知识
1. 网络编程的基础概念 TCP/IP 协议栈 TCP/IP 是互联网通信的核心协议栈,分为以下四个层次: 应用层(Application Layer):为应用程序提供网络服务的协议,比如 HTTP、FTP、SMTP 等。传输层(Tra…...
【Linux】用虚拟机配置Ubuntu环境
目录 1.虚拟机安装Ubuntu系统 2.Ubuntu系统的网络配置 3.特别声明 首先我们先要下载VMware软件,大家自己去下啊! 1.虚拟机安装Ubuntu系统 我们进去之后点击创建新的虚拟机,然后选择自定义 接着点下一步 再点下一步 进入这个界面之后&…...
酒店智能门锁SDK接口pro[V10] 门锁校验C#-SAAS本地化-未来之窗行业应用跨平台架构
一、代码 int 酒店标识_int Convert.ToInt32(酒店标识);StringBuilder 锁号2024 new StringBuilder(8);//信息 "未知返回值:" bufCard_原始;GetGuestLockNoByCardDataStr_原始(酒店标识_int, bufCard_原始.ToString(), 锁号2024);StringBuilder 退…...
Gitのrebase用法
在 Git 中,rebase 是一种用于整合多个提交历史的操作,它可以将一个分支的变更“重放”到另一个分支上。与 merge 不同,rebase 会产生一个线性的提交历史,使得项目的历史记录更加整洁和易于理解。 1. 什么是 Rebase? …...
二分查找一>:在排序数组中查找元素的第一个和最后一个位置
1.题目: 2.解析:这里不能用传统二分,因为涉及范围,传统二分时间复杂度会降为O(N),要做些改动。 步骤一:查找区间左端点 细节图: 步骤二:查找区间右端点: 细节图: 代码…...
undeclared identifier ‘UNITY_PREV_MATRIX_M‘ - Unity Shader自己写URP,引用内部 hlsl
碰到这样的问题,居然非常淡定 这个链接里说了问题: 一个哥们A问,为什么include urp common.hlsl 提示莫名其妙 另一个哥们B说,这个issue 说了,可能是这个原因(也没正面答) 从issue我们知道&a…...
避坑指南:Camunda中Execution Listeners和Task Listeners的6个常见误用
Camunda监听器实战避坑指南:6个高频误用场景解析 在Camunda流程引擎的实际开发中,Execution Listeners和Task Listeners是扩展业务流程能力的利器,但也是开发者最容易踩坑的重灾区。许多团队在初步掌握监听器基础用法后,往往会在复…...
ollama升级踩坑记:从llama3.1运行失败到手工升级0.3.0全记录
1. 当llama3.1遇上ollama0.2.5:一场版本冲突引发的血案 那天下午我正喝着咖啡刷技术论坛,突然看到llama3.1版本发布的消息。论坛里有人说这个版本在某些任务上表现比GPT-4还要好,作为一个长期关注大模型的技术宅,我立刻坐不住了。…...
告别复杂配置:Fish Speech 1.5镜像部署,小白也能轻松搞定
告别复杂配置:Fish Speech 1.5镜像部署,小白也能轻松搞定 你是不是也对那些动辄几十个步骤、需要敲一堆命令的AI模型部署感到头疼?想体验一下最新的语音合成技术,却被繁琐的环境配置、模型下载、依赖安装劝退? 今天&…...
云容笔谈·东方红颜实战:为STM32项目文档自动生成示意图
云容笔谈东方红颜实战:为STM32项目文档自动生成示意图 1. 引言:嵌入式开发者的绘图烦恼 如果你做过嵌入式开发,尤其是基于STM32这类MCU的项目,一定有过这样的经历:项目代码写完了,功能也调通了࿰…...
Obsidian模板系统深度指南:从基础应用到高级定制
Obsidian模板系统深度指南:从基础应用到高级定制 【免费下载链接】OB_Template OB_Templates is a Obsidian reference for note templates focused on new users of the application using only core plugins. 项目地址: https://gitcode.com/gh_mirrors/ob/OB_T…...
像素幻梦2.0稳定版深度解析:VAE Tiling与sequential CPU offload优化实测
像素幻梦2.0稳定版深度解析:VAE Tiling与sequential CPU offload优化实测 1. 像素幻梦2.0概述 像素幻梦(Pixel Dream Workshop)是基于FLUX.1-dev扩散模型构建的新一代像素艺术生成工具。2.0稳定版带来了显著的性能优化和用户体验提升,特别是在高分辨率…...
3大核心突破:InfiniteTalk多角色视频对话全栈指南
3大核心突破:InfiniteTalk多角色视频对话全栈指南 【免费下载链接】InfiniteTalk Unlimited-length talking video generation that supports image-to-video and video-to-video generation 项目地址: https://gitcode.com/gh_mirrors/in/InfiniteTalk …...
#新手必学:MySQL三大范式通俗讲解 | 什么时候该遵守?什么时候该打破?
本文承接MySQL库表设计规范系列内容,专门解决新手建表时最核心的困惑:天天听人说数据库三大范式,到底是什么?我建表必须严格遵守吗?为什么我严格按范式建表,查询要联五六张表,性能反而极差&…...
YOLOv5实战:从零开始训练自定义数据集(附完整代码和数据集)
YOLOv5实战:从零构建自定义数据集训练全流程指南 1. 为什么选择YOLOv5进行目标检测 在计算机视觉领域,目标检测一直是最具挑战性的任务之一。传统方法需要复杂的多阶段处理流程,而YOLO(You Only Look Once)系列算法彻…...
Python内存泄漏检测失效?:揭秘CPython 3.11+新增的__tracing__机制与自定义GC钩子实战(含GitHub Star 2.4k工具链深度集成)
第一章:Python内存泄漏修复方案Python 的自动垃圾回收机制(GC)虽强大,但无法处理所有内存泄漏场景,尤其是循环引用、全局缓存未清理、回调函数持有对象引用、或 C 扩展模块中手动内存管理失误等情况。识别和修复内存泄…...
