[AI绘画]sd学习记录(二)文生图参数进阶
目录
- 7.高分辨率修复:以小博大
- 8.细化器(Refiner):两模型接力
- 9.随机数种子(Seed):复现图片吧
本文接续https://blog.csdn.net/qq_23220445/article/details/148460878?spm=1001.2014.3001.5501,继续讲解文生图的参数。
7.高分辨率修复:以小博大
高分辨率修复位于ui的这个地方:
点击右侧的小三角,就能打开完整的UI:
直接生成高分辨率图(比如 2048×2048 )时,模型容易因 “超出训练习惯”(多数模型训练于 512×512 ),出现多头多手、细节崩坏 。
高分辨率修复(Hires.fix )的做法是,先以 低分辨率(如 512×512 )生成基础图(稳定且不易崩 ),再用 放大算法 + 重绘 ,把低分辨率图 “无损放大” 到高分辨率(如 2048×2048 ),同时补充细节、修复崩坏。
参数如下:
- 放大算法:
就是把图片放大时所用的算法,一般采用如下几个:
Latent(默认):最常用!基于 Stable Diffusion latent 空间优化,平衡速度和细节,放大后画面自然,适合二次元、插画。特点:速度快、兼容性好,放大 2 倍无压力,细节比传统算法(如 bicubic )强。Latent (antialiased):Latent 的抗锯齿版,放大后边缘更平滑(如人物发丝、物体轮廓 ),适合解决 “放大后边缘锯齿” 问题。
Latent (bicubic):结合双三次插值(bicubic )的 Latent 算法,细节更细腻(但速度稍慢 ),适合写实风格。
4x-AnimeSharp:专为二次元 / 动漫优化的算法,放大后线条更锐利、色彩更鲜亮,适合生成高清动漫壁纸。对二次元风格 “针对性增强”,但写实图可能效果奇怪。
SwinIR_4x:基于深度学习的超分辨率算法,细节还原天花板,放大后画面接近 “重新绘制”,适合写实肖像、高精度场景。
- 放大倍数:
决定最终分辨率是基础图的几倍(2 倍即 512→1024 )。
- 重绘幅度:
控制 “放大后重绘的力度”。值越高,新细节越多(但可能偏离原图 );值越低,越接近原图(但细节少 )。日常选 0.3 - 0.7 。
- 高分迭代步数:
放大后重绘的迭代次数,步数越高细节越细(但时间翻倍 )。一般设 10 - 30 ,设 0 则 “只放大不重绘”(细节少但速度快 )。
什么时候用 Hires.fix?
- 想做高清壁纸 / 商用图:低分辨率图细节不够,用它放大到 2K/4K 。
- 直接生成分辨率易崩:比如生成 1024×1024 图时人物手部崩坏,先用 512×512 生成,再用 Hires.fix 放大修复。
- 追求极致细节:比如发丝、衣物纹理,通过放大 + 重绘补充细节。
我们以放大倍数:2,高分迭代步数:10,重绘幅度:0.7,算法为Latent举例,在右上角就能看到此功能的作用:将画面大小从353x500提升到706x1000
最终耗时23.4s
直接绘制一张706x1000的图片,耗时31.8s
来个极端一点的,用250x250放大4倍生成1000x1000分辨率的图片,看起来还蛮精细的。
直接生成一张250x250的图,明显模糊很多。
8.细化器(Refiner):两模型接力
位于ui的这个地方
细化器就是两模型接力生成图片。右边是两个模型的切换时机,填0.8后,当生成百分之80时便会切换到细化器里面选择的模型。
比如说,我现在有两个模型:夜羊社v1.2和立绘专用模型,我想生成夜羊社风格的立绘
于是,我可以先用立绘专用模型生成一个框架,再填充夜羊社v1.2的内容,下面是不同切换时机的参考:
切换时机为0.1:
切换时机为0.5:
切换时机为0.8:
9.随机数种子(Seed):复现图片吧
位于ui的这个地方:
点开右边的小三角可以看到完整ui。
生成图像时,模型会先创建一个随机噪声图,再通过去噪得到最终画面。Seed 就是这张 “噪声图的密码”,只要种子相同,生成的图像完全一样!!就和mc的地图种子一样。
填写-1意思是每次生成都随机抽取种子。
比如说我设置种子为123,连续生成两张:
可以看到,两张图片是一模一样的。因此,当你觉得生成一张图很好看,只需要记住其种子,在保证其他参数一样的前提下就能复现,
并且固定 Seed ,只改提示词、采样方法、CFG Scale 等,可在原图基础上 “小幅度调整”(比如让人物换发型但姿势不变 ),亦可以用来生成同一场景下的不同角色 / 风格(比如 Seed=1234,分别生成 “白天”“黑夜” 的校园场景 )
比如我只把秋天这个此时此换成春天,可以看到变化比较小。
变异随机种子是基于原始 Seed,小幅度打乱噪声分布,让画面在可控范围内改变,而变异强度便是控制 改变的幅度,值越高,画面变化越大(但越可能偏离原图 )。从宽度 / 高度中调整种子是通过 “拉伸宽度 / 高度的噪声分布”,间接调整画面的横向 / 纵向细节(比如让人物左边头发变多,或让天空更广阔 )。
当你用固定 Seed 生成了一张满意的图,但想保留构图 / 风格,又想让细节随机变化(比如换人物表情、调整光影 ),就需要这些参数。
以上图为例,添加一个随机变异系数,变异强度为0.1,结果如下:可以看到主要改变的是背景。
当变异强度为0.5,结果如下:可以看到画面已经有了明显变化。
相关文章:

[AI绘画]sd学习记录(二)文生图参数进阶
目录 7.高分辨率修复:以小博大8.细化器(Refiner):两模型接力9.随机数种子(Seed):复现图片吧 本文接续https://blog.csdn.net/qq_23220445/article/details/148460878?spm1001.2014.3001.5501…...

CRM管理系统中的客户分类与标签管理技巧:提升转化率的核心策略
在客户关系管理(CRM)领域,有效的客户分类与标签管理是提升销售效率、优化营销ROI的关键。据统计,使用CRM管理系统进行科学客户分层的企业,客户转化率平均提升35%(企销客数据)。本文将深入解析在CRM管理软件中实施客户分类与标签管理的最佳实践…...

怎么解决cesium加载模型太黑,程序崩溃,不显示,位置不对模型太大,Cesium加载gltf/glb模型后变暗
有时候咱们cesium加载模型时候型太黑,程序崩溃,不显示,位置不对模型太大怎么办 需要处理 可以联系Q:424081801 谢谢 需要处理 可以联系Q:424081801 谢谢...

【AI系列】BM25 与向量检索
博客目录 引言:信息检索技术的演进第一部分:BM25 算法详解第二部分:向量检索技术解析第三部分:BM25 与向量检索的对比分析第四部分:融合与创新:混合检索系统 引言:信息检索技术的演进 在信息爆…...
windows10搭建nfs服务器
windows10搭建nfs服务器 Windows10搭建NFS服务 - fuzidage - 博客园...
simulink这边重新第二次仿真时,直接UE5崩溃,然后simulink没有响应
提问 : simulink这边重新第二次仿真时,直接UE5崩溃,然后simulink没有响应 simulink和UE5仿真的时候,simulink这边先停止仿真(也就是官方要求的顺序——注意:如果先在UE5那边停止仿真,如果UE5这…...
react 常见的闭包陷阱深入解析
一、引子 先来看一段代码,你能说出这段代码的问题在哪吗? const [count, setCount] = useState(0); useEffect(() => {const timer = setTimeout(() => {setCount(count + 1);}, 1000);return () => clearTimeout(timer); }, []);正确答案: 这段代码存在闭包陷阱…...
【CATIA的二次开发22】关于抽象对象Document概念详细总结
在CATIA VBA开发中,Document对象是最核心、最基础的对象之一。它代表了当前在CATIA会话中打开的一个文档(文件)。 几乎所有与文件操作、模型访问相关的操作都始于获取一个Document对象。 一、Document对象概述 1、获取Document对象: 当前活动文档: 最常见的方式是获取用户…...

模拟法解题的思路与算法分享
我们先来看思路与算法: 使用变长数组对栈进行模拟。 如果操作是 ,那么访问数组的后两个得分,将两个得分之和加到总得分,并且将两个得分之和入栈。如果操作是 D,那么访问数组的最后一个得分,将得分乘以 2 …...

mysql密码正确SpringBoot和Datagrip却连接不上
报错信息:SQLException: Access denied for user ‘root‘‘localhost‘ (using password: YES) 原因可能是是有端口号冲突 我这里是禅道端口与MySQL冲突,禅道端口也是3306,ctrlaltdelete打开任务管理器,关闭mysqlzt …...

高保真组件库:数字输入框
拖入一个文本框。 拖入一个矩形,作为整个数字输入框的边框,边框颜色为灰色DCDEE2,圆角半径为4。 拖入一个向上的箭头图标作为增加按钮,再拖入一个矩形,将向上箭头图标放入矩形内。矩形:18x15,边框颜色DCDEE2,边框左下可见,箭头图标:8x5,矩形置底,组合在一起命名”增…...
人工智能赋能高中学科教学的应用与前景研究
一、引言 1.1 研究背景 在科技飞速发展的当下,人工智能(Artificial Intelligence,简称 AI)已成为全球瞩目的关键技术领域,深刻地改变着人们的生活、工作和学习方式。从智能家居设备到智能交通系统,从医疗…...

【Linux】awk 命令详解及使用示例:结构化文本数据处理工具
【Linux】awk 命令详解及使用示例:结构化文本数据处理工具 引言 awk 是一种强大的文本处理工具和编程语言,专为处理结构化文本数据而设计。它的名称来源于其三位创始人的姓氏首字母:Alfred Aho、Peter Weinberger 和 Brian Kernighan。 基…...

紫光同创FPGA系列实现Aurora 8b/10b协议
特性 1.兼容XILINX aurora IP核 2.支持X1、X2、X4、X8模式(根据硬件条件选择模式) 3.支持FRAMING和STREAMING 用户接口 4.自动初始化和维护链路状态 5.支持热插拔 6.支持扰码、解扰 7.支持流量控制 8.支持crc用户数据 9.支持全双工或者半双工模式 10.最…...

DAY 44 预训练模型
知识点回顾: 预训练的概念常见的分类预训练模型图像预训练模型的发展史预训练的策略预训练代码实战:resnet18 (一)预训练的概念 我们发现准确率最开始随着epoch的增加而增加。随着循环的更新,参数在不断发生更新。 所以…...
[Harmony]颜色初始化
默认初始化颜色 let color: Color 0xFF00FF 创建一个工具,用十六进制颜色和RGBA初始化颜色 // 颜色工具类 export class ColorUtils {/*** 十六进制颜色初始化(支持透明度)* param hex 支持格式:#RRGGBB、#AARRGGBB、0xRRGGBB、…...
指针与函数参数传递详解 —— 值传递与地址传递的区别及应用
资料合集下载链接: https://pan.quark.cn/s/472bbdfcd014 在C语言中,函数参数的传递方式主要有两种:值传递和地址传递(通过指针)。理解两者的区别及应用对于正确操作数据和优化程序逻辑至关重要。本文将通过…...

【NLP中向量化方式】序号化,亚编码,词袋法等
1.序号化 将单词按照词典排序,给定从0或者1或者2开始的序号即可,一般情况有几 个特征的单词: PAD表示填充字符,UNK表示未知字符 在这个例子中,我们可以看到我们分别将3个文本分为了4个token,每个token用左侧的词典表示…...

C++学习-入门到精通【16】自定义模板的介绍
C学习-入门到精通【16】自定义模板的介绍 目录) C学习-入门到精通【16】自定义模板的介绍前言一、类模板创建一个自定义类模板:Stack\<T\> 二、使用函数模板来操作类模板特化的对象三、非类型形参四、模板类型形参的默认实参五、重载函数模板 前言…...
关于脏读,幻读,可重复读的学习
mysql 可以查询当前事务隔离级别 默认是RR repeatable-read 如果要测脏读 要配成未提交读 RU 读到了未提交的数据。 3.演示不可重复读 要改成提交读 RC 这个是指事务还未结束,其他事务修改了值。导致我两次读的不一样。 4.RR–可以解决不可重复读 小总结&…...

源码级拆解:如何搭建高并发「数字药店+医保购药」一体化平台?
在全民“掌上看病、线上购药”已成常态的今天,数字药店平台正在以惊人的速度扩张。而将数字药店与医保系统打通,实现线上医保购药,更是未来互联网医疗的关键拼图。 那么,如何从技术底层搭建一个 支持高并发、可扩展、安全合规的数…...
旅行商问题(TSP)的 C++ 动态规划解法教学攻略
一、问题描述 旅行商问题(TSP)是一个经典的组合优化问题。给定一个无向图,图中的顶点表示城市,边表示两个城市之间的路径,边的权重表示路径的距离。一个售货员需要从驻地出发,经过所有城市后回到驻地&…...
unix/linux,sudo,其内部结构机制
我们现在深入sudo的“引擎室”,探究其内部的结构和运作机制。这就像我们从观察行星运动,到深入研究万有引力定律的数学表达和物理内涵一样,是理解事物本质的关键一步。 sudo 的内部结构与机制详解 sudo 的执行流程可以看作是一系列精心设计的步骤,确保了授权的准确性和安…...

Hadoop 3.x 伪分布式 8088端口无法访问问题处理
【Hadoop】YARN ResourceManager 启动后 8088 端口无法访问问题排查与解决(伪分布式启动Hadoop) 在配置和启动 Hadoop YARN 模块时,发现虽然 ResourceManager 正常启动,JPS 进程中也显示无误,但通过浏览器访问 http://主机IP:8088 时却无法打…...
Redis线程安全深度解析:单线程模型的并发智慧
Redis线程安全深度解析:单线程模型的并发智慧 引言:Redis的线程模型迷思 “Redis是单线程的”——这个广为流传的说法既正确又不完全正确。Redis的线程安全机制实际上是一套精心设计的并发控制体系,它既保持了单线程的简单性,又…...

零基础在实践中学习网络安全-皮卡丘靶场(第十期-Over Permission 模块)
经过这么长时间的学习,我相信大家已经有了很大的信心,有可能会有看不起的意思,因为皮卡丘是基础靶场,但是俗话说"基础不牢,地动山摇",所以还请大家静下心来进行学习 来翻译一下是什么意思&#…...
北京大学肖臻老师《区块链技术与应用》公开课:12-BTC-比特币的匿名性
文章目录 1.比特币的匿名性不是真的匿名,相当于化名,现金是真的匿名, 2.如果银行用化名的话和比特币的匿名哪个匿名性更好? 银行匿名性比比特币好,因为比特币的区块链的账本是完全公开的,所有人都可以查&am…...
[Harmony]网络状态监听
权限 在module.json5中添加必要权限: // 声明应用需要请求的权限列表 "requestPermissions": [{"name": "ohos.permission.GET_NETWORK_INFO", // 网络信息权限"reason": "$string:network_info_reason","…...

毕设 基于机器视觉的驾驶疲劳检测系统(源码+论文)
文章目录 0 前言1 项目运行效果2 课题背景3 Dlib人脸检测与特征提取3.1 简介3.2 Dlib优点 4 疲劳检测算法4.1 眼睛检测算法4.2 打哈欠检测算法4.3 点头检测算法 5 PyQt55.1 简介5.2相关界面代码 6 最后 0 前言 🔥这两年开始毕业设计和毕业答辩的要求和难度不断提升…...
Ubuntu18.6 学习QT问题记录以及虚拟机安装Ubuntu后的设置
Ubuntu安装 1、VM 安装 Ubuntu后窗口界面太小 Vmware Tools 工具安装的有问题 处理办法: 1、重新挂载E:\VMwareWorkstation\linux.iso文件,该文件在VMware安装目录下 2、Ubuntu桌面出现vmtools共享文件夹,将gz文件拷贝至本地,解…...