当前位置: 首页 > news >正文

Stable Diffusion学习记录

文章目录

  • 前言
  • 电脑配置推荐
  • 环境搭建
    • 下载地址
    • 安装步骤
      • 步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki
      • 步骤二,打开下载好的sd-webui-aki-v4.8.7解压包
  • Stable Diffusion软件配置,插件安装,模型下载
    • Stable Diffusion Web UI文件夹作用
      • embeddings文件夹
      • extensions文件夹
      • models文件夹
    • 大模型下载
  • Stable Diffusion提示词
    • 提示词原理
      • 提示词基础
      • 符号解释
        • 权重控制
        • Lora文件触发
        • 提示词连接
    • 进阶语法
    • 提示词推荐格式
      • 画质
      • 画风
      • 反向提示词
    • prompt-all-in-one插件
  • Stable Diffusion 采样器
    • 老派采样器
    • DPM采样器
    • 新派采样器
  • 相关链接

前言

Stable Diffusion是一个开源免费能生成以假乱真的图片、有着强大可控性不能制作视频光影文字的AI软件,可以说是有必要学习的东西了,这里是基于秋叶大神整合的Stable Diffusion Web UI进行接触和学习。

电脑配置推荐

系统要求:Win10 or Win11
显卡:RTX2060以上,6GB显卡显存
内存:8GB,推荐16GB
硬盘:预留20-100GB硬盘空间

环境搭建

下载地址

这里使用秋叶aaaki整合包:链接:https://pan.baidu.com/s/1Q2k5nkPCFIWPpDOG6WJThg
提取码:3kg0

安装步骤

步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki

打开启动器运行依赖安装教程.docx文件
在这里插入图片描述
复制下载链接:
https://dotnet.microsoft.com/en-us/download/dotnet/thank-you/runtime-desktop-6.0.25-windows-x64-installer?cid=getdotnetcore

下载为Microsoft Windows Desktop Runtime启动器运行依赖,下载好进行安装
在这里插入图片描述

步骤二,打开下载好的sd-webui-aki-v4.8.7解压包

解压这个文件,注意解压的路径不能包含任何中文路径
解压密码:bilibili@秋葉aaaki
在这里插入图片描述
解压完成后,解压的主目录里面点击A绘世启动器.exe就能启动了。
等待加载后启动完成。
在这里插入图片描述
再点击一键启动,等待程序加载…
在这里插入图片描述
弹出以下网页界面就是启动完成了
在这里插入图片描述
在文生图输入a cat,就会生成一直一张猫的图片。
这是 anything-v5模型下生成的猫图片
在这里插入图片描述
到这里Stable Diffusion就安装完成了。

Stable Diffusion软件配置,插件安装,模型下载

Stable Diffusion Web UI文件夹作用

embeddings文件夹

embeddings是嵌入的意思,意识是一个物体映射到另外一个物体,就是一个关系的桥梁。
主要是用来存放pt格式和safetensors格式的嵌入式像量文件的,比如Easy Negative和bad hands5。

extensions文件夹

放置插件的文件夹,所有Stable Diffusion下载的插件都是放置到这个文件夹下的。

models文件夹

下载的大模型都是放置到这个文件夹下的。

大模型下载

进行civitai下载模型。
主页面选择Models
在这里插入图片描述
然后右边Filters点开,在Model Types里面选择Checkpoint
在这里插入图片描述

然后选择自己喜欢的风格模型下载,等待下载完成即可。
在这里插入图片描述
在这里插入图片描述
把下载好的safetensonrs文件放到主目录的models/stable-diffusion下面
在这里插入图片描述
刷新一下模型就处来了。
在这里插入图片描述
切换模型。

关闭掉后台程序,删掉extensions文件夹下的所有插件,为了保持干净的插件环境。

安装好中文插件后,进入设置/用户界面,选择zh-Hans(Stable),然后再需要下一个主题美化的插件lobe
在这里插入图片描述再重启一下后台程序和重新进入一下界面即可

在这里插入图片描述

Stable Diffusion提示词

提示词原理

提示词基础

1.提示词之间需要使用英文逗号分隔开
2.提示词是可以进行换行的
3.每个提示词的权重默认为1,权靠前权重越高
4.数量控制在75个单词以内

例如提示语输入,girlish,Blonde hair,Blue pupils
就是说生成一个少女,金色的头发,蓝色的眼瞳即可。尽量使用英文作为提示语,使用中文的时候AI有些提示语会无法识别出来。
在这里插入图片描述

符号解释

权重控制

()使用括号括起来的提示词权重会变成原来的1.1倍率,最多套三层
red = 1 ,(red) = 1.1 ,(((red))) = 1.331

{}符号也是添加权重的,{red} = 1.05

[]符号是减少权重的,[red] = 0.9

直接设置权重的方式可以如下
(red:1.5)
(greed:0.3)

如下我们输入
Noodles,Meat,Vegetables,Scallions,Eggs,Fish。然后对鸡蛋的权重进行不同的控制会生成如下不一样的
在这里插入图片描述

Lora文件触发

使用尖括号<>调用Lora
女孩穿着汉服 1GIRL,IN HandFu < LORA:Hanfu:0.6 >
在这里插入图片描述

提示词连接

使用_下划线进行连接
比如一个提示语Coffee Cake,Stable Diffusion会理解成咖啡和蛋糕
但是输入 Coffee_Cake会理解成咖啡蛋糕

进阶语法

[提示语:0-1数值]
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS: 0.7]

这里一张图片在生成采样70%以后,才开始计算Flowers的采样
在这里插入图片描述
如果是使用[提示语::0-1数值]双冒号后
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS:: 0.7]
意思是计算到70%的采样之后,不在进行Flowers的采样计算,下图
在这里插入图片描述
[提示词1:提示词2:0-1数值]
[STOHES : FLOWERS : 0.70],这句话的意思是前面70%的计算中STOHES生效, FLOWERS则只在后面的30%生效。
在这里插入图片描述

[提示语1|提示语2],则为提示语1和提示语2交替使用采样
输入1Girl,[Red|Blue] Hair,这样就生成一个红蓝交替发色的女孩了

在这里插入图片描述

提示词推荐格式

填写顺序
1,画质+画风词
2,画面主体描述
3,环境、场景、灯光、构图
4,Lora
5,负面词语

画质

画质词如下有:
[masterpiece:1.2),best qualityhighres,extremely detailed CG,perfect lighting,8k wallpaper

画风

真实系:photograph,photorealistic
插画风:lllustration,painting,paintbrush
二次元:anime, comic, game CG,
三维场景:3D,C4D render unreal engine,octane render

画风词:
Cyberpunk 赛博朋克
8bit/16bit pixel 像素风
studio ghibli 宫崎骏风格
pixel style 皮克斯风格
Chinese ink style 水墨画

反向提示词

负面词:NSFW,[worst quality:2),[low quality:2[normal quality:2],lowres, normal quality[[monochrome)),[[grayscale]],skin spots,acnes,skin blemishes, age spot,[ugly:1.331],[duplicate:1.331],[morbid:1.21),[extra legs:1.331],[fused fingers:1.5,(too many fingers:1.5](unclear eyes:1.331],lowers, bad handsmissing fingers,extra digit,bad handsmissing fingers,[llextra arms and legs]]],

上面的负面提示词为通用的,NSFW是告诉Stable Diffusion不要生成适合公共场合的图片,还有就是告诉SD不要生成角色缺手臂,缺一条腿的图片

在这里插入图片描述
这些直接复制到下面的反向提示词即可

prompt-all-in-one插件

下载链接,https://github.com/Physton/sd-webui-prompt-all-in-one

安装这个插件后在红框处输入想要的提示词中文,按一下回车就可以自动生成了英文输入此时写入正向了。
在这里插入图片描述
在这里插入图片描述
对英文不太好的朋友非常的友好。

在这里插入图片描述
而下面又可以找到不同的人物,装饰,服饰等词语。

Stable Diffusion 采样器

采样器主要划分成三大类型
1.老派采样器
2.DPM采样器
3.新派采样器

采样器名单如下
在这里插入图片描述
上面有很对采样器都不好用,而有很多采样器也有升级版本后被淘汰的。
我们只需要使用一些好用采用的采样器即可。

老派采样器

DDIM和PLMS是SD最早的采样器算法,不再进行使用
Euler和Euler a渲染画面简单直接,不容易出错,Eluer后面的a代表这收敛的意思
Heun 画质更好,但速度慢一倍
LMS和MSKarras 线性多步法,速度和Euler差不多,实测没Euler稳定,容易出色块

老派采样器中仅仅使用
Euler,Euler a,Heun

DPM采样器

在这里插入图片描述
DPM fast很不稳定,DPM adaptive算法是时间不可控。
DPM二代算法消耗高
因为Karras结尾的是优化算法,Heun是更清晰化的算法,a是收敛化,2S和2M的区别是2M的算法增加了色块直接的通讯,2M是2S的进阶版本。

剩下推荐的算法为如下
在这里插入图片描述

新派采样器

在这里插入图片描述
在这里插入图片描述

相关链接

CGMI.Com:https://cgmi.com/
ChatGPT-4白给:https://cgmi.com/archives/677
模型下载C站:https://civitai.com/

相关文章:

Stable Diffusion学习记录

文章目录 前言电脑配置推荐环境搭建下载地址安装步骤步骤一&#xff0c;打开下载的秋叶整合包&#xff0c;路径秋叶整合包/sd-wenui-aki步骤二&#xff0c;打开下载好的sd-webui-aki-v4.8.7解压包 Stable Diffusion软件配置&#xff0c;插件安装&#xff0c;模型下载Stable Dif…...

安装openssh-server,提供远程ssh

安装openssh-server&#xff0c;提供远程ssh 1.检查自己是否安装了openssh-server dpkg -l | grep ssh如果输出内容有openssh-server&#xff0c;说明已经安装过了&#xff0c;可以跳过下一步 2.安装openssh-server 由于ubuntu自带ssh客户端&#xff0c;只需要安装openssh-se…...

华纳云:选择数据库服务器你需要注意的5个原则

选择数据库服务器时&#xff0c;有几个关键原则需要注意&#xff0c;以确保选择的服务器能够满足你的需求并提供可靠的性能和安全性。 1. 性能需求 考虑你的应用程序对性能的需求&#xff0c;包括处理能力、内存、存储和网络带宽等方面。根据应用程序的负载和预期的并发访问量&…...

Linux动态库与静态库解析

文章目录 一、引言二、C/C源文件的编译过程三、静态库1、静态库的定义和原理2、静态库的优缺点3、静态库的创建和使用a、创建静态库b、使用静态库 四、动态库1、动态库的定义和原理2、动态库的优缺点3、动态库的创建和使用示例a、创建动态库b、使用动态库 五、动静态库的比较 一…...

后端的一些科普文章

后端开发一般有4个方面 后端开发流程 1阶段 域名认证 是每一个计算机在网络上有一个ip地址&#xff0c;可以通过这个地址来访问102.305.122.5&#xff08;举例&#xff09;&#xff0c; 但是这个公网ip地址&#xff0c;比较难记忆&#xff0c;所以大家使用域名来更好的记忆…...

【Android学习】日期和时间选择对话框

实现功能 实现日期和时间选择的对话框&#xff0c;具体效果可看下图(以日期为例) 具体代码 1 日期对话框 1.1 xml <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android&quo…...

在Linux上使用Selenium驱动Chrome浏览器无头模式

大家好&#xff0c;我们平时在做UI自动化测试的时候&#xff0c;经常会用到Chrome浏览器的无头模式&#xff08;无界面模式&#xff09;&#xff0c;并且将测试代码部署到Linux系统中执行&#xff0c;或者平时我们写个爬虫爬取网站的数据也会使用到&#xff0c;接下来和大家分享…...

Feign 第一次调用为什么会很慢?

feign调用的大致过程&#xff1f; Feign进行远程调用的&#xff0c;这里面包括&#xff0c;注册中心、负载均衡、FeignClient之间的关系&#xff0c;微服务通过不论是eureka、nacos也好注册到服务端&#xff0c;Feign是靠Ribbon做负载的&#xff0c;而Ribbon需要拿到注册中心的…...

Spring Framework-简介

Spring Framework Java Spring是一个开源的Java应用框架&#xff0c;它的主要目的是简化企业级应用开发的复杂性。Spring框架为开发者提供了许多基础功能&#xff0c;使得开发者能够更专注于业务逻辑的实现&#xff0c;而不是底层的细节。 主要特点和功能&#xff1a; 控制反…...

Linux——PHP8.0编译安装和yum安装

文章目录 Linux——PHP8.0编译安装和yum安装PHP8.0编译安装PHP8.0yum安装 Linux——PHP8.0编译安装和yum安装 PHP8.0编译安装 此内容参考于&#xff1a;https://www.cnblogs.com/jhno1/p/14237034.html 安装依赖 # 安装编译依赖 [rootcsq ~]# yum -y install ncurses ncurses…...

【通义千问系列】Qwen-Agent 从入门到精通【持续更新中……】

目录 前言一、快速开始1-1、介绍1-2、安装1-3、开发你自己的Agent 二、Qwen-Agent的使用和开发过程2-1、Agent2-1-1、Agent使用2-1-2、Agent开发 2-2、Tool2-2-1、工具使用2-2-2、工具开发 2-3、LLM2-3-1、LLM使用2-3-2、LLM开发 三、基于Qwen-Agent的案例分析3-1、3-2、 总结 …...

1081:分苹果

1081&#xff1a;分苹果 时间限制: 1000 ms 内存限制: 65536 KB 提交数:65448 通过数: 54401 【题目描述】 把一堆苹果分给n个小朋友&#xff0c;要使每个人都能拿到苹果&#xff0c;而且每个人拿到的苹果数都不同的话&#xff0c;这堆苹果至少应该有多少个&#x…...

Linux—-vim基础使用

1、基本概念 Vim的工作模式有四种&#xff0c;普通模式&#xff0c;输入模式&#xff0c;命令模式&#xff0c;可视模式。 在终端中打开vim&#xff0c;只需要输入vim 文件&#xff0c;在普通模式下按i就会进入到输入模式&#xff0c;按下:进入命令模式&#xff0c;输入:q就可…...

《ESP8266通信指南》12-Lua 固件烧录

往期 《ESP8266通信指南》11-Lua开发环境配置-CSDN博客 《ESP8266通信指南》10-MQTT通信&#xff08;Arduino开发&#xff09;-CSDN博客 《ESP8266通信指南》9-TCP通信&#xff08;Arudino开发&#xff09;-CSDN博客 《ESP8266通信指南》8-连接WIFI&#xff08;Arduino开发…...

Covalent Network(CQT)通过 “新曙光” 计划实现重要里程碑,增强以太坊时光机,提供 30% 的年化质押收益率

Covalent Network&#xff08;CQT&#xff09;作为集成超过 280 条区块链&#xff0c;并服务于超过 2.8 亿个钱包的领先结构化数据基础设施层&#xff0c;宣布了其战略计划 “新曙光” 中的一个重要进展。随着网络升级并完成了准备工作的 75%&#xff0c;这将为即将部署的以太坊…...

JVM8参数设置相关

1、堆内存设置 JVM堆内存的设置大小应根据应用程序的具体需求和系统环境来确定。以下是一些常见的考虑因素和建议&#xff1a; 应用程序需求&#xff1a;如果应用程序需要处理大量数据或运行多个线程&#xff0c;那么可能需要更大的堆内存。反之&#xff0c;如果应用程序的需…...

送别PI-DataLink,行列视(RCV)完美替代

行列视&#xff08;RCV&#xff09;和 OSI PI 实时数据库自带的 PI-DataLink 报表工具&#xff0c;属于以实时数 据库为主要数据源的报表产品。 PI-DataLink 是专门针对 PI 实时数据库系统开发的一套 Excel 报表插件&#xff0c;功能强大&#xff0c;借助 Excel 自身的强大报表…...

【EasySpider】EasySpider+mysql执行配置异常

问题 使用易采集工具操作时候&#xff0c;遇到一个执行异常&#xff0c;后来发现没有选择数据类型 Loading stealth.min.js MySQL config file path: ./mysql_config.json 成功连接到数据库。 Successfully connected to the database. Traceback (most recent call last):…...

大数据Scala教程从入门到精通第一篇:Scala基本介绍

一&#xff1a;Scala基本介绍 1&#xff1a;Scala相当于Java的增强版和拓展 Scala 基于 JVM和 Java 完全兼容。同样具有跨平台、可移植性好、方便的垃圾回收等特性 Scala 比 Java 更加面向对象&#xff0c;可以说完全面对对象。 Scala 是一门函数式编程语言&#xff0c;Java就…...

2-手工sql注入(进阶篇) sqlilabs靶场5-10题

1. 阅读&#xff0c;学习本章前&#xff0c;可以先去看看基础篇&#xff1a;1-手工sql注入(基础篇)-CSDN博客 2. 本章通过对sqlilabs靶场的实战&#xff0c;关于sqlilabs靶场的搭建&#xff1a;Linux搭建靶场-CSDN博客 3. 本章会使用到sqlmap&#xff0c;关于sqlmap的命令&…...

[2025CVPR]DeepVideo-R1:基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈,在多个视频基准上实现SOTA性能 一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战 ​安全措施依赖问题​ GRPO使用min和clip函数限制策略更新幅度,导致: 梯度抑制:当新旧策略差异过大时梯度消失收敛困难:策略无法充分优化# 传统GRPO的梯…...

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录 第一章 概述 第二章 弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制 第三章 主要定义 …...

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

Opencv中的addweighted函数

一.addweighted函数作用 addweighted&#xff08;&#xff09;是OpenCV库中用于图像处理的函数&#xff0c;主要功能是将两个输入图像&#xff08;尺寸和类型相同&#xff09;按照指定的权重进行加权叠加&#xff08;图像融合&#xff09;&#xff0c;并添加一个标量值&#x…...

【磁盘】每天掌握一个Linux命令 - iostat

目录 【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景 注意事项 【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat&#xff08;I/O Statistics&#xff09;是Linux系统下用于监视系统输入输出设备和CPU使…...

大语言模型如何处理长文本?常用文本分割技术详解

为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

2021-03-15 iview一些问题

1.iview 在使用tree组件时&#xff0c;发现没有set类的方法&#xff0c;只有get&#xff0c;那么要改变tree值&#xff0c;只能遍历treeData&#xff0c;递归修改treeData的checked&#xff0c;发现无法更改&#xff0c;原因在于check模式下&#xff0c;子元素的勾选状态跟父节…...

Robots.txt 文件

什么是robots.txt&#xff1f; robots.txt 是一个位于网站根目录下的文本文件&#xff08;如&#xff1a;https://example.com/robots.txt&#xff09;&#xff0c;它用于指导网络爬虫&#xff08;如搜索引擎的蜘蛛程序&#xff09;如何抓取该网站的内容。这个文件遵循 Robots…...

c#开发AI模型对话

AI模型 前面已经介绍了一般AI模型本地部署&#xff0c;直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型&#xff0c;但是目前国内可能使用不多&#xff0c;至少实践例子很少看见。开发训练模型就不介绍了&am…...

智能分布式爬虫的数据处理流水线优化:基于深度强化学习的数据质量控制

在数字化浪潮席卷全球的今天&#xff0c;数据已成为企业和研究机构的核心资产。智能分布式爬虫作为高效的数据采集工具&#xff0c;在大规模数据获取中发挥着关键作用。然而&#xff0c;传统的数据处理流水线在面对复杂多变的网络环境和海量异构数据时&#xff0c;常出现数据质…...