当前位置: 首页 > news >正文

AI 绘画 | Stable Diffusion 提示词

Prompts提示词简介

在Stable Diffusion中,Prompts是控制模型生成图像的关键输入参数。它们是一种文本提示,告诉模型应该生成什么样的图像。

Prompts可以是任何文本输入,包括描述图像的文本,如“一只橘色的短毛猫,坐在草地上,背景是蓝天白云”,也可以是关键词的组合,如“鸟,森林,天空”。

通过使用Prompts,我们可以控制生成图像的样式、主题、颜色、纹理等。同时,我们还可以通过调整Prompts的权重来控制不同要素在图像中的突出程度。例如,如果将某个关键词的权重设置得更高,那么模型在生成图像时就会更加注重这个关键词的体现。

除了手动编写Prompts,我们还可以利用一些工具来生成Prompts。例如,可以使用AI绘画工具生成一个初步的图像,然后将其作为参考图,通过调整参考图的参数来生成新的Prompts。这样可以使Prompts更加贴合我们的需求,提高生成图像的质量和效率。

需要注意的是,不同的模型和参数设置会对Prompts的解读和生成结果产生影响。因此,在使用Prompts时需要不断尝试和调整,以找到最佳的组合和权重设置。

提示词是提示而不是判定依据,比如你输入质量判定词汇的时候,其实是在限制数据的范围,而不是 “要求” AI 出一张很好的图片。

在这里插入图片描述

提示词语法

基本格式

Stable Diffusion 提示词仅支持用英文,可以是英文句子短语,标签词组。例如:我们要AI画一个女孩在森林漫步的场景图片,我们的提示词可以有两种写法

  • a girl was walking in the forest
  • a girl,walking,forest,

这两种写法的出图效果是一样的。一般情况下,我们都会使用第二种词组标签的写法,一是能写更少的单词,二是后期修改提示词的时候时候非常方便。
注意事项

  • 每个标签之间要用英文逗号分割开来。
  • 不区分大小写。Stable Diffusion都会把大写自动转成小写
  • 越靠前的标签,权重越大。
  • 目前Stable-Diffusion-UI最大支持的提示词是75个。
  • 提示词越多生成的绘画出来的内容就越难把控,不要写入两个或者更多相互矛盾(意思相反的提示词)。
  • 提示词中包含相同或者类似的提示词越多,画面出现提示词内容权重就越大。

权重系数

权重系数可改变提示词特定部分的比重。

分割符

  • , 逗号: 分割词缀,有一定权重排序功能,逗号前权重高,逗号后权重低,因而建议排序:

综述(图像质量+画风+镜头效果+光照效果+主题+构图)
主体(人物&对象+姿势+服装+道具)
细节(场景+环境+饰品+特征)

先把描述图片质量,分辨率、风格的放在提示词的最前面,其次是绘画的主题内容的提示词,最后是绘画细节的提示词。按照这里的顺序书写提示词,绘画的效果会更好。

组合符

在这里插入图片描述

  • () 圆括号: 增加权重0.1,即权重标为1.1
    大部分情况用圆括号即可。
// 权重乘以1.1
(1girl) 
  • {} 花括号: 增加权重0.05
// 权重乘以1.05
{1girl}
  • [] 方括号: 减少权重0.1,也有说是减弱0.05的
    方括号中无法自定义权重数值,自定义权重只能使用(x:0.5)形式。
// 权重乘以0.9
[1girl] 
  • (())、{{}}、[[]] 复用括号: 叠加权重
// 权重乘以1.1*1.1,即权重为1.21
((1girl))
// 权重乘以1.05*1.05,即权重为1.1025
{{1girl}} 
// 权重乘以0.9*0.9,即权重为0.81
[[1girl]]  // 权重乘以1.1*1.1*1.1,即权重为1.331
(((1girl)))
// 权重乘以1.05*1.05*1.05,即权重为1.157625
{{{1girl}}} 
// 权重乘以0.9*0.9*0.9,即权重为0.729
[[[1girl]]]   
  • : 冒号: 自定义权重数值(仅支持圆括号)
    格式:左圆括号 + 词缀 + 冒号 + 数字 + 右圆括号
// 单人女孩词缀,权重为0.75
(1girl:0.75) 
// 单人女孩词缀,权重为1.2
(1girl:1.2) 

连接符

  • AND 和: 将多个词缀聚合在一个提示词顺序位置中,其初始权重一致
// 三个词缀权重一致
bird and dog and pig// 可使用冒号标记其权重
bird:1.5 and dog:1.2 and pig:0.8
  • | 竖线 混合两个描述同一对象的提示词要素
//生成白色和黄色混合的花
white | yellow floewer, 
  • _ 下划线 加强单词之间的联系
在这里插入代码片

标签替换和标签轮转

标签替换

[] 方括号中使用: | 等符号,则可实现较为复杂的分布与交替渲染的需求。

  • [from:to:when]: 渲染元素1到多少进度后开始渲染元素2,实现元素1与元素2的互相叠加,可用于两个词条的融合。即 [元素1:元素2:迭代步数比例] 或者即 [元素1:元素2:迭代步数]
// 当图片采样迭代步数到达40%进度后,开始渲染红色
[blue:red:0.4] flower// 前12步渲染蓝色后,开始渲染红色
[blue:red:12] flower

标签轮转

  • **[A|B|C] [提示词1|提示词2|提示词3]:**元素1和元素2的交替混合渲染,意思就是渲染一次A,再渲染一次B,再渲染一次A~~以此往复直至最后。
//生成的第一步将使用 blue,第二步将使用red,第三步将使用yellow,第四步将使用blue,依此类推。
[blue|red|yellow]

调取 LoRA & Hypernetworks 模型

<> 尖括号: 调取LoRA或超网络模型等。
输入:<lora:filename:multiplier> 或 <hypernet:filename:multiplier> 可调取相应模型。

//调用lora模型
<lora:cuteGirlMix4_v10>
//调用lora模型 权重为0.5
<lora:cuteGirlMix4_v10:0.5>

Emoji表情符

Emoji (💰,💶,💷,💴,💵,🎊,🪅🪄,🎀,👩‍🚀) 表情符号也是可以使用并且 非常准确 的。
😃 微笑 😦 不悦 😉 使眼色 😄 开心 😛 吐舌头 :-C 很悲伤 😮 惊讶 张大口 😕 怀疑
Emoji 因为只有一个字符,所以在语义准确度上表现良好。

Emoji 在构图上有影响,比如 💐☺️💐。

提示词使用技巧

Stable Diffusion是一种基于transformer的文本到图像生成模型,可以通过文本提示生成高质量的图像。提示词是给Stable Diffusion输入的文本提示,它可以指导模型生成什么样的图像。选择合适的提示词非常重要,可以大大影响最终生成结果的质量。下面我将详细讲解提示词的使用技巧:

  • 以英文写提示词。Stable Diffusion是以英文训练的模型,使用英文提示词可以获得最佳效果。

  • **提示词越具体越好。**提示词应该尽可能明确地指出你想要生成什么样的图像,避免模糊、笼统的描述。例如“一只可爱的猫咪”比“一只猫”更好,“一个穿着蓝色衬衫的女孩”比“一个女孩”更好。明确的描述可以减少模型的困惑,生成更符合预期的结果。

  • **使用多词短语而不是单个词。**使用“坐在海边的少女”而不是简单地用“海”和“女孩”。短语可以更清晰地表示组合意义,单个词往往多义,增加模型需要处理的不确定性。

  • **补充修饰词。**使用形容词和副词来增加描述细节,例如“一只快乐地玩耍的金毛猎犬”。修饰词可以明确对象的属性、状态和动作,减少生成的随机性。

  • 指定样式和组成。可以直接指定“风格为糖果色调”“像漫画一样”来指导图像的视觉风格。也可以指定对象“右上角有一只猫”来指导组成。明确指导可以减少需要多次尝试的时间。

  • 排除不需要的内容。可以使用“没有文字”“不要水印”等指示来去掉不需要的元素。特别是需要生成照片时,可以指明“无水印照片”以避免生成带商标的图像。

  • 对 prompts进行细分。可以把提示词分成几部分,分别控制场景、风格、视角等不同方面。例如“一只雪白的猫,背景是蓝天白云,透视角度仰视”。这可以使得提示更结构化,各个方面可以自由组合。

  • **尝试不同的提示方式。**可以用不同的语句结构、词汇描述同一个意图,看哪种效果更好。也可以尝试用不同语言的提示词。提示词的表述方式对结果有很大影响。

  • **生成时候控制参数。**除了文本提示,生成参数如steps、sampling方法等都会影响结果。可以结合参数控制使结果更可控。

  • 查看例图选用已知好的提示词。prompts-engine等网站收集了大量示例图片与prompts,可以直接借鉴使用效果好的提示词。

  • 迭代优化找到最佳提示词。生成结果与预期不符时,可以修改提示词重新生成,逐步逼近理想结果。保持提示词的持续优化非常必要。

综上,良好的提示词应具备明确、具体、细节丰富等特点。需要注意提示词的表述方式,区分不同的控制因素,同时结合参数控制使生成可控。要多次迭代试验,优化找到最佳提示词组合。熟练掌握提示词的运用可以大大提高Stable Diffusion的生成能力,是使用中的关键技巧。

在这里插入图片描述

相关文章:

AI 绘画 | Stable Diffusion 提示词

Prompts提示词简介 在Stable Diffusion中&#xff0c;Prompts是控制模型生成图像的关键输入参数。它们是一种文本提示&#xff0c;告诉模型应该生成什么样的图像。 Prompts可以是任何文本输入&#xff0c;包括描述图像的文本&#xff0c;如“一只橘色的短毛猫&#xff0c;坐在…...

tomcat默认最大线程数、等待队列长度、连接超时时间

tomcat默认最大线程数、等待队列长度、连接超时时间 tomcat的默认最大线程数是200&#xff0c;默认核心线程数(最小空闲线程数)是10。 在核心线程数满了之后&#xff0c;会直接启用最大线程数&#xff08;和JDK线程池不一样&#xff0c;JDK线程池先使用工作队列再使用最大线程…...

本地部署 CogVLM

本地部署 CogVLM CogVLM 是什么CogVLM Github 地址部署 CogVLM启动 CogVLM CogVLM 是什么 CogVLM 是一个强大的开源视觉语言模型&#xff08;VLM&#xff09;。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。 CogVLM-17B 在 10 个经典跨模态基准测试上取得了 SOTA 性能&am…...

bff层解决了什么痛点

bff层 -- 服务于前端的后端 什么是bff&#xff1f; Backend For Frontend&#xff08;服务于前端的后端&#xff09;&#xff0c;也就是服务器设计API的时候会考虑前端的使用&#xff0c;并在服务端直接进行业务逻辑的处理&#xff0c;又称为用户体验适配器。BFF只是一种逻辑…...

面试经典150题——Day33

文章目录 一、题目二、题解 一、题目 76. Minimum Window Substring Given two strings s and t of lengths m and n respectively, return the minimum window substring of s such that every character in t (including duplicates) is included in the window. If there …...

再谈Android重要组件——Handler(Native篇)

前言 最近工作比较忙&#xff0c;没怎么记录东西了。Android的Handler重要性不必赘述&#xff0c;之前也写过几篇关于hanlder的文章了&#xff1a; Handler有多深&#xff1f;连环二十七问Android多线程&#xff1a;深入分析 Handler机制源码&#xff08;二&#xff09; And…...

Javaweb之javascript的详细解析

JavaScript html完成了架子&#xff0c;css做了美化&#xff0c;但是网页是死的&#xff0c;我们需要给他注入灵魂&#xff0c;所以接下来我们需要学习JavaScript&#xff0c;这门语言会让我们的页面能够和用户进行交互。 1.1 介绍 通过代码/js效果演示提供资料进行效果演示&…...

Linux常用命令——cd命令

在线Linux命令查询工具 cd 切换用户当前工作目录 补充说明 cd命令用来切换工作目录至dirname。 其中dirName表示法可为绝对路径或相对路径。若目录名称省略&#xff0c;则变换至使用者的home directory(也就是刚login时所在的目录)。另外&#xff0c;~也表示为home directo…...

VHDL基础知识笔记(1)

1.实体&#xff1a;其电路意义相当于器件&#xff0c;它相当于电路原理图上的元器件符号。它给出了器件的输入输出引脚。实体又被称为模块。 2.结构体&#xff1a;这个部分会给出实体&#xff08;或者说模块&#xff09;的具体实现&#xff0c;指定输入和输出的行为。结构体的…...

volatile-日常使用场景

6.4 如何正确使用volatile 单一赋值可以&#xff0c;但是含复合运算赋值不可以&#xff08;i之类的&#xff09; volatile int a 10; volatile boolean flag true; 状态标志&#xff0c;判断业务是否结束 作为一个布尔状态标志&#xff0c;用于指示发生了一个重要的一次…...

策略模式在数据接收和发送场景的应用

在本篇文章中&#xff0c;我们介绍了策略模式&#xff0c;并在数据接收和发送场景中使用了策略模式。 背景 在最近项目中&#xff0c;需要与外部系统进行数据交互&#xff0c;刚开始交互的系统较为单一&#xff0c;刚开始设计方案时打算使用了if else 进行判断&#xff1a; if(…...

学习LevelDB架构的检索技术

目录 一、LevelDB介绍 二、LevelDB优化检索系统关键点分析 三、读写分离设计和内存数据管理 &#xff08;一&#xff09;内存数据管理 跳表代替B树 内存数据分为两块&#xff1a;MemTable&#xff08;可读可写&#xff09; Immutable MemTable&#xff08;只读&#xff0…...

Docker Swarm实现容器的复制均衡及动态管理:详细过程版

Swarm简介 Swarm是一套较为简单的工具&#xff0c;用以管理Docker集群&#xff0c;使得Docker集群暴露给用户时相当于一个虚拟的整体。Swarm使用标准的Docker API接口作为其前端访问入口&#xff0c;换言之&#xff0c;各种形式的Docker Client(dockerclient in go, docker_py…...

Proteus仿真--1602LCD显示仿手机键盘按键字符(仿真文件+程序)

本文主要介绍基于51单片机的1602LCD显示仿手机键盘按键字符&#xff08;完整仿真源文件及代码见文末链接&#xff09; 仿真图如下 其中左下角12个按键模拟仿真手机键盘&#xff0c;使用方法同手机键一样&#xff0c;长按自动跳动切换键值&#xff0c;松手后确认选择&#xff…...

Rust语言和curl库编写程序

这是一个使用Rust语言和curl库编写的爬虫程序&#xff0c;用于爬取视频。 use std::env; use std::net::TcpStream; use std::io::{BufReader, BufWriter}; ​ fn main() {// 获取命令行参数let args: Vec<String> env::args().collect();let proxy_host args[1].clon…...

FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准

论文标题&#xff1a; FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images 翻译&#xff1a; FSDiffReg&#xff1a;心脏图像的特征和分数扩散引导无监督形变图像配准 摘要 无监督可变形图像配准是医学…...

音视频技术开发周刊 | 318

每周一期&#xff0c;纵览音视频技术领域的干货。 新闻投稿&#xff1a;contributelivevideostack.com。 日程揭晓&#xff01;速览深圳站大会专题议程详解 LiveVideoStackCon 2023 音视频技术大会深圳站&#xff0c;保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会…...

asp.net docker-compose添加sql server

打开docker-compose.yml 添加 sqldata:image: mysql:8.1.0 打开docker-compose.override.yml 添加 sqldata:environment:- MYSQL_ROOT_PASSWORDPasswordports:- "8080:8080"volumes:- killsb-one-sqldata:/etc/mysql/conf.d 在docker里面就有了sql server容器镜像…...

uniapp 微信小程序 uni-file-picker上传图片报错 chooseAndUploadFile

这个问题真的很搞&#xff0c; 原因是微信开发者工具更新了&#xff0c;导致图片上传问题。 解决方法&#xff1a; 将微信开发者工具的基础库改为2.33.0一下即可。 在微信开发者工具详情 - 本地设置中&#xff08;记得点击‘推送’按钮&#xff09;&#xff1a;...

《向量数据库指南》——用 Milvus Cloud和 NVIDIA Merlin 搭建高效推荐系统结论

如何搭建一个高效的推荐系统? 简单来说,现代推荐系统由训练/推理流水线(pipeline)组成,涉及数据获取、数据预处理、模型训练和调整检索、过滤、排名和评分相关的超参数等多个阶段。走遍这些流程之后,推荐系统能够给出高度个性化的推荐结果,从而提升产品的用户体验。 为…...

KubeSphere 容器平台高可用:环境搭建与可视化操作指南

Linux_k8s篇 欢迎来到Linux的世界&#xff0c;看笔记好好学多敲多打&#xff0c;每个人都是大神&#xff01; 题目&#xff1a;KubeSphere 容器平台高可用&#xff1a;环境搭建与可视化操作指南 版本号: 1.0,0 作者: 老王要学习 日期: 2025.06.05 适用环境: Ubuntu22 文档说…...

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…...

synchronized 学习

学习源&#xff1a; https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖&#xff0c;也要考虑性能问题&#xff08;场景&#xff09; 2.常见面试问题&#xff1a; sync出…...

工业安全零事故的智能守护者:一体化AI智能安防平台

前言&#xff1a; 通过AI视觉技术&#xff0c;为船厂提供全面的安全监控解决方案&#xff0c;涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面&#xff0c;能够实现对应负责人反馈机制&#xff0c;并最终实现数据的统计报表。提升船厂…...

JavaScript基础-API 和 Web API

在学习JavaScript的过程中&#xff0c;理解API&#xff08;应用程序接口&#xff09;和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能&#xff0c;使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...

人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent

安全大模型训练计划&#xff1a;基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标&#xff1a;为安全大模型创建高质量、去偏、符合伦理的训练数据集&#xff0c;涵盖安全相关任务&#xff08;如有害内容检测、隐私保护、道德推理等&#xff09;。 1.1 数据收集 描…...

链式法则中 复合函数的推导路径 多变量“信息传递路径”

非常好&#xff0c;我们将之前关于偏导数链式法则中不能“约掉”偏导符号的问题&#xff0c;统一使用 二重复合函数&#xff1a; z f ( u ( x , y ) , v ( x , y ) ) \boxed{z f(u(x,y),\ v(x,y))} zf(u(x,y), v(x,y))​ 来全面说明。我们会展示其全微分形式&#xff08;偏导…...

Linux基础开发工具——vim工具

文章目录 vim工具什么是vimvim的多模式和使用vim的基础模式vim的三种基础模式三种模式的初步了解 常用模式的详细讲解插入模式命令模式模式转化光标的移动文本的编辑 底行模式替换模式视图模式总结 使用vim的小技巧vim的配置(了解) vim工具 本文章仍然是继续讲解Linux系统下的…...

Qwen系列之Qwen3解读:最强开源模型的细节拆解

文章目录 1.1分钟快览2.模型架构2.1.Dense模型2.2.MoE模型 3.预训练阶段3.1.数据3.2.训练3.3.评估 4.后训练阶段S1: 长链思维冷启动S2: 推理强化学习S3: 思考模式融合S4: 通用强化学习 5.全家桶中的小模型训练评估评估数据集评估细节评估效果弱智评估和民间Arena 分析展望 如果…...

算法刷题-回溯

今天给大家分享的还是一道关于dfs回溯的问题&#xff0c;对于这类问题大家还是要多刷和总结&#xff0c;总体难度还是偏大。 对于回溯问题有几个关键点&#xff1a; 1.首先对于这类回溯可以节点可以随机选择的问题&#xff0c;要做mian函数中循环调用dfs&#xff08;i&#x…...