Stable Diffusion 使用详解(1)---- 提示词及相关参数
目录
背景
提示词
内容提示词
人物及主体特征
场景
环境光照
画幅视角
注意事项及示例
标准化提示词
画质等级
风格与真实性
具体要求
背景处理
光线与色彩
负向提示词
小结
常用工具
另外几个相关参数
迭代步数
宽度与高度
提示词引导系数
图片数量
背景
AI作图提示词其实是一门学问,本质上,如果AI足够智能,其实不会有提示词写法这一说,按照人脑所想即所得的原则,进行无差别障碍的生图才是最终目标。但这之间,就现有技术而言,有着一条难以逾越的鸿沟,就是AI 生图的机制决定了,你在文生图的过程中,提示词需要尽量符合AI 模型能捕捉的原则,这是不得已而为之的做法。未来这条鸿沟应该能跨越,但实现的技术方式需要仰仗LLM及其他领域对人类语言的更深层次理解。现阶段,要想用好AI绘画,特别是文生图,掌握提示词及相关参数的用法是必不可少的。提示词有两大类,一类是内容相关的,一类是画质等绘画要求相关的,比如绘画的风格,清晰度,镜头的长远等。今天主要看下提示词的用法。
提示词
内容提示词
就是指与这个画面相关的提示词,说的越清楚,AI绘制的越到位。
人物及主体特征
- 服饰穿搭:
- 示例:
white dress
,jeans and T-shirt
,business suit
- 可以通过颜色和款式详细描述服饰。
- 示例:
- 发型发色:
- 示例:
blonde hair
,long curly hair
,short black hair
- 注意描述发型的长度、颜色和卷曲程度。
- 示例:
- 五官特点:
- 示例:
small eyes
,big nose
,smiling lips
- 详细描述面部特征,包括眼睛大小、鼻子形状和嘴唇表情。
- 示例:
- 面部表情:
- 示例:
smiling
,serious
,sad
- 表情是传达人物情感的重要部分。
- 示例:
- 肢体动作:
- 示例:
sitting
,walking
,stretching arms
- 描述人物的姿态和动作。
- 示例:
场景
- 室内/室外:
- 示例:
indoor
,outdoor
- 初步确定场景的大致环境。
- 示例:
- 大场景:
- 示例:
forest
,city
,beach
- 描述主要场景背景。
- 示例:
- 小细节:
- 示例:
tree
,bush
,flower
- 增添场景中的小元素,使画面更丰富。
- 示例:
环境光照
- 白天/黑夜:
- 示例:
day
,night
- 确定整体光照的时间段。
- 示例:
- 特定时段:
- 示例:
morning
,sunset
- 细化到具体的时间段,如早晨或日落。
- 示例:
- 光环境:
- 示例:
sunlight
,bright
,dark
- 描述整体光线的亮度。
- 示例:
- 天空:
- 示例:
blue sky
,starry sky
- 特定天空的颜色和特征。
- 示例:
- 光影效果:
- 示例:
soft lighting
,hard shadows
,cinematic lighting
- 详细描述光线的柔和度、阴影的强度和电影般的灯光效果。
- 示例:
画幅视角
- 距离:
- 示例:
close-up
,distant
- 描述镜头与主体的距离。
- 示例:
- 人物比例:
- 示例:
full body
,upper body
- 展示人物的整体或局部。
- 示例:
- 观察视角:
- 示例:
from above
,from below
,front view
- 描述观察者的视角位置。
- 示例:
- 镜头类型:
- 示例:
wide angle
,telephoto
- 镜头类型影响画面的构图和透视。
- 示例:
注意事项及示例
需要说明的是,你最好使用英文来描述提示词,虽然有些国内的stable diffusion 应用在上面做了二次开发,支持了中文,但效果毕竟没有原生的好。实际上他的做法也是将中文提示词通过AI等翻译成英文的,所以不如英文来的直接,不对还可以自己调整。
比如我想绘制: ‘一搜木船停泊在碧蓝色的海上,阳光照耀着海水,波光粼粼,很美。’
翻译成提示词:
‘a sleek speedboat moored peacefully at the lower right corner of a sparkling, crystal clear turquoise sea, with sunlight gently kissing the water's surface, causing a shimmering, rippling effect of light and shade, capturing a serene and breathtaking beauty’
标准化提示词
画质等级
best quality:最佳质量
highest quality:最高质量
ultra highres:超高分辨率
highres:高分辨率
extremely detailed:极其详细
ultra-detailed:超详细
highly detailed:高度精细
detailed and intricate:细致而复杂
风格与真实性
photorealistic:照片真实感
realistic:真实感
raw photo:原始照片
professional illustration:专业插图
fine art:美术精品
cinematic:电影级画质
具体要求
masterpiece:杰作
best quality, masterpiece, best quality, ultra highres, ultra-detailed:这些组合词常用于提升图像的整体品质
8k wallpaper:8K高清壁纸,指明输出分辨率
physically-based rendering:基于物理的渲染,模拟真实光照和材质效果
背景处理
detailed background:细致的背景
blurry background:模糊背景
white background:白色背景
这些提示词可以帮助控制图像的背景细节或风格
光线与色彩
虽然不是直接关于画质的提示词,但光线和色彩的处理对画质有很大影响。
例如,perfect lighting、dynamic lighting等提示词可以引导模型生成具有优秀光影效果的图像。
负向提示词
有时,通过避免某些不想要的元素也可以间接提升画质。
例如,no blur、no jpeg artifacts等提示词可以确保图像清晰无伪影。
小结
描述人物
描述场景
描述环境 (时间、光照)
描述画幅视角
其他画面要素
高品质标准化画风
标准化
其他特殊要求
我们改变一些构图权重,看看
我希望看到水质发生一些变化:
a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,
冒号后面的是比例,默认1。 按照我的经验调整不要超过+- 0.5,不然容易走形。
水波更大了,但是我们希望船远一点,于是拉大视角,加入关键词即可。
a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,long zoom,
其实有时候长的短语更能让AI找到意境,因为一个逗号表示一个完整信息,如果这个信息比较足,他会走位一个整体考虑,同时整个场景需要他考虑的事情会比那种一直满篇都是逗号的可能要好,你可能只能用权重来调整这些分布,但好的提示词更能在意境与短语间折中。
a sleek speedboat parked gracefully on a crystal clear turquoise blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,
常用工具
推荐个写提示词的网站给你,因为我经常用。
AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!
另外几个相关参数
今天先讲下这几个参数
迭代步数
我们都知道 stable diffusion 的基本扩散原理,就是先变模糊,再不停迭代绘制将图片变清晰,在这一过程中,迭代步数 就是指 图像从水滴落下开始扩散,到完全清晰的过程中,你需要AI帮你做多少轮的绘制。通常来讲,迭代次数越多,画面越清晰,画质也会越好。当然决定画质的不止这一个因素,与高宽像素等也有密不可分的关系。但就一般情况而言,迭代次数达到某个阈值后,并不是迭代次数越多,画质越好。我的经验是一般 7 - 20 为宜,上了30以后,迭代次数不管怎么增加,都没太大意义。
宽度与高度
用AI绘画的人,都希望绘制的作品满足自己的大小要求,这里一般是比较大的画作。但不幸的是,AI绘画的宽度与高度越大,那么需要使用显卡的memory 就越多,所需要的时间也越多。一般情况下,要看你显卡的配置,一般大家都是用的是N卡,就是Nivida 的显卡。显存越大,AI作画的高宽像素也就越大。通常我自己来说,一般不超过1024,因为我的N卡在超过1024后,就比较慢。这时候可以通过诸如图片修复或是图生图的方式来解决,调优。
提示词引导系数
顾名思义,就是你写的prompt对AI作画影响的权重,是要完全符合你说的,还是说给AI自己一定的想象空间来完成作画。你可以尝试改变这个权重来看下对画作的影响。
图片数量
就是一次生成多少张符合你要求的图片,你可以从中选取一张作为最好的,在上面尽心后期调优。
比如像这样,一次生成3张:
今天就先写到这里吧。希望你对提示词等用法有所感悟,掌握人类语言转换为AI 作画提示词的一些技巧,这也不可能一蹴而就,需要多加练习才可以达到一定的境界。
相关文章:

Stable Diffusion 使用详解(1)---- 提示词及相关参数
目录 背景 提示词 内容提示词 人物及主体特征 场景 环境光照 画幅视角 注意事项及示例 标准化提示词 画质等级 风格与真实性 具体要求 背景处理 光线与色彩 负向提示词 小结 常用工具 另外几个相关参数 迭代步数 宽度与高度 提示词引导系数 图片数量 背景…...
数据结构和算法(刷题) - 无序数组排序后的最大相邻差
无序数组排序后的最大相邻差 问题:一个无序的整型数组,求出该数组排序后的任意两个相邻元素的最大差值?要求时间和空间复杂度尽可能低。 三种方法: 排序后计算比较 简介:用任意一种时间复杂度为 O ( n log n ) O…...
HOW - React 处理不紧急的更新和渲染
目录 useDeferredValueuseTransitionuseIdleCallback 在 React 中,有一些钩子函数可以帮助你处理不紧急的更新或渲染,从而优化性能和用户体验。 以下是一些常用的相关钩子及其应用场景: useDeferredValue 用途:用于处理高优先级…...

基于A律压缩的PCM脉冲编码调制通信系统simulink建模与仿真
目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1A律压缩的原理 4.2 PCM编码过程 4.3 量化噪声与信噪比 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a 3.部分核心程序 &#…...

【入门教程一】基于DE2-115的My First FPGA 工程
1.1. 概述 这是一个简单的练习, 可以帮助初学者开始了解如何使用Intel Quartus 软件进行 FPGA 开发。 在本章节中,您将学习如何编译 Verilog 代码,进行引脚分配,创建时序约束,然后对 FPGA 进行编程,驱动开…...

mysql中的索引和分区
目录 1.编写目的 2.索引 2.1 创建方法 2.2 最佳适用 2.3 索引相关语句 3.分区 3.1 创建方法 3.2 最佳适用 Welcome to Code Blocks blog 本篇文章主要介绍了 [Mysql中的分区和索引] ❤博主广交技术好友,喜欢文章的可以关注一下❤ 1.编写目的 在MySQL中&…...

项目实战--C#实现图书馆信息管理系统
本项目是要开发一个图书馆管理系统,通过这个系统处理常见的图书馆业务。这个系统主要功能是:(1)有客户端(借阅者使用)和管理端(图书馆管理员和系统管理员使用)。(2&#…...

信号【Linux】
文章目录 信号处理方式(信号递达)前后台进程 终端按键产生信号kill系统调用接口向进程发信号阻塞信号sigset_tsigprocmasksigpending内核态与用户态:内核空间与用户空间内核如何实现信号的捕捉 1、信号就算没有产生,进程也必须识别…...

Kafka Producer之ACKS应答机制
文章目录 1. 应答机制2. 等级03. 等级14. 等级all5. 设置等级6. ISR 1. 应答机制 异步发送的效率高,但是不安全,同步发送安全,但是效率低。 无论哪一种,有一个关键的步骤叫做回调,也就是ACKS应答机制。 其中ACKS也分…...

【深入理解SpringCloud微服务】深入理解Eureka核心原理
深入理解Eureka核心原理 Eureka整体设计Eureka服务端启动Eureka三级缓存Eureka客户端启动 Eureka整体设计 Eureka是一个经典的注册中心,通过http接收客户端的服务发现和服务注册请求,使用内存注册表保存客户端注册上来的实例信息。 Eureka服务端接收的…...

算法——滑动窗口(day7)
904.水果成篮 904. 水果成篮 - 力扣(LeetCode) 题目解析: 根据题意我们可以看出给了我们两个篮子说明我们在开始采摘到结束的过程中只能有两种水果的种类,又要求让我们返回收集水果的最大数目,这不难让我们联想到题目…...

Django学习第一天(如何创建和运行app)
前置知识: URL组成部分详解: 一个url由以下几部分组成: scheme://host:port/path/?query-stringxxx#anchor scheme:代表的是访问的协议,一般为http或者ftp等 host:主机名,域名,…...

VScode连接虚拟机运行Python文件的方法
声明:本文使用Linux发行版本为rocky_9.4 目录 1. 在rocky_9.4最小安装的系统中,默认是没有tar工具的,因此,要先下载tar工具 2. 在安装好的vscode中下载ssh远程插件工具 3. 然后连接虚拟机 4. 查看python是否已经安装 5. 下载…...

通义千问AI模型对接飞书机器人-模型配置(2-1)
一 背景 根据业务或者使用场景搭建自定义的智能ai模型机器人,可以较少我们人工回答的沟通成本,而且可以更加便捷的了解业务需求给出大家设定的业务范围的回答,目前基于阿里云的通义千问模型研究。 二 模型研究 参考阿里云帮助文档…...
[k8s源码]6.reflector
Reflector 和 Informer 是 Kubernetes 客户端库中两个密切相关但职责不同的组件。Reflector 是一个较低级别的组件,主要负责与 Kubernetes API 服务器进行交互,执行资源的初始列表操作和持续的监视操作,将获取到的数据放入队列中。而 Informe…...

前台文本直接取数据库值doFieldSQL插入SQL
实现功能:根据选择的车间主任带出角色。 实现步骤:OA的“字段联动”功能下拉选项带不出表“hrmrolemembers”,所以采用此方法。 doFieldSQL("select roleid from HrmResource as a inner join hrmrolemembers as b on a.id b.resource…...

【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面 conda activate GLM cd LLa…...

数学建模学习(1)遗传算法
一、简介 遗传算法(Genetic Algorithm, GA)是一种用于解决优化和搜索问题的进化算法。它基于自然选择和遗传学原理,通过模拟生物进化过程来寻找最优解。 以下是遗传算法的主要步骤和概念: 初始化种群(Initialization&a…...
NumPy冷知识66个
NumPy冷知识66个 多维切片: NumPy支持多维切片,可以通过指定多个索引来提取多维数组的子集。 复杂数支持: NumPy可以处理复数,提供了复数的基本运算和函数。 比特运算: NumPy支持比特运算,如与、或、异或等。 数据存储格式: NumPy可以将数…...

Wi-SUN无线通信技术 — 大规模分散式物联网应用首选
引言 在数字化浪潮的推动下,物联网(IoT)正逐渐渗透到我们生活的方方面面。Wi-SUN技术以其卓越的性能和广泛的应用前景,成为了大规模分散式物联网应用的首选。本文将深入探讨Wi-SUN技术的市场现状、核心优势、实际应用中的案例以及…...

【Axure高保真原型】引导弹窗
今天和大家中分享引导弹窗的原型模板,载入页面后,会显示引导弹窗,适用于引导用户使用页面,点击完成后,会显示下一个引导弹窗,直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...

深度学习在微纳光子学中的应用
深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向: 逆向设计 通过神经网络快速预测微纳结构的光学响应,替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...
R语言AI模型部署方案:精准离线运行详解
R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...
解锁数据库简洁之道:FastAPI与SQLModel实战指南
在构建现代Web应用程序时,与数据库的交互无疑是核心环节。虽然传统的数据库操作方式(如直接编写SQL语句与psycopg2交互)赋予了我们精细的控制权,但在面对日益复杂的业务逻辑和快速迭代的需求时,这种方式的开发效率和可…...

从零开始打造 OpenSTLinux 6.6 Yocto 系统(基于STM32CubeMX)(九)
设备树移植 和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下 源码修改及编译 修改arch/arm/boot/dts/st/Makefile,新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...
【C语言练习】080. 使用C语言实现简单的数据库操作
080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码:使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出:5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作 在…...
4. TypeScript 类型推断与类型组合
一、类型推断 (一) 什么是类型推断 TypeScript 的类型推断会根据变量、函数返回值、对象和数组的赋值和使用方式,自动确定它们的类型。 这一特性减少了显式类型注解的需要,在保持类型安全的同时简化了代码。通过分析上下文和初始值,TypeSc…...
BLEU评分:机器翻译质量评估的黄金标准
BLEU评分:机器翻译质量评估的黄金标准 1. 引言 在自然语言处理(NLP)领域,衡量一个机器翻译模型的性能至关重要。BLEU (Bilingual Evaluation Understudy) 作为一种自动化评估指标,自2002年由IBM的Kishore Papineni等人提出以来,…...
SQL Server 触发器调用存储过程实现发送 HTTP 请求
文章目录 需求分析解决第 1 步:前置条件,启用 OLE 自动化方式 1:使用 SQL 实现启用 OLE 自动化方式 2:Sql Server 2005启动OLE自动化方式 3:Sql Server 2008启动OLE自动化第 2 步:创建存储过程第 3 步:创建触发器扩展 - 如何调试?第 1 步:登录 SQL Server 2008第 2 步…...