当前位置: 首页 > news >正文

Stable Diffusion 使用详解(1)---- 提示词及相关参数

目录

背景

提示词

内容提示词

人物及主体特征

场景

环境光照

画幅视角

注意事项及示例

标准化提示词

画质等级

风格与真实性

具体要求

背景处理

光线与色彩

负向提示词

小结

常用工具

另外几个相关参数

迭代步数

宽度与高度

提示词引导系数

图片数量


背景

AI作图提示词其实是一门学问,本质上,如果AI足够智能,其实不会有提示词写法这一说,按照人脑所想即所得的原则,进行无差别障碍的生图才是最终目标。但这之间,就现有技术而言,有着一条难以逾越的鸿沟,就是AI 生图的机制决定了,你在文生图的过程中,提示词需要尽量符合AI 模型能捕捉的原则,这是不得已而为之的做法。未来这条鸿沟应该能跨越,但实现的技术方式需要仰仗LLM及其他领域对人类语言的更深层次理解。现阶段,要想用好AI绘画,特别是文生图,掌握提示词及相关参数的用法是必不可少的。提示词有两大类,一类是内容相关的,一类是画质等绘画要求相关的,比如绘画的风格,清晰度,镜头的长远等。今天主要看下提示词的用法。

提示词

内容提示词

就是指与这个画面相关的提示词,说的越清楚,AI绘制的越到位。

人物及主体特征

  1. 服饰穿搭
    • 示例:white dressjeans and T-shirtbusiness suit
    • 可以通过颜色和款式详细描述服饰。
  2. 发型发色
    • 示例:blonde hairlong curly hairshort black hair
    • 注意描述发型的长度、颜色和卷曲程度。
  3. 五官特点
    • 示例:small eyesbig nosesmiling lips
    • 详细描述面部特征,包括眼睛大小、鼻子形状和嘴唇表情。
  4. 面部表情
    • 示例:smilingserioussad
    • 表情是传达人物情感的重要部分。
  5. 肢体动作
    • 示例:sittingwalkingstretching arms
    • 描述人物的姿态和动作。

场景

  1. 室内/室外
    • 示例:indooroutdoor
    • 初步确定场景的大致环境。
  2. 大场景
    • 示例:forestcitybeach
    • 描述主要场景背景。
  3. 小细节
    • 示例:treebushflower
    • 增添场景中的小元素,使画面更丰富。

环境光照

  1. 白天/黑夜
    • 示例:daynight
    • 确定整体光照的时间段。
  2. 特定时段
    • 示例:morningsunset
    • 细化到具体的时间段,如早晨或日落。
  3. 光环境
    • 示例:sunlightbrightdark
    • 描述整体光线的亮度。
  4. 天空
    • 示例:blue skystarry sky
    • 特定天空的颜色和特征。
  5. 光影效果
    • 示例:soft lightinghard shadowscinematic lighting
    • 详细描述光线的柔和度、阴影的强度和电影般的灯光效果。

画幅视角

  1. 距离
    • 示例:close-updistant
    • 描述镜头与主体的距离。
  2. 人物比例
    • 示例:full bodyupper body
    • 展示人物的整体或局部。
  3. 观察视角
    • 示例:from abovefrom belowfront view
    • 描述观察者的视角位置。
  4. 镜头类型
    • 示例:wide angletelephoto
    • 镜头类型影响画面的构图和透视。

注意事项及示例

需要说明的是,你最好使用英文来描述提示词,虽然有些国内的stable diffusion 应用在上面做了二次开发,支持了中文,但效果毕竟没有原生的好。实际上他的做法也是将中文提示词通过AI等翻译成英文的,所以不如英文来的直接,不对还可以自己调整。

比如我想绘制: ‘一搜木船停泊在碧蓝色的海上,阳光照耀着海水,波光粼粼,很美。’

翻译成提示词:

‘a sleek speedboat moored peacefully at the lower right corner of a sparkling, crystal clear turquoise sea, with sunlight gently kissing the water's surface, causing a shimmering, rippling effect of light and shade, capturing a serene and breathtaking beauty’

标准化提示词


画质等级


best quality:最佳质量
highest quality:最高质量
ultra highres:超高分辨率
highres:高分辨率
extremely detailed:极其详细
ultra-detailed:超详细
highly detailed:高度精细
detailed and intricate:细致而复杂


风格与真实性


photorealistic:照片真实感
realistic:真实感
raw photo:原始照片
professional illustration:专业插图
fine art:美术精品
cinematic:电影级画质


具体要求


masterpiece:杰作
best quality, masterpiece, best quality, ultra highres, ultra-detailed:这些组合词常用于提升图像的整体品质
8k wallpaper:8K高清壁纸,指明输出分辨率
physically-based rendering:基于物理的渲染,模拟真实光照和材质效果


背景处理


detailed background:细致的背景
blurry background:模糊背景
white background:白色背景
这些提示词可以帮助控制图像的背景细节或风格


光线与色彩


虽然不是直接关于画质的提示词,但光线和色彩的处理对画质有很大影响。

例如,perfect lighting、dynamic lighting等提示词可以引导模型生成具有优秀光影效果的图像。


负向提示词


有时,通过避免某些不想要的元素也可以间接提升画质。

例如,no blur、no jpeg artifacts等提示词可以确保图像清晰无伪影。

小结

描述人物
描述场景
描述环境 (时间、光照)
描述画幅视角
其他画面要素
高品质标准化画风
标准化
其他特殊要求

我们改变一些构图权重,看看

我希望看到水质发生一些变化:

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

冒号后面的是比例,默认1。 按照我的经验调整不要超过+- 0.5,不然容易走形。

水波更大了,但是我们希望船远一点,于是拉大视角,加入关键词即可。

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,long zoom,

其实有时候长的短语更能让AI找到意境,因为一个逗号表示一个完整信息,如果这个信息比较足,他会走位一个整体考虑,同时整个场景需要他考虑的事情会比那种一直满篇都是逗号的可能要好,你可能只能用权重来调整这些分布,但好的提示词更能在意境与短语间折中。

a sleek speedboat parked gracefully on a crystal clear turquoise blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

常用工具

推荐个写提示词的网站给你,因为我经常用。

AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!

另外几个相关参数

今天先讲下这几个参数

迭代步数

我们都知道 stable diffusion 的基本扩散原理,就是先变模糊,再不停迭代绘制将图片变清晰,在这一过程中,迭代步数 就是指 图像从水滴落下开始扩散,到完全清晰的过程中,你需要AI帮你做多少轮的绘制。通常来讲,迭代次数越多,画面越清晰,画质也会越好。当然决定画质的不止这一个因素,与高宽像素等也有密不可分的关系。但就一般情况而言,迭代次数达到某个阈值后,并不是迭代次数越多,画质越好。我的经验是一般 7 - 20  为宜,上了30以后,迭代次数不管怎么增加,都没太大意义。

宽度与高度

用AI绘画的人,都希望绘制的作品满足自己的大小要求,这里一般是比较大的画作。但不幸的是,AI绘画的宽度与高度越大,那么需要使用显卡的memory 就越多,所需要的时间也越多。一般情况下,要看你显卡的配置,一般大家都是用的是N卡,就是Nivida 的显卡。显存越大,AI作画的高宽像素也就越大。通常我自己来说,一般不超过1024,因为我的N卡在超过1024后,就比较慢。这时候可以通过诸如图片修复或是图生图的方式来解决,调优。

提示词引导系数

顾名思义,就是你写的prompt对AI作画影响的权重,是要完全符合你说的,还是说给AI自己一定的想象空间来完成作画。你可以尝试改变这个权重来看下对画作的影响。

图片数量

就是一次生成多少张符合你要求的图片,你可以从中选取一张作为最好的,在上面尽心后期调优。

比如像这样,一次生成3张:

今天就先写到这里吧。希望你对提示词等用法有所感悟,掌握人类语言转换为AI 作画提示词的一些技巧,这也不可能一蹴而就,需要多加练习才可以达到一定的境界。

相关文章:

Stable Diffusion 使用详解(1)---- 提示词及相关参数

目录 背景 提示词 内容提示词 人物及主体特征 场景 环境光照 画幅视角 注意事项及示例 标准化提示词 画质等级 风格与真实性 具体要求 背景处理 光线与色彩 负向提示词 小结 常用工具 另外几个相关参数 迭代步数 宽度与高度 提示词引导系数 图片数量 背景…...

数据结构和算法(刷题) - 无序数组排序后的最大相邻差

无序数组排序后的最大相邻差 问题:一个无序的整型数组,求出该数组排序后的任意两个相邻元素的最大差值?要求时间和空间复杂度尽可能低。 三种方法: 排序后计算比较 简介:用任意一种时间复杂度为 O ( n log ⁡ n ) O…...

HOW - React 处理不紧急的更新和渲染

目录 useDeferredValueuseTransitionuseIdleCallback 在 React 中,有一些钩子函数可以帮助你处理不紧急的更新或渲染,从而优化性能和用户体验。 以下是一些常用的相关钩子及其应用场景: useDeferredValue 用途:用于处理高优先级…...

基于A律压缩的PCM脉冲编码调制通信系统simulink建模与仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1A律压缩的原理 4.2 PCM编码过程 4.3 量化噪声与信噪比 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a 3.部分核心程序 &#…...

【入门教程一】基于DE2-115的My First FPGA 工程

1.1. 概述 这是一个简单的练习, 可以帮助初学者开始了解如何使用Intel Quartus 软件进行 FPGA 开发。 在本章节中,您将学习如何编译 Verilog 代码,进行引脚分配,创建时序约束,然后对 FPGA 进行编程,驱动开…...

mysql中的索引和分区

目录 1.编写目的 2.索引 2.1 创建方法 2.2 最佳适用 2.3 索引相关语句 3.分区 3.1 创建方法 3.2 最佳适用 Welcome to Code Blocks blog 本篇文章主要介绍了 [Mysql中的分区和索引] ❤博主广交技术好友,喜欢文章的可以关注一下❤ 1.编写目的 在MySQL中&…...

项目实战--C#实现图书馆信息管理系统

本项目是要开发一个图书馆管理系统,通过这个系统处理常见的图书馆业务。这个系统主要功能是:(1)有客户端(借阅者使用)和管理端(图书馆管理员和系统管理员使用)。(2&#…...

信号【Linux】

文章目录 信号处理方式(信号递达)前后台进程 终端按键产生信号kill系统调用接口向进程发信号阻塞信号sigset_tsigprocmasksigpending内核态与用户态:内核空间与用户空间内核如何实现信号的捕捉 1、信号就算没有产生,进程也必须识别…...

Kafka Producer之ACKS应答机制

文章目录 1. 应答机制2. 等级03. 等级14. 等级all5. 设置等级6. ISR 1. 应答机制 异步发送的效率高,但是不安全,同步发送安全,但是效率低。 无论哪一种,有一个关键的步骤叫做回调,也就是ACKS应答机制。 其中ACKS也分…...

【深入理解SpringCloud微服务】深入理解Eureka核心原理

深入理解Eureka核心原理 Eureka整体设计Eureka服务端启动Eureka三级缓存Eureka客户端启动 Eureka整体设计 Eureka是一个经典的注册中心,通过http接收客户端的服务发现和服务注册请求,使用内存注册表保存客户端注册上来的实例信息。 Eureka服务端接收的…...

算法——滑动窗口(day7)

904.水果成篮 904. 水果成篮 - 力扣(LeetCode) 题目解析: 根据题意我们可以看出给了我们两个篮子说明我们在开始采摘到结束的过程中只能有两种水果的种类,又要求让我们返回收集水果的最大数目,这不难让我们联想到题目…...

Django学习第一天(如何创建和运行app)

前置知识: URL组成部分详解: 一个url由以下几部分组成: scheme://host:port/path/?query-stringxxx#anchor scheme:代表的是访问的协议,一般为http或者ftp等 host:主机名,域名,…...

VScode连接虚拟机运行Python文件的方法

声明:本文使用Linux发行版本为rocky_9.4 目录 1. 在rocky_9.4最小安装的系统中,默认是没有tar工具的,因此,要先下载tar工具 2. 在安装好的vscode中下载ssh远程插件工具 3. 然后连接虚拟机 4. 查看python是否已经安装 5. 下载…...

通义千问AI模型对接飞书机器人-模型配置(2-1)

一 背景 根据业务或者使用场景搭建自定义的智能ai模型机器人,可以较少我们人工回答的沟通成本,而且可以更加便捷的了解业务需求给出大家设定的业务范围的回答,目前基于阿里云的通义千问模型研究。 二 模型研究 参考阿里云帮助文档&#xf…...

[k8s源码]6.reflector

Reflector 和 Informer 是 Kubernetes 客户端库中两个密切相关但职责不同的组件。Reflector 是一个较低级别的组件,主要负责与 Kubernetes API 服务器进行交互,执行资源的初始列表操作和持续的监视操作,将获取到的数据放入队列中。而 Informe…...

前台文本直接取数据库值doFieldSQL插入SQL

实现功能:根据选择的车间主任带出角色。 实现步骤:OA的“字段联动”功能下拉选项带不出表“hrmrolemembers”,所以采用此方法。 doFieldSQL("select roleid from HrmResource as a inner join hrmrolemembers as b on a.id b.resource…...

【06】LLaMA-Factory微调大模型——微调模型评估

上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面 conda activate GLM cd LLa…...

数学建模学习(1)遗传算法

一、简介 遗传算法(Genetic Algorithm, GA)是一种用于解决优化和搜索问题的进化算法。它基于自然选择和遗传学原理,通过模拟生物进化过程来寻找最优解。 以下是遗传算法的主要步骤和概念: 初始化种群(Initialization&a…...

NumPy冷知识66个

NumPy冷知识66个 多维切片: NumPy支持多维切片,可以通过指定多个索引来提取多维数组的子集。 复杂数支持: NumPy可以处理复数,提供了复数的基本运算和函数。 比特运算: NumPy支持比特运算,如与、或、异或等。 数据存储格式: NumPy可以将数…...

Wi-SUN无线通信技术 — 大规模分散式物联网应用首选

引言 在数字化浪潮的推动下,物联网(IoT)正逐渐渗透到我们生活的方方面面。Wi-SUN技术以其卓越的性能和广泛的应用前景,成为了大规模分散式物联网应用的首选。本文将深入探讨Wi-SUN技术的市场现状、核心优势、实际应用中的案例以及…...

CentOS8网络管理大变革:从network.service到NetworkManager的全面解析

CentOS8网络管理架构深度解析:从传统命令到NetworkManager的进化之路 如果你是一位长期使用CentOS的系统管理员,最近升级到CentOS8后可能会遇到一个令人困惑的问题:当你习惯性地输入systemctl restart network命令时,系统却无情地…...

避坑指南:STM32磁编码器校准常见的5个错误及解决方案

STM32磁编码器校准实战:5个典型错误分析与高阶解决方案 磁编码器在步进电机控制系统中扮演着关键角色,而MT6816作为国产AMR技术代表芯片,其14位高精度输出为位置检测提供了可靠保障。但在实际校准过程中,开发者常会遇到CALI_Error…...

手把手教你用VerilogA实现1.8V两相非交叠时钟(附完整代码与仿真)

1.8V两相非交叠时钟的VerilogA实现实战指南 在混合信号电路设计中,非交叠时钟(Non-Overlapping Clock)是许多关键模块的基础需求,特别是在开关电容电路、电荷泵和采样保持电路中。本文将带你从零开始,使用VerilogA语言…...

FreeRTOS中断管理实战:如何用信号量优雅处理硬件中断(附STM32代码)

FreeRTOS中断管理实战:信号量在STM32硬件中断中的高效应用 1. 嵌入式实时系统中的中断挑战 在嵌入式开发中,中断处理就像餐厅里的紧急订单——它可能随时打断主厨正在准备的常规菜品。想象你正在安静地享用下午茶,突然门铃响起(…...

ADC0808搭配51单片机测电压:从芯片手册解读到量程切换逻辑的代码实现

ADC0808与51单片机电压测量系统:从芯片手册到智能量程切换的工程实践 在嵌入式系统开发中,精确的电压测量是许多应用的基础功能。ADC0808作为经典的8位模数转换器,与51单片机的组合曾是工业控制和仪器仪表领域的黄金搭档。本文将带您深入探索…...

DAMOYOLO-S基础教程:理解count字段与实际业务中目标计数逻辑映射

DAMOYOLO-S基础教程:理解count字段与实际业务中目标计数逻辑映射 1. 从一次“数数”的困惑说起 前两天,一个做零售分析的朋友找我帮忙。他兴奋地告诉我,他们用上了最新的AI目标检测模型,想自动统计货架上的商品数量。他上传了一…...

TinyXML2性能优化终极指南:10个技巧让XML处理速度飙升

TinyXML2性能优化终极指南:10个技巧让XML处理速度飙升 【免费下载链接】tinyxml2 TinyXML2 is a simple, small, efficient, C XML parser that can be easily integrated into other programs. 项目地址: https://gitcode.com/gh_mirrors/ti/tinyxml2 TinyX…...

Go后端项目代码规范:编写可维护Clean Architecture代码的7个黄金法则

Go后端项目代码规范:编写可维护Clean Architecture代码的7个黄金法则 【免费下载链接】go-backend-clean-architecture A Go (Golang) Backend Clean Architecture project with Gin, MongoDB, JWT Authentication Middleware, Test, and Docker. 项目地址: https…...

3分钟学会Qwerty Learner:打字练习与单词记忆的完美结合

3分钟学会Qwerty Learner:打字练习与单词记忆的完美结合 【免费下载链接】qwerty-learner 项目地址: https://gitcode.com/GitHub_Trending/qw/qwerty-learner Qwerty Learner是一款专为键盘工作者设计的开源学习工具,巧妙地将英语单词记忆与打字…...

Qwen3-Reranker-0.6B与Java后端服务集成实战

Qwen3-Reranker-0.6B与Java后端服务集成实战 1. 为什么需要在Java服务中集成重排序模型 在企业级搜索和推荐系统中,我们经常遇到这样的场景:用户输入一个查询词,系统从千万级文档库中召回前100个候选结果,但这些结果的排序质量往…...