当前位置: 首页 > news >正文

Stable Diffusion 使用详解(1)---- 提示词及相关参数

目录

背景

提示词

内容提示词

人物及主体特征

场景

环境光照

画幅视角

注意事项及示例

标准化提示词

画质等级

风格与真实性

具体要求

背景处理

光线与色彩

负向提示词

小结

常用工具

另外几个相关参数

迭代步数

宽度与高度

提示词引导系数

图片数量


背景

AI作图提示词其实是一门学问,本质上,如果AI足够智能,其实不会有提示词写法这一说,按照人脑所想即所得的原则,进行无差别障碍的生图才是最终目标。但这之间,就现有技术而言,有着一条难以逾越的鸿沟,就是AI 生图的机制决定了,你在文生图的过程中,提示词需要尽量符合AI 模型能捕捉的原则,这是不得已而为之的做法。未来这条鸿沟应该能跨越,但实现的技术方式需要仰仗LLM及其他领域对人类语言的更深层次理解。现阶段,要想用好AI绘画,特别是文生图,掌握提示词及相关参数的用法是必不可少的。提示词有两大类,一类是内容相关的,一类是画质等绘画要求相关的,比如绘画的风格,清晰度,镜头的长远等。今天主要看下提示词的用法。

提示词

内容提示词

就是指与这个画面相关的提示词,说的越清楚,AI绘制的越到位。

人物及主体特征

  1. 服饰穿搭
    • 示例:white dressjeans and T-shirtbusiness suit
    • 可以通过颜色和款式详细描述服饰。
  2. 发型发色
    • 示例:blonde hairlong curly hairshort black hair
    • 注意描述发型的长度、颜色和卷曲程度。
  3. 五官特点
    • 示例:small eyesbig nosesmiling lips
    • 详细描述面部特征,包括眼睛大小、鼻子形状和嘴唇表情。
  4. 面部表情
    • 示例:smilingserioussad
    • 表情是传达人物情感的重要部分。
  5. 肢体动作
    • 示例:sittingwalkingstretching arms
    • 描述人物的姿态和动作。

场景

  1. 室内/室外
    • 示例:indooroutdoor
    • 初步确定场景的大致环境。
  2. 大场景
    • 示例:forestcitybeach
    • 描述主要场景背景。
  3. 小细节
    • 示例:treebushflower
    • 增添场景中的小元素,使画面更丰富。

环境光照

  1. 白天/黑夜
    • 示例:daynight
    • 确定整体光照的时间段。
  2. 特定时段
    • 示例:morningsunset
    • 细化到具体的时间段,如早晨或日落。
  3. 光环境
    • 示例:sunlightbrightdark
    • 描述整体光线的亮度。
  4. 天空
    • 示例:blue skystarry sky
    • 特定天空的颜色和特征。
  5. 光影效果
    • 示例:soft lightinghard shadowscinematic lighting
    • 详细描述光线的柔和度、阴影的强度和电影般的灯光效果。

画幅视角

  1. 距离
    • 示例:close-updistant
    • 描述镜头与主体的距离。
  2. 人物比例
    • 示例:full bodyupper body
    • 展示人物的整体或局部。
  3. 观察视角
    • 示例:from abovefrom belowfront view
    • 描述观察者的视角位置。
  4. 镜头类型
    • 示例:wide angletelephoto
    • 镜头类型影响画面的构图和透视。

注意事项及示例

需要说明的是,你最好使用英文来描述提示词,虽然有些国内的stable diffusion 应用在上面做了二次开发,支持了中文,但效果毕竟没有原生的好。实际上他的做法也是将中文提示词通过AI等翻译成英文的,所以不如英文来的直接,不对还可以自己调整。

比如我想绘制: ‘一搜木船停泊在碧蓝色的海上,阳光照耀着海水,波光粼粼,很美。’

翻译成提示词:

‘a sleek speedboat moored peacefully at the lower right corner of a sparkling, crystal clear turquoise sea, with sunlight gently kissing the water's surface, causing a shimmering, rippling effect of light and shade, capturing a serene and breathtaking beauty’

标准化提示词


画质等级


best quality:最佳质量
highest quality:最高质量
ultra highres:超高分辨率
highres:高分辨率
extremely detailed:极其详细
ultra-detailed:超详细
highly detailed:高度精细
detailed and intricate:细致而复杂


风格与真实性


photorealistic:照片真实感
realistic:真实感
raw photo:原始照片
professional illustration:专业插图
fine art:美术精品
cinematic:电影级画质


具体要求


masterpiece:杰作
best quality, masterpiece, best quality, ultra highres, ultra-detailed:这些组合词常用于提升图像的整体品质
8k wallpaper:8K高清壁纸,指明输出分辨率
physically-based rendering:基于物理的渲染,模拟真实光照和材质效果


背景处理


detailed background:细致的背景
blurry background:模糊背景
white background:白色背景
这些提示词可以帮助控制图像的背景细节或风格


光线与色彩


虽然不是直接关于画质的提示词,但光线和色彩的处理对画质有很大影响。

例如,perfect lighting、dynamic lighting等提示词可以引导模型生成具有优秀光影效果的图像。


负向提示词


有时,通过避免某些不想要的元素也可以间接提升画质。

例如,no blur、no jpeg artifacts等提示词可以确保图像清晰无伪影。

小结

描述人物
描述场景
描述环境 (时间、光照)
描述画幅视角
其他画面要素
高品质标准化画风
标准化
其他特殊要求

我们改变一些构图权重,看看

我希望看到水质发生一些变化:

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

冒号后面的是比例,默认1。 按照我的经验调整不要超过+- 0.5,不然容易走形。

水波更大了,但是我们希望船远一点,于是拉大视角,加入关键词即可。

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,long zoom,

其实有时候长的短语更能让AI找到意境,因为一个逗号表示一个完整信息,如果这个信息比较足,他会走位一个整体考虑,同时整个场景需要他考虑的事情会比那种一直满篇都是逗号的可能要好,你可能只能用权重来调整这些分布,但好的提示词更能在意境与短语间折中。

a sleek speedboat parked gracefully on a crystal clear turquoise blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

常用工具

推荐个写提示词的网站给你,因为我经常用。

AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!

另外几个相关参数

今天先讲下这几个参数

迭代步数

我们都知道 stable diffusion 的基本扩散原理,就是先变模糊,再不停迭代绘制将图片变清晰,在这一过程中,迭代步数 就是指 图像从水滴落下开始扩散,到完全清晰的过程中,你需要AI帮你做多少轮的绘制。通常来讲,迭代次数越多,画面越清晰,画质也会越好。当然决定画质的不止这一个因素,与高宽像素等也有密不可分的关系。但就一般情况而言,迭代次数达到某个阈值后,并不是迭代次数越多,画质越好。我的经验是一般 7 - 20  为宜,上了30以后,迭代次数不管怎么增加,都没太大意义。

宽度与高度

用AI绘画的人,都希望绘制的作品满足自己的大小要求,这里一般是比较大的画作。但不幸的是,AI绘画的宽度与高度越大,那么需要使用显卡的memory 就越多,所需要的时间也越多。一般情况下,要看你显卡的配置,一般大家都是用的是N卡,就是Nivida 的显卡。显存越大,AI作画的高宽像素也就越大。通常我自己来说,一般不超过1024,因为我的N卡在超过1024后,就比较慢。这时候可以通过诸如图片修复或是图生图的方式来解决,调优。

提示词引导系数

顾名思义,就是你写的prompt对AI作画影响的权重,是要完全符合你说的,还是说给AI自己一定的想象空间来完成作画。你可以尝试改变这个权重来看下对画作的影响。

图片数量

就是一次生成多少张符合你要求的图片,你可以从中选取一张作为最好的,在上面尽心后期调优。

比如像这样,一次生成3张:

今天就先写到这里吧。希望你对提示词等用法有所感悟,掌握人类语言转换为AI 作画提示词的一些技巧,这也不可能一蹴而就,需要多加练习才可以达到一定的境界。

相关文章:

Stable Diffusion 使用详解(1)---- 提示词及相关参数

目录 背景 提示词 内容提示词 人物及主体特征 场景 环境光照 画幅视角 注意事项及示例 标准化提示词 画质等级 风格与真实性 具体要求 背景处理 光线与色彩 负向提示词 小结 常用工具 另外几个相关参数 迭代步数 宽度与高度 提示词引导系数 图片数量 背景…...

数据结构和算法(刷题) - 无序数组排序后的最大相邻差

无序数组排序后的最大相邻差 问题:一个无序的整型数组,求出该数组排序后的任意两个相邻元素的最大差值?要求时间和空间复杂度尽可能低。 三种方法: 排序后计算比较 简介:用任意一种时间复杂度为 O ( n log ⁡ n ) O…...

HOW - React 处理不紧急的更新和渲染

目录 useDeferredValueuseTransitionuseIdleCallback 在 React 中,有一些钩子函数可以帮助你处理不紧急的更新或渲染,从而优化性能和用户体验。 以下是一些常用的相关钩子及其应用场景: useDeferredValue 用途:用于处理高优先级…...

基于A律压缩的PCM脉冲编码调制通信系统simulink建模与仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1A律压缩的原理 4.2 PCM编码过程 4.3 量化噪声与信噪比 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a 3.部分核心程序 &#…...

【入门教程一】基于DE2-115的My First FPGA 工程

1.1. 概述 这是一个简单的练习, 可以帮助初学者开始了解如何使用Intel Quartus 软件进行 FPGA 开发。 在本章节中,您将学习如何编译 Verilog 代码,进行引脚分配,创建时序约束,然后对 FPGA 进行编程,驱动开…...

mysql中的索引和分区

目录 1.编写目的 2.索引 2.1 创建方法 2.2 最佳适用 2.3 索引相关语句 3.分区 3.1 创建方法 3.2 最佳适用 Welcome to Code Blocks blog 本篇文章主要介绍了 [Mysql中的分区和索引] ❤博主广交技术好友,喜欢文章的可以关注一下❤ 1.编写目的 在MySQL中&…...

项目实战--C#实现图书馆信息管理系统

本项目是要开发一个图书馆管理系统,通过这个系统处理常见的图书馆业务。这个系统主要功能是:(1)有客户端(借阅者使用)和管理端(图书馆管理员和系统管理员使用)。(2&#…...

信号【Linux】

文章目录 信号处理方式(信号递达)前后台进程 终端按键产生信号kill系统调用接口向进程发信号阻塞信号sigset_tsigprocmasksigpending内核态与用户态:内核空间与用户空间内核如何实现信号的捕捉 1、信号就算没有产生,进程也必须识别…...

Kafka Producer之ACKS应答机制

文章目录 1. 应答机制2. 等级03. 等级14. 等级all5. 设置等级6. ISR 1. 应答机制 异步发送的效率高,但是不安全,同步发送安全,但是效率低。 无论哪一种,有一个关键的步骤叫做回调,也就是ACKS应答机制。 其中ACKS也分…...

【深入理解SpringCloud微服务】深入理解Eureka核心原理

深入理解Eureka核心原理 Eureka整体设计Eureka服务端启动Eureka三级缓存Eureka客户端启动 Eureka整体设计 Eureka是一个经典的注册中心,通过http接收客户端的服务发现和服务注册请求,使用内存注册表保存客户端注册上来的实例信息。 Eureka服务端接收的…...

算法——滑动窗口(day7)

904.水果成篮 904. 水果成篮 - 力扣(LeetCode) 题目解析: 根据题意我们可以看出给了我们两个篮子说明我们在开始采摘到结束的过程中只能有两种水果的种类,又要求让我们返回收集水果的最大数目,这不难让我们联想到题目…...

Django学习第一天(如何创建和运行app)

前置知识: URL组成部分详解: 一个url由以下几部分组成: scheme://host:port/path/?query-stringxxx#anchor scheme:代表的是访问的协议,一般为http或者ftp等 host:主机名,域名,…...

VScode连接虚拟机运行Python文件的方法

声明:本文使用Linux发行版本为rocky_9.4 目录 1. 在rocky_9.4最小安装的系统中,默认是没有tar工具的,因此,要先下载tar工具 2. 在安装好的vscode中下载ssh远程插件工具 3. 然后连接虚拟机 4. 查看python是否已经安装 5. 下载…...

通义千问AI模型对接飞书机器人-模型配置(2-1)

一 背景 根据业务或者使用场景搭建自定义的智能ai模型机器人,可以较少我们人工回答的沟通成本,而且可以更加便捷的了解业务需求给出大家设定的业务范围的回答,目前基于阿里云的通义千问模型研究。 二 模型研究 参考阿里云帮助文档&#xf…...

[k8s源码]6.reflector

Reflector 和 Informer 是 Kubernetes 客户端库中两个密切相关但职责不同的组件。Reflector 是一个较低级别的组件,主要负责与 Kubernetes API 服务器进行交互,执行资源的初始列表操作和持续的监视操作,将获取到的数据放入队列中。而 Informe…...

前台文本直接取数据库值doFieldSQL插入SQL

实现功能:根据选择的车间主任带出角色。 实现步骤:OA的“字段联动”功能下拉选项带不出表“hrmrolemembers”,所以采用此方法。 doFieldSQL("select roleid from HrmResource as a inner join hrmrolemembers as b on a.id b.resource…...

【06】LLaMA-Factory微调大模型——微调模型评估

上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面 conda activate GLM cd LLa…...

数学建模学习(1)遗传算法

一、简介 遗传算法(Genetic Algorithm, GA)是一种用于解决优化和搜索问题的进化算法。它基于自然选择和遗传学原理,通过模拟生物进化过程来寻找最优解。 以下是遗传算法的主要步骤和概念: 初始化种群(Initialization&a…...

NumPy冷知识66个

NumPy冷知识66个 多维切片: NumPy支持多维切片,可以通过指定多个索引来提取多维数组的子集。 复杂数支持: NumPy可以处理复数,提供了复数的基本运算和函数。 比特运算: NumPy支持比特运算,如与、或、异或等。 数据存储格式: NumPy可以将数…...

Wi-SUN无线通信技术 — 大规模分散式物联网应用首选

引言 在数字化浪潮的推动下,物联网(IoT)正逐渐渗透到我们生活的方方面面。Wi-SUN技术以其卓越的性能和广泛的应用前景,成为了大规模分散式物联网应用的首选。本文将深入探讨Wi-SUN技术的市场现状、核心优势、实际应用中的案例以及…...

stm32G473的flash模式是单bank还是双bank?

今天突然有人stm32G473的flash模式是单bank还是双bank?由于时间太久,我真忘记了。搜搜发现,还真有人和我一样。见下面的链接:https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...

PPT|230页| 制造集团企业供应链端到端的数字化解决方案:从需求到结算的全链路业务闭环构建

制造业采购供应链管理是企业运营的核心环节,供应链协同管理在供应链上下游企业之间建立紧密的合作关系,通过信息共享、资源整合、业务协同等方式,实现供应链的全面管理和优化,提高供应链的效率和透明度,降低供应链的成…...

centos 7 部署awstats 网站访问检测

一、基础环境准备(两种安装方式都要做) bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角,以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向,距离坐标原点x个像素;第二个是y坐标,表示当前位置为垂直方向,距离坐标原点y个像素。 坐标体系-像素 …...

搭建DNS域名解析服务器(正向解析资源文件)

正向解析资源文件 1)准备工作 服务端及客户端都关闭安全软件 [rootlocalhost ~]# systemctl stop firewalld [rootlocalhost ~]# setenforce 0 2)服务端安装软件:bind 1.配置yum源 [rootlocalhost ~]# cat /etc/yum.repos.d/base.repo [Base…...

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用: 方法一:使用 Homebrew 安装 Git(推荐) 步骤如下:打开终端(Terminal.app) 1.安装 Homebrew…...

【网络安全】开源系统getshell漏洞挖掘

审计过程: 在入口文件admin/index.php中: 用户可以通过m,c,a等参数控制加载的文件和方法,在app/system/entrance.php中存在重点代码: 当M_TYPE system并且M_MODULE include时,会设置常量PATH_OWN_FILE为PATH_APP.M_T…...

32位寻址与64位寻址

32位寻址与64位寻址 32位寻址是什么? 32位寻址是指计算机的CPU、内存或总线系统使用32位二进制数来标识和访问内存中的存储单元(地址),其核心含义与能力如下: 1. 核心定义 地址位宽:CPU或内存控制器用32位…...

【1】跨越技术栈鸿沟:字节跳动开源TRAE AI编程IDE的实战体验

2024年初,人工智能编程工具领域发生了一次静默的变革。当字节跳动宣布退出其TRAE项目(一款融合大型语言模型能力的云端AI编程IDE)时,技术社区曾短暂叹息。然而这一退场并非终点——通过开源社区的接力,TRAE在WayToAGI等…...