当前位置：首页 > news >正文

Stable Diffusion如何生成高质量的图-prompt写法介绍

news 2026/3/30 7:50:50

文章目录

Stable Diffusion
使用
- 尝试下效果
- prompt的编写技巧
- - prompt 和 negative prompt
  - Prompt格式
  - Prompt规则细节
  - 优化
  - Guidance Scale
总结

Stable Diffusion

Stable Diffusion是一个开源的图像生成AI系统,由Anthropic公司开发。它基于 Transformer模型架构,可以通过文字描述生成高质量的图像。
Stable Diffusion的主要特点包括:

强大的图像生成能力。它可以根据文本描述生成非常逼真的图像,包括人物、风景、动物等各种主题。
对文本的理解能力强。它可以捕捉文本描述的关键信息,转换为视觉上的表现。
生成图像分辨率高。它可以生成512x512甚至1024x1024像素的高分辨率图像。
开源且易于使用。它建立在开源框架PyTorch等基础上,可以轻松地在GPU及普通电脑上运行。
训练数据量大。它的训练数据集包含大量高质量图像,这是它强大能力的重要基础。
结果多样化。每次输入相同提示,它都可以生成略有不同的结果,增加了结果的多样性。
控制能力强。用户可以通过调整文字提示、超参数等方式控制生成结果。

Stable Diffusion是一种潜在扩散模型（Latent Diffusion Model），能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说，我们只要给出想要的图片的文字描述在提Stable Diffusion就能生成符合你要求的逼真的图像。Stable Diffusion作为新兴的AI生成模型,拥有强大的图像生成能力,是目前最先进的开源生成模型之一,值得关注。它的出现将推动创作界发生革命性的变化。

使用

尝试下效果

prompt：beautiful girl,bikini,sea,beach,sunshine

生成的效果如下：
在这里插入图片描述

效果不太好，我们来学习下prompt如何编写，再看看改善效果。

prompt的编写技巧

prompt 和 negative prompt

在这里插入图片描述

描述语分为正向/负向描述，它们也叫tag(标签）或prompt(提示词）
正面提示词：相比Midjourney，SD需要写得更精准和细致，描述少就给AI更多自由发挥空间。
负面提示词：不想让SD生成的内容。
正向：masterpiece, best quality, 画质词，画面描述。
反向：根据画面产出加不想出现的画面。

Prompt格式

第一段：画质tag，画风tag
第二段：画面主体，主体强调，主体细节概括（主体可以是人、事、物、景）画面核心内容
第三段：画面场景细节，或人物细节，embedding tag。画面细节内容
第二段一般提供人数，人物主要特征，主要动作（一般置于人物之前），物体主要特征，主景或景色框架等

Prompt规则细节

提示词的顺序决定了权重的大小,越靠前的词汇权重越大,会对图像生成产生更直接的影响。
生成图片分辨率越大,需要的提示词量也越多,否则不同的提示词会产生不一致的效果,相互干扰。
使用括号可以精确调整单个词的权重值,提高或降低其对图像生成的影响程度。常用的权重调整范围建议控制在0.25到1.5之间,避免超出这个范围带来负面效果。
方法如下：
(word) - 将权重提高 1.1 倍
((word)) - 将权重提高 1.21 倍（= 1.1 * 1.1）
[word] - 将权重降低至原先的 90.91%
(word:1.5) - 将权重提高 1.5 倍
(word:0.25) - 将权重减少为原先的 25%
请注意，权重值最好不要超过 1.5

优化

根据上面的规则我们来改下下prompt

A beautiful young girl standing in the shallow seawater on a sunny tropical beach. She has long wavy blonde hair flowing in the ocean breeze. She's wearing a red floral bikini which compliments her tanned skin tone. Her fit athletic body is perfectly framed in this scene. She has a bright, energetic smile on her face as she's enjoying the warm ocean water washing over her feet. The background is a picturesque tropical beach scene with white sand, palm trees, and turquoise blue water sparkling in the bright sunlight stretching out to the horizon. This is a perfect summer beach day. The overall color tone is vibrant and cheerful. The girl looks natural, elegant, and carefree. This is a high quality, photorealistic image.

报错

“Unsafe content found”

继续优化

"A cheerful young woman smiling and having fun at the beach. She has long, dark brown hair blowing casually in the tropical breeze. She's dressed appropriately in a blue floral one-piece swimsuit. Posing happily on the shore, with one hand up to her forehead to shade her eyes. Behind her is a beautiful scenic view of bright turquoise waves gently lapping against the sandy shore. In the background, the wide open clear blue sky meets the ocean horizon. Palm trees and green vegetation dot the landscape. The sunlight is bright and warm. This is a high quality, idyllic summer beach scene."

主要修改的点包括:

使用积极正面词语 como “cheerful”,“having fun”,“happily”,移除可能引起歧义的词汇。
将比基尼改为更保守的连体泳衣。
去掉只描写女孩的语句,加上与海滩景色的衔接。
增加阳光、植被等宁静自然的元素。
使用专业的视觉描述词语如“idyllic”,“scenic”等。
强调图像质量要高,内容要正面积极。
避免可能引起歧义或联想的表达。

看效果
在这里插入图片描述
很明显，改善很明显…… 哈哈哈哈哈哈哈（如果被吓到实在不好意思，我也有点看恐怖片的感觉）

上面这些图是因为我Guidance Scale的参数设置太低了。

Guidance Scale

Stable Diffusion 模型中的 Guidance Scale 参数是调整文本提示(Text Prompt)对图像生成影响力的一个重要超参数。
Guidance Scale 参数的主要作用是:

控制文本提示的重要性:

参数值越高,文本提示的影响就越大,生成图片会越关注文本提示的要求。
参数值越低,文本提示影响减弱,生成图片会更具原创性和多样性。

平衡文本提示和训练数据:

参数值越高,依赖文本提示的信息更多,训练数据的影响被压制。
参数值越低,训练数据的信息起主导作用,文本提示只起辅助影响。

调节生成图片质量:

适当的Guidance Scale可以帮助生成更高质量的图片。
参数过大或过小,都可能导致生成图片质量下降。
通常Guidance Scale的取值范围在1-20之间。默认值是7,这是一个比较平衡的设置。使用时可以通过调整这个参数,来实现对生成图片的精细控制。
Guidance Scale直接影响文本提示的作用强度,是Stable Diffusion中非常重要的一个生成控制超参数。

我们来调整下Guidance Scale参数
在这里插入图片描述

改后的效果如图（我实在不知道怎么修改CSDN才不违规了，一个连体泳衣都违规，其他平台都正常显示，只能马赛克了）：

在这里插入图片描述

总结

想要用Stable Diffusion生成高质量的图片,避免生成低质量的“烂图片”,可以注意以下几点:

使用合理的提示词(Prompt)

提示词要简洁明确,避免歧义。important信息前置。
添加合适的描述词帮助生成细节。如大小,颜色,质感等。
使用正确的英文语法和拼写。
避免使用负面和敏感词汇。

调整超参数

适当调高 Guidance Scale,加强提示词影响力。
调整 Steps(迭代次数)不要过少,一般100-200。
调试不同的 Sampler,如DDIM较平滑。

使用高质量训练数据

大型模型效果更好,如Stable Diffusion v2。
尝试不同主题的训练数据,匹配生成目标。

生成分辨率不要过低

分辨率过低会造成图片质量下降。
一般选择512x512 或更高分辨率。

复核和选择图片

生成多张样本图片,挑选效果最佳的。
检查合理性,删除离题图像。
通过以上方法,可以最大程度地避免Stable Diffusion生成不理想的低质量图片。但过程中也需要一定的试错尝试,以找到最佳设置。

Stable Diffusion如何生成高质量的图-prompt写法介绍

文章目录 Stable Diffusion使用尝试下效果prompt的编写技巧prompt 和 negative promptPrompt格式Prompt规则细节优化Guidance Scale 总结 Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,由Anthropic公司开发。它基于 Transformer模型架构,可以通过文字描述生成…...

编程日记 2023/7/26 20:01:37

MySQL 高级SQL语句（一）

目录一、高级SQL语句（进阶查询） 1.1 select 1.2 distinct 1.3 where 1.4 and 和 or 1.5 in 1.6 between 1.7 通配符 1.8 like 1.9 order by 一、高级SQL语句（进阶查询） 先准备2个表一个location表： use m…...

编程日记 2023/7/26 20:00:36

SkyWalking链路追踪-技术文档首页

SkyWalking 文档中文版（社区提供） (skyapm.github.io)https://skyapm.github.io/document-cn-translation-of-skywalking/ SkyWalking-基本概念 SkyWalking链路追踪是一个用于分布式系统的性能监控工具，它帮助开发人员了解系统中各组件之间…...

编程日记 2023/7/26 19:59:34

AndroidStudio Memory profiler(内存分析器)

1.Record Java/Kotlin allocations 查看java 层中对象的调用栈和短时间内创建对象的次数。可用于内存抖动快速分析,可用快速查找到该对象的调用栈(等同于mat) 从上图可见，短时间内创建了23个char[] 数组，其中最大的char[] 占用20k, 查看cll stack 调用…...

编程日记 2023/7/26 19:58:33

【C++模板进阶】

目录一、模板使用时的一个小注意点二、非类型模板参数三、类模板的特化3.1函数模板的特化3.2类模板的特化3.2.1全特化3.2.2偏特化四、模板的分离编译4.1模板不支持分离编译4.2模板分离编译报错的分析4.2解决方案五、模板的总结一、模板使用时的一个小注意点在使用模板时&…...

编程日记 2023/7/26 19:57:32

(一)RabbitMQ概念-优势、劣势、应用场景、AMQP、工作原理

Lison <dreamlison163.com>, v1.0.0, 2023.06.22 RabbitMQ概念-优势、劣势、应用场景、AMQP、工作原理文章目录 RabbitMQ概念-优势、劣势、应用场景、AMQP、工作原理RabbitMQ概念RabbitMQ的优势RabbitMQ劣势RabbitMQ应用的场景RabbitMQ_AMQPRabbitMQ工作原理 RabbitM…...

编程日记 2023/7/26 19:56:31

JetBrains全家桶：如何自定义实现类TODO注释？

文章目录效果图具体方法参考文献效果图 TODO注释大家应该都用过，在注释开头打上TODO的话，软件下方的TODO选项卡里就可以自动筛选出你打了TODO的注释，你可以点击里面对应的注释来实现快速跳转。 jetbrains全家桶（如Pycharm、Int…...

编程日记 2023/7/26 19:55:28

【技术干货】工业级BLE5.2蓝牙模块SKB378 使用教程，AT指令集

SKB378是一个高度集成的蓝牙5.2模组，可用来在2.4GHz ISM频段内做高速率、短距离无线通信。工业级标准，支持主从模式(1主对8从)，支持串口透传，AT指令控制，且支持AoA蓝牙高精度室内定位，模组内部集成32位ARM …...

编程日记 2023/7/26 19:54:26

零基础深度学习——学习笔记1 (逻辑回归)

前言因为各种各样的原因要开始学习深度学习了，跟着吴恩达老师的深度学习视频，自己总结一些知识点，以及学习中遇到的一些问题，以便记录学习轨迹以及以后复习使用，为了便于自己理解，我会将一些知识点用以个…...

编程日记 2023/7/26 19:53:25

I want to know on what switchport is connected my computer (10.8.0.2)

i.e. I am connected to an L2. I want to know on what switchport is connected my computer (10.8.0.2) Well….obviously not on this switch. Let’s dig Now I have the MAC address of my computer, we confinue to dig Computer has been seen on interface g0/2. Let’…...

编程日记 2023/7/26 19:52:24

OpenCv之人脸操作

目录一、马赛克实现二、人脸马赛克三、人脸检测四、多张人脸检测一、马赛克实现案例代码如下: import cv2 import numpy as npimg cv2.imread(8.jpg) # 马赛克方式一:缩小图片 # img2 cv2.resize(img,(600,400)) # # 马赛克方式二: # img2 cv2.resize(img,(600,4…...

编程日记 2023/7/26 19:51:22

C++[第五章]--指针和引用

指针和引用文章目录指针和引用1、引用2、指针3、右值引用4、引用限定符const和引用限定符1、引用引用就是别名，引用定义时必须初始化: int a; int &b=a; //b即为a的别名如果不是形参，必须初始化，引用某一变量 2、指针指针和c一样； this指针在类的成员函数中使…...

编程日记 2023/7/26 19:50:20

用i18next使你的应用国际化-React

ref: https://www.i18next.com/ i18next是一个用JavaScript编写的国际化框架。 i18next为您提供了一个完整的解决方案，本地化您的产品从web端到移动端和桌面端。在react项目中安i18next依赖： i18nextreact-i18nexti18next-browser-languagedetector&…...

编程日记 2023/7/26 19:49:18

TSN -促进IT/OT 融合的网络技术

时间敏感网络（tsn）技术是IT/OT 融合的一项关键的基础网络技术，它实现了在一个异构网络中，实现OT的实时数据和IT系统的交互数据的带宽共享。 TSN允许将经典的高确定性现场总线系统和IT应用（如大数据传输）的功…...

编程日记 2023/7/26 19:48:17

改进的北方苍鹰算法优化BP神经网络---回归+分类两种案例

今天采用前作者自行改进的一个算法---融合正余弦和折射反向学习的北方苍鹰(SCNGO)优化算法优化BP神经网络。文章一次性讲解两种案例，回归与分类。回归案例中，作者选用了一个经典的股票数据。分类案例中，选用的是公用的UCI数据集。 BP神经网络…...

编程日记 2023/7/26 19:47:15

等保工作如何和企业创新业务发展相结合，实现“安全”和“创新”的火花碰撞？

等保工作如何和企业创新业务发展相结合，实现“安全”和“创新”的火花碰撞？在当今数字化浪潮的背景下，企业越来越需要在“安全”和“创新”之间找到平衡点，以实现业务的持续创新和安全的有效保障。等保工作可以为企业提供安全保障…...

编程日记 2023/7/26 19:46:14

23.7.25 杭电暑期多校3部分题解

1005 - Out of Control 题目大意解题思路 code 1009 - Operation Hope 题意、思路待补 code #include <bits/stdc.h> using namespace std; const int N 1e5 9; struct lol {int x, id;} e[3][N * 2]; int t, n, a[3][N * 2], hd[3], tl[3], vis[N * 2], q[N * …...

编程日记 2023/7/26 19:45:11

【设计模式——学习笔记】23种设计模式——桥接模式Bridge（原理讲解+应用场景介绍+案例介绍+Java代码实现）

问题引入现在对不同手机类型的不同品牌实现操作编程(比如:开机、关机、上网，打电话等)，如图【对应类图】【分析】扩展性问题(类爆炸)，如果我们再增加手机的样式(旋转式)，就需要增加各个品牌手机的类，同样如果我们…...

编程日记 2023/7/26 19:44:09

文档翻译软件那么多，哪个能满足你的多语言需求？

想象一下，你手中拿着一份外文文件，上面记录着珍贵的知识和信息，但是语言的障碍让你无法领略其中的内容。而此时，一位翻译大师闪亮登场！他的翻译技巧犹如一把魔法笔，能够将文字的魅力和意境完美传递。无论是…...

编程日记 2023/7/26 19:43:08

MySQL 中NULL和空值的区别

MySQL 中NULL和空值的区别？ 简介NULL也就是在字段中存储NULL值，空值也就是字段中存储空字符(’’)。区别 1、空值不占空间，NULL值占空间。当字段不为NULL时，也可以插入空值。 2、当使用 IS NOT NULL 或者 IS NULL 时&#xff0…...

编程日记 2023/7/26 19:42:07

3MF格式终极指南：如何在Blender中轻松导入导出3D打印文件

3MF格式终极指南：如何在Blender中轻松导入导出3D打印文件【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 想要在Blender中处理3D打印文件却苦于格式转换&…...

编程新知 2026/3/30 7:29:04

CosyVoice3在CSDN星图一键部署：开箱即用，无需复杂配置

CosyVoice3在CSDN星图一键部署：开箱即用，无需复杂配置 1. 引言：语音克隆技术的新选择你是否曾经想过，只需几秒钟的录音就能让AI完美复刻你的声音？或者为你的视频内容添加多种方言配音？CosyVoice3作为阿里…...

编程新知 2026/3/30 7:21:00

圣女司幼幽-造相Z-Turbo多模态生成：从文本到视频脚本的连贯创作

圣女司幼幽-造相Z-Turbo多模态生成：从文本到视频脚本的连贯创作最近在尝试一些新的内容创作工具，发现了一个挺有意思的现象：很多工具要么只能做图，要么只能写文案，想把它们串起来做个完整的视频，中间总得…...

编程新知 2026/3/30 6:24:51

Java异常体系全景解析：从Checked与Unchecked的本质区别到最佳实践

Java异常体系全景解析：从Checked与Unchecked的本质区别到最佳实践在Java的浩瀚生态中，异常处理机制无疑是构建健壮、可靠应用程序的基石。它不仅仅是简单的错误捕获，更是一套精密的契约系统，决定了程序在遭遇非预期状态时如何“表…...

编程新知 2026/3/30 6:14:49

YOLO-v5小目标检测：微小物体识别效果惊艳展示

YOLO-v5小目标检测：微小物体识别效果惊艳展示 1. 小目标检测的技术挑战在计算机视觉领域，小目标检测一直是个棘手的问题。当目标在图像中占据的像素面积小于3232时，传统检测算法往往会遇到以下困难： 特征信息不足：…...

编程新知 2026/3/30 6:12:49

Android逆向实战：用Frida Hook自己写的APK，让1+1=88（附完整代码）

Android逆向实战：用Frida Hook自己写的APK，让1188（附完整代码） 在移动安全领域，逆向工程一直是个充满挑战又极具魅力的方向。想象一下，你能否让一个简单的计算器应用突然改变行为，比如让11的结果…...

编程新知 2026/3/30 5:46:31

DeepSeek技术解析：如何利用128K上下文窗口提升代码生成效率

1. 128K上下文窗口的技术革命第一次看到DeepSeek支持128K上下文窗口时，我的反应和大多数开发者一样："这数字是不是多打了个0？"毕竟在主流大模型还停留在32K上下文的时候，这个参数直接翻了四倍。但实测下来才发现&#…...

编程新知 2026/3/30 5:26:21

Keil环境下C与汇编混合编程实战：从参数传递到函数调用

1. 为什么需要C与汇编混合编程？ 在嵌入式开发领域，C语言因其可移植性和开发效率成为主流选择，但当你需要精确控制硬件时序或优化关键代码段时，汇编语言的优势就显现出来了。我曾在电机控制项目中遇到一个典型场景：用C语…...

编程新知 2026/3/30 5:14:14

揭秘APP签名信息：如何快速获取MD5、SHA1和SHA256值

1. 为什么需要获取APP签名信息？ 当你下载一个APP时，有没有想过如何确认它真的是官方发布的版本？或者作为开发者，如何确保自己打包的APK没有被篡改？这些问题的答案都藏在APP的签名信息里。签名信息就像APP的"身份证…...

编程新知 2026/3/30 4:35:47

FPGA时序优化实战：如何用Path Group提升关键路径性能（附PrimeTime配置）

FPGA时序优化实战：如何用Path Group提升关键路径性能（附PrimeTime配置） 在FPGA设计流程中，时序收敛往往是工程师面临的最大挑战之一。当设计规模达到数百万门级别时，传统的全局优化方法常常会导致关键路径被非关键路径…...

编程新知 2026/3/30 4:13:24