当前位置: 首页 > news >正文

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你一些资料如何去找,或者让你能自己写出来,不是一味的复制粘贴。

首先 Stable Diffusion WebUI 的界面如下:
请添加图片描述

接下来我只介绍比较关键的或者能用到的,而且只简单介绍一下,后面会有相关演示:

  • Stable Diffusion checkpoint:这是你选择的模型,位置在stable-diffusion-webui/models/Stable-diffusion
  • Prompt:这个是正向提示词,也就是你想生成什么样的内容。
  • Negative Prompt:这个是反向提示词,也就是你不想生成的内容。
  • Sampling steps:这个是采样率,数值越大,画面细节越多。
  • Width 和 Height:这个是生成画面的宽和高。需要注意,这玩意和画面细节也挂钩,如果小的话生成的细节也少。
  • Batch count:生成的图像批次数。它更高可以降低生成的噪音。
  • Batch size:这个是每次生成几张图,调高需要更大显存,不然速度会慢一些。
  • CFG Scale:这个是遵循 prompt 的严格程度。一般为 7-12,如果你 prompt 写的很细,需要更多的细节,那么可以使用12-16 更高的。当然如果你想让他随机发挥,更低的也行。
  • Seed:这个是“种子”,如果你很满意一张图,那么就保留这个种子,然后修改其他参数进行调整,这样变化就不会那么随机。默认的-1就表示随机生成一个种子。

参数演示

我们首先不演示 Prompt 和 Negative Prompt,先来演示一下其他的参数。因为这两个比较复杂。

下面使用的 Prompt 如下:

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

下面使用的 Prompt 如下:

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

Width 和 Height

前面提到,宽和高是和画面细节挂钩的,比如 512x512 与 1024x1024 的差别如下(Seed 为 3503979678,Sampling steps 为 20,CFG Scale 为 7):

请添加图片描述
请添加图片描述

你可以看到这两张图的细节完全不是一个量级的。

此外,宽高也会影响生成效果。比如 512x1024、1024x1024 与 1024x2048 的差别如下:

请添加图片描述
请添加图片描述

请添加图片描述

需要注意,由于 SD 使用 1024x1024 训练,所以“宽+高”是 1024 的倍数的效果会好一些。一般比例如下:

  • 1:1: 1024x1024, 768x768
  • 3:2: 1152x768
  • 2:3: 768x1152
  • 4:3: 1152x864
  • 3:4: 864x1152
  • 16:9: 1360x768
  • 9:16: 768x1360

Sampling steps

采样率可以提高画面的细节,一般使用 30-40 就足够了。一般宽高有一个不足 1024 的情况下,选择 20 比较合适,1024 往上选择 35 左右。

比如上面同样的参数,Sampling steps 提高为 35,如下:
请添加图片描述
脸部和背景的细节会更多,颜色的层次一也更丰富,你可以放大看头发部分。

Batch count和Batch size

Batch count:生成的图像批次数。Batch size:这个是每次生成几张图。

需要注意:尽管我们设置了种子,到那时 Batch count 和 Batch count 还是会改变种子,比如下面演示的四张图,种子是 3503979678~3503979681。

Batch count 调整为 4,Batch size 为 1,生成图如下。
请添加图片描述

Batch count 调整为 1,Batch size 为 2。可以看到他是一起生成两张图的。
请添加图片描述

生成图如下:

请添加图片描述

Seed

Seed 是种子,也就是“基础”。上面演示 Batch count 和 Batch size 你也看到了,种子的变化会导致画面内容的变化。

这里说明一下如何查看种子。

首先,生成之后,图片下面的内容中有说明:

请添加图片描述

此外,输出位置stable-diffusion-webui/output中的文件名中就记录了种子,这样想找到之前的种子也很方便了。

请添加图片描述

不过还是演示一下生成 4 张图是什么样的:

请添加图片描述

可以看到差别要比种子只差 1 的差别更大。

Prompt 和 Negative Prompt

Prompt 和 Negative Prompt 是最关键的部分了。

首先我们看一下之前的 Prompt 和 Negative Prompt,了解一下常见的一些 prompt。

Prompt

1girl, looking at viewer, wool coat, fur collar,smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

这个参数按顺序是:一个女孩(1girl),看着镜头(looking at viewer),羊毛大衣(wool coat),毛领(fur collar),微笑(smile),站在山坡上(standing on a hillside),下雪中(snowfall),背景是山脉(mountains in the background),杰作(masterpiece),高质量(best quality),非常美观(very aesthetic),1990 年代的风格(1990s style),复古艺术风格(retro artstyle)

可以看到包含人物,姿态,衣服,表情,背景等多种信息。

Negative Prompt

这个 Negative Prompt 是我常用的,很多情况下都很适合。

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

这个参数按顺序是:低分辨率(lower),不好的身体结构(bad anatomy,直翻是不好的解刨学),令人不愉快的(displeasing),丑陋的(ugly),低颜色位数(fewer digit),多手指(extra digit),缺少手指(missing fingers),不好的手(bad hands),模糊的(blurry),(低质量,最差质量1.3)((low quality, worst quality:1.3))。

可以看到主要防止是手不行。其他的就是要画质好点。

艺术家风格

Animagine XL V3.1 里不光可以通过上面的1990s style, retro artstyle,指定风格,也可以通过艺术家风格,方法是在 prompt 中加上(艺术家:1.3)

艺术家列表有个神人做了张图,你可以在 Animagine XL v3.1 - Artists’ Style Sheet. 看到,其中一张如下:

请添加图片描述

好了现在弄一下生成图。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (tinnies:1.3)

生成图如下:

请添加图片描述

再换个艺术家。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (sekina:1.3)

生成如下:

请添加图片描述

授之以渔:Danbooru tags

Danbooru tags是什么

其实你看我之前的用的,会发现都是一个个短语,并不是句子,但是如何知道用哪些短语呢?

有一个网络数据库叫做 Danbooru tags,它里面记录了包括风格、动作、表情、物品等多种信息,当然也包含一些 NSFW 的内容。

请添加图片描述

比如说慌张(flustered),它的介绍界面如下,其中还包含一些示例,让你更直观的看到:

请添加图片描述

如何使用Danbooru tags

下面用表情和背景演示一下:

表情

之前表情用的是微笑(smile),那我们改成慌张(flustered)看看,其实我觉得根据示例这个应该叫娇羞,而不是慌张:

请添加图片描述
请添加图片描述

可以看到表情变成娇羞的样子了。

背景

把背景的山改成城市街道(city street in the background),注意把站在山坡删了:

1girl, looking at viewer, wool coat, fur collar,smile, snowfall, city street in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

生成图如下:
请添加图片描述

如果没删站在山坡:
请添加图片描述

更多的 Prompt 使用你可以看看 Danbooru tags 自己尝试一下。

希望能帮到有需要的人~

相关文章:

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你…...

快速提取Excel工作簿中所有工作表的名称?

大家好,我是小鱼。 在Excel表格中如何快速提取工作簿中所有工作表的名称?这个问题在日常工作中也经常遇到,比如说经常使用的INDIRECT函数跨工作表汇总或者制作类似于导航的工作表快捷跳转列表,就需要每个工作表的名称。如果工作表…...

【紫光同创PG2L100H开发板】盘古676系列,盘古100Pro+开发板,MES2L676-100HP

本原创文章由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处(www.meyesemi.com) 一:开发系统介绍 开发系统概述 MES2L676-100HP开发板采用紫光创 logos2系列 FPGA,型号&#x…...

Node.JS 版本管理工具 Fnm 安装及配置(Windows)

Fnm 安装及配置(Windows) Fnm(Fast Node Manager)?? 一个快速而简单的 Node.js 版本管理工具,使用 Rust 编写。 1 安装 官网:Fnm(镜像网站 )。 下载:Fnm&#xff08…...

labview通过时间计数器来设定采集频率

在刚接触labview的时候,笔者通常用定时里的等待函数来实现指令的收发,但是当用到的收发消息比较多时就出现了卡顿,卡死的情况,这是因为当用队列框架时,程序卡在了其中的一个分支里,等通过相应的延时后才可以…...

汇编JCC条件跳转指令记忆

汇编中的条件跳转指令(JCC): 1. 理解标志寄存器 JCC 指令依赖于标志寄存器(FLAGS)的状态,常见的标志位有: ZF(Zero Flag):结果为0时置1。 CF(Ca…...

HTML排版标签、语义化标签、块级和行内元素详解

目录 前言 一、HTML中的排版标签 1. 文本相关标签 1.1 标题标签 ~ 1.2 段落标签 1.3 强调和加粗 1.4 换行标签 1.5 水平线标签 二、HTML中的语义化标签 2.1 语义化标签概述 2.2 常见的语义化标签 示例(核心代码部分): 三、HTM…...

【回溯+剪枝】单词搜索,你能用递归解决吗?

文章目录 79. 单词搜索解题思路:回溯(深搜) 剪枝 79. 单词搜索 79. 单词搜索 ​ 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 …...

《深度揭秘LDA:开启人工智能降维与分类优化的大门》

在当今人工智能蓬勃发展的时代,数据成为了驱动技术进步的核心要素。随着数据采集和存储技术的飞速发展,我们所面临的数据量不仅日益庞大,其维度也愈发复杂。高维数据虽然蕴含着丰富的信息,但却给机器学习算法带来了一系列严峻的挑…...

Linux(CentOS)安装 MySQL

CentOS版本:CentOS 7 三种安装方式: 一、通过 yum 安装,最简单,一键安装,全程无忧。 二、通过 rpm 包安装,需具备基础概念及常规操作。 三、通过 gz 包安装,需具备配置相关操作。 --------…...

C++ 使用CURL开源库实现Http/Https的get/post请求进行字串和文件传输

CURL开源库介绍 CURL 是一个功能强大的开源库,用于在各种平台上进行网络数据传输。它支持众多的网络协议,像 HTTP、HTTPS、FTP、SMTP 等,能让开发者方便地在程序里实现与远程服务器的通信。 CURL 可以在 Windows、Linux、macOS 等多种操作系…...

面试题-SpringCloud的启动流程

关键词 prepareEnvironmentBootstrapApplicationListenerBootStrap Context(启动应用上下文)Environment中bootstrap属性 面试回答 引入SpringCloud相关组件后,均会引入一个spring-cloud-context的依赖包,这个项目的META-INF/s…...

MySQL基础知识

目录 一.什么是MySQL 二.分布式系统中的身份转换 三.MySQL是如何存储数据的 四.什么是数据库的命令 一.什么是MySQL MySQL是一个“客户端(client) - 服务器(server)”结构的软件(数据库软件)。 客户端&am…...

nas-群晖docker查询注册表失败解决办法(平替:使用SSH命令拉取ddns-go)

目录 前言必读 一、遇到问题 二、操作步骤 (一)打开群晖系统的SSH服务? (二)Windows电脑本地下载安装putty? 输入登录账号密码 开启root权限 例子:使用命令行下载ddns-go? 前言必读 读者手册(必…...

GSMA SGP.31 eSIM IoT 架构与需求笔记

GSMA SGP.31 eSIM IoT 架构与需求笔记 (版本 1.2,2024 年 4 月 26 日) 一、 概述 1. 文档目的: 本文件旨在为网络受限和/或用户界面 (UI) 受限的物联网 (IoT) 设备中的嵌入式通用集成电路卡 (eUICC) 提供远程配置架构和需求规范。 2. 主要内容&#…...

sql版本序列号

SQL Server 2019 Enterprise密钥:HMWJ3-KY3J2-NMVD7-KG4JR-X2G8G SQL Server 2019 Enterprise Core密钥:2C9JR-K3RNG-QD4M4-JQ2HR-8468J SQL Server 2019 Standard密钥:PMBDC-FXVM3-T777P-N4FY8-PKFF4 SQL Server 2019 Web密钥:33…...

vue2-nextTick

这里是引用 vue2-nextTick 1. 什么是nextTick 先来看官方定义 在下次DOM更新循环结束之后执行延迟回调。在修改数据之后立即使用这个方法,获取更新后的DOM云里雾里,啥意思呢,其实本质就是事件循环、同步和异步的问题不懂事件循环相关问题的…...

【其他专题】如何在线将PNG转ICO图标

在我们编程打包成exe时,可能需要一些图标文件。但往往我们下载的图标文件是.png或是其他格式的,是不能用于做图标文件的,因为图标文件往往是.ico文件。 比如下图所示的.png文件,我们怎么快速的将它转为ico文件呢? 首先…...

2019_AutoInt

AutoInt:通过自注意神经网络进行自动特征交互学习 创新点复现论文0摘要1介绍2相关工作2.1点击率预测2.2学习特征交互2.3注意力和残差网络 3问题定义4自动特征交互学习4.1概述4.2输入层4.3嵌入层4.4交互层4.5输出层 4.6训练4.7 AutoInt分析 5实验5.1实验装置5.2定量结…...

HAL库 Systick定时器 基于STM32F103EZT6 野火霸道,可做参考

目录 1.时钟选择(这里选择高速外部时钟) ​编辑 2.调试模式和时基源选择: 3.LED的GPIO配置 这里用板子的红灯PB5 4.工程配置 5.1ms的systick中断实现led闪烁 源码: 6.修改systick的中断频率 7.systick定时原理 SysTick 定时器的工作原理 中断触发机制 HAL_SYSTICK_Co…...

【杂谈】-递归进化:人工智能的自我改进与监管挑战

递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路

进入2025年以来,尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断,但全球市场热度依然高涨,入局者持续增加。 以国内市场为例,天眼查专业版数据显示,截至5月底,我国现存在业、存续状态的机器人相关企…...

AspectJ 在 Android 中的完整使用指南

一、环境配置(Gradle 7.0 适配) 1. 项目级 build.gradle // 注意:沪江插件已停更,推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

springboot整合VUE之在线教育管理系统简介

可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生,小白用户,想学习知识的 有点基础,想要通过项…...

从物理机到云原生:全面解析计算虚拟化技术的演进与应用

前言:我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM(Java Virtual Machine)让"一次编写,到处运行"成为可能。这个软件层面的虚拟化让我着迷,但直到后来接触VMware和Doc…...

密码学基础——SM4算法

博客主页:christine-rr-CSDN博客 ​​​​专栏主页:密码学 📌 【今日更新】📌 对称密码算法——SM4 目录 一、国密SM系列算法概述 二、SM4算法 2.1算法背景 2.2算法特点 2.3 基本部件 2.3.1 S盒 2.3.2 非线性变换 ​编辑…...

【免费数据】2005-2019年我国272个地级市的旅游竞争力多指标数据(33个指标)

旅游业是一个城市的重要产业构成。旅游竞争力是一个城市竞争力的重要构成部分。一个城市的旅游竞争力反映了其在旅游市场竞争中的比较优势。 今日我们分享的是2005-2019年我国272个地级市的旅游竞争力多指标数据!该数据集源自2025年4月发表于《地理学报》的论文成果…...

6.9本日总结

一、英语 复习默写list11list18,订正07年第3篇阅读 二、数学 学习线代第一讲,写15讲课后题 三、408 学习计组第二章,写计组习题 四、总结 明天结束线代第一章和计组第二章 五、明日计划 英语:复习l默写sit12list17&#…...

Java高级 |【实验八】springboot 使用Websocket

隶属文章:Java高级 | (二十二)Java常用类库-CSDN博客 系列文章:Java高级 | 【实验一】Springboot安装及测试 |最新-CSDN博客 Java高级 | 【实验二】Springboot 控制器类相关注解知识-CSDN博客 Java高级 | 【实验三】Springboot 静…...