当前位置: 首页 > news >正文

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你一些资料如何去找,或者让你能自己写出来,不是一味的复制粘贴。

首先 Stable Diffusion WebUI 的界面如下:
请添加图片描述

接下来我只介绍比较关键的或者能用到的,而且只简单介绍一下,后面会有相关演示:

  • Stable Diffusion checkpoint:这是你选择的模型,位置在stable-diffusion-webui/models/Stable-diffusion
  • Prompt:这个是正向提示词,也就是你想生成什么样的内容。
  • Negative Prompt:这个是反向提示词,也就是你不想生成的内容。
  • Sampling steps:这个是采样率,数值越大,画面细节越多。
  • Width 和 Height:这个是生成画面的宽和高。需要注意,这玩意和画面细节也挂钩,如果小的话生成的细节也少。
  • Batch count:生成的图像批次数。它更高可以降低生成的噪音。
  • Batch size:这个是每次生成几张图,调高需要更大显存,不然速度会慢一些。
  • CFG Scale:这个是遵循 prompt 的严格程度。一般为 7-12,如果你 prompt 写的很细,需要更多的细节,那么可以使用12-16 更高的。当然如果你想让他随机发挥,更低的也行。
  • Seed:这个是“种子”,如果你很满意一张图,那么就保留这个种子,然后修改其他参数进行调整,这样变化就不会那么随机。默认的-1就表示随机生成一个种子。

参数演示

我们首先不演示 Prompt 和 Negative Prompt,先来演示一下其他的参数。因为这两个比较复杂。

下面使用的 Prompt 如下:

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

下面使用的 Prompt 如下:

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

Width 和 Height

前面提到,宽和高是和画面细节挂钩的,比如 512x512 与 1024x1024 的差别如下(Seed 为 3503979678,Sampling steps 为 20,CFG Scale 为 7):

请添加图片描述
请添加图片描述

你可以看到这两张图的细节完全不是一个量级的。

此外,宽高也会影响生成效果。比如 512x1024、1024x1024 与 1024x2048 的差别如下:

请添加图片描述
请添加图片描述

请添加图片描述

需要注意,由于 SD 使用 1024x1024 训练,所以“宽+高”是 1024 的倍数的效果会好一些。一般比例如下:

  • 1:1: 1024x1024, 768x768
  • 3:2: 1152x768
  • 2:3: 768x1152
  • 4:3: 1152x864
  • 3:4: 864x1152
  • 16:9: 1360x768
  • 9:16: 768x1360

Sampling steps

采样率可以提高画面的细节,一般使用 30-40 就足够了。一般宽高有一个不足 1024 的情况下,选择 20 比较合适,1024 往上选择 35 左右。

比如上面同样的参数,Sampling steps 提高为 35,如下:
请添加图片描述
脸部和背景的细节会更多,颜色的层次一也更丰富,你可以放大看头发部分。

Batch count和Batch size

Batch count:生成的图像批次数。Batch size:这个是每次生成几张图。

需要注意:尽管我们设置了种子,到那时 Batch count 和 Batch count 还是会改变种子,比如下面演示的四张图,种子是 3503979678~3503979681。

Batch count 调整为 4,Batch size 为 1,生成图如下。
请添加图片描述

Batch count 调整为 1,Batch size 为 2。可以看到他是一起生成两张图的。
请添加图片描述

生成图如下:

请添加图片描述

Seed

Seed 是种子,也就是“基础”。上面演示 Batch count 和 Batch size 你也看到了,种子的变化会导致画面内容的变化。

这里说明一下如何查看种子。

首先,生成之后,图片下面的内容中有说明:

请添加图片描述

此外,输出位置stable-diffusion-webui/output中的文件名中就记录了种子,这样想找到之前的种子也很方便了。

请添加图片描述

不过还是演示一下生成 4 张图是什么样的:

请添加图片描述

可以看到差别要比种子只差 1 的差别更大。

Prompt 和 Negative Prompt

Prompt 和 Negative Prompt 是最关键的部分了。

首先我们看一下之前的 Prompt 和 Negative Prompt,了解一下常见的一些 prompt。

Prompt

1girl, looking at viewer, wool coat, fur collar,smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

这个参数按顺序是:一个女孩(1girl),看着镜头(looking at viewer),羊毛大衣(wool coat),毛领(fur collar),微笑(smile),站在山坡上(standing on a hillside),下雪中(snowfall),背景是山脉(mountains in the background),杰作(masterpiece),高质量(best quality),非常美观(very aesthetic),1990 年代的风格(1990s style),复古艺术风格(retro artstyle)

可以看到包含人物,姿态,衣服,表情,背景等多种信息。

Negative Prompt

这个 Negative Prompt 是我常用的,很多情况下都很适合。

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

这个参数按顺序是:低分辨率(lower),不好的身体结构(bad anatomy,直翻是不好的解刨学),令人不愉快的(displeasing),丑陋的(ugly),低颜色位数(fewer digit),多手指(extra digit),缺少手指(missing fingers),不好的手(bad hands),模糊的(blurry),(低质量,最差质量1.3)((low quality, worst quality:1.3))。

可以看到主要防止是手不行。其他的就是要画质好点。

艺术家风格

Animagine XL V3.1 里不光可以通过上面的1990s style, retro artstyle,指定风格,也可以通过艺术家风格,方法是在 prompt 中加上(艺术家:1.3)

艺术家列表有个神人做了张图,你可以在 Animagine XL v3.1 - Artists’ Style Sheet. 看到,其中一张如下:

请添加图片描述

好了现在弄一下生成图。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (tinnies:1.3)

生成图如下:

请添加图片描述

再换个艺术家。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (sekina:1.3)

生成如下:

请添加图片描述

授之以渔:Danbooru tags

Danbooru tags是什么

其实你看我之前的用的,会发现都是一个个短语,并不是句子,但是如何知道用哪些短语呢?

有一个网络数据库叫做 Danbooru tags,它里面记录了包括风格、动作、表情、物品等多种信息,当然也包含一些 NSFW 的内容。

请添加图片描述

比如说慌张(flustered),它的介绍界面如下,其中还包含一些示例,让你更直观的看到:

请添加图片描述

如何使用Danbooru tags

下面用表情和背景演示一下:

表情

之前表情用的是微笑(smile),那我们改成慌张(flustered)看看,其实我觉得根据示例这个应该叫娇羞,而不是慌张:

请添加图片描述
请添加图片描述

可以看到表情变成娇羞的样子了。

背景

把背景的山改成城市街道(city street in the background),注意把站在山坡删了:

1girl, looking at viewer, wool coat, fur collar,smile, snowfall, city street in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

生成图如下:
请添加图片描述

如果没删站在山坡:
请添加图片描述

更多的 Prompt 使用你可以看看 Danbooru tags 自己尝试一下。

希望能帮到有需要的人~

相关文章:

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你…...

快速提取Excel工作簿中所有工作表的名称?

大家好,我是小鱼。 在Excel表格中如何快速提取工作簿中所有工作表的名称?这个问题在日常工作中也经常遇到,比如说经常使用的INDIRECT函数跨工作表汇总或者制作类似于导航的工作表快捷跳转列表,就需要每个工作表的名称。如果工作表…...

【紫光同创PG2L100H开发板】盘古676系列,盘古100Pro+开发板,MES2L676-100HP

本原创文章由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处(www.meyesemi.com) 一:开发系统介绍 开发系统概述 MES2L676-100HP开发板采用紫光创 logos2系列 FPGA,型号&#x…...

Node.JS 版本管理工具 Fnm 安装及配置(Windows)

Fnm 安装及配置(Windows) Fnm(Fast Node Manager)?? 一个快速而简单的 Node.js 版本管理工具,使用 Rust 编写。 1 安装 官网:Fnm(镜像网站 )。 下载:Fnm&#xff08…...

labview通过时间计数器来设定采集频率

在刚接触labview的时候,笔者通常用定时里的等待函数来实现指令的收发,但是当用到的收发消息比较多时就出现了卡顿,卡死的情况,这是因为当用队列框架时,程序卡在了其中的一个分支里,等通过相应的延时后才可以…...

汇编JCC条件跳转指令记忆

汇编中的条件跳转指令(JCC): 1. 理解标志寄存器 JCC 指令依赖于标志寄存器(FLAGS)的状态,常见的标志位有: ZF(Zero Flag):结果为0时置1。 CF(Ca…...

HTML排版标签、语义化标签、块级和行内元素详解

目录 前言 一、HTML中的排版标签 1. 文本相关标签 1.1 标题标签 ~ 1.2 段落标签 1.3 强调和加粗 1.4 换行标签 1.5 水平线标签 二、HTML中的语义化标签 2.1 语义化标签概述 2.2 常见的语义化标签 示例(核心代码部分): 三、HTM…...

【回溯+剪枝】单词搜索,你能用递归解决吗?

文章目录 79. 单词搜索解题思路:回溯(深搜) 剪枝 79. 单词搜索 79. 单词搜索 ​ 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 …...

《深度揭秘LDA:开启人工智能降维与分类优化的大门》

在当今人工智能蓬勃发展的时代,数据成为了驱动技术进步的核心要素。随着数据采集和存储技术的飞速发展,我们所面临的数据量不仅日益庞大,其维度也愈发复杂。高维数据虽然蕴含着丰富的信息,但却给机器学习算法带来了一系列严峻的挑…...

Linux(CentOS)安装 MySQL

CentOS版本:CentOS 7 三种安装方式: 一、通过 yum 安装,最简单,一键安装,全程无忧。 二、通过 rpm 包安装,需具备基础概念及常规操作。 三、通过 gz 包安装,需具备配置相关操作。 --------…...

C++ 使用CURL开源库实现Http/Https的get/post请求进行字串和文件传输

CURL开源库介绍 CURL 是一个功能强大的开源库,用于在各种平台上进行网络数据传输。它支持众多的网络协议,像 HTTP、HTTPS、FTP、SMTP 等,能让开发者方便地在程序里实现与远程服务器的通信。 CURL 可以在 Windows、Linux、macOS 等多种操作系…...

面试题-SpringCloud的启动流程

关键词 prepareEnvironmentBootstrapApplicationListenerBootStrap Context(启动应用上下文)Environment中bootstrap属性 面试回答 引入SpringCloud相关组件后,均会引入一个spring-cloud-context的依赖包,这个项目的META-INF/s…...

MySQL基础知识

目录 一.什么是MySQL 二.分布式系统中的身份转换 三.MySQL是如何存储数据的 四.什么是数据库的命令 一.什么是MySQL MySQL是一个“客户端(client) - 服务器(server)”结构的软件(数据库软件)。 客户端&am…...

nas-群晖docker查询注册表失败解决办法(平替:使用SSH命令拉取ddns-go)

目录 前言必读 一、遇到问题 二、操作步骤 (一)打开群晖系统的SSH服务? (二)Windows电脑本地下载安装putty? 输入登录账号密码 开启root权限 例子:使用命令行下载ddns-go? 前言必读 读者手册(必…...

GSMA SGP.31 eSIM IoT 架构与需求笔记

GSMA SGP.31 eSIM IoT 架构与需求笔记 (版本 1.2,2024 年 4 月 26 日) 一、 概述 1. 文档目的: 本文件旨在为网络受限和/或用户界面 (UI) 受限的物联网 (IoT) 设备中的嵌入式通用集成电路卡 (eUICC) 提供远程配置架构和需求规范。 2. 主要内容&#…...

sql版本序列号

SQL Server 2019 Enterprise密钥:HMWJ3-KY3J2-NMVD7-KG4JR-X2G8G SQL Server 2019 Enterprise Core密钥:2C9JR-K3RNG-QD4M4-JQ2HR-8468J SQL Server 2019 Standard密钥:PMBDC-FXVM3-T777P-N4FY8-PKFF4 SQL Server 2019 Web密钥:33…...

vue2-nextTick

这里是引用 vue2-nextTick 1. 什么是nextTick 先来看官方定义 在下次DOM更新循环结束之后执行延迟回调。在修改数据之后立即使用这个方法,获取更新后的DOM云里雾里,啥意思呢,其实本质就是事件循环、同步和异步的问题不懂事件循环相关问题的…...

【其他专题】如何在线将PNG转ICO图标

在我们编程打包成exe时,可能需要一些图标文件。但往往我们下载的图标文件是.png或是其他格式的,是不能用于做图标文件的,因为图标文件往往是.ico文件。 比如下图所示的.png文件,我们怎么快速的将它转为ico文件呢? 首先…...

2019_AutoInt

AutoInt:通过自注意神经网络进行自动特征交互学习 创新点复现论文0摘要1介绍2相关工作2.1点击率预测2.2学习特征交互2.3注意力和残差网络 3问题定义4自动特征交互学习4.1概述4.2输入层4.3嵌入层4.4交互层4.5输出层 4.6训练4.7 AutoInt分析 5实验5.1实验装置5.2定量结…...

HAL库 Systick定时器 基于STM32F103EZT6 野火霸道,可做参考

目录 1.时钟选择(这里选择高速外部时钟) ​编辑 2.调试模式和时基源选择: 3.LED的GPIO配置 这里用板子的红灯PB5 4.工程配置 5.1ms的systick中断实现led闪烁 源码: 6.修改systick的中断频率 7.systick定时原理 SysTick 定时器的工作原理 中断触发机制 HAL_SYSTICK_Co…...

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器 在Ubuntu上,你可以使用apt包管理器来安装NFS服务器。打开终端并运行: sudo apt update sudo apt install nfs-kernel-server创建共享目录 创建一个目录用于共享,例如/shared: sudo mkdir /shared sud…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP? 模型控制协议 (MCP) 是一种创新的协议,旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议,它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

图表类系列各种样式PPT模版分享

图标图表系列PPT模版,柱状图PPT模版,线状图PPT模版,折线图PPT模版,饼状图PPT模版,雷达图PPT模版,树状图PPT模版 图表类系列各种样式PPT模版分享:图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

是否存在路径(FIFOBB算法)

题目描述 一个具有 n 个顶点e条边的无向图,该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序,确定是否存在从顶点 source到顶点 destination的路径。 输入 第一行两个整数,分别表示n 和 e 的值(1…...

Selenium常用函数介绍

目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...

腾讯云V3签名

想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...

站群服务器的应用场景都有哪些?

站群服务器主要是为了多个网站的托管和管理所设计的,可以通过集中管理和高效资源的分配,来支持多个独立的网站同时运行,让每一个网站都可以分配到独立的IP地址,避免出现IP关联的风险,用户还可以通过控制面板进行管理功…...

python爬虫——气象数据爬取

一、导入库与全局配置 python 运行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用: 引入数据解析、网络请求、时间处理、数据库操作等所需库。requests:发送 …...

【LeetCode】算法详解#6 ---除自身以外数组的乘积

1.题目介绍 给定一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O…...

深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏

一、引言 在深度学习中,我们训练出的神经网络往往非常庞大(比如像 ResNet、YOLOv8、Vision Transformer),虽然精度很高,但“太重”了,运行起来很慢,占用内存大,不适合部署到手机、摄…...