当前位置: 首页 > article >正文

Stable-Diffusion-v1-5-archive新手教程:30分钟掌握Prompt/Negative Prompt/Seed协同技巧

Stable-Diffusion-v1-5-archive新手教程30分钟掌握Prompt/Negative Prompt/Seed协同技巧你是不是也遇到过这种情况看到别人用Stable Diffusion生成的图片又美又精致轮到自己上手输入同样的描述词出来的图却总是“买家秀”和“卖家秀”的区别要么是画面混乱要么是细节缺失要么是风格跑偏。别灰心这很可能不是你手气不好而是没掌握好Stable Diffusion的“核心三件套”提示词Prompt、负向提示词Negative Prompt和随机种子Seed。这三个参数就像厨师手中的盐、火候和食材单独用哪个都做不出好菜只有协同得当才能稳定地烹饪出你想要的“视觉大餐”。今天我们就以经典的Stable Diffusion v1.5 Archive模型为例用30分钟的时间带你彻底搞懂这三者的关系与协同技巧让你从“抽卡玩家”变成“精准控图”的创作者。1. 环境准备与快速上手在开始我们的技巧之旅前我们先确保你已经站在了正确的起跑线上。Stable Diffusion v1.5 Archive是一个开箱即用的Web服务部署非常方便。1.1 访问你的创作空间部署成功后你会在Web界面看到类似下图的交互界面。别被密密麻麻的参数吓到我们今天只聚焦最核心的几个。界面主要分为三块左侧输入区你“发号施令”的地方包括Prompt和Negative Prompt。中间参数区你“微调火候”的地方包括Steps、Guidance Scale、Seed等。右侧输出区展示生成结果的“餐桌”。1.2 完成你的第一次生成我们先来一个最简单的流程感受一下在Prompt框里输入a cute cat(一只可爱的猫)。其他参数先保持默认Steps: 20,Guidance Scale: 7.5,Seed: -1。点击「Generate」按钮。稍等片刻你就能在右侧看到一只由AI生成的“猫”。它可能很抽象也可能很写实这完全取决于模型的“随机发挥”。记住这次生成时右侧显示的Seed值比如123456我们后面会用到它。2. 深入理解核心三要素现在我们来逐一拆解这三个核心工具看看它们各自扮演什么角色。2.1 Prompt告诉AI“你想要什么”Prompt是正向提示词是你向AI描述画面蓝图的最主要工具。它的质量直接决定了生成内容的上限。一个常见的误区是描述过于笼统。比如“一个美丽的女孩”这种描述留给AI的想象空间太大结果自然不稳定。我们需要学会结构化地描述。基础Prompt结构从主到次[主体] [场景/动作] [细节/属性] [艺术风格] [画质/镜头]举个例子对比笼统描述a beautiful girl(一个美丽的女孩)结构化描述a young woman with long silver hair, wearing a elegant white dress, standing in a field of sunflowers at golden hour, studio ghibli style, highly detailed, cinematic lighting(一位银色长发的年轻女子身着优雅白裙站在金色时刻的向日葵花田中吉卜力风格高细节电影感灯光)你可以立刻尝试用这两种描述分别生成图片感受一下细节和画面掌控力的天壤之别。2.2 Negative Prompt告诉AI“你绝对不要什么”如果说Prompt是“指挥棒”那么Negative Prompt就是“刹车片”和“过滤器”。它的作用是排除你不想要的元素、风格或瑕疵让画面更干净、更符合预期。为什么它如此重要SD1.5模型在训练时接触了海量质量参差不齐的图片。Negative Prompt能有效抑制那些常见的低质量特征比如模糊、畸形、水印等。一些通用的“负面词汇包”lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck你可以将上面这段文本保存下来作为你的基础负面词库每次生成时都粘贴进去能显著提升出图的基本质量。2.3 Seed锁定结果的“魔法种子”Seed随机种子是一个数字它决定了AI生成过程中所有随机噪声的初始状态。相同的Seed在相同参数下会产出几乎完全相同的图片。它的核心价值在于“复现”和“微调”复现当你生成一张满意的图记下它的Seed。下次用同样的Prompt和参数就能得到一模一样的图。微调固定一个Seed然后只修改Prompt中的某个词比如把“红裙子”改成“蓝裙子”你就能得到两张构图、光影、人物姿势都高度一致仅颜色不同的图非常适合做系列作品或对比测试。操作技巧随机探索将Seed设为-1每次点击生成都会使用一个随机的新种子适合创意发散。固定创作当你找到满意的构图或感觉时将Seed固定为当前值然后在此基础上优化Prompt细节。3. 三要素协同实战从想法到精品理解了各自的作用后我们通过一个完整的案例看看如何让它们协同工作。我们的目标生成一张“未来赛博朋克风格的女武士”肖像。3.1 第一轮搭建基础框架只用Prompt我们先只用Prompt来构建基础想法。输入Prompt:cyberpunk female samurai, portrait, intricate armor, neon lights, rainy night, detailed face, sharp focusNegative Prompt: (留空)Seed:-1(随机)其他参数: 默认点击生成。你可能会得到一张还不错但有些问题的图比如脸部可能有些扭曲背景有奇怪的模糊块或者盔甲细节不够。记下这次生成的Seed例如334455。3.2 第二轮引入质量控制加入Negative Prompt现在我们固定Seed并加入Negative Prompt来修复常见缺陷。输入Prompt:cyberpunk female samurai, portrait, intricate armor, neon lights, rainy night, detailed face, sharp focus(不变)Negative Prompt: 粘贴我们之前准备的通用负面词库。Seed:334455(固定为上轮结果)其他参数: 不变再次生成。对比上一张图你会发现画面的“干净度”提升了。那些细微的畸形、模糊的瑕疵大概率被抑制了。画面主体更突出但可能风格还不够强烈。3.3 第三轮风格强化与细节微调协同优化最后我们在固定Seed和Negative Prompt的基础上优化Prompt增加风格化描述和细节。输入Prompt:masterpiece, best quality, cyberpunk female samurai, portrait, intricate biomechanical armor with glowing circuits, standing in neon-lit alley with rainy night, cinematic lighting, reflections on wet ground, highly detailed face, sharp focus, by greg rutkowski and wlop, 8k解读增加了masterpiece, best quality强调质量用biomechanical armor with glowing circuits细化了装甲增加了cinematic lighting电影灯光、reflections倒影等环境细节加入了艺术家风格by greg rutkowski and wlop来强化视觉风格最后用8k暗示超高细节。Negative Prompt:lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry(可以精简保留核心质量负面词)Seed:334455(依然固定)其他参数: 可以将Steps提高到25或30以增加细节渲染。生成最终图像。现在你应该得到了一张在构图不变的基础上质量、细节、风格感都全面升级的作品。通过这个“固定Seed迭代优化Prompt和Negative Prompt”的流程你实现了对生成结果的精准控制。4. 高效工作流与实用技巧掌握了核心方法后再分享几个能极大提升你效率的技巧。4.1 构建你的提示词库不要每次都从零开始写Prompt。建立自己的分类词库质量词masterpiece, best quality, ultra detailed, 8k, HDR镜头词close-up, medium shot, wide angle, birds eye view光影词cinematic lighting, soft light, rim light, golden hour风格词digital painting, concept art, oil painting, studio ghibli style, cyberpunk艺术家by artgerm, by greg rutkowski, by wlop写作时像搭积木一样从词库中组合。4.2 使用“提示词权重”进行微调在WebUI中你可以用括号()来调整某个词的重要性。(word)权重增加1.1倍((word))权重增加1.21倍[word]权重减少为0.9倍(word:1.5)权重设置为1.5倍例如在a cat and a dog中如果你觉得狗不够突出可以写成a cat and a (dog:1.3)。4.3 利用Seed进行“图生图”式创作这是Seed最强大的用法之一。找到一张构图、光影你都很喜欢的图可以是AI生成的也可以是别人的图记下它的Seed和大致Prompt。然后固定这个Seed将Prompt的主体彻底替换成你的新想法比如把“骑士”换成“宇航员”你可能会得到一张构图光影极佳的全新作品。这相当于用别人的“骨架”长出了自己的“血肉”。4.4 参数协同的黄金法则Prompt越复杂Guidance Scale可以适当调低如7-8避免过度渲染导致失真。追求高细节和复杂构图时提高Steps25-35并配合高质量的Prompt。固定Seed进行微调时优先修改Prompt而不是大幅调整Guidance Scale或Steps否则可能破坏原有构图。Negative Prompt是保障基础质量的底线通常可以保持不变除非你有特殊的排除需求。5. 总结好了30分钟的核心技巧之旅到此结束。让我们最后回顾一下关键点明确分工Prompt是创造力的方向盘负责描绘蓝图Negative Prompt是质量的控制阀负责排除干扰Seed是复现的锚点负责锁定状态。掌握流程最有效的工作流是“随机探索 - 固定Seed - 优化Prompt - 用Negative Prompt净化”。先找到一个不错的随机起点Seed然后在这个稳定的基础上进行精细化创作。结构化思考写Prompt时按照“主体-场景-细节-风格-画质”的结构来组织会让你的指令清晰十倍。善用工具建立自己的提示词库学会使用权重语法(word:1.5)把Negative Prompt当作标配。Stable Diffusion的创作三分靠模型七分靠提示。现在你已经掌握了最核心的“提示工程”心法。剩下的就是大胆地去实践、去组合、去试错。记住每一次不满意的生成其Seed和参数都是你下一次完美创作的垫脚石。打开你的Stable Diffusion v1.5 Archive开始你的精准控图之旅吧获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Stable-Diffusion-v1-5-archive新手教程:30分钟掌握Prompt/Negative Prompt/Seed协同技巧

Stable-Diffusion-v1-5-archive新手教程:30分钟掌握Prompt/Negative Prompt/Seed协同技巧 你是不是也遇到过这种情况:看到别人用Stable Diffusion生成的图片又美又精致,轮到自己上手,输入同样的描述词,出来的图却总是…...

Stable Yogi Leather-Dress-Collection入门指南:Streamlit宽屏UI响应式布局解析

Stable Yogi Leather-Dress-Collection入门指南:Streamlit宽屏UI响应式布局解析 1. 项目概述 Stable Yogi Leather-Dress-Collection是一款基于Stable Diffusion v1.5和Anything V5动漫底座模型开发的2.5D皮衣穿搭生成工具。它通过Streamlit构建了直观的宽屏交互界…...

Kimi-VL-A3B-Thinking开源大模型价值:相比闭源方案降本70%+数据本地化保障

Kimi-VL-A3B-Thinking开源大模型价值:相比闭源方案降本70%数据本地化保障 1. 模型简介与核心优势 Kimi-VL-A3B-Thinking是一款创新的开源混合专家(MoE)视觉语言模型,在多模态推理领域展现出卓越性能。该模型仅激活2.8B参数的语言…...

5个开源语义模型部署推荐:BAAI/bge-m3免配置镜像一键启动

5个开源语义模型部署推荐:BAAI/bge-m3免配置镜像一键启动 1. 项目简介 BAAI/bge-m3语义相似度分析引擎是一个基于先进多语言嵌入模型的智能文本分析工具。这个镜像封装了北京智源人工智能研究院开发的bge-m3模型,是目前开源领域最强大的语义理解模型之…...

StructBERT情感分析部署案例:边缘设备(Jetson)轻量化适配可行性分析

StructBERT情感分析部署案例:边缘设备(Jetson)轻量化适配可行性分析 1. 引言:当情感分析遇上边缘计算 想象一下,一个智能客服机器人正在处理海量的用户咨询,它需要实时判断每一条消息背后的情绪是愤怒、满…...

Qwen3-0.6B-FP8行业落地:跨境电商商品描述生成+多平台适配格式输出

Qwen3-0.6B-FP8行业落地:跨境电商商品描述生成多平台适配格式输出 1. 引言:当小模型遇上大生意 如果你是做跨境电商的,每天最头疼的事情是什么?我猜很多人会说:写商品描述。 一个爆款产品,要上架到亚马逊…...

EagleEye效果展示:同一张图不同Threshold设置下的检测结果对比图集

EagleEye效果展示:同一张图不同Threshold设置下的检测结果对比图集 1. EagleEye是什么:毫秒级目标检测的视觉新选择 EagleEye不是传统意义上的目标检测模型,而是一套基于达摩院DAMO-YOLO架构、融合TinyNAS自动搜索能力的轻量化视觉引擎。它…...

VibeVoice语音合成快速上手:流式播放+CFG参数调节详细步骤

VibeVoice语音合成快速上手:流式播放CFG参数调节详细步骤 1. 项目简介与核心价值 VibeVoice是微软推出的轻量级实时语音合成系统,基于开源的VibeVoice-Realtime-0.5B模型构建。这个系统最大的特点是能够在300毫秒内开始输出音频,真正实现了…...

WuliArt Qwen-Image Turbo代码实例:基于Qwen-Image-2512的Turbo推理实践

WuliArt Qwen-Image Turbo代码实例:基于Qwen-Image-2512的Turbo推理实践 想不想在个人电脑上,用一张消费级显卡,就能像专业工作室一样“秒出”高清大图?今天要介绍的WuliArt Qwen-Image Turbo,就是这样一个让你梦想成…...

Chord视频分析完整指南:抽帧策略、分辨率限制、显存保护机制全说明

Chord视频分析完整指南:抽帧策略、分辨率限制、显存保护机制全说明 1. 引言:为什么需要本地智能视频分析? 想象一下,你有一段视频,想知道里面发生了什么,或者想找到某个特定的人或物在视频的哪个位置、哪…...

伏羲天气预报气象服务升级:地市级气象台低成本部署AI预报辅助决策系统

伏羲天气预报气象服务升级:地市级气象台低成本部署AI预报辅助决策系统 1. 系统概述与核心价值 伏羲天气预报系统(FuXi)是复旦大学研发的15天全球天气预报级联机器学习系统,基于Nature npj Climate and Atmospheric Science发表的…...

FireRed-OCR Studio快速上手:使用Gradio替代Streamlit构建更轻量Web界面

FireRed-OCR Studio快速上手:使用Gradio替代Streamlit构建更轻量Web界面 1. 为什么选择Gradio重构FireRed-OCR Studio? 如果你用过FireRed-OCR Studio,一定会被它强大的文档解析能力所吸引。它能精准识别文字、还原复杂表格、提取数学公式&…...

Kimi-VL-A3B-Thinking镜像免配置:Chainlit前端自动发现vLLM服务机制

Kimi-VL-A3B-Thinking镜像免配置:Chainlit前端自动发现vLLM服务机制 1. 模型简介 Kimi-VL-A3B-Thinking是一款高效的开源混合专家(MoE)视觉语言模型(VLM),具备以下核心特点: 高效架构&#x…...

Z-Image-Turbo_Sugar脸部Lora惊艳案例:‘薄涂裸粉唇釉’色彩饱和度与唇部纹理细节还原

Z-Image-Turbo_Sugar脸部Lora惊艳案例:‘薄涂裸粉唇釉’色彩饱和度与唇部纹理细节还原 最近在尝试各种AI图像生成模型时,我偶然发现了一个专门针对“Sugar”风格脸部特写的Lora模型——Z-Image-Turbo_Sugar。说实话,一开始我对这种特定风格的…...

Kimi-VL-A3B-Thinking部署教程:Kubernetes集群中多实例水平扩展

Kimi-VL-A3B-Thinking部署教程:Kubernetes集群中多实例水平扩展 1. 模型简介与核心能力 Kimi-VL-A3B-Thinking是一款高效的开源混合专家(MoE)视觉语言模型,专为多模态推理任务设计。该模型仅激活语言解码器中的2.8B参数&#xf…...

通义千问3-4B-Instruct镜像部署:Windows/Mac双平台教程

通义千问3-4B-Instruct镜像部署:Windows/Mac双平台教程 1. 开篇:为什么选择这个模型? 如果你正在寻找一个既小巧又强大的AI模型,能在自己的电脑上流畅运行,那么通义千问3-4B-Instruct可能就是你的理想选择。 这个模…...

HY-Motion 1.0企业应用:智能硬件厂商生成SDK示例动作库(含C++调用)

HY-Motion 1.0企业应用:智能硬件厂商生成SDK示例动作库(含C调用) 想象一下,你是一家智能硬件公司的研发负责人,正在为一款全新的家庭健身镜或AI教练机器人开发核心功能。产品需要能根据用户的语音指令,实时…...

使用VScode开发Java项目,在一个maven工程中,出现src源代码的java文件无法进行自动编译、自动纠错功能的解决方法

也就是VScode编译器代码不进行自动纠察,胡乱写一通代码,代码下面不出现波浪线?!出现原因:其实就是在maven工程中jdk未识别到!无法编译java工程!解决方法:完善pom.xml即可&#xff0c…...

SkyWalking - 指标(Metrics)采集:JVM、OS、HTTP 等内置指标说明

👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕SkyWalking这个话题展开,希望能为你带来一些…...

内网---> Owns权限滥用

目录 🏆 Owns权限全面扩展解析 🌐 Owns底层原理详解 ⚔️ 内网渗透中的关联与利用场景 🛠️ 详细利用步骤(以Owns组对象为例) ✍️ WriteOwner权限全面扩展解析 🌐 WriteOwner底层原理详解 ⚔️ 内网渗透中的关联与利用场景 🛠️ 详细利用步骤(WriteOwner…...

SkyWalking - 自定义告警指标:基于 Meter 或日志的扩展告警

👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕SkyWalking这个话题展开,希望能为你带来一些…...

卫星载荷论文阅读笔记

1.《China Seismo-Electromagnetic Satellite search coil magnetometer data and initial results》(中国地震机理电磁监测卫星搜索磁强计数据及初步结果) 这篇文章主要介绍了“张衡一号”(CSES)卫星上搭载的**搜索磁强计&#x…...

java+vue基于springboot高校餐饮档口管理系统的设计与实现_6t8pw5bl

目录高校餐饮档口管理系统的设计目标技术架构与实现系统功能模块创新点与优势应用效果开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!高校餐饮档口管理系统的设计目标 该系统旨在通过JavaVue技术栈结合SpringBoot框架&#xf…...

Dify详解

1.什么是Dify (1)Dify 是一个开源的大语言模型(LLM)应用开发平台,帮助开发者快速搭建生产级生成式AI应用 (2)特点 ①支持各类应用创建:聊天助手、Agent、文本生成应用、工作流等。 ②…...

茶亦醉人奶茶店网页设计

目录茶亦醉人奶茶店网页设计概述色彩搭配页面布局交互功能响应式设计视觉元素项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作茶亦醉人奶茶店网页设计概述 茶亦醉人奶茶店的网页设计通常以清新、时尚、年轻…...

java+vue+springboot开题报告 基于视频的运动目标分割算法研究

目录研究背景与意义研究内容与方法预期成果创新点分析进度计划关键技术示例(代码片段)项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作研究背景与意义 视频中的运动目标分割是计算机…...

LTA-OM(一)论文

目录1.摘要2.相关工作3.系统总体流程3.1LiDAR-IMU 里程计3.2回环检测3.3回环优化图优化FPR方法因子规模管理3.4回环矫正地图点校正与 ikd-Tree 重建位姿校正与 ikd-Tree 替换维护策略里程计因子重新计算3.5Multisession模式LTA-OM(Long-Term Association LiDAR-Inertial Odome…...

写论文最崩溃的不是没内容,是格式调不对!这些神器救命

格式混乱确实是写论文时最让人头疼的问题之一——标题层级乱七八糟、参考文献格式不对、目录生成失败……针对这个痛点,我为你整理了目前市面上专门解决格式问题的AI写作工具,分为“内置格式助手”和“专业排版神器”两类: 🛠️ 解…...

水光仪专用屏四大核心优势:防刮耐腐、快交付、高性价比、全流程服务!

水光仪作为当下家用护肤、院线皮肤管理领域的热门智能设备,已成为精细化护肤的核心工具,无论是便携家用款,还是院线商用款,显示屏都是设备的核心人机交互窗口,承担着档位调节、模式切换、用量计时、耗材提醒、状态监控…...

CAD 学习笔记

1.平移视图:按住鼠标滚轮,拖动视图2.缩放视图:滚动鼠标滚轮3.三维围绕:按住键盘shift键,再按住鼠标滚轮拖动4.恢复平面 :左上角选择俯视或者输入“PLAN”空格两下5.选择图形:点选、框选&#xf…...