AI绘画软件Stable Diffusion详解教程(2):Windows系统本地化部署操作方法(专业版)
一、事前准备
1、一台配置不错的电脑,英伟达显卡,20系列起步,建议显存6G起步,安装win10或以上版本,我的显卡是40系列,16G显存,所以跑大部分的模型都比较快;
2、科学上网,很多下载所需的链接都在国外,虽然国内目前资源也不少了,但是精品不多,建议备一个。
二、安装所需的环境
具体包括python,这是Stable Diffusion的主要运行环境;git,用来克隆下载所需项目,包括Stable Diffusion自身;cuda,英伟达显卡用来跑算法的驱动,没有这个,显卡就是摆设。
1、安装python
记住,必须是3.10.6版本,后期的版本不支持pytorch,无法跑显卡算法,部署上会一直报错。
下载链接:Python Release Python 3.10.6 | Python.org

下载后按提示一路安装,安装完把安装路径加入到系统变量中,按如下操作步骤:



在cmd命令行中敲python --version,显示如下结果即说明安装好了。

2、安装git
到官网Git 下载软件,按提示安装。
如何使用git参考我之前的一篇文章:手记:把代码上传到Gitee等远程仓库的过程记录及常见问题_提交到gitee仓库的代码看不到吗-CSDN博客
安装完敲入指令git --version看版本

3、安装cuda
到官网CUDA Toolkit Archive | NVIDIA Developer 下载驱动,按提示安装。这里需要为自己的显卡选择具体的版本,命令行输入指令nvidia-smi查看对应版本。


下载后安装完也要配置一下环境变量,前面配置python环境变量的截图中有,操作步骤雷同。
三、安装与配置Stable Diffusion
1、下载Stable Diffusion
使用cmd,进入想安装的目录,敲入指令:
git clone https://github.com/Stability-AI/stablediffusion.git


2、下载所需的包
运行指令:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
查看这个txt文档,内容如下

最好是手动一条条安装,如pip install albumentations==0.4.3
这样好能看出哪个安装有问题,以便定向排查问题。
3、下载基础模型
目录如下:

新建目录models,在其中再建个Stable-diffusion目录,用于存放基础模型文件。
到网站ReV Animated - V2 Rebirth | Stable Diffusion Checkpoint | Civitai 上下载个基础模型。

下载的模型文件放入models\Stable-diffusion目录中
4、运行画图指令
python ./scripts/txt2img.py --prompt "a professional photograph of an astronaut riding a horse" --ckpt ./models/Stable-diffusion/revAnimated_v2Rebirth.safetensors --config ./configs/stable-diffusion/v2-inference-v.yaml --H 768 --W 768
运行完图片生成在outputs中。
至此,专业版的部署已经完成,不过使用的时候每次都要编写指令,在cmd窗口中运行,很不便捷,不过有利于理解它背后的运行机制,用于研究。
下一篇介绍如何使用web页面画图。
相关文章:
AI绘画软件Stable Diffusion详解教程(2):Windows系统本地化部署操作方法(专业版)
一、事前准备 1、一台配置不错的电脑,英伟达显卡,20系列起步,建议显存6G起步,安装win10或以上版本,我的显卡是40系列,16G显存,所以跑大部分的模型都比较快; 2、科学上网࿰…...
MySql数据库运维学习笔记
数据库运维常识 DQL、DML、DCL 和 DDL 是 SQL(结构化查询语言)中的四个重要类别,它们分别用于不同类型的数据库操作,下面为你简单明了地解释这四类语句: 1. DQL(数据查询语言,Data Query Langu…...
Linux中Shell运行原理和权限(下)(4)
文章目录 前言一、Shell的运行原理二、Linux当中的权限问题Linux权限的概念如何将普通用户添加到信任列表 三、Linux权限管理文件访问者的分类(人)文件类型和访问权限(事物属性)文件权限值的表示方法文件访问权限的相关设置方法如…...
LeetCode热题100- 字符串解码【JavaScript讲解】
古语有云:“事以密成,语以泄败”! 关于字符串解码: 题目:题解:js代码:代码中遇到的方法:repeat方法:为什么这里不用this.strstack.push(result)? 题目&#x…...
每日一题——LRU缓存机制的C语言实现详解
LRU缓存机制的C语言实现详解 参考1. 数据结构设计双向链表节点哈希表节点哈希表LRU缓存结构 2. 初始化哈希表和双向链表哈希函数初始化哈希表初始化双向链表创建LRU缓存 3. 更新双向链表4. 实现Get操作5. 实现Put操作更新节点值删除最久未使用节点插入或更新节点 6. 释放缓存释…...
Leetcode3162:优质数对的总数 I
题目描述: 给你两个整数数组 nums1 和 nums2,长度分别为 n 和 m。同时给你一个正整数 k。 如果 nums1[i] 可以除尽 nums2[j] * k,则称数对 (i, j) 为 优质数对(0 < i < n - 1, 0 < j < m - 1)。 返回 优…...
docker安装etcd:docker离线安装etcd、docker在线安装etcd、etcd镜像下载、etcd配置详解、etcd常用命令、安装常见问题总结
官方网站 官方网址:etcd 二进制包下载:Install | etcd GitHub社区项目:etcd-io GitHub GitHub社区项目版本历史:Releases etcd-io/etcd GitHub 一、镜像下载 1、在线下载 在一台能连外网的linux上执行docker镜像拉取命令…...
Apache SeaTunnel 构建实时数据同步管道(最新版)
文章作者 王海林 白鲸开源 数据集成引擎研发 Apache SeaTunnel Committer & PMC Member,Apache SkyWalking Committer,多年平台研发经验,目前专注于数据集成领域。 导读 在当今数字化快速发展的时代,数据已然成为企业决策…...
递归、搜索与回溯第二讲:二叉树中的深搜 穷举vs暴搜vs深搜vs回溯vs剪枝
递归、搜索与回溯第二讲:二叉树中的深搜 && 穷举vs暴搜vs深搜vs回溯vs剪枝 1.计算布尔二叉树的值2.求根节点到叶结点数字之和3.二叉树剪枝4.验证二叉搜索树5.二叉搜索树中第K小的元素6.二叉树的所有路径7.全排列8.子集 1.计算布尔二叉树的值 2.求根节点到叶…...
Hbase分布式——储存机制
说明: 客户端调用,到达zk。然后到大HMaster(主节点可以有多个但是只有和active在一起的才有效。)。然后找到一个HRegionServer(从节点可以有多个)去做保存操作。 每一个HRegionServer上管理着表的HRegion…...
Word表格中如何只单独调整某一单元格宽度
大家好,我是小鱼。 在日常制作Word表格时,表格中不同单元格有时需要设置不同的宽度,但是很多小伙伴会发现想单独调整某一个单元格宽度时,发现其它单元格宽度也会发生变化。那么,到底怎么才能单独调整某一单元格宽度呢…...
Build错误:Cannot determine build data storage root for project 和 无法加载主类的解决办法的经验分享
Build错误:Cannot determine build data storage root for project 解决方案与经验分享 1. 引言 查看错误信息 “Cannot determine build data storage root for project”的含义: 这是一个关于构建项目时遇到的常见错误。错误信息表明构建工具无法确定…...
【Springboot知识】Logback从1.2.x升级到1.3.x需要注意哪些点?
文章目录 **1. 确认依赖版本**示例依赖配置(Maven): **2. 处理 StaticLoggerBinder 的移除**解决方案: **3. 修改日志配置文件**示例 logback.xml 配置: **4. 检查兼容性问题**Spring Boot 2.x 的兼容性解决方案&#…...
大语言加持的闭环端到端自动驾驶模型 学习笔记纯干货
LMDrive:大语言模型辅助闭环端到端 LMDrive:大语言模型辅助闭环端到端 背景框架输入部分:导航指令:视觉数据:提示指令(可选):处理部分:输出部分: 视觉编码器…...
初阶数据结构(C语言实现)——2算法的时间复杂度和空间复杂度
目录 本节目标1. 算法效率1.1 如何衡量一个算法的好坏1.2 算法的复杂度 2.时间复杂度2.1 时间复杂度的概念2.1.1 入门习题2.1.2 进阶习题 2.2 常见时间复杂度 3. 空间复杂度3.1 常见空间复杂度 本节目标 算法效率时间复杂度空间复杂度常见时间复杂度以及复杂度oj练习 1. 算法…...
MySQL知识
1.Navicat客户端连接 打开navicat,点击连接,点击MySQL 输入连接名与密码,如果连接的mysql是windows下的mysql主机号就填写localhost 填写好后点击测试连接 点击确定,mysql连接navicat成功 2.MySQL数据定义语言(DDL) DDL用于数据库…...
【前端定位线上问题的多种方案(不依赖 Sentry)】
前端定位线上问题的多种方案(不依赖 Sentry) 🛠️ 一、构建时注入调试信息 🔧 1. 注入版本信息与 Git 提交哈希 Webpack 配置: // webpack.config.js const webpack require(webpack); const gitRevision require(…...
怎么修改node_modules里的文件,怎么使用patch-package修改node_modules的文件,怎么修改第三方库原文件。
在开发中会遇到需要node_modules里第三方库有bug,然后需要修改node_modules文件的情况 使用patch-package包可以修改node_modules里的文件 patch-package npm 官网:patch-package - npm 安装 npm i patch-package 修改文件后 npx patch-package s…...
muduo网络库2
Muduo网络库:底层实质上为Linux的epoll pthread线程池,且依赖boost库。 muduo的网络设计核心为一个线程一个事件循环,有一个main Reactor负载accept连接,然后把连接分发到某个sub Reactor(采用轮询的方式来选择sub Reactor)&…...
什么是DrawCall?DrawCall为什么会影响游戏运行效率?如何减少DrawCall?
目录 1 什么是DrawCall? 2 DrawCall为什么会影响游戏运行效率? 3 如何减少 DrawCall?(结合性能分析工具) 1 什么是DrawCall? DrawCall(绘制调用) 是 GPU 的一个指令,…...
问题解决:Anything to RealCharacters转换效果不理想?试试这3个调参技巧
问题解决:Anything to RealCharacters转换效果不理想?试试这3个调参技巧 你是否遇到过这样的困扰:使用Anything to RealCharacters引擎将心爱的动漫角色转换为真人风格时,结果却差强人意?人物面部扭曲、皮肤质感不自然…...
如何高效获取Twitch游戏奖励?TwitchDropsMiner智能调度系统解析
如何高效获取Twitch游戏奖励?TwitchDropsMiner智能调度系统解析 【免费下载链接】TwitchDropsMiner An app that allows you to AFK mine timed Twitch drops, with automatic drop claiming and channel switching. 项目地址: https://gitcode.com/GitHub_Trendi…...
使用Typora与OFA-Image-Caption打造智能Markdown笔记系统
使用Typora与OFA-Image-Caption打造智能Markdown笔记系统 不知道你有没有这样的经历:在Typora里写技术笔记,插入一张截图或者流程图,当时觉得一目了然。可过了一两个月再回头看,对着那张图愣了半天,死活想不起来当时为…...
从论文到落地:ResUNet++语义分割全流程指南(含Torch数据增强技巧)
从论文到落地:ResUNet语义分割全流程指南(含Torch数据增强技巧) 当你第一次翻开ResUNet的论文时,那些复杂的网络结构图和数学公式可能让你望而生畏。但别担心,每个优秀的算法工程师都经历过从理论到实践的迷茫期。本文…...
免费终极视频修复工具:5分钟拯救你的损坏MP4文件
免费终极视频修复工具:5分钟拯救你的损坏MP4文件 【免费下载链接】untrunc Restore a damaged (truncated) mp4, m4v, mov, 3gp video. Provided you have a similar not broken video. 项目地址: https://gitcode.com/gh_mirrors/unt/untrunc 你是否曾因视频…...
GLM-4.1V-9B-Base惊艳效果:古诗词配图理解、AI绘画作品风格反推分析
GLM-4.1V-9B-Base惊艳效果:古诗词配图理解、AI绘画作品风格反推分析 1. 视觉多模态理解新标杆 GLM-4.1V-9B-Base是智谱最新开源的视觉多模态理解模型,在中文视觉理解领域展现出令人惊艳的能力。不同于常见的纯文本大模型,这款模型专精于图像…...
Pixel Mind Decoder 生成技术文档:基于代码注释的情绪可读性分析
Pixel Mind Decoder 生成技术文档:基于代码注释的情绪可读性分析 1. 代码注释的情绪分析价值 在软件开发过程中,代码注释是开发者之间沟通的重要桥梁。但很少有人关注这些注释背后隐藏的情绪状态——它们可能是疲惫的深夜加班产物,也可能是…...
Gemini 3 Pro的国内体验路径:从AI Studio到聚合平台的日常使用观察
Google DeepMind在Gemini 3 Pro上投入的技术资源,从那份长达数十页的技术报告中可见一斑。原生多模态架构意味着图像、音频、视频不再需要额外的预处理步骤,模型能在同一个推理过程中直接理解不同模态的信息。我在AI Studio里试过上传一段技术会议的录像…...
Qwen3-ASR-0.6B保姆级教程:Linux终端直连Web服务+curl命令行调用
Qwen3-ASR-0.6B保姆级教程:Linux终端直连Web服务curl命令行调用 你是不是觉得语音识别模型一定要在网页上点点鼠标才能用?或者觉得部署一个AI服务特别麻烦,需要各种配置和调试? 今天我要分享一个完全不同的思路:直接…...
C++零基础到工程实战(3.4.1):switch高效条件判断分析
目录 一、本节学习内容概要图 二、前言 三、switch 的基本作用与适用场景 3.1 什么是 switch 语句 (1)一个变量只有若干个固定取值 (2)判断条件是整数或枚举 3.2 switch 和 if 的核心区别 (1)if 更…...
