【stable diffusion部署】Stable Diffusion开源本地化的文生图图生图AI
前言

主要功能
文生图、图生图、图像修复、处理、合成
所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~

系统要求
windows 10、11系统,建议6G显存,NVIDIA显卡推荐12G显存,内存建议16G以上,建议N卡,磁盘空间要足,一个模型就好几G O(∩_∩)O 我用垃圾办公电脑win10+1231V3 CPU/8G DDR3内存跑一张512X512的图十几分钟,独显是AMD的用CPU跑的速度贼慢,8G内存文生图可以跑图生图直接崩溃,加内存到16G可以跌跌撞撞的图生图
安装步骤
需要的程序
-
• Python(3.10.6)
-
• git(克隆项目代码到本地和从网址安装插件)
-
• CUDA驱动(Nvidia 显卡)
-
• Stable Diffusion(SD项目本体)
python
SD WebUI 推荐使用的 Python 版本为 3.10.6,较新版本的 Python 不支持 torch 下载地址:https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe 安装时勾选添加环境变量可以不用再单独去系统设置里配置环境变量

git
官网:https://git-scm.com/
CUDA驱动
确定电脑能安装的 CUDA 版本,根据显卡驱动版本,可以确定可安装的 CUDA 版本。在显卡驱动被正确安装的前提下,通过在命令行输入nvidia-smi命令,查看输出信息中的驱动版本以及它所支持的CUDA Version。这个版本是当前驱动支持的CUDA最高版本 CUDA 官方归档:https://developer.nvidia.com/cuda-toolkit-archive 验证 CUDA 是否安装成功:nvcc --version
Stable Diffusion WebUI
下载
- • 通过git克隆项目到本地,后期项目有更新可以方便的通过git pull拉取最新代码
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git #AMD显卡用DirectML的分支 git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml.git #Intel Arc显卡用DirectML的分支 git clone https://github.com/Aloereed/stable-diffusion-webui-arc-directml.git
-
• 也可以手动下载项目压缩包

安装
配置启动参数,使用记事本编辑 webui-user.bat 文件:
set COMMANDLINE_ARGS=--enable-insecure-extension-access #显存大于8G set COMMANDLINE_ARGS=--medvram --opt-split-attention --enable-insecure-extension-access #显存小于等于8GB,--medvram的作用是限制VRAM占用 set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access #内存小于等于8GB,--lowvram参数会让高端显卡算图变很慢 set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --xformers #进一步减少VRAM占用,仅限Nvidia显卡,可以加上--xformers参数 set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --no-half-vae #减少使用VAE导致黑图出现几率,加入--no-half-vae参数 set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --listen --port 7860 #允许局域网内其他设备通过浏览器访问WebUI,在防火墙中开放7860端口并添加--listen参数 set COMMANDLINE_ARGS=--precision full --no-half --skip-torch-cuda-test #运行提示:Torch is not able to use GPU;add --skip-torch-cuda-test to COMMANDLINE_ARGS variab,加此参数将使用CPU执行。Torch和CUDA版本兼容问题可以解决兼容问题使用GPU执行,搜索问题就有答案。
双击运行webui-user.bat

运行之后自动下载安装所需依赖包,时间比较久耐心等待,国内下载文件较大网络环境不好的话会比较慢,可以更换python源以及使用一些GitHub加速的服务提速,如果自动安装依赖失败,可以尝试手动安装所需的依赖包。在Stable Diffusion WebUI项目的根目录,使用命令行工具(如cmd、PowerShell或终端)运行pip install -r requirements.txt来安装所有列出的依赖

运行webui-user.bat命令行出现Running on local URL: http://127.0.0.1:7860, 表示已经跑起来了,使用浏览器访问这个地址就可以使用了

关闭:在终端工具按Ctrl+c,输入Y回车即可退出
扩展插件
通过官方插件库(有网络要求)或者通过网址安装
安装中文插件
从网址安装:https://github.com/VinsonLaro/stable-diffusion-webui-chinese 安装后点击installed选项卡点击apply and restart UI重启webui,重新进入页面后点击ssttings-userinterface-Localization设置为中文,设置应用并重启webui就可以看到中文界面了。可以通过sd-webui-bilingual-localization插件中英双语显示。

sd-webui-controlnet插件
sd-webui-controlnet插件是一个功能强大的基础扩展,它允许用户通过各种方式对生成的图像进行精确控制。
大模型文件
Stable Diffusion推荐的模型下载源:
-
• Hugging Face:一个流行的AI模型分享平台,Stable Diffusion背后的许多工具如Transformer、Tokenizers、Datasets都是由Hugging Face开发的。用户可以通过Hugging Face下载Stable Diffusion的官方模型和其他衍生模型。
-
• Civitai:一个专门用于分享Stable Diffusion相关资源的网站,它以模型示范缩略图和用户分享的提示词为特色。请注意,Civitai可能包含未成年不宜的图像,因此需要用户自行判断内容的适宜性。
-
• LiblibAI:国内的网站,提供了一些Stable Diffusion模型的下载,但要注意版权和合规性问题。
-
• 哩布哩布 (liblib.ai):国内可下载Stable Diffusion模型的站点,提供了多种类型的模型。
-
• GitHub:有时开发者会在GitHub上分享他们的Stable Diffusion模型,例如Stability-AI/stablediffusion和CompVis/stable-diffusion。
模型文件存放路径
Stable Diffusion的模型文件通常需要放置在特定的文件夹中,以便程序能够正确加载和使用它们。根据不同的模型类型,放置的路径可能会有所不同。
| 模型名称 | 介绍 | 路径 |
|---|---|---|
| Checkpoint | 这是Stable Diffusion绘图的基础模型,常见文件大小:2G-7G。文件扩展名通常为.ckpt或.safetensors | 放在程序主目录下models/Stable-diffusion目录中。 |
| LoRA | 微调模型,用于固定某一类型的人物或事物的风格,在数据相似度非常高的情形下,lora模型更加轻巧,训练效率也更高,可以节省大量的训练时间和训练资源。文件扩展名一般为 .ckpt、.safetensors 或 .pt | 放在程序主目录下models/Lora 目录中。 |
| VAE | 中文叫变分自编码器,全名Variational autoenconder,VAE一般用于美化图片的色彩和细节微调,主要功能是滤镜和微调;滤镜就像是剪映、美图秀秀、PS等软件用到的滤镜一样,让图片的画面看上整体色彩饱和清晰度更高;微调就是对出图的部分细节进行细微调整。文件扩展名通常为.ckpt、.pt或.safetensors,常见文件大小:100MB-800MB | 放在程序主目录下models/VAE目录中 |
| Embedding | 一种嵌入式模型,属于微调模型,Embedding模型的主要作用是文本反转,调教文本理解能力、用于个性化图像生成。文件扩展名通常为.pt,常见文件大小:几十KB | 放在程序主目录下embeddings目录中 |
| Hypernetwork | 一个超网络模型。Hypernetwork模型的主要功能是定制生成图片的画风和风格。通过使用Hypernetwork模型,可以对生成的图片进行更加细致的风格调整和定制化处理。文件扩展名通常为.pt | 放在程序主目录下models/hypernetworks目录中 |
| Controlnet | 用于控制Stable Diffusion图像生成过程的神经网络结构。它通过添加额外的条件来控制扩散模型,使用户能够根据特定的输入(如动作、线条、景深等)更精准地生成图片。ControlNet可以与各种Stable Diffusion模型结合使用,以实现更精细的图像控制和生成效果 | 放在程序主目录下extensions/sd-webui-controlnet/models目录中 |
| LyCORIS | 微调模型,它们基于LoRA(Low-Rank Adaptation)技术但进行了扩展和优化。LoRA是一种参数高效的微调方法,它通过在模型的特定层中引入低秩矩阵来调整模型的行为,而不需要改变模型的大部分权重。LyCORIS模型继承了LoRA的核心思想,并引入了不同的算法来进一步提升微调的效果和效率 | 放在程序主目录下models/LyCORIS目录中 |
| Aesthetic Gradients | 美学嵌入,是一种在文本到图像生成任务中用于增强模型个性化和风格化的技术。通过美学嵌入,可以对生成模型进行微调,使其生成的图像具有特定的美学风格特征。作用主要体现在风格定制、特征空间映射、提高生成质量、泛化性 | 放在程序主目录下aesthetic_embeddings目录中 |
| Motion Module | 实现动画生成。具体来说,Motion Module通过训练学习到的动态特性,可以生成一系列连贯的图像,这些图像可以组合成动画。配合sd-webui-animatediff插件。关键作用:生成连贯动画、个性化动画制作 | 放在程序主目录下extensions/sd-webui-animatediff/model/目录中 |
懒人一键安装整合包
手动安装虽然麻烦但是还是推荐手动安装,手动安装正统的Stable Diffusion WebUI程序,可以按需按需安装插件,一步步了解Stable Diffusion部署和插件安装过程,出现问题也好查找处理。下面是两个比较有名的已经按安装整合包安装教程
-
• 秋叶一键整合包:https://www.bilibili.com/video/BV17d4y1C73R
-
• 星空一键整合包:https://www.bilibili.com/video/BV1iM4y1y7oA
本文转自 https://mp.weixin.qq.com/s/0AsVGQazXV33jwzX1s2Kzw,如有侵权,请联系删除。
相关文章:
【stable diffusion部署】Stable Diffusion开源本地化的文生图图生图AI
前言 主要功能 文生图、图生图、图像修复、处理、合成 所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~ 系统要求 windows 10、11系统,建议6G显存,NVIDIA显卡推荐12G显存,内存建…...
县城楼市踩踏式降价,或现2字头,率先回归月薪一平方的合理价格
在一二线城市都在欢呼10月份、11月份成交量回升,楼价回稳的时候,广东一些县城却先顶不住了,大举降价,显示出县城楼市房价率先回归月薪一平方的合理水平,这将对全国楼市产生巨大影响。 据了解这个县城的楼价此前较为稳定…...
计算机组成原理(七):二进制编码
二进制编码 二进制系统 二进制由两个数字 0 和 1 组成,适合数字电路中的高电平(1)和低电平(0)表示。在计算机内部,所有数据(如数字、文本、图像、声音等)最终都以二进制形式存储和…...
【GitHub分享】you-get项目
【GitHub分享】you-get 一、介绍二、安装教程三、使用教程四、配置ffmpeg五,卸载 如果大家想要更具体地操作可去开源网站查看手册,这里只是一些简单介绍,但是也够用一般,有什么问题,也可以留言。 一、介绍 you-get是一…...
论文概览 |《Sustainable Cities and Society》2024.12 Vol.116
本次给大家整理的是《Sustainable Cities and Society》杂志2024年12月第116期的论文的题目和摘要,一共包括52篇SCI论文! 论文1 Enhancing road traffic flow in sustainable cities through transformer models: Advancements and challenges 通过变压…...
解决node.js的req.body为空的问题
从昨晚一直在试,明明之前用的封装的axios发送请求给其他的后端(springboot)是可以的,但昨天用了新项目的后端(node.js)就不行。 之前用了代理,所以浏览器发送的post请求不会被拦截,…...
Mysql学习笔记之安装
“工欲善其事,必先利其器”,这篇文章我们主要介绍Msql的安装方法。 1. 通过Docker方式安装Mysql 通过dock可以很方便的安装mysql,可以通过图形化界面配置各种参数,简介明了推荐使用dock方式安装,当然也可以使用命令方…...
将PDF流使用 canvas 绘制然后转为图片展示在页面上(二)
将PDF流转为图片展示在页面上 使用 pdfjs-dist 库来渲染 PDF 页面到 canvas 上,然后将 canvas 转为图片 安装 pdfjs-dist 依赖 npm install pdfjs-dist 或者 yarn add pdfjs-dist创建一个组件来处理 PDF 流的加载和渲染 该组件中是一个包含 PDF 文件的 ArrayBuffer…...
【深度学习】 零基础介绍卷积神经网络(CNN)
零基础介绍 卷积神经网络(CNN,Convolutional Neural Network)是深度学习中的一种神经网络,特别擅长处理图像和视频等有空间结构的数据。 假设我们在做一个“照片分类”的任务,比如判断一张照片中是猫还是狗。下面用一…...
Coze概述
### Coze概述 Coze(中文名为扣子)是由字节跳动开发的一个新一代AI应用开发平台,旨在让用户轻松创建各种AI驱动的应用和聊天机器人,无论用户的编程经验如何。以下是Coze的一些关键特性和功能: #### 关键特性 - **无代…...
康佳Android面试题及参考答案(多张原理图)
JVM 内存分布和分代回收机制是什么? JVM 内存主要分为以下几个区域。 堆(Heap)是 JVM 管理的最大的一块内存区域,主要用于存放对象实例。所有线程共享堆内存,在堆中又分为年轻代(Young Generation)和老年代(Old Generation)。年轻代又分为 Eden 区和两个 Survivor 区(…...
2022 年 3 月青少年软编等考 C 语言四级真题解析
目录 T1. 拦截导弹思路分析T2. 神奇的数列思路分析T3. 硬币思路分析T4. 公共子序列思路分析T1. 拦截导弹 某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于前一发的…...
关于24年408真题的疑问
45.某计算机按字节编址,采用页式虚拟存储管理方式,虚拟地址和物理地址的长度均为32位,页表项的大小为4字节,页大小为4MB。虚拟地址结构如下: 这一道题如果不细想的话,其实是可以做对的,毕竟数字…...
【容器】k8s学习笔记基础部分(三万字超详细)
概念 应用部署方式演变 在部署应用程序的方式上,主要经历了三个时代: 传统部署:互联网早期,会直接将应用程序部署在物理机上 优点:简单,不需要其它技术的参与 缺点:不能为应用程序定义资源使…...
dayjs(2kb)和momentjs(70kb)关系详述及项目中如何选择讲解
关系 API:Day.js被设计为Moment.js的极简替代品,其API和用法与Moment.js几乎完全一致。这使得开发者在两者之间进行切换时,学习成本极低。 理念: Moment.js是一个大而全的时间日期库,提供了丰富的日期时间操作方法&am…...
【Python网络爬虫笔记】11- Xpath精准定位元素
目录 一、Xpath 在 Python 网络爬虫中的作用(一)精准定位元素(二)应对动态网页(三)数据结构化提取 二、Xpath 的常用方法(一)节点选取(二)谓词筛选࿰…...
6.python列表
Python 列表 (List) 深度总结 文章目录 Python 列表 (List) 深度总结1. 列表的基本概念2. 访问列表中的元素3. 修改列表4. 删除列表元素5. 列表的操作符6. 列表的内置函数7. 列表的方法8. 列表的高级用法8.1 列表推导式 (List Comprehensions)8.2 列表的浅拷贝与深拷贝8.3 列表…...
Android中bindService和startService启动服务有何区别
Android中bindService和startService启动服务有何区别 bindService 和 startService 是 Android 中两种用于与 Service 交互的方式,它们的区别主要在于 生命周期管理 和 使用场景。以下是详细对比: 1. bindService方式 bindService 是一种绑定方式&am…...
超牛免费 机械臂模型、工业机器人模型下载网站集合
机械臂是一种高精度、多输入多输出的复杂系统,能够模仿人手的动作,按照给定程序、轨迹和要求实现自动抓取、搬运等功能。它通常由执行机构、驱动装置、控制系统以及传感器等组成,能够完成各种复杂的动作。 机械臂在工业、医学、娱乐、…...
引领未来的变革:15种前沿RAG技术及其应用探索
在现代人工智能领域,检索增强生成(RAG)技术逐渐成为推动各种应用的重要力量。这些技术通过结合信息检索与文本生成,能够更有效地处理和利用信息。本文将详细介绍15种前沿RAG技术及其具体应用实例,以帮助您更好地理解这…...
阿里云ACP云计算备考笔记 (5)——弹性伸缩
目录 第一章 概述 第二章 弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制 第三章 主要定义 …...
【git】把本地更改提交远程新分支feature_g
创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...
C++.OpenGL (10/64)基础光照(Basic Lighting)
基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...
高防服务器能够抵御哪些网络攻击呢?
高防服务器作为一种有着高度防御能力的服务器,可以帮助网站应对分布式拒绝服务攻击,有效识别和清理一些恶意的网络流量,为用户提供安全且稳定的网络环境,那么,高防服务器一般都可以抵御哪些网络攻击呢?下面…...
服务器--宝塔命令
一、宝塔面板安装命令 ⚠️ 必须使用 root 用户 或 sudo 权限执行! sudo su - 1. CentOS 系统: yum install -y wget && wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh2. Ubuntu / Debian 系统…...
vulnyx Blogger writeup
信息收集 arp-scan nmap 获取userFlag 上web看看 一个默认的页面,gobuster扫一下目录 可以看到扫出的目录中得到了一个有价值的目录/wordpress,说明目标所使用的cms是wordpress,访问http://192.168.43.213/wordpress/然后查看源码能看到 这…...
R 语言科研绘图第 55 期 --- 网络图-聚类
在发表科研论文的过程中,科研绘图是必不可少的,一张好看的图形会是文章很大的加分项。 为了便于使用,本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中,获取方式: R 语言科研绘图模板 --- sciRplothttps://mp.…...
Vue ③-生命周期 || 脚手架
生命周期 思考:什么时候可以发送初始化渲染请求?(越早越好) 什么时候可以开始操作dom?(至少dom得渲染出来) Vue生命周期: 一个Vue实例从 创建 到 销毁 的整个过程。 生命周期四个…...
uniapp 小程序 学习(一)
利用Hbuilder 创建项目 运行到内置浏览器看效果 下载微信小程序 安装到Hbuilder 下载地址 :开发者工具默认安装 设置服务端口号 在Hbuilder中设置微信小程序 配置 找到运行设置,将微信开发者工具放入到Hbuilder中, 打开后出现 如下 bug 解…...
Xela矩阵三轴触觉传感器的工作原理解析与应用场景
Xela矩阵三轴触觉传感器通过先进技术模拟人类触觉感知,帮助设备实现精确的力测量与位移监测。其核心功能基于磁性三维力测量与空间位移测量,能够捕捉多维触觉信息。该传感器的设计不仅提升了触觉感知的精度,还为机器人、医疗设备和制造业的智…...
