当前位置: 首页 > news >正文

【stable diffusion部署】Stable Diffusion开源本地化的文生图图生图AI

前言

主要功能

文生图、图生图、图像修复、处理、合成

所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~

在这里插入图片描述

系统要求

windows 10、11系统,建议6G显存,NVIDIA显卡推荐12G显存,内存建议16G以上,建议N卡,磁盘空间要足,一个模型就好几G O(∩_∩)O 我用垃圾办公电脑win10+1231V3 CPU/8G DDR3内存跑一张512X512的图十几分钟,独显是AMD的用CPU跑的速度贼慢,8G内存文生图可以跑图生图直接崩溃,加内存到16G可以跌跌撞撞的图生图

安装步骤

需要的程序
  • • Python(3.10.6)

  • • git(克隆项目代码到本地和从网址安装插件)

  • • CUDA驱动(Nvidia 显卡)

  • • Stable Diffusion(SD项目本体)

python

SD WebUI 推荐使用的 Python 版本为 3.10.6,较新版本的 Python 不支持 torch 下载地址:https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64.exe 安装时勾选添加环境变量可以不用再单独去系统设置里配置环境变量

git

官网:https://git-scm.com/

CUDA驱动

确定电脑能安装的 CUDA 版本,根据显卡驱动版本,可以确定可安装的 CUDA 版本。在显卡驱动被正确安装的前提下,通过在命令行输入nvidia-smi命令,查看输出信息中的驱动版本以及它所支持的CUDA Version。这个版本是当前驱动支持的CUDA最高版本 CUDA 官方归档:https://developer.nvidia.com/cuda-toolkit-archive 验证 CUDA 是否安装成功:nvcc --version

Stable Diffusion WebUI
下载
  • • 通过git克隆项目到本地,后期项目有更新可以方便的通过git pull拉取最新代码
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git   #AMD显卡用DirectML的分支   git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml.git   #Intel Arc显卡用DirectML的分支   git clone https://github.com/Aloereed/stable-diffusion-webui-arc-directml.git
  • • 也可以手动下载项目压缩包

安装

配置启动参数,使用记事本编辑 webui-user.bat 文件:

set COMMANDLINE_ARGS=--enable-insecure-extension-access #显存大于8G   set COMMANDLINE_ARGS=--medvram --opt-split-attention --enable-insecure-extension-access #显存小于等于8GB,--medvram的作用是限制VRAM占用   set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access #内存小于等于8GB,--lowvram参数会让高端显卡算图变很慢   set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --xformers #进一步减少VRAM占用,仅限Nvidia显卡,可以加上--xformers参数   set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --no-half-vae #减少使用VAE导致黑图出现几率,加入--no-half-vae参数   set COMMANDLINE_ARGS=--lowvram --opt-split-attention --enable-insecure-extension-access --listen --port 7860 #允许局域网内其他设备通过浏览器访问WebUI,在防火墙中开放7860端口并添加--listen参数   set COMMANDLINE_ARGS=--precision full --no-half --skip-torch-cuda-test #运行提示:Torch is not able to use GPU;add --skip-torch-cuda-test to COMMANDLINE_ARGS variab,加此参数将使用CPU执行。Torch和CUDA版本兼容问题可以解决兼容问题使用GPU执行,搜索问题就有答案。

双击运行webui-user.bat

运行之后自动下载安装所需依赖包,时间比较久耐心等待,国内下载文件较大网络环境不好的话会比较慢,可以更换python源以及使用一些GitHub加速的服务提速,如果自动安装依赖失败,可以尝试手动安装所需的依赖包。在Stable Diffusion WebUI项目的根目录,使用命令行工具(如cmd、PowerShell或终端)运行pip install -r requirements.txt来安装所有列出的依赖

运行webui-user.bat命令行出现Running on local URL: http://127.0.0.1:7860, 表示已经跑起来了,使用浏览器访问这个地址就可以使用了

关闭:在终端工具按Ctrl+c,输入Y回车即可退出

扩展插件

通过官方插件库(有网络要求)或者通过网址安装

安装中文插件

从网址安装:https://github.com/VinsonLaro/stable-diffusion-webui-chinese 安装后点击installed选项卡点击apply and restart UI重启webui,重新进入页面后点击ssttings-userinterface-Localization设置为中文,设置应用并重启webui就可以看到中文界面了。可以通过sd-webui-bilingual-localization插件中英双语显示。

sd-webui-controlnet插件

sd-webui-controlnet插件是一个功能强大的基础扩展,它允许用户通过各种方式对生成的图像进行精确控制。

大模型文件

Stable Diffusion推荐的模型下载源:

  • • Hugging Face:一个流行的AI模型分享平台,Stable Diffusion背后的许多工具如Transformer、Tokenizers、Datasets都是由Hugging Face开发的。用户可以通过Hugging Face下载Stable Diffusion的官方模型和其他衍生模型。

  • • Civitai:一个专门用于分享Stable Diffusion相关资源的网站,它以模型示范缩略图和用户分享的提示词为特色。请注意,Civitai可能包含未成年不宜的图像,因此需要用户自行判断内容的适宜性。

  • • LiblibAI:国内的网站,提供了一些Stable Diffusion模型的下载,但要注意版权和合规性问题。

  • • 哩布哩布 (liblib.ai):国内可下载Stable Diffusion模型的站点,提供了多种类型的模型。

  • • GitHub:有时开发者会在GitHub上分享他们的Stable Diffusion模型,例如Stability-AI/stablediffusion和CompVis/stable-diffusion。

模型文件存放路径

Stable Diffusion的模型文件通常需要放置在特定的文件夹中,以便程序能够正确加载和使用它们。根据不同的模型类型,放置的路径可能会有所不同。

模型名称介绍路径
Checkpoint这是Stable Diffusion绘图的基础模型,常见文件大小:2G-7G。文件扩展名通常为.ckpt或.safetensors放在程序主目录下models/Stable-diffusion目录中。
LoRA微调模型,用于固定某一类型的人物或事物的风格,在数据相似度非常高的情形下,lora模型更加轻巧,训练效率也更高,可以节省大量的训练时间和训练资源。文件扩展名一般为 .ckpt、.safetensors 或 .pt放在程序主目录下models/Lora 目录中。
VAE中文叫变分自编码器,全名Variational autoenconder,VAE一般用于美化图片的色彩和细节微调,主要功能是滤镜和微调;滤镜就像是剪映、美图秀秀、PS等软件用到的滤镜一样,让图片的画面看上整体色彩饱和清晰度更高;微调就是对出图的部分细节进行细微调整。文件扩展名通常为.ckpt、.pt或.safetensors,常见文件大小:100MB-800MB放在程序主目录下models/VAE目录中
Embedding一种嵌入式模型,属于微调模型,Embedding模型的主要作用是文本反转,调教文本理解能力、用于个性化图像生成。文件扩展名通常为.pt,常见文件大小:几十KB放在程序主目录下embeddings目录中
Hypernetwork一个超网络模型。Hypernetwork模型的主要功能是定制生成图片的画风和风格。通过使用Hypernetwork模型,可以对生成的图片进行更加细致的风格调整和定制化处理。文件扩展名通常为.pt放在程序主目录下models/hypernetworks目录中
Controlnet用于控制Stable Diffusion图像生成过程的神经网络结构。它通过添加额外的条件来控制扩散模型,使用户能够根据特定的输入(如动作、线条、景深等)更精准地生成图片。ControlNet可以与各种Stable Diffusion模型结合使用,以实现更精细的图像控制和生成效果放在程序主目录下extensions/sd-webui-controlnet/models目录中
LyCORIS微调模型,它们基于LoRA(Low-Rank Adaptation)技术但进行了扩展和优化。LoRA是一种参数高效的微调方法,它通过在模型的特定层中引入低秩矩阵来调整模型的行为,而不需要改变模型的大部分权重。LyCORIS模型继承了LoRA的核心思想,并引入了不同的算法来进一步提升微调的效果和效率放在程序主目录下models/LyCORIS目录中
Aesthetic Gradients美学嵌入,是一种在文本到图像生成任务中用于增强模型个性化和风格化的技术。通过美学嵌入,可以对生成模型进行微调,使其生成的图像具有特定的美学风格特征。作用主要体现在风格定制、特征空间映射、提高生成质量、泛化性放在程序主目录下aesthetic_embeddings目录中
Motion Module实现动画生成。具体来说,Motion Module通过训练学习到的动态特性,可以生成一系列连贯的图像,这些图像可以组合成动画。配合sd-webui-animatediff插件。关键作用:生成连贯动画、个性化动画制作放在程序主目录下extensions/sd-webui-animatediff/model/目录中

懒人一键安装整合包

手动安装虽然麻烦但是还是推荐手动安装,手动安装正统的Stable Diffusion WebUI程序,可以按需按需安装插件,一步步了解Stable Diffusion部署和插件安装过程,出现问题也好查找处理。下面是两个比较有名的已经按安装整合包安装教程

  • • 秋叶一键整合包:https://www.bilibili.com/video/BV17d4y1C73R

  • • 星空一键整合包:https://www.bilibili.com/video/BV1iM4y1y7oA

本文转自 https://mp.weixin.qq.com/s/0AsVGQazXV33jwzX1s2Kzw,如有侵权,请联系删除。

相关文章:

【stable diffusion部署】Stable Diffusion开源本地化的文生图图生图AI

前言 主要功能 文生图、图生图、图像修复、处理、合成 所有的AI设计工具,安装包、模型和插件,都已经整理好了,👇获取~ 系统要求 windows 10、11系统,建议6G显存,NVIDIA显卡推荐12G显存,内存建…...

县城楼市踩踏式降价,或现2字头,率先回归月薪一平方的合理价格

在一二线城市都在欢呼10月份、11月份成交量回升,楼价回稳的时候,广东一些县城却先顶不住了,大举降价,显示出县城楼市房价率先回归月薪一平方的合理水平,这将对全国楼市产生巨大影响。 据了解这个县城的楼价此前较为稳定…...

计算机组成原理(七):二进制编码

二进制编码 二进制系统 二进制由两个数字 0 和 1 组成,适合数字电路中的高电平(1)和低电平(0)表示。在计算机内部,所有数据(如数字、文本、图像、声音等)最终都以二进制形式存储和…...

【GitHub分享】you-get项目

【GitHub分享】you-get 一、介绍二、安装教程三、使用教程四、配置ffmpeg五,卸载 如果大家想要更具体地操作可去开源网站查看手册,这里只是一些简单介绍,但是也够用一般,有什么问题,也可以留言。 一、介绍 you-get是一…...

论文概览 |《Sustainable Cities and Society》2024.12 Vol.116

本次给大家整理的是《Sustainable Cities and Society》杂志2024年12月第116期的论文的题目和摘要,一共包括52篇SCI论文! 论文1 Enhancing road traffic flow in sustainable cities through transformer models: Advancements and challenges 通过变压…...

解决node.js的req.body为空的问题

从昨晚一直在试,明明之前用的封装的axios发送请求给其他的后端(springboot)是可以的,但昨天用了新项目的后端(node.js)就不行。 之前用了代理,所以浏览器发送的post请求不会被拦截,…...

Mysql学习笔记之安装

“工欲善其事,必先利其器”,这篇文章我们主要介绍Msql的安装方法。 1. 通过Docker方式安装Mysql 通过dock可以很方便的安装mysql,可以通过图形化界面配置各种参数,简介明了推荐使用dock方式安装,当然也可以使用命令方…...

将PDF流使用 canvas 绘制然后转为图片展示在页面上(二)

将PDF流转为图片展示在页面上 使用 pdfjs-dist 库来渲染 PDF 页面到 canvas 上,然后将 canvas 转为图片 安装 pdfjs-dist 依赖 npm install pdfjs-dist 或者 yarn add pdfjs-dist创建一个组件来处理 PDF 流的加载和渲染 该组件中是一个包含 PDF 文件的 ArrayBuffer…...

【深度学习】 零基础介绍卷积神经网络(CNN)

零基础介绍 卷积神经网络(CNN,Convolutional Neural Network)是深度学习中的一种神经网络,特别擅长处理图像和视频等有空间结构的数据。 假设我们在做一个“照片分类”的任务,比如判断一张照片中是猫还是狗。下面用一…...

Coze概述

### Coze概述 Coze(中文名为扣子)是由字节跳动开发的一个新一代AI应用开发平台,旨在让用户轻松创建各种AI驱动的应用和聊天机器人,无论用户的编程经验如何。以下是Coze的一些关键特性和功能: #### 关键特性 - **无代…...

康佳Android面试题及参考答案(多张原理图)

JVM 内存分布和分代回收机制是什么? JVM 内存主要分为以下几个区域。 堆(Heap)是 JVM 管理的最大的一块内存区域,主要用于存放对象实例。所有线程共享堆内存,在堆中又分为年轻代(Young Generation)和老年代(Old Generation)。年轻代又分为 Eden 区和两个 Survivor 区(…...

2022 年 3 月青少年软编等考 C 语言四级真题解析

目录 T1. 拦截导弹思路分析T2. 神奇的数列思路分析T3. 硬币思路分析T4. 公共子序列思路分析T1. 拦截导弹 某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于前一发的…...

关于24年408真题的疑问

45.某计算机按字节编址,采用页式虚拟存储管理方式,虚拟地址和物理地址的长度均为32位,页表项的大小为4字节,页大小为4MB。虚拟地址结构如下: 这一道题如果不细想的话,其实是可以做对的,毕竟数字…...

【容器】k8s学习笔记基础部分(三万字超详细)

概念 应用部署方式演变 在部署应用程序的方式上,主要经历了三个时代: 传统部署:互联网早期,会直接将应用程序部署在物理机上 优点:简单,不需要其它技术的参与 缺点:不能为应用程序定义资源使…...

dayjs(2kb)和momentjs(70kb)关系详述及项目中如何选择讲解

关系 API:Day.js被设计为Moment.js的极简替代品,其API和用法与Moment.js几乎完全一致。这使得开发者在两者之间进行切换时,学习成本极低。 理念: Moment.js是一个大而全的时间日期库,提供了丰富的日期时间操作方法&am…...

【Python网络爬虫笔记】11- Xpath精准定位元素

目录 一、Xpath 在 Python 网络爬虫中的作用(一)精准定位元素(二)应对动态网页(三)数据结构化提取 二、Xpath 的常用方法(一)节点选取(二)谓词筛选&#xff0…...

6.python列表

Python 列表 (List) 深度总结 文章目录 Python 列表 (List) 深度总结1. 列表的基本概念2. 访问列表中的元素3. 修改列表4. 删除列表元素5. 列表的操作符6. 列表的内置函数7. 列表的方法8. 列表的高级用法8.1 列表推导式 (List Comprehensions)8.2 列表的浅拷贝与深拷贝8.3 列表…...

Android中bindService和startService启动服务有何区别

Android中bindService和startService启动服务有何区别 bindService 和 startService 是 Android 中两种用于与 Service 交互的方式,它们的区别主要在于 生命周期管理 和 使用场景。以下是详细对比: 1. bindService方式 bindService 是一种绑定方式&am…...

超牛免费 机械臂模型、工业机器人模型下载网站集合

‌机械臂是一种高精度、多输入多输出的复杂系统,能够模仿人手的动作,按照给定程序、轨迹和要求实现自动抓取、搬运等功能‌。它通常由执行机构、驱动装置、控制系统以及传感器等组成,能够完成各种复杂的动作。‌ 机械臂在工业、医学、娱乐、…...

引领未来的变革:15种前沿RAG技术及其应用探索

在现代人工智能领域,检索增强生成(RAG)技术逐渐成为推动各种应用的重要力量。这些技术通过结合信息检索与文本生成,能够更有效地处理和利用信息。本文将详细介绍15种前沿RAG技术及其具体应用实例,以帮助您更好地理解这…...

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数,对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

23-Oracle 23 ai 区块链表(Blockchain Table)

小伙伴有没有在金融强合规的领域中遇见,必须要保持数据不可变,管理员都无法修改和留痕的要求。比如医疗的电子病历中,影像检查检验结果不可篡改行的,药品追溯过程中数据只可插入无法删除的特性需求;登录日志、修改日志…...

centos 7 部署awstats 网站访问检测

一、基础环境准备(两种安装方式都要做) bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

爬虫基础学习day2

# 爬虫设计领域 工商:企查查、天眼查短视频:抖音、快手、西瓜 ---> 飞瓜电商:京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空:抓取所有航空公司价格 ---> 去哪儿自媒体:采集自媒体数据进…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合

在汽车智能化的汹涌浪潮中,车辆不再仅仅是传统的交通工具,而是逐步演变为高度智能的移动终端。这一转变的核心支撑,来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒(T-Box)方案:NXP S32K146 与…...

【C++特殊工具与技术】优化内存分配(一):C++中的内存分配

目录 一、C 内存的基本概念​ 1.1 内存的物理与逻辑结构​ 1.2 C 程序的内存区域划分​ 二、栈内存分配​ 2.1 栈内存的特点​ 2.2 栈内存分配示例​ 三、堆内存分配​ 3.1 new和delete操作符​ 4.2 内存泄漏与悬空指针问题​ 4.3 new和delete的重载​ 四、智能指针…...

LOOI机器人的技术实现解析:从手势识别到边缘检测

LOOI机器人作为一款创新的AI硬件产品,通过将智能手机转变为具有情感交互能力的桌面机器人,展示了前沿AI技术与传统硬件设计的完美结合。作为AI与玩具领域的专家,我将全面解析LOOI的技术实现架构,特别是其手势识别、物体识别和环境…...

永磁同步电机无速度算法--基于卡尔曼滤波器的滑模观测器

一、原理介绍 传统滑模观测器采用如下结构: 传统SMO中LPF会带来相位延迟和幅值衰减,并且需要额外的相位补偿。 采用扩展卡尔曼滤波器代替常用低通滤波器(LPF),可以去除高次谐波,并且不用相位补偿就可以获得一个误差较小的转子位…...

系统掌握PyTorch:图解张量、Autograd、DataLoader、nn.Module与实战模型

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文通过代码驱动的方式,系统讲解PyTorch核心概念和实战技巧,涵盖张量操作、自动微分、数据加载、模型构建和训练全流程&#…...

学习一下用鸿蒙​​DevEco Studio HarmonyOS5实现百度地图

在鸿蒙(HarmonyOS5)中集成百度地图,可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API,可以构建跨设备的定位、导航和地图展示功能。 ​​1. 鸿蒙环境准备​​ ​​开发工具​​:下载安装 ​​De…...