当前位置：首页 > news >正文

最新版本 Stable Diffusion 开源 AI 绘画工具之微调模型篇

news 2025/7/8 23:25:58

✨ 目录

🎈 模型种类
🎈 变分自动编码器 / VAE
🎈 美学梯度 / Aesthetic Gradients
🎈 大型语言模型的低阶自适应 / LoRA
🎈 超网络模型 / Hypernetwork
🎈 微调模型 / LyCORIS

🎈 模型种类

当你打开模型网站C站后，你可以看到右上角筛选里面有很多不同种类的模型
包括：Checkpoint、Textual Inversion、Hypernetwork、VAE、Lora、LyCORIS、Aesthetic Gradients等等
其中 Checkpoint 是主模型，所以体积会很大，因为要基于大模型参数的训练，所以最开始诞生的就是主模型，你可以把它当作其他模型的主体
因为体积太大，导致在处理各种细节的时候准确度其实是不够的，比如我要调图片的饱和度，给图片添加不同的滤镜，所以对于细节的处理，出现了各种衍生出来的小模型
比如上一篇我们讲解的 Embedding 模型，它就是负责文本理解的模块，上手非常容易，但是效果却非常的不错，逐渐被用户接受，因此相继出现了其他的模型

模型种类

🎈 变分自动编码器 / VAE

这个其实就是在主模型基础上做图片微调的，比如大家经常使用的滤镜，以及处理图片的饱和度
所以这类模型比较少，主要是一些主流的修图软件已经可以实现这些功能，用起来门槛更低
首先，默认操作界面上是没有 VAE 选项的，需要手动开启
点击设置 Setting ► 点击用户界面 User Interface ► 找到快捷设置列表 Quicksettings list ► 输入框添加 ,sd_vae,CLIP_stop_at_last_layers ► 点击应用设置 Apply settings ► 点击重启UI界面 Reload UI，即可看到 VAE 选项卡

开启VAE选项卡
选项卡界面

下载 vae 模型后，将其放置在 models/VAE 目录下，当然，你可以从C站上面下载，也可以从 huggingface 上面下载
一些常见的 VAE 下载地址：
https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.ckpt
https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Anything-V3.0.vae.safetensors
https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Berry's%20Mix.vae.safetensors
下载好，然后点击 VAE 设置项右边的刷新按钮就可以看到这些模型
可以使用 X/Y/Z plot 脚本对比一下加和不加 VAE 的一个对比情况

脚本设置
效果对比

🎈 美学梯度 / Aesthetic Gradients

这个模型主要是通过一张或者几张参考图生成一个美学模型，最终对提示词进行调整和加权
项目地址是：https://github.com/vicgalle/stable-diffusion-aesthetic-gradients，其中 aesthetic_embeddings 目录下有一些准备好的 Embedding
如果你想使用它，需要安装扩展：https://github.com/AUTOMATIC1111/stable-diffusion-webui-aesthetic-gradients
安装好这个扩展后，就可以在 Aesthetic imgs embedding 里面选择对应的 Embedding
但是现在这个美学梯度已经属于落后的模型方式了，效果相对其他方案而言，已经没有了任何优势，现在算是大势已去

🎈 大型语言模型的低阶自适应 / LoRA

这个模型主要是通过矩阵分解的方式，微调少量参数，并加总在整体参数上，所以它现在主要用来控制很多特定场景的内容生成
LoRA 模型下载后需要放置在 models\lora 目录下
对比下不用 LoRA 和用 LoRA 的区别

是否添加lora区别

🎈 超网络模型 / Hypernetwork

主要是让梯度作用于模型的扩散 Diffusion 过程。扩散过程中的每一步都通过一个额外的小网络来调整去噪过程的结果
功能和embedding、lora类似，都是对生成的图片进行针对性地调整
hypernetwork 的应用领域较窄，主要是训练画风，训练难度很大
未来很有可能被后出现的 lora 所替代，新手可以将 hypernetwork 理解为低配版的 lora
hypernetwork 最重要也是实现最好的功能是对画面风格的转换，也就是切换不同的画风
模型下载后需要放在 models\hypernetworks 目录下，主要使用方式是在 prompt 中使用嵌入语法 <hypernet:felt:1>
我这里使用的是毛毡风格画：https://civitai.com/models/68942/felt

毛毡艺术

🎈 微调模型 / LyCORIS

这是最近开始流行的一种新的模型，如其名字是一种超越传统方法的 Lora，但是要比 LoRA 能够微调的层级多，它的前身是 LoCon (LoRA for convolution layer)
LyCORIS 模型可以放在 lora 的目录下，当做普通的 lora 使用，但无法使用丰富的细节参数
如果需要使用更多的参数，需要安装扩展：https://github.com/KohakuBlueleaf/a1111-sd-webui-lycoris
安装过 LyCORIS 插件后，将 LyCORIS 模型下载后，拷贝至 models\LyCORIS
比如我们使用C站很火的胶片风模型：https://civitai.com/models/33208/filmgirl-film-grain-lora-and-loha
使用语法：<lyco:LoRA名称:1:0.5:13>，可以通过 script 中的 prompt matrix 功能可以查看加和不加 lyco 的区别

# prompt 
young 1girl with braided hair and fluffy cat ears, dressed in Off-Shoulder Sundress, standing in a rustic farm setting. She has a soft, gentle smile, expressive eyes and sexy cleavage. The background features a charming barn, fields of golden wheat, and a clear blue sky. The composition should be bathed in the warm, golden hour light, with a gentle depth of field and soft bokeh to accentuate the pastoral serenity. Capture the image as if it were taken on an old-school 35mm film for added charm, looking at viewer, ||<lora:Velvia1:0.6># negative prompt
cartoon, anime, sketches,(worst quality, low quality), (deformed, distorted, disfigured), (bad eyes, wrong lips, weird mouth, bad teeth, mutated hands and fingers:1.2), bad anatomy, wrong anatomy, amputation, extra limb, missing limb, floating limbs, disconnected limbs, mutation, ugly, disgusting, (bad_pictures, negative_hand-neg:1.2)

效果对比

路径规划算法：基于哈里斯鹰优化的路径规划算法- 附代码

路径规划算法：基于哈里斯鹰优化的路径规划算法- 附代码文章目录路径规划算法：基于哈里斯鹰优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献摘要：本文主要介绍利用智能优化…...

编程日记 2023/6/3 6:18:04

Web 应用程序防火墙 (WAF) 相关知识介绍

Web应用程序防火墙 (WAF) 如何工作？ Web应用防护系统（也称为：网站应用级入侵防御系统。英文：Web Application Firewall，简称：WAF）。利用国际上公认的一种说法：Web应用防火墙是通过执…...

编程日记 2023/6/3 6:13:03

docker快速部署hue+hue集成hive

首先需要安装hive，hive的安装在HIVE的安装与配置_EEEurekaaa！的博客-CSDN博客安装完成之后，使用脚本命令启动hdfs和hive的相关服务。一、安装docker # 安装yum-config-manager配置工具 $ yum -y install yum-utils # 设置yum源 $ yum-co…...

编程日记 2023/6/3 6:08:02

基于java SpringBoot和Vue uniapp的校园信息交流小程序

随着信息社会的网络化和计算机科学的广泛普及和迅速普及应用，具有综合智能的我国校园信息教育网络已成为推动中小学科学教育及其实践科学发展的信息技术手段。迅速推进了信息化改革，改善了高校信息交流的网络环境，提高了信息教育平台的管理水…...

编程日记 2023/6/3 6:03:01

数据包伪造替换、会话劫持、https劫持之探索和测试

（一）数据包替换攻击该攻击过程如下：伪造服务器响应客户端的数据包。监听客户端的数据包，用预先伪造的数据包，伪装成服务器返回的数据发送给客户端。因为攻击者跟目标在同一个局域网，所以攻击者发送的数…...

编程日记 2023/6/3 5:58:00

正则表达式集合

目录一、校验数字的表达式 1. 数字 2. n位的数字 3. 至少n位的数字 4. m-n位的数字 5. 零和非零开头的数字 6. 非零开头的最多带两位小数的数字 7. 带1-2位小数的正数或负数 8. 正数、负数、和小数 9. 有两位小数的正实数 10. 有1~3位小数的正实数 11. 非零的正整…...

编程日记 2023/6/3 5:52:59

Django框架中models对象转换为json的方法

在django框架中输出api接口时一般都是输出json数据但是通过orm获取的数据库数据一般都是object所以需要转换成json数据，一般有一下3种情况 1.models对象使用“all()”时 from django.http import HttpResponse from django.core import serializers from TestMode…...

编程日记 2023/6/3 5:47:57

利用Servlet编写第一个“hello world“

利用Servlet编写第一个"hello world" 🔎创建 Maven 项目🔎引入依赖🔎创建目录🔎编写代码🔎打包代码🔎部署🔎程序验证🔎结尾 🔎创建 Maven 项目 Maven 是一个构…...

编程日记 2023/6/3 5:42:56

python 爬虫之js逆向爬虫详解

随着网站前端技术的不断发展，越来越多的网站采用JS进行渲染，并加上了一些反爬机制，导致传统的爬虫技术有些力不从心。本文将为大家介绍如何进行JS逆向爬虫，并且不少于1000字。一、JS逆向爬虫的介绍 JS逆向是一种分析反爬机制的…...

编程日记 2023/6/3 5:37:53

SpringBoot:WebSocket实现消息撤回、图片撤回

下面只是讲述一下实现思路，代码基本没有哈！有时间单独发表一篇关于websocket的相关操作的博客。 1. 消息撤回、图片撤回个人觉得关于撤回，需要下述几个过程： 发送的消息的标签上可以定义一个属性，这个属性的值应该是…...

编程日记 2023/6/3 5:32:52

输出指定日期区间内的所有天、周、月

部分方法需要依赖hutool工具包。 <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>4.5.10</version> </dependency>需求：输出2023-04-17到2023-05-23期间所有的天、周、月。…...

编程日记 2023/6/3 5:27:51

【线性规划模型】

线性规划模型：原理介绍和预测应用引言线性规划是运筹学中一种重要的数学优化方法，被广泛应用于各个领域，包括工业、经济、物流等。线性规划模型的原理线性规划模型的目标是在一组线性约束条件下，寻找一组变量的最优解&…...

编程日记 2023/6/3 5:22:50

android 12.0卸载otg设备开机不加载otg设备

1.概述在12.0定制化开发过程中,客户有功能需求，通过系统属性值控制是否加载挂载otg设备，当设置为卸载模式时，要求不能挂载otg设备，开机也不能挂载otg设备 2.卸载otg设备开机不加载otg设备的核心代码 frameworks/base/services/core/java/com/android/server/StorageMan…...

编程日记 2023/6/3 5:17:49

通过 Wacom 的 Project Mercury 提高远程办公效率

过去几年中，我们的工作方式发生了翻天覆地的变化。疫情加快了对远程办公和协作的采纳，导致人们更加依赖技术来联系团队和提高工作效率。但是，那些依靠专门硬件和软件来完成工作的创作者呢？艺术家、设计师和开发人员需要使用专门…...

编程日记 2023/6/3 5:12:48

Linux-0.11 文件系统namei.c详解

Linux-0.11 文件系统namei.c详解模块简介 namei.c是整个linux-0.11版本的内核中最长的函数，总长度为700行。其核心是namei函数，即根据文件路径寻找对应的i节点。除此以外，该模块还包含一些创建目录，删除目录，创建目…...

编程日记 2023/6/3 5:07:47

$B*T_r$