当前位置：首页 > news >正文

AI绘画-Stable Diffusion 原理介绍及使用

news 2026/5/26 14:22:15

引言

好像很多朋友对AI绘图有兴趣，AI绘画背后，依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用，在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者，调用已有的server接口。

首先需要说明的是，AI绘图和AI识图是不一样的两类训练模型。当然从原理上讲，你可以很范的认为他们都是从训练集中训练神经网络，经过正向传播，反向计算，调整参数，降低loss，并不断迭代。在验证集验证模型，并在测试集上测试模型。但实际上在实作的时候，AI绘图对显卡等硬件资源要求相对更高，且模型在前期，中期，后期的处理手法也不一样。今天以 stable diffusion 为例，看看他的基本原理和怎么用。

Stable Diffusion 主要技术

VAE（变分自编码器）

stable diffusion 采用了VAE模型的预加载方式，在训练过程中，通常会采用预训练的通用VAE（变分自编码器）或自己训练的VAE模型。
他使用Encoder部分对原图片进行处理，将输入图片信息降维到latent space（潜在空间）。
在latent space上应用Diffusion Model进行正向采样和逆向预测。

总的来说，有如下步骤：

数据预处理：使用预训练的VAE模型对输入图片进行编码，将其映射到潜在空间。
正向扩散：在潜在空间上，对编码后的数据添加噪声，模拟扩散过程。
逆向预测：训练模型从含噪声的数据中恢复出原始图像，即逆向扩散过程。
参数调整：通过调整学习率、正则化参数等，控制神经网络参数的变化范围，提高模型的稳定性和收敛性。
结合其他技巧：应用批标准化、残差网络等训练技巧，进一步提高模型的稳定性和训练效果。

使用

github 下载project，进行build

如果你自己的GPU很好，你可以本地搭建stable diffusion，比如你的pc或台式机配了GeForce RTX 高端型号显卡。你可以在github 下载 stable diffusion 项目进行 build。

build 前会自动 pip 相关依赖

使用已搭建完成的 stable diffusion

初学者总是站在巨人的肩上，来看下 stable diffusion 怎么用。我这里采用的是baidu 飞浆 AI进行使用讲解。我们先进入 stable diffsuion 的应用页：

大模型社区-飞桨星河AI Studio大模型社区

先尝试下文字转图的效果：

效果还行。

我们再尝试生成一只小老虎

我们发现其实并不是非常完美，如果没有下面的不出现内容，该stable diffusion 生成的是一只成年老虎。

其实里面提供了API，你可以通过API调用的方式实现。

你需要构造的request：

你得到的response：

实际上生成的图是一个imgurls的数组，里面就是生成的结果，你可以单独打开这个url:

好了，就先写到这里吧

AI绘画-Stable Diffusion 原理介绍及使用

引言

Stable Diffusion 主要技术

VAE（变分自编码器）

使用

github 下载project，进行build

使用已搭建完成的 stable diffusion

相关文章：

AI绘画-Stable Diffusion 原理介绍及使用

2024年过半，新能源车谁在掉链子？

离线查询+线段树，CF522D - Closest Equals

CTF常用sql注入（二）报错注入（普通以及双查询）

LabVIEW汽车ECU测试系统

3个让你爽到爆炸的学习工具

Java 重载和重写

ode45的例程|MATLAB例程|四阶龙格库塔定步长节微分方程

“第六感”真的存在吗?

软信天成：您的数据仓库真的“达标”了吗？

TCP/IP模型每层内容和传输单位

EtherCAT通讯介绍

14-4 深入探究小型语言模型 (SLM)

ai智能语音机器人化繁为简让沟通无界限

c++ primer plus 第15章友，异常和其他：友元类

面试题002-Java-Java集合

数组越界情况

工作日常学习记录

C#中的容器

rust + mingw安装教程

echarts中heatmap鼠标滚动禁用缩放，向下滚动

MBTI性格测试

航空航天为什么离不开高强镁合金？国产替代到哪一步了

中兴光猫终极管理指南：解锁工厂模式与Telnet权限的实战教程

收藏干货｜2026 版企业 AI 落地实操指南，程序员小白入门避坑必备

LeagueAkari：英雄联盟终极自动化助手革命性指南

实战教程：5步构建基于YOLOv5的FPS游戏智能瞄准系统

Safe Exam Browser虚拟机绕过实战：深度解析与安全研究指南

TorchEasyRec：阿里巴巴开源的推荐系统深度学习框架详解

在github上快速接入taotoken大模型api的python调用教程