当前位置：首页 > news >正文

Stable Diffusion人工智能图像合成

news 2026/5/21 2:37:24

AI 图像生成大有来头。新发布的开源图像合成模型称为Stable Diffusion，它允许任何拥有 PC 和像样的 GPU 的人想象出他们能想象到的几乎任何视觉现实。它几乎可以模仿任何视觉风格，如果你给它输入一个描述性的短语，结果就会像魔术一样出现在你的屏幕上。

一些艺术家对这一前景感到高兴，其他人对此并不满意，而且整个社会似乎基本上还没有意识到通过 Twitter、Discord 和 Github 上的社区正在发生的快速发展的技术革命。可以说，图像合成带来的影响与相机的发明一样大——或者可能是视觉艺术本身的创造。甚至我们的历史感也可能受到威胁，这取决于事态发展的方式。无论哪种方式，Stable Diffusion 都在引领新一轮的深度学习创意工具浪潮，这些工具有望彻底改变视觉媒体的创作。

深度学习图像合成的兴起

Stable Diffusion 是伦敦前对冲基金经理 Emad Mostaque 的创意，他的目标是通过他的公司 Stability AI 将深度学习的新颖应用带给大众。但现代图像合成的根源可以追溯到2014 年，而 Stable Diffusion 并不是今年第一个掀起波澜的图像合成模型 (ISM)。

2022 年 4 月，OpenAI 发布了DALL-E 2，它震惊了社交媒体，因为它能够将用文字编写的场景（称为“提示”）转换为无数视觉风格，这些视觉风格可以是梦幻般的、逼真的，甚至是平凡的。有权使用封闭工具的人产生了骑在马背上的宇航员、在古埃及购买面包的泰迪熊、著名艺术家风格的新颖雕塑等等。

在 DALL-E 2 之后不久，Google和Meta宣布了他们自己的文本到图像 AI 模型。MidJourney自 2022 年 3 月起作为 Discord 服务器提供，并在几个月后向公众开放，它对访问收费并实现类似的效果，但默认情况下具有更具绘画性和说明性的质量。

然后是稳定扩散。8 月 22 日，Stability AI发布了其开源图像生成模型，其质量可以说与 DALL-E 2 相当。它还推出了自己的商业网站，名为DreamStudio，出售使用 Stable Diffusion 生成图像的计算时间。与 DALL-E 2 不同，任何人都可以使用它，而且由于 Stable Diffusion 代码是开源的，因此项目可以在几乎没有限制的情况下构建它。

仅在过去的一周内，就涌现了数十个将 Stable Diffusion 推向全新方向的项目。人们使用一种名为“img2img”的技术取得了意想不到的效果，该技术“升级”了MS-DOS 游戏艺术、将 Minecraft 图形转换为逼真图形、将阿拉丁的场景转换为 3D、将童趣涂鸦转换为丰富的插图等等。图像合成可以为大众带来丰富的想法可视化能力，降低进入门槛，同时也加速拥抱该技术的艺术家的能力，就像 Adobe Photoshop 在 1990 年代所做的那样。

稳定扩散的工作原理

从广义上讲，大多数最近的 ISM 浪潮都使用了一种称为潜在扩散的技术。基本上，该模型学会在纯噪声领域识别熟悉的形状，然后如果这些元素与提示中的单词匹配，则逐渐将这些元素聚焦。

首先，训练模型的个人或小组收集带有元数据（例如网络上的 alt 标签和标题）的图像，并形成一个大数据集。在 Stable Diffusion 的案例中，Stability AI 使用了LAION-5B图像集的一个子集，它基本上是互联网上 50 亿张可公开访问的图像的巨大图像抓取。最近对数据集的分析表明，许多图像来自 Pinterest、DeviantArt 甚至 Getty Images 等网站。结果，稳定扩散吸收了许多在世艺术家的风格，其中一些人强烈反对这种做法。更多关于下面的内容。

Stable Diffusion人工智能图像合成

AI 图像生成大有来头。新发布的开源图像合成模型称为Stable Diffusion，它允许任何拥有 PC 和像样的 GPU 的人想象出他们能想象到的几乎任何视觉现实。它几乎可以模仿任何视觉风格，如果你给它输入一个描述性的短语，结果就会像魔术一样出现在你…...

编程日记 2023/4/29 1:20:26

【Java EE】-CSS详解

作者：学Java的冬瓜博客主页：☀冬瓜的主页🌙 专栏：【JavaEE】分享: 且视他人如盏盏鬼火，大胆地去走你的道路。——史铁生《病隙碎笔》主要内容：CSS引入html的三种方式，CSS八大选择器&#xff…...

编程日记 2023/6/1 3:40:18

C#_语言简介

目录 1. C# 简介 2. Visual Studio 窗口界面显示 1. C# 简介什么是程序？ 程序（Program）简单来说就是： 计算机是无法听懂我们人类的语言的，也可以说我们通过我们日常交流的语言是无法控制计算机的，计算机…...

编程日记 2023/4/29 1:10:23

【Python_Opencv图像处理框架】直方图与傅里叶变换

写在前面本篇文章是opencv学习的第五篇文章，主要讲解了直方图与傅里叶变换的有关操作，作为初学者，我尽己所能，但仍会存在疏漏的地方，希望各位看官不吝指正🥰 写在中间一、直方图 （ 1 &…...

编程日记 2023/4/29 1:05:21

Know-Evolve: Deep Temporal Reasoning for Dynamic Knowledge Graphs

Know-Evolve: Deep Temporal Reasoning for Dynamic Knowledge Graphs Rakshit Trivedi 1 Hanjun Dai 1 Yichen Wang 1 Le Song 1 知识背景 Temporal Knowledge Graph : facts occur,recur or evolve over time in these graphs,and each edge in the graphs have temporal …...

编程日记 2023/4/29 1:00:20

电脑高效率工作、学习工具软件推荐

本文介绍在学习、工作时，实测很好用、明显提高工作效率的几个免费电脑软件与小工具。 1 Microsoft To Do 官方网站：https://todo.microsoft.com/tasks/ Microsoft To Do是一款由Microsoft公司开发的待办事项管理应用程序。它提供了一个简单易用的界面&a…...

编程日记 2023/4/29 0:55:19

Java8新特性函数式编程 - Lambda、Stream流、Optional

1.Lambda表达式 1.1 概述 Lambda是JDK8中一个语法糖。他可以对某些匿名内部类的写法进行简化。它是函数式编程思想的一个重要体现。让我们不用关注是什么对象。而是更关注我们对数据进行了什么操作。 1.2 核心原则可推导可省略 1.3 基本格式 (参数列表)->{代码}例一…...

编程日记 2023/4/29 0:50:17

AutoGPT安装教程

最近安装AutoGPT时遇到了一些问题，写下这篇文章记录一下 1 下载AutoGPT AutoGPT链接：https://github.com/Significant-Gravitas/Auto-GPT/tree/v0.2.2 下载AutoGPT 推荐下载stable 版本 2 申请openai 的api key 获取api的key，这里就不介…...

编程日记 2023/4/29 0:45:16

轻量级服务器nginx:负载均衡

负载均衡就是让每个设备，以同样的概率，处理用户对于服务器的任务请求，默认采用的负载调度策略就是轮流询问，Nginx作为反向代理服务器安装在服务端，Nginx的功能就是把请求转发给后面的应用服务器. 这里写目录标题一负…...

编程日记 2023/4/29 0:40:15

陶渊明最有名的10首诗，闲适美好

他是中国第一位田园诗人，被誉为“古今隐逸诗人之宗”、“田园诗派之鼻祖”。他是诗人、辞赋家、散文家。他是陶渊明。欧阳修：晋无文章，唯陶渊明《归去来兮辞》。陶渊明不为五斗米折腰，挂冠而去，给后世留下一段…...

编程日记 2023/5/30 10:46:10

最好用的六款虚拟机软件，赶紧收藏

在日常工作和学习中，我们常常需要在一台电脑上运行多个操作系统，以便进行软件测试、开发、学习以及实验等任务。虚拟机软件就是一种崭新的技术，它可以在一台电脑上运行多个操作系统，为用户提供了更高效、安全、稳定和智能化的工作和学习环境。今天我为大家介绍6款优秀的虚拟…...

编程日记 2023/4/29 0:30:10

LSSANet:一种用于肺结节检测的长、短切片感知网络

文章目录 LSSANet: A Long Short Slice-Aware Network for Pulmonary Nodule Detection摘要方法Long Short Slice GroupingLong Short Slice-Aware Network 实验结果 LSSANet: A Long Short Slice-Aware Network for Pulmonary Nodule Detection 摘要提出了一个长短片感知网…...

编程日记 2023/4/29 0:25:09

LVS负载均衡群集部署—NAT

目录一、群集的概述1、群集的含义2、出现高并发的解决方法3、群集的三种分类3.1负载均衡群集3.2高可用群集3.3高性能运算群集 4、负载均衡的结构三、LVS调度器用的调度方法四、LVS的工作模式及其工作过程1.NAT模式（VS-NAT）2.直接路由模式（V…...

编程日记 2023/4/29 0:20:08

【Access】win 10 / win 11：Access 下载、安装、使用教程（「管理信息系统」实践专用软件）

目录一、前言二、卸载 Office 三、下载 Office Tool Plus 四、安装 Office（内含 Access） （1）启动 Office Tool Plus （2）部署 （3）安装 Office（内含 Access&#…...

编程日记 2023/5/29 19:41:03

波奇学Linux：Linux的认识和云服务器使用

认识Linux 在讲Linux前，我们先来理解计算机： 计算机：输入->算法->输出举个栗子： pritnf :输出到屏幕（硬件）上我们在计算机所有的行为都会转为硬件行为。再进一步理解,我们打开visual studio后&a…...

编程日记 2023/4/29 0:10:05

JMeter 获取登录接口的token

1、登录接口为POST请求方式，添加请求登录接口的消息体数据添加HTTP信息头管理器，配置content-type值为application/json 2、给登录接口“添加监听器-查看结果树”和“后置处理器-正则表达式处理器” 先运行一次登录接口，通过查看结果树返回内…...

编程日记 2023/5/30 5:04:38

算法训练day4：栈与队列

那么我这里再列出四个关于栈的问题，大家可以思考一下。以下是以C为例，使用其他编程语言的同学也对应思考一下，自己使用的编程语言里栈和队列是什么样的。 C中stack 是容器么？我们使用的stack是属于哪个版本的STL？我们…...

编程日记 2023/4/29 0:00:02

Git cherry-pick详解

文章目录基本用法引入多个提交代码冲突解决引入分支所有提交引入另一个代码库提交常用配置常见问题此文在阅读前需要有一定的git命令基础，若基础尚未掌握，建议先阅读这篇文章Git命令播报详版对于多分支的代码库，将代码从一个分支引入到另一…...

编程日记 2023/4/28 23:54:59

基于JS简单甘特图（IT枫斗者）

基于JS简单甘特图基于JS简单甘特图先来看一下效果吧，这里的需求是从早上的5点为开始时间，到第二天到凌晨5点前期准备其实网上有很多甘特图的实现方式，但是他们都只能具象到天，不能具体到某个时间点，而且每一个…...

编程日记 2023/4/28 23:49:58

你真的会判断对象是否为空吗？

首先，这个问题就很有意思，相信大部分人第一反应不就是null吗？ 比如： if(str ! null){}可是，很多时候我们判断前端送过来的值，有可能是空字符串，所以更严格的写法是： if(str ! nul…...

编程日记 2023/4/28 23:44:57

2026年降AI工具万方检测专项测试：五款工具万方AIGC检测通过率完整横评

2026年降AI工具万方检测专项测试：五款工具万方AIGC检测通过率完整横评选工具之前做了一周功课，试用了三款，最后定了嘎嘎降AI（www.aigcleaner.com）。 4.8元，知网AI率从61%降到了5.3%，达标率99…...

编程新知 2026/5/21 1:58:35

2026 运营实战：AI 电商生图能快速上手的工具深度测评，哪款是你的大促生产力？

随着 618 电商节大促之战打响，电商圈可以说是全行业交付压力最高的地方。尤其是现在的跨平台视觉竞争，不仅对视觉的高级感和 3D 渲染有要求，更看重一个字——快。如果一个爆款链接需要快速延展出厨房电器、宠物用品等不同类目的几百张不同尺…...

编程新知 2026/5/21 1:38:05

如何彻底禁用iOS过热降频：thermalmonitordDisabler终极指南

如何彻底禁用iOS过热降频：thermalmonitordDisabler终极指南【免费下载链接】thermalmonitordDisabler A tool used to disable iOS daemons. 项目地址: https://gitcode.com/gh_mirrors/th/thermalmonitordDisabler 你是否曾在游戏激战时遭遇iPhone突然卡顿…...

编程新知 2026/5/21 1:00:41

行业白皮书 GEO 化转 HTML + 结构化，AI 引用率提升 50%

你花了 3 个月写了一本白皮书，排版精美，数据详实。发出去之后，阅读量不到 500。更扎心的是，当用户在 ChatGPT、Perplexity 里提问时，引用的是竞品那篇网页版的报告，而不是你的 PDF。这不是运气问题&#xf…...

编程新知 2026/5/20 22:45:01

RISC-V开放架构如何重塑垂直半导体商业模式

1. 从边缘到中心：RISC-V的崛起与半导体模式的裂变最近和几位在芯片设计公司工作的老朋友聊天，话题总绕不开RISC-V。十年前，当我们还在讨论ARM和x86谁主沉浮时，RISC-V还只是学术界论文里的一个概念。如今，它已经成了行业…...

编程新知 2026/5/20 22:42:51

当A*算法遇上真实山地DEM：一份给无人机/机器人路径规划者的Python避坑指南

当A*算法遇上真实山地DEM：无人机路径规划的Python实战与优化山地路径规划的独特挑战在无人机和机器人导航领域，山地地形带来了传统路径规划算法难以应对的复杂性。与平坦城市环境不同，山地DEM（数字高程模型）数据包含…...

编程新知 2026/5/20 21:55:40

ETT数据集实战：如何用油温预测优化电网负载与设备维护策略

ETT数据集实战：如何用油温预测优化电网负载与设备维护策略当一座城市的电网在盛夏午后突然崩溃，背后往往隐藏着变压器油温失控的连锁反应。去年某沿海城市电网的故障分析报告显示，超过60%的突发停电事件与变压器过热直接相关——这个数据让行…...

编程新知 2026/5/20 21:48:46

实战指南：用Python ESL（greenswitch库）监听FreeSWITCH事件并自动录音

实战指南：用Python ESL（greenswitch库）监听FreeSWITCH事件并自动录音在通信系统开发中，FreeSWITCH作为强大的开源软交换平台，其Event Socket接口为开发者提供了深度集成的可能。本文将聚焦如何利用Python生态中的gre…...

编程新知 2026/5/20 20:01:09

ATmega328P烧录Bootloader报错？别急着换芯片，可能是签名搞的鬼（附avrdude.conf修改教程）

ATmega328P烧录Bootloader报错？别急着换芯片，可能是签名搞的鬼（附avrdude.conf修改教程） 当你兴致勃勃地准备给新买的ATmega328P芯片烧录Bootloader时，突然弹出一串红色报错信息，那种心情就像煮熟的鸭子飞走…...

编程新知 2026/5/20 17:15:02

从零构建：基于YOLOv8/YOLOv10的智能游戏瞄准系统深度解析

从零构建：基于YOLOv8/YOLOv10的智能游戏瞄准系统深度解析【免费下载链接】yolov8_aimbot Aim-bot based on AI for all FPS games 项目地址: https://gitcode.com/gh_mirrors/yo/yolov8_aimbot 你是否曾经好奇，人工智能技术如何精准识别游戏中的…...

编程新知 2026/5/20 17:14:58

深度学习图像合成的兴起

稳定扩散的工作原理

相关文章：