当前位置：首页 > news >正文

深入了解diffusion model

news 2026/2/10 1:02:55

diffusion model是如何运作的

会输入当时noise的严重程度，根据我们的输入来确定在第几个step，并做出不同的回应。

Denoise模组内部实际做的事情

产生一张图片和产生noise难度是不一样的，若denoise 模块产生一只带噪声的猫说明这个模块已经会画一只猫，所以产生一只带噪声的猫和产生图片中死亡噪声难度是不一样的

如何训练noise predictor

输入这张图片和step id 然后产生出一个预测中的噪声，但为了产生预测中的噪声，则需要输入这张图片的噪声是什么样子，才会学习如何把噪声输出。

noise predictor 的训练资料是人们创造出来的

Text-to-Image

Stable Diffusion

内部有三个元件

1、Text Encoder:好的文字的encoder,会把一段文字变成向量

2、Generation Model:可以用其他model(如diffusion Model)，用一个粉红色的矩阵表示以恶搞噪声，将噪声与文字的encode产生一个中间产物（为一张图片被压缩后的结果）

3、Decoder:把图片压缩后的版本还原成原图

第一元件：如何评估影像生成的模型好坏（常用FID Frechet Inception Distance）

若这两组越接近，则表示生成的影像与原图更接近。

FID需要许多的图片

第三元件：它训练不需要文字的输入，可任意单凭影像的输入自动训练decoder

中间产物为：压缩后的图片

中间产物为：Latent Representation ,则应该如何训练decoder，把其还原成图片

需要训练一个Auto-encoder ,过程如下图所示：

输入和输出的结果越接近越好。把训练好的decoder直接拿出来将Latent Representation还原成图片即可。

第二元件：generation model

diffusion model的数学原理

Training

第三行表示从1-T sample一个数出来，第四行表示从normal distribution sample一个 $\varepsilon$

第五行红色方框表示T越大表示所加的噪声越多

想象中噪声是一点一点加进去的，去噪声也是把噪声一点一点的抹去，实际上真正做的事情并没有把噪声一点一点的加进去，噪声一次加入，去噪声也是一次便去除

sampling

深入了解diffusion model

diffusion model是如何运作的会输入当时noise的严重程度，根据我们的输入来确定在第几个step，并做出不同的回应。 Denoise模组内部实际做的事情产生一张图片和产生noise难度是不一样的，若denoise 模块产生一只带噪声的猫说明这个模块已经会…...

编程日记 2024/5/31 22:02:03

TransmittableThreadLocal原理

1、原理 TransmittableThreadLocal（简称TTL）是阿里巴巴开源的一个Java库，用于解决线程池中线程本地变量传递的问题。其底层原理主要是基于Java的ThreadLocal机制并对其进行扩展，以支持在父子线程间以及线程池中任务切换时&#x…...

编程日记 2024/5/31 22:01:02

华为昇腾310B初体验，OrangePi AIpro开发板使用测评

0、写在前面很高兴收到官方的OrangePi AIpro开发板测试邀请，在过去的几年中，我在自己的博客写了一系列有关搭载嵌入式Linux系统的SBC（单板计算机）的博文，包括树莓派4系列、2K1000龙芯教育派、Radxa Rock5B、BeagleBo…...

编程日记 2024/5/31 21:59:00

GPTQ 量化大模型

GPTQ 量化大模型 GPTQ 算法 GPTQ 算法由 Frantar 等人 (2023) 提出，它从 OBQ 方法中汲取灵感，但进行了重大改进，可以将其扩展到（非常）大型的语言模型。步骤 1：任意顺序量化 OBQ 方法选择权重按特定顺序…...

编程日记 2024/5/31 21:56:58

【GD32】05 - PWM 脉冲宽度调制

PWM PWM (Pulse Width Modulation) 是一种模拟信号电平的方法，它通过使用数字信号（通常是方波）来近似地表示模拟信号。在PWM中，信号的占空比（即高电平时间占整个周期的比例）被用来控制平均输出电压或电流。…...

编程日记 2024/5/31 21:55:57

JVM思维导图

帮助我们快速整理和总结JVM相关知识，有结构化认识和整体的思维模型 JVM相关详细知识和面试题...

编程日记 2024/5/31 21:54:56

Ollama+OpenWebUI+Phi3本地大模型入门

文章目录 Ollama+OpenWebUI+Phi3本地大模型入门一、基础环境二、Ollama三、OpenWebUI + Phi3Ollama+OpenWebUI+Phi3本地大模型入门完全不懂大模型的请绕道，相信我李一舟的课程比较适合 Ollama提供大模型运行环境，OpenWebUI提供UI，Phi3就是那个大模型。当然，Ollama支持超级…...

编程日记 2024/5/31 21:53:55

实战15：bert 命名实体识别、地址解析、人名电话地址抽取系统-完整代码数据

直接看项目视频演示： bert 命名实体识别、关系抽取、人物抽取、地址解析、人名电话地址提取系统-完整代码数据_哔哩哔哩_bilibili 项目演示：代码： import re from transformers import BertTokenizer, BertForTokenClassification, pipeline import os import torch im…...

编程日记 2024/5/31 21:52:54

js 表格添加|删除一行交互

一、需求二、实现 <div style"margin-bottom: 55px"><form action"" method"post" enctype"multipart/form-data" id"reportForm" name"sjf" style"margin-left: 25px;margin-bottom: 50px;&quo…...

编程日记 2024/5/31 21:51:52

如何选择合适的服务器硬件和配置？

业务需求了解您的业务需求和负载。这将帮助您确定需要哪种类型的服务器（如文件服务器、数据库服务器、Web服务器等）以及所需的处理能力、内存、存储和网络性能。...

编程日记 2024/5/31 21:50:51

Prometheus + Grafana + Alertmanager 系统监控

PrometheusGrafana 系统监控 1. 简介1.1 Prometheus 普罗米修斯1.2 Grafana 2. 快速试用2.1 Prometheus 普罗米修斯2.2 Prometheus 配置文件2.3 Grafana 2. 使用 Docker-Compose脚本部署监控服务3. Grafana 配置3.1 配置数据源 Prometheus3.2 使用模板ID 配置监控模板3.3 使用…...

编程日记 2024/5/31 21:49:50

5.23R语言-参数假设检验

理论方差分析（ANOVA, Analysis of Variance）是统计学中用来比较多个样本均值之间差异的一种方法。它通过将总变异分解为不同来源的变异来检测因子对响应变量的影响。方差分析广泛应用于实验设计、质量控制、医学研究等领域。方差分析的基本模型方差…...

编程日记 2024/5/31 21:48:49

rnn 和lstm源码学习笔记

目录 rnn学习笔记 lstm学习笔记 rnn学习笔记 import torchdef rnn(inputs, state, params):# inputs的形状: (时间步数量, 批次大小, 词表大小)W_xh, W_hh, b_h, W_hq, b_q paramsH stateoutputs []# 遍历每个时间步for X in inputs:# 计算隐藏状态 HH torch.tanh(torch.…...

编程日记 2024/5/31 21:47:48

解析Java中1000个常用类：CharSequence类，你学会了吗？

在 Java 编程中，字符串操作是最常见的任务之一。为了提供一种灵活且统一的方式来处理不同类型的字符序列，Java 引入了 CharSequence 接口。通过实现 CharSequence 接口，各种字符序列类可以提供一致的 API，增强了代码的灵活性和可扩展性。本文将深入探讨 CharSequence 接…...

编程日记 2024/5/31 21:46:46

微服务远程调用之拦截器实战

微服务远程调用之拦截器实战前言： 在我们开发过程中，很可能是项目是从0到1开发，或者在原有基础上做二次开发，这次是根据已有代码做二次开发，需要在我们微服务一【这里方便举例，我们后面叫模版微服务】调用…...

编程日记 2024/5/31 21:45:45

德人合科技——天锐绿盾内网安全管理软件 | -文档透明加密模块

天锐绿盾文档加密功能能够为各种模式的电子文档提供高强度加密保护，丰富的权限控制以及灵活的应用管理，帮助企业构建更严密的立体保密体系。 PC地址： https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee ————…...

编程日记 2024/5/31 21:44:44

超融合架构下，虚拟机高可用机制如何构建？

作者：SmartX 产品部钟锦锌虚拟机高可用（High Availability，简称 HA）是虚拟化/超融合平台最常用、关键的功能之一，可在服务器发生故障时通过重建业务虚拟机以降低故障对业务带来的影响。因此，为了充分保障…...

编程日记 2024/5/31 21:42:43

工厂模式详情

一.介绍工厂模式的用途与特点工厂方法模式是一种创建型设计模式， 其在父类中提供一个创建对象的方法， 允许子类决定实例化对象的类型。定义工厂方法模式(Fatory Method Pattern)是指定义一个创建对象的接口，但让实现这个接口的类来决定实例…...

编程日记 2024/5/31 21:41:42

【Word】调整列表符号与后续文本的间距

1. 默认的列表格式： 2. 修改间距： ************************************************** 分割线 ************************************************************ 3. 效果...

编程日记 2024/5/31 21:39:40

匠心独运，B 端系统 UI 演绎华章之美

匠心独运，B 端系统 UI 演绎华章之美...

编程日记 2024/5/31 21:38:39

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2026/2/8 4:37:10

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

Docker 运行 Kafka 带 SASL 认证教程

Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明：server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

编程新知 2026/1/23 4:15:03

React19源码系列之事件插件系统

事件类别事件类型定义文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...

编程新知 2026/2/7 8:31:55

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

编程新知 2026/2/8 1:58:01

排序算法总结（C++）

目录一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序三、总结一、稳定性排序算法的稳定性是指：同样大小的样本 **（同样大小的数据）**在排序之后不会改变原始的相对次序。稳定性对基础类型对象…...

编程新知 2026/1/25 9:33:23

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

考察一般的三次多项式，以r为参数： p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]； 此多项式的根为： 尽管看起来这个多项式是特殊的，其实一般的三次多项式都是可以通过线性变换化为这个形式…...

编程新知 2026/1/30 3:24:00

Python竞赛环境搭建全攻略

Python环境搭建竞赛技术文章大纲竞赛背景与意义竞赛的目的与价值Python在竞赛中的应用场景环境搭建对竞赛效率的影响竞赛环境需求分析常见竞赛类型（算法、数据分析、机器学习等）不同竞赛对Python版本及库的要求硬件与操作系统的兼容性问题 Pyth…...

编程新知 2025/9/5 19:04:58

【HarmonyOS 5】鸿蒙中Stage模型与FA模型详解

一、前言在HarmonyOS 5的应用开发模型中，featureAbility是旧版FA模型（Feature Ability）的用法，Stage模型已采用全新的应用架构，推荐使用组件化的上下文获取方式，而非依赖featureAbility。 FA大概是API7之…...

编程新知 2025/10/9 0:45:56

41道Django高频题整理(附答案背诵版)

解释一下 Django 和 Tornado 的关系？ Django和Tornado都是Python的web框架，但它们的设计哲学和应用场景有所不同。 Django是一个高级的Python Web框架，鼓励快速开发和干净、实用的设计。它遵循MVC设计，并强调代码复用。Django有…...

编程新知 2026/1/29 23:31:34