当前位置：首页 > news >正文

深入浅出 diffusion(2)：pytorch 实现 diffusion 加噪过程

news 2026/2/9 1:44:29

我在上篇博客深入浅出 diffusion（1）：白话 diffusion 原理（无公式）中介绍了 diffusion 的一些基本原理，其中谈到了 diffusion 的加噪过程，本文用pytorch 实现下到底是怎么加噪的。

import torch
import math
import numpy as np
from PIL import Image
import requests
import matplotlib.pyplot as plot
import cv2def linear_beta_schedule(timesteps):"""linear schedule, proposed in original ddpm paper"""scale = 1000 / timestepsbeta_start = scale * 0.0001beta_end = scale * 0.02return torch.linspace(beta_start, beta_end, timesteps, dtype = torch.float64)def cosine_beta_schedule(timesteps, s = 0.008):"""cosine scheduleas proposed in https://openreview.net/forum?id=-NEXDKk8gZ"""steps = timesteps + 1t = torch.linspace(0, timesteps, steps, dtype = torch.float64) / timestepsalphas_cumprod = torch.cos((t + s) / (1 + s) * math.pi * 0.5) ** 2alphas_cumprod = alphas_cumprod / alphas_cumprod[0]betas = 1 - (alphas_cumprod[1:] / alphas_cumprod[:-1])return torch.clip(betas, 0, 0.999)# 时间步(timestep)定义为1000
timesteps = 1000# 定义Beta Schedule, 选择线性版本，同DDPM原文一致，当然也可以换成cosine_beta_schedule
betas = linear_beta_schedule(timesteps=timesteps)# 根据beta定义alpha 
alphas = 1. - betas
alphas_cumprod = torch.cumprod(alphas, axis=0)
sqrt_recip_alphas = torch.sqrt(1.0 / alphas)# 计算前向过程 diffusion q(x_t | x_{t-1}) 中所需的
sqrt_alphas_cumprod = torch.sqrt(alphas_cumprod)
sqrt_one_minus_alphas_cumprod = torch.sqrt(1. - alphas_cumprod)def extract(a, t, x_shape):batch_size = t.shape[0]out = a.gather(-1, t.cpu())return out.reshape(batch_size, *((1,) * (len(x_shape) - 1))).to(t.device)# 前向加噪过程: forward diffusion process
def q_sample(x_start, t, noise=None):if noise is None:noise = torch.randn_like(x_start)cv2.imwrite('noise.png', noise.numpy()*255)sqrt_alphas_cumprod_t = extract(sqrt_alphas_cumprod, t, x_start.shape)sqrt_one_minus_alphas_cumprod_t = extract(sqrt_one_minus_alphas_cumprod, t, x_start.shape)print('sqrt_alphas_cumprod_t :', sqrt_alphas_cumprod_t)print('sqrt_one_minus_alphas_cumprod_t :', sqrt_one_minus_alphas_cumprod_t)return sqrt_alphas_cumprod_t * x_start + sqrt_one_minus_alphas_cumprod_t * noise# 图像后处理
def get_noisy_image(x_start, t):# add noisex_noisy = q_sample(x_start, t=t)# turn back into PIL imagenoisy_image = x_noisy.squeeze().numpy()return noisy_image...# 展示图像, t=0, 50, 100, 500的效果
x_start = cv2.imread('img.png') / 255.0
x_start = torch.tensor(x_start, dtype=torch.float)
cv2.imwrite('img_0.png', get_noisy_image(x_start, torch.tensor([0])) * 255.0)
cv2.imwrite('img_50.png', get_noisy_image(x_start, torch.tensor([50])) * 255.0)
cv2.imwrite('img_100.png', get_noisy_image(x_start, torch.tensor([100])) * 255.0)
cv2.imwrite('img_500.png', get_noisy_image(x_start, torch.tensor([500])) * 255.0)
cv2.imwrite('img_999.png', get_noisy_image(x_start, torch.tensor([999])) * 255.0)sqrt_alphas_cumprod_t : tensor([[[0.9999]]], dtype=torch.float64)
sqrt_one_minus_alphas_cumprod_t : tensor([[[0.0100]]], dtype=torch.float64)
sqrt_alphas_cumprod_t : tensor([[[0.9849]]], dtype=torch.float64)
sqrt_one_minus_alphas_cumprod_t : tensor([[[0.1733]]], dtype=torch.float64)
sqrt_alphas_cumprod_t : tensor([[[0.9461]]], dtype=torch.float64)
sqrt_one_minus_alphas_cumprod_t : tensor([[[0.3238]]], dtype=torch.float64)
sqrt_alphas_cumprod_t : tensor([[[0.2789]]], dtype=torch.float64)
sqrt_one_minus_alphas_cumprod_t : tensor([[[0.9603]]], dtype=torch.float64)
sqrt_alphas_cumprod_t : tensor([[[0.0064]]], dtype=torch.float64)
sqrt_one_minus_alphas_cumprod_t : tensor([[[1.0000]]], dtype=torch.float64)

以下分别为原图，t = 0, 50, 100, 500, 999 的结果。

可见，随着 t 的加大，原图对应的比例系数减小，噪声的强度系数加大，t = 500的时候，隐约可见人脸轮廓，t = 999 的时候，人脸彻底淹没在噪声里面了。

深入浅出 diffusion(2)：pytorch 实现 diffusion 加噪过程

我在上篇博客深入浅出 diffusion（1）：白话 diffusion 原理（无公式）中介绍了 diffusion 的一些基本原理，其中谈到了 diffusion 的加噪过程，本文用pytorch 实现下到底是怎么加噪的。 import torch…...

编程日记 2024/1/30 4:03:00

【软件测试】学习笔记-构建并执行 JMeter 脚本的正确姿势

有些团队在组建之初往往并没有配置性能测试人员，后来随着公司业务体量的上升，开始有了性能测试的需求，很多公司为了节约成本会在业务测试团队里选一些技术能力不错的同学进行性能测试，但这些同学也是摸着石头过河。他们会去网上寻…...

编程日记 2024/1/30 3:55:54

iOS 面试 Swift基础题

一、Swift 存储属性和计算属性比较： 存储型属性:用于存储一个常量或者变量计算型属性: 计算性属性不直接存储值,而是用 get / set 来取值和赋值,可以操作其他属性的变化. 计算属性可以用于类、结构体和枚举，存储属性只能用于类和结构体。存储属性可…...

编程日记 2024/1/30 3:53:52

（七）for循环控制

文章目录用法while的用法for的用法两者之间的联系可以相互等价用for改写while示例for和while的死循环怎么写for循环见怪不怪表达式1省略第一.三个表达式省略（for 改 while）全省略即死循环（上面已介绍） 用法类比学习while语句 …...

编程日记 2024/1/30 3:50:49

ASP .NET Core Api 使用过滤器

过滤器说明过滤器与中间件很相似，过滤器（Filters）可在管道（pipeline）特定阶段（particular stage）前后执行操作。可以将过滤器视为拦截器（interceptors）。过滤器级别范围…...

编程日记 2024/1/30 3:43:43

GitCode - 开发者的代码家园 gitcode.com/ inscode.csdn.net/liujiaping/java_1706242128563/edit?openFileMain.java&editTypelite marketplace.visualstudio.com/items?itemNameCSDN.csdn-codegpt&spm1018.2226.3001.9836&extra%5Butm_source%5Dvip_chatgpt_c…...

编程日记 2024/1/30 3:41:41

1.Mybatis入门

目录前言 1入门 1.1 入门程序实现 1.2 数据准备编辑 1.3 配置Mybatis 1.4 编写SQL语句 1.5 单元测试 1.6 解决SQL警告与提示 2. JDBC介绍(了解) 2.1 介绍 2.2 代码 2.3 问题分析 2.4 技术对比 3. 数据库连接池 3.1 介绍 3.2 产品 4. lombok 4.1 介绍 4.…...

编程日记 2024/1/30 3:38:38

android camera系列(Camera1、Camera2、CameraX)的使用以及输出的图像格式

一、Camera 1.1、结合SurfaceView实现预览 1.1.1、布局 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http://schemas.android.com/apk/res-au…...

编程日记 2024/1/30 3:37:37

live555搭建流式rtsp服务器

源代码已上传gitee 一、需求 live555源代码中的liveMediaServer是将本地文件作为源文件搭建rtsp服务器，我想用live555封装一个第三方库，接收流数据搭建Rtsp服务器；预想接口如下： class LiveRtspServer { public:/***brief构造一…...

编程日记 2024/1/30 3:35:35

Apache孵化器领路人与导师的职责

对于捐赠到 ASF 孵化器的项目来说， ASF 孵化器项目管理委员会（IPMC）的成员会扮演两个角色，一个孵化器领路人（Champion），另外一个是孵化器导师（Mentor）。本文源自 ALC …...

编程日记 2024/1/30 3:29:29

【C++中STL】set/multiset容器

set/multiset容器 Set基本概念set构造和赋值set的大小和交换set的插入和删除set查找和统计 set和multiset的区别pair对组两种创建方式 set容器排序 Set基本概念所有元素都会在插入时自动被排序。 set/multist容器属于关联式容器，底层结构属于二叉树。 set不允许容…...

编程日记 2024/1/30 3:28:27

使用 create-react-app 创建 react 应用

一、创建项目并启动第一步：全局安装：npm install -g create-react-app 第二步：切换到想创建项目的目录，使用命令create-react-app hello-react 第三步：进入项目目录，cd hello-react 第四步：启…...

编程日记 2024/1/30 3:27:26

obs-studio 源码学习 obs.h

obs.h 引用头文件介绍 c99defs.h：这个头文件提供了一些 C99 标准的定义和声明，包括一些常用的宏定义和类型定义，用于提高代码的可移植性和兼容性。 bmem.h：这个头文件提供了对内存分配和管理的功能，包括一些内存分配…...

编程日记 2024/1/30 3:26:26

C语言-指针的基本知识（上）

一、关于内存存储器：存储数据器件外存外存又叫外部存储器，长期存放数据，掉电不丢失数据常见的外存设备：硬盘、flash、rom、u盘、光盘、磁带内存内存又叫内部存储器，暂时存放数据，掉电数据…...

编程日记 2024/1/30 3:25:25

4核16G幻兽帕鲁服务器优惠价格表，阿里云和腾讯云报价

幻兽帕鲁服务器价格多少钱？4核16G服务器Palworld官方推荐配置，阿里云4核16G服务器32元1个月、96元3个月，腾讯云幻兽帕鲁服务器服务器4核16G14M带宽66元一个月、277元3个月，8核32G22M配置115元1个月、345元3个月，16核64…...

编程日记 2024/1/30 3:21:21

GitHub 上传文件夹到远程仓库、再次上传修改文件、如何使用lfs上传大文件、github报错一些问题

按照大家的做法，把自己遇到的问题及解决方案写出来（注意：Error里面有些方法有时候我用可以成功，有时候我用也不能成功，写出来仅供参考，实在不行重头再clone，add，commit，p…...

编程日记 2024/1/30 3:20:20

一些es的基本操作

目录给索引增加字段：给索引删除字段[^1]：创建索引：插入document删除document(应该是按ID) : 给索引增加字段： 用postMan: 给名为population_portrait_hash_seven的索引增加了一个text类型的字段。用chrome插件Elasticvue 的Re…...

编程日记 2024/1/30 3:18:18