当前位置: 首页 > news >正文

车辆重识别(2021NIPS无分类器扩散指南)论文阅读2024/10/08

[1] CLASSIFIER-FREE DIFFUSION GUIDANCE(无分类器扩散指导) (NIPS 2021)
作者:Jonathan Ho & Tim Salimans
单位:Google Research, Brain team(谷歌团队)

摘要:
分类器指导是最近引入的一种方法,它与其他类型的生成模型中的低温采样或截断一样,在训练后的条件扩散模型中权衡模式覆盖率和样本保真度。分类器指导将扩散模型的得分估计与图像分类器的梯度相结合,因此需要训练一个与扩散模型分离的图像分类器。这也提出了在没有分类器的情况下是否可以进行引导的问题。我们证明了在没有分类器的情况下,指导确实可以由一个纯生成模型来执行:在我们称之为无分类器指导的情况下,我们联合训练一个有条件和无条件的扩散模型,并将得到的有条件和无条件的评分估计结合起来,以获得与使用分类器指导相似的样本质量和多样性之间的权衡。

主要贡献:
分类器指导使得扩散模型训练管道变得复杂,因为它需要训练一个额外的分类器,而这个分类器必须在有噪声的数据上训练,所以一般不可能插入预训练的分类器。这就提出了一个问题,即分类器指导是否成功地提升了基于分类器的度量指标,如FID和Inception score ( IS )。通过扫过混合权重,我们得到了类似于分类器引导的FID / IS权衡。我们的无分类器指导结果表明,纯生成式扩散模型能够与其他类型的生成式模型一起合成极高保真度的样本。给出了无分类器模型的训练和采样算法。

创新点:
同主要贡献。

简介:
Dhariwal & Nichol ( 2021 )提出了分类器指导,一种利用额外训练的分类器来提高扩散模型样本质量的技术。在分类器指导之前,还不知道如何从类似于截断Big GAN ( Brock et al , 2019)或低温辉光( Kingma & Dhariwal , 2018)产生的扩散模型中生成"低温"样本:幼稚的尝试,如缩放模型得分向量或减少扩散采样时添加的高斯噪声量,都是无效的( Dhariwal & Nichol , 2021)。通过改变分类器梯度的强度,Dhariwal & Nichol能够以类似于改变BigGAN截断参数的方式权衡Inception score ( Salimans et al , 2016)和FID score ( Heusel等, 2017) (或者精确率和召回率)。

框图:
请添加图片描述
请添加图片描述

什么叫做有条件和无条件的扩散模型?
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
FID是什么?请添加图片描述
IS是什么?
请添加图片描述
请添加图片描述
请添加图片描述
λ是给出的参数,就像去噪扩散模型中每个时间步的β一样,每一时间步的λ都会给出。对于是否有条件信息c的概率

我的意思是在每一个训练轮次中,每一时间步的网络是彻底优化完,再执行下一时间步的扩散然后再优化吗?
请添加图片描述
请添加图片描述
那么对于随机采样的这一时间步,对于这一时间步的网络优化也是参数更新一次就再随机采样下一个时间步吗?还是前一个随机采样的时间步的网络参数彻底优化完全,再对下一随机的时间步进行处理?请添加图片描述
请添加图片描述
那么这个多次随机采样扩散然后训练是对于一个初始数据吗?请添加图片描述
对于一个初始数据,这个多次具体的次数是给出的。
然后这个是否带有条件信息的概率p是提前给出,可以变化也可以不变,看情况。
整个流程的两个算法:
请添加图片描述
请添加图片描述
但是对于具体的流程,我还是不太清楚,因为没有具体的代码。
对于每个时间步请添加图片描述
这个就是预测的噪声,请添加图片描述
这个是zt估计去噪之后的样本数据,然后再从特定的高斯分布中采样的到zt-1,然后再估计去噪后的样本数据。

那么如何实现在一定概率的情况下采样得到的数据中含有条件信息,使用随机数吗?请添加图片描述
请添加图片描述

相关文章:

车辆重识别(2021NIPS无分类器扩散指南)论文阅读2024/10/08

[1] CLASSIFIER-FREE DIFFUSION GUIDANCE(无分类器扩散指导) (NIPS 2021) 作者:Jonathan Ho & Tim Salimans 单位:Google Research, Brain team(谷歌团队) 摘要: 分类器指导是最近引入的一…...

JavaSE——认识异常

1.概念 在生活中,人有时会生病,在程序中也是一样,程序猿是一帮办事严谨、追求完美的高科技人才。在日常开发中,绞尽脑汁将代码写的尽善尽美,在程序运行过程中,难免会出现一些奇奇怪怪的问题。有时通过代码很…...

嵌入式数据结构中顺序栈用法

第一:嵌入式C语言中栈特点 栈是限制在一端进行插入操作和删除操作的线性表(俗称堆栈),允许进行操作的一端称为“栈顶”,另一固定端称为“栈底”,当栈中没有元素时称为“空栈”。特点 :后进先出(LIFO)。...

PE结构之绑定导入表

打印绑定导入表 //打印 绑定导入表 BOOL PrintBoundImport(__in char* m_fileName) {char* Filebuffer NULL;if (!GetFileBuffer(m_fileName, &Filebuffer)) return FALSE;PIMAGE_DOS_HEADER LPdosHeader NULL;PIMAGE_NT_HEADERS LPntHeader NULL;LPdosHeader (PIMAGE…...

【python学习】1-2 配置python系统环境变量

1.点击“我的电脑”右键,点击属性,点击“高级系统设置”,再点击环境变量。 2.选择“系统变量”中的Path后,点击编辑。 3.点击新建,添加如图两个路径,即是python安装的路径位置后,点击确定。...

日均千万订单的交易平台设计稿

业务背景 平台主要售卖电子商品和少量特定的实物商品。 经营模式,主要分为平台商家和自营店,自营店的流量占整个平台业务的50%以上,我负责自营店交易履约相关业务。 以前的架构,平台交易和履约中心是所有流量共享,在…...

如何在 iPad 上恢复已删除的历史记录?

iPad 配备了一个名为 Safari 的内置网络浏览器。这是一种在旅途中保持联系和浏览网页的强大且便捷的方式。但如果您不小心删除了浏览历史记录,则尝试恢复它可能会很令人沮丧。 幸运的是,您可以通过多种方法在 iPad 上恢复已删除的 Safari 历史记录。您应…...

Haar cascade训练人脸小模型做人脸辨别

代码讲解 1. 导入必要的库 import cv2 import os from pathlib import Path import shutil import numpy as np import loggingcv2: OpenCV 库,用于图像处理和计算机视觉。os: 提供了一种便携的方式使用操作系统依赖的功能。pathlib.Path: 提供了对象导向的路径处…...

DBA | 如何将 .mdf 与 .ldf 的数据库文件导入到SQL Server 数据库中?

[ 知识是人生的灯塔,只有不断学习,才能照亮前行的道路 ] 原文链接:DBA | 如何将 .mdf 与 .ldf 的数据库文件导入到SQL Server 数据库中? 如何将 (.mdf) 和 (.ldf) 的SQL Server 数据库文件导入到当前数据库中? Step 1.登录到 Sql Server 服…...

【差分数组】个人练习-Leetcode-3229. Minimum Operations to Make Array Equal to Target

题目链接:https://leetcode.cn/problems/minimum-operations-to-make-array-equal-to-target/description/ 题目大意:给出两个数组nums[]和target[],可以对nums[]数组进行这样两种操作 给某个区间内的子列全加1给某个区间内的子列全减1 求…...

HTML5--裸体回顾

免责声明:本文仅做分享~ 详情请参考以下: HTML 系列教程 (w3school.com.cn) 菜鸟教程 - 学的不仅是技术,更是梦想! --本文是光秃秃的空壳. 标题标签 段落标签 换行和水平线 文本格式化标签 (一般用左边的&#xff…...

【网络安全】CVE-2024-46990: Directus环回IP过滤器绕过实现SSRF

未经许可,不得转载。 文章目录 背景漏洞详情受影响版本解决方案背景 Directus 是一款开源 CMS,提供强大的内容管理 API,使开发人员能够轻松创建自定义应用程序,凭借其灵活的数据模型和用户友好的界面备受欢迎。然而,Directus 存在一个漏洞,允许攻击者绕过默认的环回 IP …...

问:JVM的垃圾收集算法你知道哪些,有什么区别?

GC(垃圾回收器)的概念 GC,即垃圾回收(Garbage Collection),是计算机程序中一种自动管理内存的机制。其目的是自动回收不再被使用的对象所占用的内存空间,从而避免内存泄漏和内存溢出&#xff0…...

Python selenium库学习使用实操四

系列文章目录 Python selenium库学习使用实操 Python selenium库学习使用实操二 Python selenium库学习使用实操三 文章目录 系列文章目录[TOC](文章目录) 前言一、元素获取二、选项解析总结 前言 在Python selenium库学习使用实操二中提到了下拉框的操作,一种是标…...

用Go开发跨平台GUI

本篇内容是根据2023年3月份#271 Cross-platform graphical user interfaces音频录制内容的整理与翻译 这一期与 Wails 和 Fyne 的创建者一起深入研究为不同架构和操作系统编写 Go 代码。 译者注: Wails的作者是在澳大利亚悉尼的威尔士人,github头像是威尔士的旗帜,Wails也是Wa…...

云原生开发 - 工具镜像(简约版)

在微服务和云原生环境中,容器化的目标之一是尽可能保持镜像小型化以提高启动速度和减少安全风险。然而,在实际操作中,有时候需要临时引入一些工具来进行调试、监控或问题排查。Kubernetes提供了临时容器(ephemeral containers&…...

Mac 电脑pink 后端ip地址进行本地联调

文章目录 0: 使用ping 192.39.192.180查看是否能ping通1:点击访达2:在访达里面 shift commit g 打开前往路径的窗口3:在窗口中输入地址/private/etc/hosts4:打开hosts文件 添加后端地址(如:192.39.192.180 localhost:80805:保存 后端ip为192.39.192.180…...

iPhone使用指南:如何在没有备份的情况下从 iPhone 恢复已删除的照片

本指南将向您展示如何在没有备份的情况下从 iPhone 恢复已删除的照片。我们所有人在生活中的某个时刻都一定做过一些愚蠢的事情,例如从手机或电脑中删除一些重要的东西。这是很自然的,没有什么可羞耻的。您可能在辛苦工作一天后回来。当突然想看一些照片…...

黑马程序员 javaWeb基础学习,精细点复习【持续更新】

文章目录 WEB开发一、HTML1.html介绍 二、CSS1.CSS介绍2.CSS导入方式3.CSS选择器4.CSS属性 三、JavaScript1.介绍2.浏览器3.js的三种输出方式4.js定义变量5.js数据类型6.js运算符7.全局函数8.函数定义9.js数组对象10.js正则对象11.字符串对象12.自定义对象13.BOM浏览器对象模型…...

【C++设计模式】行为型模式:中介者模式

行为型模式:中介者模式 中介者模式通过引入一个中介者对象来集中控制对象之间的交互。这样可以解耦多个对象之间的复杂交互关系,使系统更易于维护和扩展。 假设我们有一个简单的聊天室应用,其中有每个用户可以发送群聊消息给其他用户&#…...

Python 3.14 JIT为何在ARM64上降频17%?源码级定位_pyltopt_arch.c中2个未对齐的寄存器分配bug(已提交CPython PR#12894)

第一章:Python 3.14 JIT编译器性能降频现象概览Python 3.14 引入的实验性 JIT 编译器(基于 Pyjion 与新式 AST 优化管道)在部分工作负载下表现出非预期的性能降频现象——即启用 JIT 后,某些计算密集型循环或 I/O 绑定协程的执行耗…...

超高压输电线路空载运行时的电压升高现象解析

1. 为什么空载时线路末端电压会升高? 第一次接触超高压输电线路时,很多工程师都会对这个现象感到困惑:明明没有接任何用电设备,为什么线路末端的电压反而比始端更高?这就像往一根长长的水管里注水,结果发现…...

基于计算机视觉的AI头像质量评估系统

基于计算机视觉的AI头像质量评估系统 1. 引言 在数字社交时代,头像已经成为个人形象的重要代表。无论是社交平台、专业网站还是在线会议,一个高质量的头像都能显著提升个人形象和可信度。然而,如何快速评估头像的质量一直是个难题——什么样…...

tao-8k部署避坑指南:Xinference日志排查、WebUI访问与调用验证

tao-8k部署避坑指南:Xinference日志排查、WebUI访问与调用验证 1. 环境准备与快速部署 在开始部署tao-8k模型之前,我们先来了解一下这个模型的基本情况。tao-8k是由Hugging Face开发者amu研发并开源的专业文本嵌入模型,它能够将文本转换为高…...

GAN训练过程可视化神器对比:GAN Lab和TensorFlow Playground到底怎么选?

GAN训练可视化工具深度评测:从交互设计到教学效果的全面对比 当开发者第一次接触生成对抗网络(GAN)时,往往会被其复杂的对抗训练机制所困扰。传统的静态图表和数学公式很难直观展示生成器与判别器之间微妙的博弈过程。这正是可视化…...

Suno API:生成 AI 音乐的完整指南

简介 Suno API 是 Ace Data Cloud 提供的一项强大服务,旨在将 AI 音乐生成能力集成到您的应用程序中。借助这一稳定且全面的 RESTful API,您可以创建自定义歌曲、纯音乐、混音、翻唱等。本文将详细介绍如何使用 Suno API,并提供快速上手的指…...

WAN2.2文生视频开源镜像快速上手:ComfyUI界面操作+SDXL Prompt Styler详解

WAN2.2文生视频开源镜像快速上手:ComfyUI界面操作SDXL Prompt Styler详解 想试试用几句话就让AI帮你生成一段视频吗?WAN2.2文生视频开源镜像,结合了强大的ComfyUI界面和SDXL Prompt Styler风格化工具,让这个过程变得直观又简单。…...

MongoDB:如何构建“数据回收站“,防止人为误删数据(延迟节点)

更多内容请见: 《深入掌握MongoDB数据库》 - 专栏介绍和目录 一、引言:数据误删的现实挑战 在企业级数据库系统中,人为误删数据是导致业务中断的常见原因。根据2023年数据库安全报告,37%的数据丢失事件是由人为错误引起的,其中误删除操作占主要部分。MongoDB作为企业级No…...

Git开源贡献全指南:从入门到精通

开源项目Git贡献全流程拆解 理解开源项目贡献的基本概念 开源项目的定义与意义Git在开源协作中的核心作用常见的开源贡献类型(代码、文档、测试等) 准备开发环境 安装Git并完成基础配置(用户名、邮箱、SSH密钥)注册GitHub/GitLab等…...

树莓派Pico硬件重置失效?试试这个C语言强制重置方案(附完整代码)

树莓派Pico硬件重置失效?试试这个C语言强制重置方案(附完整代码) 当你在开发树莓派Pico项目时,可能会遇到这样的情况:硬件重置按钮突然失效,外围设备(比如LED)无法正常复位。传统的B…...