当前位置: 首页 > news >正文

【通俗理解】ELBO(证据下界)——机器学习中的“情感纽带”

【通俗理解】ELBO(证据下界)——机器学习中的“情感纽带”

关键词提炼

#ELBO #证据下界 #变分推断 #机器学习 #潜变量模型 #KL散度 #期望 #对数似然

第一节:ELBO的类比与核心概念【尽可能通俗】

ELBO,即证据下界,在机器学习中扮演着“情感纽带”的角色,它连接着模型的真实后验分布与我们通过变分推断得到的近似后验分布。就像恋爱中的两个人,虽然无法完全重合,但通过ELBO这个“纽带”,我们可以找到他们之间最紧密的联系。

第二节:ELBO的核心概念与应用

2.1 核心概念

核心概念定义比喻或解释
ELBOEvidence Lower BOund,即证据下界,是变分推断中用于近似后验分布的目标函数。像是恋爱中的“最低标准”,确保双方关系不会太差。
变分推断一种用于潜变量模型推断的方法,通过优化ELBO来近似真实的后验分布。像是恋爱中的“磨合过程”,不断调整以找到最佳状态。
KL散度Kullback-Leibler Divergence,衡量两个分布之间差异的度量。像是恋爱中的“距离感”,表示双方之间的差异程度。

2.2 优势与劣势

方面描述
优势提供了明确的优化目标,使得变分推断成为可能;能够处理复杂的潜变量模型,提高模型的表达能力。
劣势ELBO的求解通常涉及复杂的数学运算,需要较高的数学功底;对于某些模型,ELBO可能不是最优的近似方法。

2.3 与机器学习的类比

ELBO在机器学习中就像是恋爱中的“共同目标”,它引导着模型(或恋人)不断接近真实(或理想)的状态,虽然可能无法完全达到,但在这个过程中,双方都在不断成长和进步。

第三节:公式探索与推演运算【重点在推导】

3.1 ELBO的基本形式

ELBO的基本形式为:

ELBO ( θ , ϕ ) = E q ϕ ( z ∣ x ) [ log ⁡ p θ ( x , z ) ] − E q ϕ ( z ∣ x ) [ log ⁡ q ϕ ( z ∣ x ) ] \text{ELBO}(\theta, \phi) = \mathbb{E}_{q_\phi(z|x)}[\log p_\theta(x, z)] - \mathbb{E}_{q_\phi(z|x)}[\log q_\phi(z|x)] ELBO(θ,ϕ)=Eqϕ(zx)[logpθ(x,z)]Eqϕ(zx)[logqϕ(zx)]

其中, θ \theta θ ϕ \phi ϕ 分别是模型参数和变分参数, x x x 是观测数据, z z z 是潜变量, p θ ( x , z ) p_\theta(x, z) pθ(x,z) 是联合概率分布, q ϕ ( z ∣ x ) q_\phi(z|x) qϕ(zx) 是近似后验分布。

3.2 公式拆解与推演

ELBO由两部分组成:第一部分是期望下的对数联合概率(即期望的“好处”),第二部分是期望下的对数近似后验概率(即期望的“代价”)。

  • 期望的“好处” E q ϕ ( z ∣ x ) [ log ⁡ p θ ( x , z ) ] \mathbb{E}_{q_\phi(z|x)}[\log p_\theta(x, z)] Eqϕ(zx)[logpθ(x,z)],表示在近似后验分布下,联合概率的对数期望。这就像是恋爱中,双方共同期待的美好未来。
  • 期望的“代价” E q ϕ ( z ∣ x ) [ log ⁡ q ϕ ( z ∣ x ) ] \mathbb{E}_{q_\phi(z|x)}[\log q_\phi(z|x)] Eqϕ(zx)[logqϕ(zx)],表示在近似后验分布下,自身概率的对数期望。这就像是恋爱中,为了维持关系所需要付出的努力。

因此,ELBO可以看作是“好处”与“代价”之间的权衡,我们希望通过优化ELBO来找到最佳的近似后验分布。

3.3 具体实例与推演

假设我们有一个简单的潜变量模型,其中观测数据 x x x 是由潜变量 z z z 生成的。我们可以通过变分推断来近似 z z z 的后验分布。在这个过程中,我们需要不断优化ELBO,使得近似后验分布越来越接近真实的后验分布。

第四节:相似公式比对【重点在差异】

公式/模型共同点不同点
最大似然估计都涉及对数似然的使用。最大似然估计直接优化对数似然,而ELBO是优化对数似然的下界。
贝叶斯推断都涉及潜变量的处理。贝叶斯推断通过精确推断来得到后验分布,而ELBO是通过近似推断来得到后验分布的近似。

第五节:核心代码与可视化【全英文的代码,标签label尤其需要是英文的!】

这段代码使用TensorFlow框架实现了ELBO的计算,并绘制了ELBO随迭代次数的变化曲线。通过可视化,我们可以直观地看到优化过程中的ELBO变化。

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns# Define the model parameters and variational parameters
theta = tf.Variable(0.0, trainable=True)
phi = tf.Variable(0.0, trainable=True)# Define the joint probability and approximate posterior probability
def joint_probability(x, z, theta):# Example joint probability functionreturn tf.exp(-tf.square(x - z * theta))def approximate_posterior(z, phi):# Example approximate posterior functionreturn tf.exp(-tf.square(z - phi))# Define the ELBO function
def elbo(x, theta, phi):z = tf.random.normal(shape=x.shape)log_joint = tf.math.log(joint_probability(x, z, theta))log_q = tf.math.log(approximate_posterior(z, phi))return tf.reduce_mean(log_joint - log_q)# Generate some synthetic data
x_data = np.random.normal(size=100)# Define the optimizer
optimizer = tf.optimizers.Adam(learning_rate=0.01)# Training loop
elbo_values = []
for epoch in range(1000):with tf.GradientTape() as tape:elbo_value = elbo(x_data, theta, phi)elbo_values.append(elbo_value.numpy())gradients = tape.gradient(elbo_value, [theta, phi])optimizer.apply_gradients(zip(gradients, [theta, phi]))if epoch % 100 == 0:print(f"Epoch {epoch}, ELBO: {elbo_value.numpy()}")# Visualize the ELBO values over epochs
sns.set_theme(style="whitegrid")
plt.plot(elbo_values, label='ELBO')
plt.xlabel('Epoch')
plt.ylabel('ELBO Value')
plt.title('ELBO Over Epochs')
plt.legend()
plt.show()# Printing more detailed output information
print("ELBO plot has been generated and displayed. \nThe plot illustrates the change of ELBO value over epochs during the optimization process.")

在这里插入图片描述

输出内容描述
ELBO随迭代次数的变化曲线图显示了优化过程中ELBO值的变化情况。
图表标题、x轴标签、y轴标签和图例提供了图表的基本信息和说明。
详细的输出信息(打印到控制台)提供了关于ELBO变化曲线图的详细解释和迭代过程中的ELBO值。

参考文献

  1. Blei, D. M., Kucukelbir, A., & McAuliffe, J. D. (2017). Variational inference: A review for statisticians. Journal of the American Statistical Association, 112(518), 859-877. [【影响因子=3.8,统计学领域权威期刊】]内容概述:该论文对变分推断进行了全面的综述,介绍了其基本原理、方法以及在统计学中的应用。
  2. Kingma, D. P., & Welling, M. (2014). Auto-encoding variational bayes. In International Conference on Learning Representations. [【会议论文,机器学习领域重要会议】]内容概述:该论文提出了自动编码变分贝叶斯(AEVB)算法,通过变分推断来优化潜变量模型的参数,为后续的变分推断研究提供了重要的思路和方法。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

相关文章:

【通俗理解】ELBO(证据下界)——机器学习中的“情感纽带”

【通俗理解】ELBO(证据下界)——机器学习中的“情感纽带” 关键词提炼 #ELBO #证据下界 #变分推断 #机器学习 #潜变量模型 #KL散度 #期望 #对数似然 第一节:ELBO的类比与核心概念【尽可能通俗】 ELBO,即证据下界,在…...

php 使用mqtt

在 Webman 框架中使用 MQTT 进行消息的发布和订阅,你可以借助 PHP 的 MQTT 客户端库,比如 phpMQTT。以下是一个简单的示例,展示了如何在 Webman 中使用 MQTT 发布和订阅消息。 安装 phpMQTT 首先,你需要通过 Composer 安装 phpMQ…...

STM32学习笔记-----什么是同步/异步/全双工/半双工/单工?

在通信系统中,同步、异步、全双工、半双工和单工是描述数据传输方式的重要概念。在STM32微控制器中,这些概念广泛应用于串行通信(如USART、SPI和I2C协议)中。接下来,我会详细解释这些术语,并特别关注STM32中…...

网络安全之内网安全

下面给出了应对企业内网安全挑战的10种策略。这10种策略即是内网的防御策略,同时也是一个提高大型企业网络安全的策略。 1、注意内网安全与网络边界安全的不同 内网安全的威胁不同于网络边界的威胁。网络边界安全技术防范来自Internet上的攻击,主要是防…...

Odoo中,要实现实时数据推送,SSE 与 WebSocket 该如何选择

目录 1. 技术特点对比 2. 使用场景 适合使用 SSE 的场景: 适合使用 WebSocket 的场景: 3. 优缺点总结 SSE 优点: SSE 缺点: WebSocket 优点: WebSocket 缺点: 4. 选择建议 选择 SSE 的条件&#x…...

CTF--php伪协议结合Base64绕过

Base64绕过 在ctf中,base64是比较常见的编码方式,在做题的时候发现自己对于base64的编码和解码规则不是很了解,并且恰好碰到了类似的题目,在翻阅了大佬的文章后记录一下,对于base64编码的学习和一个工具 base64编码是…...

设计模式-创建型-抽象工厂模式

1.概念 工厂方法模式只能生产一个产品系列,抽象工厂可以生产多个产品系列 2.作用 多个具体产品组成一个产品族(产品系列),一个具体工厂负责生产一个产品族 3.应用场景 系统所需产品间由依赖关系,可以划分为同一产…...

Hadoop 系列 MapReduce:Map、Shuffle、Reduce

文章目录 前言MapReduce 基本流程概述MapReduce 三个核心阶段详解Map 阶段工作原理 Shuffle 阶段具体步骤分区(Partition)排序(Sort)分组(Combine 和 Grouping) Reduce 阶段工作原理 MapReduce 应用场景Map…...

Axios 响应拦截器与未登录状态的统一处理

目录 前言1. 响应拦截器的作用与应用场景1.1 什么是响应拦截器?1.2 响应拦截器的应用场景 2. 代码解读:响应拦截器中的未登录处理2.1 原始代码分析 3. 完善未登录处理逻辑3.1 未登录状态的用户体验优化3.2 改进后的代码实现 4. 实践中的场景4.1 登录态的…...

深度学习每周学习总结J6(ResNeXt-50 算法实战与解析 - 猴痘识别)

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 | 接辅导、项目定制 目录 0. 总结ResNeXt基本介绍 1. 设置GPU2. 导入数据及处理部分3. 划分数据集4. 模型构建部分5. 设置超参数:定义损失函数&…...

Flask 中的 `url_for` 使用指南

在 Flask 中,url_for 是一个强大的工具,用于动态生成 URL。相比硬编码路径,url_for 更加灵活且便于维护。以下是其常见用法和技巧。 基本用法 url_for 根据 视图函数名称 和 动态参数 生成 URL。例如: from flask import Flask,…...

xiaolin coding 图解网络笔记——HTTP篇

1. HTTP 是什么? HTTP 是超文本传输协议(HyperText Transfer Protocol),一个用在计算机世界里专门在【两点】之间【传输】文字、图片、音频、视频等【超文本】数据的【约定和规范】。 2. HTTP 常见的状态码有哪些? …...

Oracle热备过程中对数据库崩溃的处理方法

引言 在热备过程中如果发生数据库崩溃、断电等情况该如何处理? 如果正在备份 users 表空间的数据文件过程中,此时的数据文件表头 SCN 会被锁定,此时正在复制数据文件时数据库崩溃,系统断电。 从而导致数据文件表头与控制文件中的不一致,导致数据库无法打开,会要求介质恢…...

【phpseclib】 PHP 使用加密算法 RSA、DES、AES等

一、Composer 下载 phpseclib # 我使用的是 phpseclib3 composer require phpseclib/phpseclib二、RSA 加密解密 // 我使用的是 phpseclib3use phpseclib3\Crypt\RSA;$type PKCS8; // 看需求选其一, PKCS8 | PKCS1 | JWK | MSBLOB | OpenSSH | PSS | PuTTY | Raw | WML $rsa…...

【ubuntu】开机进入initramfs,无法开机

Step 1 blkid查看 ext4 的磁盘 Step 2 找到TYPE"EXT4"的盘,我们此处是 /dev/mapper/ubuntu–vg-ubuntu–lv,fsck命令是用于检查和修复Linux文件系统中的错误。通过使用-t参数指定文件系统类型(例如ext4)。我们使用如下命令进行…...

ECLAIR:利用基础模型实现企业自动化

人工智能咨询培训老师叶梓 转载标明出处 尽管流程自动化的概念已经存在了几十年,但实现端到端工作流程自动化的最终愿景仍然难以捉摸。斯坦福大学的研究人员提出了一种新的解决方案——ECLAIR系统,旨在通过最少的人工监督实现企业工作流程的自动化。 EC…...

The Yarn application application_xxx_xxx doesn‘t exist in RM

本文主要解决flink在standalone模式下,flink run却一直使用yarn-session模式的问题。 问题 有个客户找到笔者,问题是报错如下: 分析 笔者先从环境入手,首先要确定的是flink是使用了什么模式。确认过后是使用standalone模式。 那就很奇怪&a…...

elasticsearch介绍和部署

1 elasticsearch介绍 Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。可以很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性。Elasticsearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasticsea…...

Flutter之使用mqtt进行连接和信息传输的使用案例

目录 引言 什么是MQTT? 在Flutter中使用MQTT 安装 iOS 安卓 创建一个全局的客户端对象 配置客户端对象 连接(异步) 监听接受的消息 发送消息 监听连接状态和订阅的回调 引言 随着移动应用开发技术的发展,实时通信成为…...

汽车HiL测试:利用TS-GNSS模拟器掌握硬件性能的仿真艺术

一、汽车HiL测试的概念 硬件在环(Hardware-in-the-Loop,简称HiL)仿真测试,是模型基于设计(Model-Based Design,简称MBD)验证流程中的一个关键环节。该步骤至关重要,因为它整合了实际…...

Spring Cloud AWS 实战教程:构建高可用 SQS 消息队列应用 [特殊字符]

Spring Cloud AWS 实战教程:构建高可用 SQS 消息队列应用 🚀 【免费下载链接】spring-cloud-aws The New Home for Spring Cloud AWS 项目地址: https://gitcode.com/gh_mirrors/sp/spring-cloud-aws Spring Cloud AWS 是一个强大的开源框架&…...

Sentinel-3B OLCI 3 级全球分箱地球观测降分辨率(ERR)叶绿素(CHL)数据,版本 2022.0

Sentinel-3B OLCI Level-3 Global Binned Earth-observation Reduced Resolution (ERR) Chlorophyll (CHL) Data, version 2022.0 简介 叶绿素 a 数据集提供全球网格化的表层叶绿素 a 浓度(浮游植物生物量的替代指标)合成数据。CHL 支持时间序列和气候…...

别再手动改路径了!用LabVIEW + MATLAB Script做自动化测试,这份环境配置指南让你效率翻倍

LabVIEW与MATLAB深度整合:构建自动化测试系统的工程实践指南在工业自动化与测试测量领域,LabVIEW和MATLAB的组合堪称黄金搭档。LabVIEW擅长硬件接口和实时控制,而MATLAB在算法开发和数据分析方面具有无可比拟的优势。本文将深入探讨如何将两者…...

skills CANN开源社区贡献技能包开发指南

前言 开源社区的健康运转,不仅依赖核心代码的贡献,还需要降低贡献门槛、提供清晰的指南和自动化工具。skills仓库是CANN开源社区的"贡献技能包",提供了一系列辅助脚本、代码模板、CI检查和文档生成工具,帮助新手快速上…...

Veo 2提示词性能瓶颈诊断:基于1726组AB测试的token敏感度热力图与阈值红线预警

更多请点击: https://kaifayun.com 第一章:Veo 2提示词编写最佳实践总览 Veo 2 是 Google 推出的高性能视频生成模型,其对提示词(prompt)的语义精度、结构清晰度和上下文控制能力高度敏感。高质量提示词并非简单堆砌关…...

简单学习 --> SSE

我们使用AI时,AI对我们说的话不会一次性把全部内容弹出来,而是会像流水一样,一点点吐出来,那么这种丝滑的交互体验,背后的核心就是 SSE (Server-Sent Events)。 什么是 SSE? SSE(Server-Sent …...

大模型测试新范式:Claude端到端验证的5层断言体系(语义一致性/上下文连贯性/安全边界/成本阈值/时序鲁棒性)

更多请点击: https://codechina.net 第一章:大模型测试新范式:Claude端到端验证的5层断言体系(语义一致性/上下文连贯性/安全边界/成本阈值/时序鲁棒性) 传统LLM测试常聚焦于准确率或BLEU等静态指标,而Cla…...

低空旅游观光与低空通勤(eVTOL)运营管理与服务保障平台建设方案

本方案旨在为eVTOL载具构建集运营管理、空中交通管制、安全保障与乘客服务于一体的数字化平台。通过微服务架构、5G-A融合感知、空域网格化与零信任安全等核心技术,解决高密度飞行中的资源调度与安全冲突问题。目标实现毫秒级冲突解算与15分钟内快速周转&#xff0c…...

CANN runtime:昇腾NPU 运行时的职责边界

个人主页:ujainu 文章目录前言为什么需要运行时这一层runtime管什么,不管什么Stream:并行的基本调度单位Event:跨Stream的同步锚点内存池化:少一次malloc就少一次卡顿任务队列:从计算图到硬件指令的最后一跳…...

关于内卷,几个值得深想的洞察

首先声明:这篇不劝躺平,也不教内卷——只是想说清楚,你到底在一个什么样的游戏里。 你以为内卷是“资源不足”,其实是“分配方式” 很多人对内卷有个本质上的认知错误:以为内卷是因为资源不够,大家为了抢资…...