当前位置: 首页 > article >正文

正向KL散度、反向KL散度、对称KL散度

KL散度是变分推断和信息论中的核心概念。KL散度基础KL散度Kullback-Leibler Divergence衡量两个概率分布PPP和QQQ之间的差异定义为DKL(P∥Q)∫p(x)log⁡p(x)q(x)dxEx∼P[log⁡p(x)q(x)]D_{KL}(P \parallel Q) \int p(x) \log \frac{p(x)}{q(x)} dx \mathbb{E}_{x \sim P}\left[\log \frac{p(x)}{q(x)}\right]DKL​(P∥Q)∫p(x)logq(x)p(x)​dxEx∼P​[logq(x)p(x)​]KL散度不是对称的DKL(P∥Q)≠DKL(Q∥P)D_{KL}(P \parallel Q) \neq D_{KL}(Q \parallel P)DKL​(P∥Q)DKL​(Q∥P)这引出了两种不同方向的变体。1. 正向KL散度Forward KL定义DKL(P∥Q)Ex∼P[log⁡p(x)q(x)]D_{KL}(P \parallel Q) \mathbb{E}_{x \sim P}\left[\log \frac{p(x)}{q(x)}\right]DKL​(P∥Q)Ex∼P​[logq(x)p(x)​]别名Inclusive KL包容性KLMoment-matching矩匹配I-projection信息投影核心特性特性说明期望采样从真实分布PPP采样优化目标在PPP有质量的地方QQQ必须有质量零避免P(x)0P(x) 0P(x)0时要求Q(x)0Q(x) 0Q(x)0行为模式覆盖模式Covering Mode这意味着 Q 必须覆盖所有 P 有概率的区域【mass-covering】不能漏掉任何模式【zero-avoiding】否则 KL散度就会无限大。反过来对于P(x)0但Q(x)0的区域正向KL惩罚很小。所以 Q 可以在 P 支撑集外随意取值只要不牺牲对 P 内部的拟合。直观理解正向KL要求QQQ覆盖PPP的所有支持区域。如果PPP在某处有概率质量QQQ也必须在那里有质量否则会产生无穷大的惩罚log⁡p0∞\log \frac{p}{0} \inftylog0p​∞。变分推断中的应用在变分自编码器VAE的标准形式中使用LELBOEq(z∣x)[log⁡p(x∣z)]−DKL(q(z∣x)∥p(z))\mathcal{L}_{ELBO} \mathbb{E}_{q(z|x)}[\log p(x|z)] - D_{KL}(q(z|x) \parallel p(z))LELBO​Eq(z∣x)​[logp(x∣z)]−DKL​(q(z∣x)∥p(z))这里用正向KL约束后验q(z∣x)q(z|x)q(z∣x)接近先验p(z)p(z)p(z)导致q(z∣x)q(z|x)q(z∣x)倾向于覆盖先验的全部区域。正向 KL 散度具有“zero forcing”的特性这种逼近方式对于模型外推性要求高的任务非常重要。2. 反向KL散度Reverse KL定义DKL(Q∥P)Ex∼Q[log⁡q(x)p(x)]D_{KL}(Q \parallel P) \mathbb{E}_{x \sim Q}\left[\log \frac{q(x)}{p(x)}\right]DKL​(Q∥P)Ex∼Q​[logp(x)q(x)​]别名Exclusive KL排他性KLMode-seeking模态寻找M-projection矩投影核心特性特性说明期望采样从近似分布QQQ采样优化目标在QQQ有质量的地方PPP必须有质量零允许QQQ可以在PPP为零的地方为零行为模式模态寻找模式Mode-Seeking Modezero-forcing特性它会强迫 Q 在 P 概率密度低的地方取零值从而 Q 的支撑集是 P 支撑集的子集。这对于外推性要求高的任务非常重要因为模型不会在未见过的输入区域随意给出高概率避免过度自信的外推。外推性要求高的任务例如在训练数据分布之外进行预测如物理模拟、风险建模、序列预测等需要模型保持保守当输入远离训练数据时模型应该输出低置信度或接近先验而不是给出高概率的猜测。如果使用 mass-covering正向 KL覆盖所有模式近似分布 Q 会在 P 的支撑集外也分配一些概率这可能导致在外推区域给出非零甚至较大的概率值造成“过度外推”。如果使用 zero-forcing反向 KLQ 在 P 概率极低的区域会被强迫置零因此对于训练分布以外的输入模型会输出非常低的概率或高不确定性。这符合安全外推的需求不知道就是不知道不要瞎猜。直观理解反向KL允许QQQ忽略PPP的某些模态。只要QQQ放置质量的地方PPP也有质量即可QQQ可以只拟合PPP的某一个或几个主要模态。典型应用生成对抗网络GAN隐式最小化DKL(pdata∥pmodel)D_{KL}(p_{data} \parallel p_{model})DKL​(pdata​∥pmodel​)的变体变分推断中的IWAE重要性加权自编码器强化学习策略优化中的TRPO/PPO算法3. 对称KL散度Symmetric KL / Jeffreys Divergence定义为了克服KL散度的不对称性定义对称版本J(P,Q)DKL(P∥Q)DKL(Q∥P)\mathcal{J}(P, Q) D_{KL}(P \parallel Q) D_{KL}(Q \parallel P)J(P,Q)DKL​(P∥Q)DKL​(Q∥P)∫(p(x)−q(x))log⁡p(x)q(x)dx \int (p(x) - q(x)) \log \frac{p(x)}{q(x)} dx∫(p(x)−q(x))logq(x)p(x)​dx别名Jeffreys散度Jeffreys DivergenceJ散度双向KL核心特性特性说明对称性J(P,Q)J(Q,P)\mathcal{J}(P, Q) \mathcal{J}(Q, P)J(P,Q)J(Q,P)✓惩罚强度对差异的双向惩罚数学形式结合了覆盖和模态寻找的特性计算成本需要计算两个方向的KL应用场景统计检验作为距离度量更公平分布对齐需要双向约束的任务最优传输与Wasserstein距离的替代方案三种KL散度的对比图示左反向KL右正向KLVAE用正向KL → 潜在空间要覆盖所有可能的编码GAN用反向KL → 生成器只关注生成最逼真的样本一个模态关键差异总结维度正向KLDKL(P∥Q)D_{KL}(P\parallel Q)DKL​(P∥Q)反向KLDKL(Q∥P)D_{KL}(Q\parallel P)DKL​(Q∥P)对称KLJ(P,Q)\mathcal{J}(P,Q)J(P,Q)采样来源真实分布PPP近似分布QQQ两者都需要零惩罚QQQ不能为零P0P0P0处PPP不能为零Q0Q0Q0处双向约束典型行为覆盖所有模态锁定单一模态折中方案方差特性高估方差低估方差适中估计优化难度通常更易优化可能更稳定计算成本高主要应用VAE, 变分推断GAN, 模式寻找统计距离度量实际选择指南需要完整分布表示→ 使用正向KL如VAE的潜在空间学习需要高质量样本→ 使用反向KL如GAN生成清晰图像需要公平距离度量→ 使用对称KL或考虑Wasserstein距离多模态分布→ 正向KL避免模态坍塌反向KL可能丢失模态这三种KL散度的选择直接决定了概率模型是追求全面覆盖还是精确拟合是生成模型和推断算法设计的核心考量。附录补充信息变分推断变分推断是一种用于近似复杂概率模型中无法直接计算的后验分布的机器学习方法。当我们根据观测数据去推断未知变量比如模型参数的概率分布时根据贝叶斯公式这个后验分布的计算往往涉及高维积分在数学上难以处理或计算量极大。变分推断的做法是从一组已知的、简单的分布族中挑选一个最接近真实后验分布的分布来作为近似。它的核心思想可以概括为三步1.设定一个候选分布族比如高斯分布族。这个分布族形式上简单、易于计算。2.定义一个衡量两个分布接近程度的指标。通常使用KL散度Kullback-Leibler divergence它衡量了候选分布与真实后验分布之间的差异。3.通过优化找到最优候选分布。调整候选分布的参数使其与真实后验分布的KL散度最小化。这个优化过程通常利用证据下界来间接进行。

相关文章:

正向KL散度、反向KL散度、对称KL散度

KL散度是变分推断和信息论中的核心概念。 KL散度基础 KL散度(Kullback-Leibler Divergence) 衡量两个概率分布 PPP 和 QQQ 之间的差异,定义为: DKL(P∥Q)∫p(x)log⁡p(x)q(x)dxEx∼P[log⁡p(x)q(x)]D_{KL}(P \parallel Q) \int p…...

ESP32内存不够用?别急着换芯片,试试在menuconfig里关掉这两个WiFi选项

ESP32内存优化实战:关闭WiFi加速选项释放IRAM空间 当你在开发一个集成了WiFi和蓝牙功能的ESP32智能网关时,突然遭遇这样的编译错误:"IRAM0 segment data does not fit. region iram0_0_seg overflowed by 3924 bytes",这…...

Cursor Free VIP:打破AI编程工具的付费墙,让每个开发者都能免费使用Pro功能

Cursor Free VIP:打破AI编程工具的付费墙,让每个开发者都能免费使用Pro功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用P…...

海洋遥感论文中常说的:in-situ数据和proxy

一、什么是 in-situ 数据 in-situ 是拉丁语,意思是:在原位、在现场所以在海洋环境研究里,in-situ data 指的是:在真实海域现场直接测到的数据例子 比如研究人员在海上采样、布设浮标、现场监测,测出来的:叶…...

AKShare金融数据获取指南:新手也能轻松获取股票历史数据

AKShare金融数据获取指南:新手也能轻松获取股票历史数据 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirrors/aks/…...

网络安全视角:图片旋转判断模型的对抗攻击

网络安全视角:图片旋转判断模型的对抗攻击 1. 引言 在当今数字化时代,图片旋转判断模型已经成为许多应用的核心组件,从社交媒体自动旋转照片到文档扫描应用的自动校正功能。然而,这些看似简单的模型背后隐藏着严重的安全隐患。本…...

商家如何根据IP归属地工具做差异化服务?

在全球化电商和本地化服务的浪潮中,商家面临的共同痛点是:不同地区的用户需求差异巨大,提供一刀切的页面和服务,往往导致转化率低下。研究表明,近70%的中国用户更愿意响应与自身地理位置相关的营销内容。而IP归属地工具…...

雷电模拟器+Android5.0环境下的APK抓包实战(附Fiddler证书安装避坑指南)

雷电模拟器Android5.0环境下的APK抓包实战(附Fiddler证书安装避坑指南) 在移动应用安全分析领域,流量抓包是最基础也最关键的技能之一。不同于高版本Android系统的复杂证书管理机制,Android5.0环境以其简化的证书安装流程和稳定的…...

仪表盘管理化技术数据可视化与交互设计

仪表盘管理化技术:数据可视化与交互设计的智慧引擎 在数字化转型浪潮中,仪表盘管理化技术已成为企业决策的核心工具。通过将复杂数据转化为直观图表,并结合交互设计,它帮助用户快速捕捉关键信息,优化业务流程。无论是…...

从校园到职场:一位测试新人的海康威视面试全记录与心得拆解

1. 从校园到职场:我的海康威视测试岗面试全记录 去年秋天,我作为一名应届毕业生参加了海康威视的测试岗位面试。整个过程从技术一面到HR面,让我深刻体会到校园与职场的差异。记得收到面试通知时,我既兴奋又紧张——兴奋的是有机会…...

如何一键获取Steam游戏完整清单:终极免费解决方案

如何一键获取Steam游戏完整清单:终极免费解决方案 【免费下载链接】Onekey Onekey Steam Depot Manifest Downloader 项目地址: https://gitcode.com/gh_mirrors/one/Onekey 想要轻松管理你的Steam游戏库,却苦于复杂的文件清单获取流程&#xff1…...

Netflix团队揭秘:AI如何让视频编辑“预测未来“

视频编辑的世界即将迎来一场前所未有的变革。Netflix公司联合索菲亚大学圣克里门特奥赫里德斯基分校INSAIT研究所的科研团队,在2026年4月3日发布了一项突破性研究成果,这项名为"VOID: Video Object and Interaction Deletion"的技术论文详细阐…...

EmbeddingGemma-300m新手必看:快速部署文本分类模型

EmbeddingGemma-300m新手必看:快速部署文本分类模型 1. 从零开始:认识EmbeddingGemma-300m 如果你正在寻找一个既轻量又强大的文本嵌入模型,EmbeddingGemma-300m绝对值得你花时间了解。这个由谷歌开源的模型,虽然只有3亿参数&am…...

如何用Video2X轻松实现视频画质无损放大:AI视频增强的完整指南

如何用Video2X轻松实现视频画质无损放大:AI视频增强的完整指南 【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/…...

一键解锁蓝奏云高速下载:LanzouAPI直链解析方案深度解析

一键解锁蓝奏云高速下载:LanzouAPI直链解析方案深度解析 【免费下载链接】LanzouAPI 蓝奏云直链,蓝奏api,蓝奏解析,蓝奏云解析API,蓝奏云带密码解析 项目地址: https://gitcode.com/gh_mirrors/la/LanzouAPI 还…...

POSTECH团队突破视频生成瓶颈:用虚拟数据教AI生成现实中的动作

这项由韩国浦项科技大学(POSTECH)联合微软亚洲研究院完成的研究,发表于2024年4月的计算机视觉顶会,论文编号为arXiv:2604.01666v1。该研究解决了一个让视频生成领域头疼已久的问题:如何让AI生成那些在现实中极其罕见但…...

保姆级教程:用Unity 2017.4.2f2为Android App添加可拖拽的3D桌面宠物(附完整源码)

从零构建Android悬浮3D宠物:Unity 2017.4.2f2全流程实战 在移动应用生态中,增强用户粘性的小设计往往能带来意想不到的效果。最近接触到一个需求:为社交类App添加可交互的3D桌面宠物,类似早年PC端的QQ宠物,但需要支持全…...

Illustrator脚本合集:10个免费工具让你的设计效率翻倍

Illustrator脚本合集:10个免费工具让你的设计效率翻倍 【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 你是否厌倦了在Adobe Illustrator中重复执行繁琐的操作&#xff1…...

ESP32-CAM搭配云服务器,三步实现外网远程监控

1. 环境准备与硬件连接 想要实现ESP32-CAM的外网远程监控,首先得把基础环境搭建好。我去年给工作室装这套系统时,发现很多人卡在第一步的硬件连接上。ESP32-CAM模块上有两个关键接口:一个是摄像头排线插座,一个是串口烧录接口。排…...

别再只跑Demo了!用AISHELL-1数据集给你的FunASR模型做个‘体检’(附完整测试脚本)

从Demo到实战:用AISHELL-1为FunASR模型打造专业级测试方案 在语音识别技术快速迭代的今天,许多开发者虽然能够成功部署模型,却往往止步于简单的Demo演示,缺乏对模型真实性能的系统评估。这种"Demo即终点"的现象&#xf…...

Nuxt 3项目从零到生产:一站式搭建与高效部署实战

1. Nuxt 3项目环境准备与初始化 最近在帮朋友搭建一个电商网站时,我选择了Nuxt 3作为前端框架。不得不说,相比Nuxt 2,Nuxt 3在开发体验和性能上都有显著提升。但刚开始配置环境时,我也踩了不少坑,这里分享下我的经验。…...

Tab-Resize终极指南:如何轻松实现浏览器分屏布局

Tab-Resize终极指南:如何轻松实现浏览器分屏布局 【免费下载链接】tab-resize Split Screen made easy. Resize the CURRENT tab and tabs to the RIGHT into layouts on separate Windows. w/ Multi-monitor Support 项目地址: https://gitcode.com/gh_mirrors/t…...

静息态功能磁共振成像(rs-fMRI)数据处理实战:从人脑图谱构建到动物模型分析

1. rs-fMRI数据处理全流程解析 静息态功能磁共振成像(rs-fMRI)是研究大脑自发神经活动的重要工具。与任务态fMRI不同,rs-fMRI不需要受试者执行特定任务,只需保持安静状态即可。这种技术特别适合研究抑郁症等精神疾病,因…...

亚马逊人的mbti来了?测出结果真令人哭笑不得!

做亚马逊久了,总好奇身边同行都是什么 “路子”—— 有人是数据控,算利润算到小数点后两位; 有人凭直觉选品,偏偏总能踩中蓝海; 有人社牛到站外红人随便聊,也有人只想安静守链接不被打扰。 抱着好玩、图一…...

从课堂到实战:手把手教你用AT89C51和LCD1602做一个能调时间的电子钟(附Proteus仿真)

从零构建AT89C51电子钟:模块化编程与Proteus仿真全指南 当你第一次看到LCD屏幕上跳动的数字准确显示时分秒,那种亲手创造"时间"的成就感,是学习单片机最迷人的瞬间。这个基于AT89C51的电子钟项目,正是为刚入门嵌入式开发…...

手把手教你用Wireshark解密TLS流量(附SSLkey.log实战案例)

从零掌握Wireshark解密TLS流量的完整指南 当你在进行网络安全分析或参加CTF比赛时,经常会遇到需要分析加密网络流量的情况。HTTPS作为当前最主流的加密传输协议,其流量通常使用TLS/SSL加密,这给安全分析带来了挑战。本文将带你深入理解TLS解密…...

MCP服务深度解析—MySQL数据库操作实战指南

1. MCP协议与MySQL的完美结合 第一次听说MCP协议时,我正被各种数据库接口搞得焦头烂额。那感觉就像每次换手机都要重新买充电线一样烦人。MCP的出现彻底改变了这种局面,它就像数据库世界的"万能充电器",让MySQL操作变得前所未有的…...

计算机网络差错控制技术全解析:从奇偶校验到CRC的实战应用

1. 为什么我们需要差错控制技术? 想象一下你正在给朋友发送一条重要消息:"明天下午3点会议室见"。如果传输过程中某个比特位发生了翻转,比如"3"变成了"1",结果变成了"明天下午1点会议室见&quo…...

伸缩数据线充电宝:倍思灵动充让年轻人的出行,不再有“线”制

当代年轻人对充电宝的期待,早已超越“能充电”本身。在快节奏的移动场景中,他们追求的是“不打结、不缠绕、不占地方”的简洁体验。而伸缩数据线充电宝的出现,恰好击中了这一需求痛点。倍思推出的灵动充伸缩线充电宝,则是这一趋势下的典型代表。它凭借“轻量化出行”和“可靠耐…...

tsMuxer视频封装技术解析:无损转码与蓝光兼容性优化方案

tsMuxer视频封装技术解析:无损转码与蓝光兼容性优化方案 【免费下载链接】tsMuxer tsMuxer is a transport stream muxer for remuxing/muxing elementary streams, EVO/VOB/MPG, MKV/MKA, MP4/MOV, TS, M2TS to TS to M2TS. Supported video codecs H.264/AVC, H.2…...