当前位置: 首页 > news >正文

【自信息、信息熵、联合熵、条件熵、互信息】

文章目录

  • 一、自信息 I(X)
  • 二、信息熵:衡量系统的混乱程度
    • 信息熵 H(X)
    • 联合熵 H(X,Y)
  • 三、条件熵H(Y|X) = 联合熵H(X,Y) - 信息熵H(X)
  • 四、互信息 I(X,Y)
  • 五、总结
  • References

一、自信息 I(X)

自信息(Self-information) 是由香农提出的,用来衡量单一事件发生时所包含的信息量的多寡,单位是bit或nats。

就是说,自信息表示某一事件发生时所带来的信息量的多少,当事件发生的概率越大,其自信息就越小,反之亦然。

数学定义

自信息定义为时间发生的概率的负对数。 具体来说,设事件 x i x_i xi 发生的概率为 p ( x i ) p(x_i) p(xi),则该事件的自信息量 I ( x i ) I(x_i) I(xi) 定义为:
I ( x i ) = − log ⁡ 2 p ( x i ) I(x_i) = - \log_2 p(x_i) I(xi)=log2p(xi)

函数对应的图像表示如下图所示,其中 p p p 表示事件发生的概率。

在这里插入图片描述

自信息的含义、性质和应用

  • 小概率事件提供更多的信息:小概率事件发生时,提供的信息量较大;大概率事件发生时,提供的信息量较小。
  • 不确定性与信息量:自信息表示事件发生前的不确定性和事件发生后提供的信息量。小概率事件发生前的不确定性大,发生后提供的信息量大;大概率事件则相反。
  • 自信息与互信息的关系:互信息是已知一个事件后另一个事件的不确定性减少的量。互信息可以表示为两个事件的自信息之差。

二、信息熵:衡量系统的混乱程度

自信息描述的是随机变量的某个事件发生所带来的的信息量,而信息熵通常用来描述整个随机分布所带来的信息量,更具有统计特性。

信息熵也叫香农熵,代表一个系统中信息量的总和。信息量总和越大,表明这个系统的不确定性就越大。

信息熵 H(X)

信息熵定义为对所有可能事件所带来的信息量求期望

一个随机变量 X X X 的熵 H ( x ) H(x) H(x) 定义为:

H ( X ) = E x ∼ p [ I ( x ) ] = − E x ∼ p [ log ⁡ p ( x ) ] = − ∑ x p ( x ) log ⁡ p ( x ) = − ∫ x p ( x ) log ⁡ p ( x ) d x \begin{aligned} H(X) &= E_{x \sim p}[I(x)]=-E_{x \sim p}[\log p(x)]\\ &=-\sum_x p(x)\log p(x)\\ &=-\int_x p(x) \log p(x)dx \end{aligned} H(X)=Exp[I(x)]=Exp[logp(x)]=xp(x)logp(x)=xp(x)logp(x)dx

信息熵是各项自信息的累加值。在同样的定义域内,熵的关系为脉冲分布信息熵<高斯分布信息熵<均匀分布信息熵。可以通过数学证明,当随机变量分布为均匀分布时即状态数最多时,熵最大。熵代表了随机分布的混乱程度。

联合熵 H(X,Y)

推广至多维随机变量的联合分布,对于服从联合分布为 p ( x , y ) p(x,y) p(x,y) 的一对离散随机变量 ( X , Y ) (X,Y) (X,Y),其联合信息熵为:
H ( X , Y ) = − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) H(X,Y)=-\sum_{x,y} p(x,y) \log p(x,y) H(X,Y)=x,yp(x,y)logp(x,y)

三、条件熵H(Y|X) = 联合熵H(X,Y) - 信息熵H(X)

条件熵的定义为:在 X X X 给定条件下, Y Y Y 的条件概率分布的熵对 X X X 的数学期望。
H ( Y ∣ X ) = E x ∼ p [ H ( Y ∣ X = x ) ] = ∑ x p ( x ) H ( Y ∣ X = x ) = − ∑ x p ( x ) ∑ y p ( y ∣ x ) log ⁡ p ( y ∣ x ) = − ∑ x ∑ y p ( x , y ) log ⁡ ( y ∣ x ) = − ∑ x , y p ( x , y ) log ⁡ p ( y ∣ x ) \begin{aligned} H(Y|X)&=E_{x \sim p}[H(Y|X=x)]\\ &=\sum_{x} p(x) H(Y|X=x)\\ &=-\sum_x p(x) \sum_y p(y|x) \log p(y|x)\\ &=-\sum_x \sum_y p(x,y) \log(y|x)\\ &=-\sum_{x,y} p(x,y) \log p(y|x) \end{aligned} H(YX)=Exp[H(YX=x)]=xp(x)H(YX=x)=xp(x)yp(yx)logp(yx)=xyp(x,y)log(yx)=x,yp(x,y)logp(yx)

条件熵 H ( Y ∣ X ) H(Y|X) H(YX) 等于联合熵 H ( X , Y ) H(X,Y) H(X,Y) 捡去信息熵 H ( X ) H(X) H(X),即 H ( Y ∣ X ) = H ( X , Y ) − H ( X ) H(Y|X) = H(X,Y) - H(X) H(YX)=H(X,Y)H(X)

证明如下:
H ( X , Y ) = − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) = − ∑ x , y p ( x , y ) log ⁡ ( p ( y ∣ x ) p ( x ) ) = − ∑ x , y p ( x , y ) log ⁡ p ( y ∣ x ) − ∑ x , y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x , y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x ∑ y p ( x , y ) log ⁡ p ( x ) = H ( Y ∣ X ) − ∑ x log ⁡ p ( x ) ∑ y p ( x , y ) = H ( Y ∣ X ) − ∑ x p ( x ) log ⁡ p ( x ) = H ( Y ∣ X ) − H ( X ) \begin{aligned} H(X,Y) &= -\sum_{x,y} p(x,y) \log p(x,y)\\ &=-\sum_{x,y} p(x,y) \log (p(y|x)p(x))\\ &=-\sum_{x,y}p(x,y) \log p(y|x)-\sum_{x,y} p(x,y) \log p(x)\\ &=H(Y|X) - \sum_{x,y} p(x,y) \log p(x)\\ &=H(Y|X) - \sum_x \sum_y p(x,y) \log p(x)\\ &=H(Y|X) - \sum_x \log p(x) \sum_y p(x,y)\\ &=H(Y|X) - \sum_x p(x) \log p(x)\\ &=H(Y|X) - H(X) \end{aligned} H(X,Y)=x,yp(x,y)logp(x,y)=x,yp(x,y)log(p(yx)p(x))=x,yp(x,y)logp(yx)x,yp(x,y)logp(x)=H(YX)x,yp(x,y)logp(x)=H(YX)xyp(x,y)logp(x)=H(YX)xlogp(x)yp(x,y)=H(YX)xp(x)logp(x)=H(YX)H(X)

四、互信息 I(X,Y)

互信息定义为一个随机变量由于已知另一个随机变量而减少的不确定性,或者说从贝叶斯角度考虑,由于新的观测数据y到来而导致x分布的不确定性下降程度

假设两个离散随机变量 X X X Y Y Y,他们的联合概率分布函数为 p ( x , y ) p(x,y) p(x,y),边缘概率分布函数分别为 p ( x ) p(x) p(x) p ( y ) p(y) p(y)。那么互信息 I ( X , Y ) I(X,Y) I(X,Y) 为联合分布 p ( x , y ) p(x,y) p(x,y) p ( x ) p ( y ) p(x)p(y) p(x)p(y) 之间的相对熵,即:
I ( X , Y ) = ∑ x ∑ y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) I(X,Y) = \sum_x \sum_y p(x,y)\log \frac{p(x,y)}{p(x)p(y)} I(X,Y)=xyp(x,y)logp(x)p(y)p(x,y)

连续随机变量的情形下,求和被替换成二重定积分:
I ( X , Y ) = ∫ Y ∫ X p ( x , y ) log ⁡ ( p ( x , y ) p ( x ) p ( y ) ) d x d y I(X,Y) = \int_Y \int_X p(x,y) \log(\frac{p(x,y)}{p(x)p(y)})dx dy I(X,Y)=YXp(x,y)log(p(x)p(y)p(x,y))dxdy

其中, p ( x , y ) p(x,y) p(x,y) X X X Y Y Y 的联合概率密度函数,而 p ( x ) p(x) p(x) p ( y ) p(y) p(y) 分别是 X X X Y Y Y 的边缘概率密度函数。

经过推导,互信息可以等价的表示成:
I ( X , Y ) = H ( X ) − H ( X ∣ Y ) = H ( Y ) − H ( Y ∣ X ) = H ( X ) + H ( Y ) − H ( X , Y ) = H ( X , Y ) − H ( X ∣ Y ) − H ( Y ∣ X ) \begin{aligned} I(X,Y) &= H(X) - H(X|Y)\\ &= H(Y) - H(Y|X) \\ &= H(X) + H(Y) - H(X,Y)\\ &= H(X,Y)-H(X|Y) - H(Y|X) \end{aligned} I(X,Y)=H(X)H(XY)=H(Y)H(YX)=H(X)+H(Y)H(X,Y)=H(X,Y)H(XY)H(YX)

直观上,互信息度量 X 和 Y 共享的信息:它度量知道这两个变量其中一个,对另一个不确定度减少的程度。例如,如果 X 和 Y 相互独立,则知道 X 不对 Y 提供任何信息,反之亦然,所以它们的互信息为零。在另一个极端,如果 X 是 Y 的一个确定性函数,且 Y 也是 X 的一个确定性函数,那么传递的所有信息被 X 和 Y 共享:知道 X 决定 Y 的值,反之亦然。因此,在此情形互信息与 Y(或 X)单独包含的不确定度相同,称作 Y(或 X)的熵。而且,这个互信息与 X 的熵和 Y 的熵相同。(这种情形的一个非常特殊的情况是当 X 和 Y 为相同随机变量时。)

此外,互信息是非负的,而且是对称的(即 I ( X , Y ) = I ( Y , X ) I(X,Y) = I(Y,X) I(X,Y)=I(Y,X))。

五、总结

对于随机变量 X X X Y Y Y ,他们的熵、联合熵、条件熵以及互信息之间的关系如图所示。

在这里插入图片描述


References

  1. 什么是「互信息」?
  2. 自信息和互信息、信息熵

相关文章:

【自信息、信息熵、联合熵、条件熵、互信息】

文章目录 一、自信息 I(X)二、信息熵&#xff1a;衡量系统的混乱程度信息熵 H(X)联合熵 H(X,Y) 三、条件熵H(Y|X) 联合熵H(X,Y) - 信息熵H(X)四、互信息 I(X,Y)五、总结References 一、自信息 I(X) 自信息(Self-information) 是由香农提出的&#xff0c;用来衡量单一事件发生…...

免费资源网站

记录一下 音效 爱给网制片帮素材...

C++--------继承

一、继承的基本概念 继承是 C 中的一个重要特性&#xff0c;它允许一个类&#xff08;派生类或子类&#xff09;继承另一个类&#xff08;基类或父类&#xff09;的属性和方法。这样可以实现代码的重用和建立类之间的层次关系。 #include <iostream>// 基类 class Base…...

Python PyMupdf 去除PDF文档中Watermark标识水印

通过PDF阅读或编辑工具&#xff0c;可在PDF中加入Watermark标识的PDF水印&#xff0c;如下图&#xff1a; 该类水印特点 这类型的水印&#xff0c;会在文件的字节流中出现/Watermark、EMC等标识&#xff0c;那么&#xff0c;我们可以通过改变文件字节内容&#xff0c;清理掉…...

改进爬山算法之四:概率爬山法(Probabilistic Hill Climbing,PHC)

概率爬山法(Probabilistic Hill Climbing,PHC)是一种局部搜索算法,它结合了随机性和贪婪搜索的特点,是对爬山算法(Hill Climbing Algorithm)的一种变体或扩展。与传统的爬山法不同,PHC不是总是选择最优的邻居作为下一步的移动,而是以一定的概率选择最优邻居,同时以一…...

解读DeepseekV3

本年度还剩几天&#xff0c;Deepseek就发布了这么值得惊喜的产品&#xff0c;我觉得是真正做AI&#xff0c;也喜欢AI同学&#xff0c;对这个魔幻的2024年12月&#xff0c;一定是未来多少年想起都能回忆起这波澜壮阔的岁月。 我见过的最省的GPT4o&#xff0c;Claude&#xff0c…...

【网络安全 | 漏洞挖掘】如何通过竞态条件发现账户接管漏洞

未经许可,不得转载。 文章目录 背景正文设置竞态条件实现漏洞背景 目标应用允许用户创建项目。这些项目中包含多个用户角色,每个角色权限不同(如所有者、管理员、成员管理者等)。用户可通过接受邀请来加入项目,而只有项目所有者才能通过输入邮箱将项目所有权转移给其他用…...

串口通信标准RS232、RS422、RS485有什么区别和不同

目录 第一个区别&#xff1a;硬件管脚接口定义不同&#xff1a; 第二个区别、工作方式不同 第三个区别、通信方式不同 第四个区别&#xff0c;逻辑特性不同 第五个区别、抗干扰性、传输距离和传输速率也不同 RS-232与RS-485对比 RS-422与RS-485对比 今天给大家分享的是&…...

win版ffmpeg的安装和操作

一、ffmpeg软件安装&#xff1a; ffmpeg是一个通过命令行将视频转化为图片的软件。 在浏览器搜索ffmpeg在官网里找到软件并下载&#xff08;不过官网很慢&#xff09;&#xff0c;建议用这个下载。 下载的文件是一个zip压缩包&#xff0c;将压缩包解压&#xff0c;有如下文件…...

力扣56. 合并区间

此题在技巧上需要掌握Lambda表达式&#xff0c;在 C 的 Lambda 表达式 中&#xff0c;[] 是 捕获列表&#xff08;capture list&#xff09;&#xff0c;用于指定 Lambda 表达式如何访问其外部作用域的变量。 [捕获列表](参数列表) -> 返回类型 {函数体 };• 捕获列表&…...

2024基于大模型的智能运维(附实践资料合集)

基于大模型的智能运维是指利用人工智能技术&#xff0c;特别是大模型技术&#xff0c;来提升IT运维的效率和质量。以下是一些关键点和实践案例&#xff1a; AIOps的发展&#xff1a;AIOps&#xff08;人工智能在IT运维领域的应用&#xff09;通过大数据分析和机器学习技术&…...

Android Java 版本的 MSAA OpenGL ES 多重采样

最近多次被小伙伴问到 OpenGL 多重采样&#xff0c;其实前面文章里多次讲过了&#xff0c;就是构建2个缓冲区&#xff0c;多重采样缓冲区和目标解析缓冲区。 代码流程 // Framebuffer IDs private int msaaFBO; private int msaaColorBuffer; private int msaaDepthBuffer;pr…...

YOLO11改进-注意力-引入自调制特征聚合模块SMFA

本篇文章将介绍一个新的改进机制——SMFA&#xff08;自调制特征聚合模块&#xff09;&#xff0c;并阐述如何将其应用于YOLOv11中&#xff0c;显著提升模型性能。随着深度学习在计算机视觉中的不断进展&#xff0c;目标检测任务也在快速发展。YOLO系列模型&#xff08;You Onl…...

VMware虚拟机安装银河麒麟操作系统KylinOS教程(超详细)

目录 引言1. 下载2. 安装 VMware2. 安装银河麒麟操作系统2.1 新建虚拟机2.2 安装操作系统2.3 网络配置 3. 安装VMTools 创作不易&#xff0c;禁止转载抄袭&#xff01;&#xff01;&#xff01;违者必究&#xff01;&#xff01;&#xff01; 创作不易&#xff0c;禁止转载抄袭…...

Elasticsearch-索引的批量操作

索引的批量操作 批量查询和批量增删改 批量查询 #批量查询 GET product/_search GET /_mget {"docs": [{"_index": "product","_id": 2},{"_index": "product","_id": 3}] }GET product/_mget {"…...

【Android】application@label 属性属性冲突报错

错误记录 What went wrong: Execution failed for task :app:processDebugMainManifest. > Manifest merger failed : Attribute applicationlabel value(string/app_name) from AndroidManifest.xml:8:9-41is also present at [:abslibrary] AndroidManifest.xml:25:9-47 v…...

手机发烫怎么解决?

在当今这个智能手机不离手的时代&#xff0c;手机发烫成了不少人头疼的问题。手机发烫不仅影响使用手感&#xff0c;长期过热还可能损害手机硬件、缩短电池寿命&#xff0c;甚至引发安全隐患。不过别担心&#xff0c;下面这些方法能帮你有效给手机 “降温”。 一、使用习惯方面…...

【Artificial Intelligence篇】AI 携手人类:共铸未来创作新纪元

引言&#xff1a; 随着科技的飞速发展&#xff0c;人工智能已逐渐渗透到各个领域&#xff0c;尤其是在创作领域&#xff0c;其与人类的合作展现出了前所未有的可能性和潜力。从艺术作品的生成到文学作品的创作&#xff0c;从复杂软件的开发到创新设计的构思&#xff0c;AI 正在…...

小米路由器开启SSH,配置阿里云ddns,开启外网访问SSH和WEB管理界面

文章目录 前言一、开启SSH二、配置阿里云ddns1.准备工作2.创建ddns脚本3.添加定时任务 三、开启外网访问SSH和WEB管理界面1、解除WEB管理页面访问限制2.手动添加防火墙端口转发规则&#xff0c;开启外网访问WEB管理和SSH 前言 例如&#xff1a;随着人工智能的不断发展&#xf…...

Go快速开发框架2.6.0版本更新内容快速了解

GoFly企业版框架2.6.0版本更新内容较多&#xff0c;为了大家能够快速了解&#xff0c;本文将把更新内容列出详细讲解。本次更新一段时间以来大伙反馈的问题&#xff0c;并且升级后台安全认证机制&#xff0c;增加了RBAC权限管理及系统操作日志等提升后台数据安全性。 更新明细…...

合规刚需下,游戏行业适合的内网通讯软件怎么选

一、背景 2026年&#xff0c;游戏行业在合规监管、信创推进与降本增效三重驱动下&#xff0c;内部协作与数据安全需求持续升级。《数据安全法》《网络安全法》对游戏企业研发代码、运营数据、用户信息的存储与传输提出明确合规要求&#xff0c;数据泄露、权限失控、协作低效等…...

Pixel Couplet Gen完整指南:从GitHub Fork到微信小程序上线的像素春联项目闭环

Pixel Couplet Gen完整指南&#xff1a;从GitHub Fork到微信小程序上线的像素春联项目闭环 1. 项目介绍与核心价值 Pixel Couplet Gen是一款融合AI技术与复古游戏美学的创新应用&#xff0c;它将传统春联创作带入了数字时代。这个项目最吸引人的特点是&#xff1a; 8-bit像素…...

ECDH算法避坑指南:OpenSSL和Node.js中的椭圆曲线参数选择

ECDH算法实战避坑指南&#xff1a;跨平台椭圆曲线参数选择与性能优化 在构建现代加密通信系统时&#xff0c;ECDH&#xff08;椭圆曲线迪菲-赫尔曼密钥交换&#xff09;算法因其高效性和安全性已成为TLS协议栈的核心组件。然而&#xff0c;当开发者需要在OpenSSL和Node.js等不同…...

跨平台兼容技术选型:轻量级Android应用Windows运行解决方案

跨平台兼容技术选型&#xff1a;轻量级Android应用Windows运行解决方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 在数字化办公与多设备协同的趋势下&#xff0c;…...

RAGFlow与Dify共存方案:同一台Win11机器如何用Docker隔离部署

RAGFlow与Dify共存方案&#xff1a;同一台Win11机器如何用Docker隔离部署 在AI应用开发领域&#xff0c;RAGFlow和Dify作为两款热门工具&#xff0c;分别擅长知识库构建和AI应用编排。许多开发者面临一个现实挑战&#xff1a;如何在本地开发环境中同时运行这两个系统&#xff1…...

OpenClaw+Qwen3-14b_int4_awq:自动化内容处理与发布流水线

OpenClawQwen3-14b_int4_awq&#xff1a;自动化内容处理与发布流水线 1. 为什么需要自动化内容流水线 作为一个长期与文字打交道的创作者&#xff0c;我每天要处理大量重复性工作&#xff1a;从各个渠道收集素材、整理成结构化内容、撰写初稿、调整格式、最后发布到不同平台。…...

2026届学术党必备的十大AI写作助手推荐榜单

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 知网AIGC检测服务的目的是辅助识别学术文本里由人工智能生成的内容&#xff0c;该技术凭借对…...

3分钟搞定Windows软件安装难题:winget-install终极解决方案

3分钟搞定Windows软件安装难题&#xff1a;winget-install终极解决方案 【免费下载链接】winget-install Install WinGet using PowerShell! Prerequisites automatically installed. Works on Windows 10/11 and Server 2019/2022. 项目地址: https://gitcode.com/gh_mirror…...

永磁同步电机多电机同步控制仿真:改进与对比的奇妙之旅

永磁同步电机多电机同步控制仿真&#xff0c;含改进对比在电机控制领域&#xff0c;永磁同步电机&#xff08;PMSM&#xff09;凭借其高效、节能等诸多优点&#xff0c;广泛应用于工业生产、电动汽车等多个重要领域。而当涉及多个永磁同步电机协同工作时&#xff0c;实现同步控…...

LCC-LCC无线充电恒流/恒压闭环移相控制仿真 Simulink仿真模型,LCC-LCC谐振...

LCC-LCC无线充电恒流/恒压闭环移相控制仿真 Simulink仿真模型&#xff0c;LCC-LCC谐振补偿拓扑&#xff0c;闭环移相控制 1. 输入直流电压350V&#xff0c;负载为切换电阻&#xff0c;分别为50-60-70Ω&#xff0c;最大功率3.4kW&#xff0c;最大效率为93.6% 2. 闭环PI控制&…...