当前位置：首页 > news >正文

【数据分析】(交互) 延迟互信息（熵、概率密度、高斯核、带宽估计）

news 2026/2/9 22:04:30

文章目录

一、互信息基础
二、延迟互信息
- 2.1 交互延迟互信息
三、时间序列互信息中的概率计算（高斯核密度估计）
四、python 示例
补充 1：熵
- 熵的定义
- 熵的性质
- 熵的单位和对数底数
- 熵的最大值
- 高熵、低熵的分辨
补充 2：概率密度和高斯核
- 概率密度
- 高斯核
拓展3 ：核密度函数带宽估计

在信息理论和时间序列分析中，研究变量之间的相互依赖性和信息流动是理解复杂系统行为的关键。

交互延迟互信息（Interactive Delayed Mutual Information, IDMI）是一种用于量化两个时间序列之间相互依赖关系的方法，它结合了互信息和时间延迟的概念，能够捕捉系统中不同时间点的依赖性。

一、互信息基础

互信息（Mutual Information, MI）是量化两个随机变量之间相互依赖性的度量，能够捕捉非线性依赖关系。

互信息是一种已知一个变量的情况下，另一个变量不确定性减少的度量。互信息越大，相互影响越紧密（这里也体现了概率、熵的概念）。举例：变量A表示骰子点数的奇偶性（假设0是奇数，1是偶数），变量B是骰子点数，知道变量B取值为6时，变量A的不确定性减少了（A是1）。

对于两个离散随机变量 $X$ 和 $Y$ ，互信息定义为：

$\sum_{x \in X} \sum_{y \in Y} p(x, y) \log \left(\frac{p(x, y)}{p(x)p(y)}\right)$

其中：

$p (x, y)$ 是 $X = x$ 和 $Y = y$ 时的联合概率分布（即两个事件同时发生的概率）。
$p (x)$ 和 $p (y)$ 分别是 $X$ 和 $Y$ 的边缘概率分布（即只考虑一个变量，另一个任意取值）。

$p (x, y) = p (x) * p (y)$ 是否成立：

如果x、y是独立的变量，上式成立。互信息表达式中的对数值就是 $l o g (1) = 0$ ，也就是两个独立变量的互信息为0。
如果x、y不独立，上式不成立。这时候就要使用条件概率了， $p (x, y) = p (x) * p (y ∣ x)$ ，即x、y同时发生的概率等于x发生的概率乘以x发生的前提下y发生的概率，这很好理解。

互信息也可以表示为熵的差值形式：

$I (X; Y) = H (X) + H (Y) - H (X, Y)$

这里， $H (X)$ 和 $H (Y)$ 分别是 $X$ 和 $Y$ 的熵， $H (X, Y)$ 是联合熵。

熵的定义为：

$-\sum_{x \in X} p(x) \log p(x)$

熵的概念见本文补充章节。 上面的公式很好推导的，对数变成减法就行了，以及 $\sum_{y_j} P(X = x_i, Y = y_j) = P(X_i)$ 。

二、延迟互信息

对于时间序列，通常需要考虑时间上的延迟效应。延迟互信息（Delayed Mutual Information, DMI）扩展了互信息的概念，量化了两个时间序列在不同时间延迟下的依赖关系。给定时间序列 $X_t$ 和 $Y_t$ ，延迟互信息定义为：

$I_\tau(X_t; Y_{t+\tau}) = I(X_t; Y_{t+\tau})$

该公式表示在时间点 $t$ 上的 $X_t$ 与在时间点 $\tau$ 上的 $Y_{t+\tau}$ 之间的互信息。

延迟互信息的计算步骤如下：

计算联合概率分布：根据时间延迟 $\tau$ ，计算 $X_t$ 和 $Y_{t+\tau}$ 的联合概率分布 $p(X_t, Y_{t+\tau})$ 。
计算边缘概率分布：分别计算 $X_t$ 的边缘概率分布 $p(X_t)$ 和 $Y_{t+\tau}$ 的边缘概率分布 $p(Y_{t+\tau})$ 。
计算互信息：使用互信息的定义公式计算 $I_\tau(X_t; Y_{t+\tau})$ 。

举例：

原来：
X： 1 2 3 4 5 6 7 8 9
Y： 1 2 3 4 5 6 7 8 9
计算X滞后阶数为2时X和Y的延迟互信息，就是计算：
X'：3 4 5 6 7 8 9
Y'：1 2 3 4 5 6 7 8 9
之间的互信息
序列长的需要截掉多余的部分，最终即计算：
X''：3 4 5 6 7 8 9
Y''：1 2 3 4 5 6 7 
之间的互信息

2.1 交互延迟互信息

交互延迟互信息（IDMI）进一步扩展了延迟互信息的概念，通过在多个时间尺度上计算和整合延迟互信息，得到一个综合的依赖度量。

其基本思想是分析两个时间序列在多个时间延迟和时间尺度下的交互作用。

设定一组时间延迟 $\tau_i$ 和时间尺度 $s_j$ ，IDMI 可以表示为：

$IDMI(X_t, Y_t) = \sum_{j} \sum_{i} w_{ij} I_{\tau_i}(X_t^{(s_j)}; Y_{t+\tau_i}^{(s_j)})$

【数据分析】(交互) 延迟互信息（熵、概率密度、高斯核、带宽估计）

文章目录

一、互信息基础

二、延迟互信息

2.1 交互延迟互信息

相关文章：

【数据分析】(交互) 延迟互信息（熵、概率密度、高斯核、带宽估计）

html转vue项目

.NET系列定时器

【Golang】火焰图空白部分是什么？

Web框架 --- 解析Web请求 [FromBody] [FromQuery] [FromRoute] [FromHeader]

Messari 摘要报告：Covalent Network（CXT）2024 Q2 品牌重塑、AI模块化数据、亚太地区扩展、代币回购计划和网络增长

Open3D 计算点云的面状指数

python下麦克风设备选择和录音

云和集群有什么区别？

无人机视角下的EasyCVR视频汇聚管理：构建全方位、智能化的AI视频监控网络

数字影像技术是如何改变我们看待世界的方式呢？

Chainlit实现启动页面选择不同的LLM启动器等设置界面

SQL - 增、改、删

怎么屏蔽电脑监控软件？企业管理者的智慧选择——精准定位，合理屏蔽，让监控软件成为助力而非障碍！

Linux·权限与工具-make

C++的序列容器——数组

TCC 和 XA 协议之间的区别？

萌啦数据插件使用情况分析，萌啦数据插件下载

C++初学（13）

目标检测之数据增强

Xshell远程连接Kali（默认 | 私钥）Note版

边缘计算医疗风险自查APP开发方案

c++ 面试题(1)-----深度优先搜索（DFS）实现

什么是库存周转？如何用进销存系统提高库存周转率？

高危文件识别的常用算法：原理、应用与企业场景

python如何将word的doc另存为docx

【JavaSE】绘图与事件入门学习笔记

PostgreSQL——环境搭建

uniapp 实现腾讯云IM群文件上传下载功能

MFE(微前端) Module Federation：Webpack.config.js文件中每个属性的含义解释