当前位置：首页 > news >正文

非独立随机变量的概率上界估计

news 2026/2/10 2:24:08

目前的概率论或者随机变量书籍过分强调对独立随机变量的大数定律，中心极限定理，遗憾上界的估计。而对于非独立随机变量的研究很少，在《概率论的极限定理》中曾给出过一般随机变量求和的渐进分布簇的具体形式，然而形式却太过复杂。下面将以切比雪夫不等式为基本出发点，研究非独立情况下的随机变量均值的一个误差上界，为后面研究提供基础。

（非独立随机变量概率误差上界） 若对于随机变量 ${r_{t+1},r_{t+1},...,r_{t+n}\}$ ，存在 $D_{\max}\geq0$ 使得对于任意 $k$ ，有 $\mathbb{D}[r_{t+k}|H_k]\leq D_{\max}$ ，则有下面的式子成立，对于给定 $\varepsilon >0$ ：
$\mathbb{P}[|\frac{1}{n}\sum_{k=1}^nr_{t+k}-\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}|H_k]|>\varepsilon]\leq \frac{\mathbb{D}[\sum_{k=1}^nr_{t+k}|H_n]}{n^2\varepsilon^2}\\ =\frac{\sum_{k=1}^n\mathbb{D}[r_{t+k}|H_n]+\sum_{i=1}^n\sum_{j\ne i}^n[\mathbb{E}[r_{t+i}r_{t+j}|H_n]-\mathbb{E}[r_{t+i}|H_n]\mathbb{E}[r_{t+j}|H_n]}{n^2\varepsilon^2}\\ = \frac{\sum_{k=1}^n\mathbb{D}[r_{t+k}|H_n]+\sum_{i=1}^n\sum_{j\ne i}^n\rho_{ij}\sqrt{\mathbb{D}[r_{t+i}|H_n]}\sqrt{\mathbb{D}[r_{t+j}|H_n]}}{n^2\varepsilon^2}\\=D_{\max}\frac{n+\sum_{i=1}^n\sum_{j\ne i}\rho_{ij}}{n^2\varepsilon^2}$
其中 $\rho_{ij}\in[-1,1]$ ，表示随机变量 $r_{t+i}$ 和随机变量 $r_{t+j}$ 的相关系数，描述了其相关程度。

（推论1） 可以看出的是，若相关性最强的情况，对于任意两个随机变量 $r_{t+i}$ 和 $r_{t+j}$ 间都是强相关的，即对于任意 $r_{t+i},r_{t+j}$ ， $\rho_{ij}=1$ ，则有对于给定的 $\varepsilon >0$ ：
$\mathbb{P}[|\frac{1}{n}\sum_{k=1}^nr_{t+k}-\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}|H_k]|>\varepsilon]\leq \frac{D_{\max}}{\varepsilon^2}$
（推论2） 非独立随机变量若想要使得 大数定律成立，即 $\frac{1}{n}\sum_{k=1}^nr_{t+k}$ 依概率收敛到 $\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}]$ ,则需要使得 $\sum_{j\ne i}\rho_{ij}<o(n)$ 或者 $\sum_{i=1}^n\sum_{j\ne i}\rho_{ij}<o(n^2)$ 。

即对于任意一个随机变量 $r_{t+i}$ 而言，其同其他随机变量 $r_{t+j}$ 的相关程度之和应该大于 $n$ 的线性增加。例如：随着 $n$ 的增加， $r_{t+i}$ 永远只有和其有限个 $m$ 的 $r_{t+i-1},r_{t+i-2},...r_{t+i-m}$ 相关，则此时大数定律依然成立。
（推论3） 若对于任意 $\rho_{ij},i\ne j$ ， $|\rho_{ij}|<\rho\leq1$ ,则可以得到： $\mathbb{P}[|\frac{1}{n}\sum_{k=1}^nr_{t+k}-\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}|H_k]|>\varepsilon]\leq \frac{D_{\max}|\rho|}{\varepsilon^2}+\frac{D_{\max}(1-|\rho|)}{n\varepsilon^2}$
进一步可以由极限的保号性可以得到: $\lim_{n\rightarrow \infty} \mathbb{P}[|\frac{1}{n}\sum_{k=1}^nr_{t+k}-\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}|H_k]|>\varepsilon]\leq\frac{D_{\max}|\rho|}{\varepsilon^2}$
Proof：设 $a_n= \mathbb{P}[|\frac{1}{n}\sum_{k=1}^nr_{t+k}-\frac{1}{n}\sum_{k=1}^n\mathbb{E}_{t+k}[r_{t+k}|H_k]|$ ，设 $\lim_{n\rightarrow \infty} a_n = c_1$ ， $b_n=\frac{D_{\max}|\rho|}{\varepsilon^2}+\frac{D_{\max}(1-|\rho|)}{n\varepsilon^2}$ ,令 $c_2=\frac{D_{\max}|\rho|}{\varepsilon^2}$ ,则： $\lim_{n\rightarrow \infty} b_n = c_2$ ，由假设可知 $a_n\leq b_n$ 恒成立。待证明 $c_1\leq c_2$ ,下面采用反证法证明：
不妨设 $c_1 > c_2$ ,则有：
$\lim_{n\rightarrow \infty}(a_n-b_n)=c_1-c_2>0$ 由极限的保号性： $\exists N$ ,当 $n > N$ 时有 $a_n-b_n>0$ ，即 $a_n>b_n$ ，然而这与条件 $a_n\leq b_n$ 恒成立矛盾，因此得证 $c_1\leq c_2$ 。

（问题） 所以目前一个重要的问题是： $\rho_{ij}$ 如何进行估计？

非独立随机变量的概率上界估计

相关文章：

非独立随机变量的概率上界估计

常见电子仪器及其用途

配置测试ip、正式ip、本地ip

Linux 系统移植（一）-- 系统组成

利用git的贮藏功能

第52节：cesium 3DTiles模型特效+选中高亮（含源码+视频）

day03_基础语法

数据结构与算法-时间复杂度与空间复杂度

数组的去重

Electron自动化测试技术选型调研

微服务学习（九）：安装OpenOffice

SAP Oracle表空间扩展技术手册

Linux系统编程——线程的学习

zemaxMIF曲线图

【苹果】SpringBoot监听Iphone15邮件提醒，Selenium+Python自动化抢购脚本

什么是WhatsApp群发，WhatsApp协议，WhatsApp云控

RealVNC viewer 窗口指定默认显示

图论20（Leetcode1254.统计封闭岛屿的数目）

Docker 的基本概念和优势，以及在应用程序开发中的实际应用

数据仓库整理

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

USB Over IP专用硬件的5个特点

JS手写代码篇----使用Promise封装AJAX请求

日常一水C

[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG

Spring Boot + MyBatis 集成支付宝支付流程

DAY 45 超大力王爱学Python

用js实现常见排序算法

【Qt】控件 QWidget

作为点的对象CenterNet论文阅读