【返璞归真】-切比雪夫不等式(Chebyshev‘s Inequality)
切比雪夫不等式(Chebyshev’s Inequality)
切比雪夫不等式是概率论中的一个基本不等式,用于估计随机变量偏离其期望值一定范围的概率。它对于任何具有有限期望和有限方差的随机变量都成立。
公式表达
切比雪夫不等式的基本形式如下:
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 , 其中 k > 0. P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2}, \quad \text{其中 } k > 0. P(∣X−μ∣≥kσ)≤k21,其中 k>0.
其中:
- X X X:随机变量
- μ = E [ X ] \mu = \mathbb{E}[X] μ=E[X]:随机变量的期望
- σ 2 = Var ( X ) = E [ ( X − μ ) 2 ] \sigma^2 = \text{Var}(X) = \mathbb{E}[(X - \mu)^2] σ2=Var(X)=E[(X−μ)2]:随机变量的方差
- σ = Var ( X ) \sigma = \sqrt{\text{Var}(X)} σ=Var(X):标准差
- k k k:任意正实数,表示偏离标准差的倍数
解释
-
不等式意义:切比雪夫不等式表示随机变量 X X X偏离其期望值 μ \mu μ至少 k σ k\sigma kσ的概率不会超过 1 k 2 \frac{1}{k^2} k21。也就是说,随着 k k k增大,随机变量偏离期望值的概率迅速减少。
-
适用条件:切比雪夫不等式适用于任何随机变量 X X X,只要其期望值和方差有限。它对分布形状没有要求,因此适用于非对称分布或长尾分布等。
推导过程
切比雪夫不等式基于马尔可夫不等式:
P ( Y ≥ a ) ≤ E [ Y ] a , 其中 a > 0 , Y ≥ 0. P(Y \geq a) \leq \frac{\mathbb{E}[Y]}{a}, \quad \text{其中 } a > 0, Y \geq 0. P(Y≥a)≤aE[Y],其中 a>0,Y≥0.
通过定义 Y = ( X − μ ) 2 Y = (X - \mu)^2 Y=(X−μ)2并代入马尔可夫不等式:
- 定义:随机变量的偏差平方为 Y = ( X − μ ) 2 Y = (X - \mu)^2 Y=(X−μ)2,因此 Y ≥ 0 Y \geq 0 Y≥0,且 E [ Y ] = Var ( X ) = σ 2 \mathbb{E}[Y] = \text{Var}(X) = \sigma^2 E[Y]=Var(X)=σ2。
- 应用马尔可夫不等式:
P ( ( X − μ ) 2 ≥ k 2 σ 2 ) ≤ E [ ( X − μ ) 2 ] k 2 σ 2 . P((X - \mu)^2 \geq k^2\sigma^2) \leq \frac{\mathbb{E}[(X - \mu)^2]}{k^2\sigma^2}. P((X−μ)2≥k2σ2)≤k2σ2E[(X−μ)2]. - 简化右边的分母:
P ( ( X − μ ) 2 ≥ k 2 σ 2 ) ≤ σ 2 k 2 σ 2 = 1 k 2 . P((X - \mu)^2 \geq k^2\sigma^2) \leq \frac{\sigma^2}{k^2\sigma^2} = \frac{1}{k^2}. P((X−μ)2≥k2σ2)≤k2σ2σ2=k21. - 注意到 ( X − μ ) 2 ≥ k 2 σ 2 ⟺ ∣ X − μ ∣ ≥ k σ (X - \mu)^2 \geq k^2\sigma^2 \iff |X - \mu| \geq k\sigma (X−μ)2≥k2σ2⟺∣X−μ∣≥kσ,因此:
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 . P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2}. P(∣X−μ∣≥kσ)≤k21.
应用举例
- 质量控制:在工业生产中,用切比雪夫不等式估计产品参数偏离标准值一定范围的概率。
- 数据分析:对于缺乏分布信息的随机变量,切比雪夫不等式提供了一个分布无关的概率界限。
- 金融领域:用于估算金融资产回报率偏离期望值的概率。
直观理解
切比雪夫不等式的保守性体现在其仅利用方差和期望的信息,而不依赖分布的形状。例如:
- k = 2 k = 2 k=2:表示偏离期望值至少2个标准差的概率不会超过 1 4 = 25 % \frac{1}{4} = 25\% 41=25%。
- k = 3 k = 3 k=3:表示偏离期望值至少3个标准差的概率不会超过 1 9 ≈ 11.1 % \frac{1}{9} \approx 11.1\% 91≈11.1%。
切比雪夫不等式保证了对极端值概率的一个上界,但这个界限通常较为宽松。
切比雪夫不等式有多种通用形式,适用于不同的随机变量表达方式。以下是几种常见形式:
1. 标准形式(经典形式)
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 , k > 0. P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2}, \quad k > 0. P(∣X−μ∣≥kσ)≤k21,k>0.
其中:
- μ = E [ X ] \mu = \mathbb{E}[X] μ=E[X]:随机变量的期望
- σ 2 = Var ( X ) \sigma^2 = \text{Var}(X) σ2=Var(X):随机变量的方差
- k k k:偏离标准差的倍数
这是最常用的切比雪夫不等式形式,表明随机变量偏离其期望值的概率不会超过某一上界。
2. 分布无关形式
对于任意随机变量 X X X,具有有限的期望 μ \mu μ和方差 σ 2 \sigma^2 σ2:
P ( ∣ X − a ∣ ≥ b ) ≤ σ 2 b 2 , b > 0. P(|X - a| \geq b) \leq \frac{\sigma^2}{b^2}, \quad b > 0. P(∣X−a∣≥b)≤b2σ2,b>0.
- a a a:可以是任意常数(通常取为 μ = E [ X ] \mu = \mathbb{E}[X] μ=E[X])。
- b b b:表示偏离的范围。
这是一种更广义的形式,适用于任何常数中心点 a a a。
3. 非对称形式
对于随机变量 X X X和任意正数 ϵ > 0 \epsilon > 0 ϵ>0,我们可以对正负偏差进行不同的估计:
- 正偏差(右尾概率):
P ( X − μ ≥ ϵ ) ≤ Var ( X ) ϵ 2 . P(X - \mu \geq \epsilon) \leq \frac{\text{Var}(X)}{\epsilon^2}. P(X−μ≥ϵ)≤ϵ2Var(X). - 负偏差(左尾概率):
P ( X − μ ≤ − ϵ ) ≤ Var ( X ) ϵ 2 . P(X - \mu \leq -\epsilon) \leq \frac{\text{Var}(X)}{\epsilon^2}. P(X−μ≤−ϵ)≤ϵ2Var(X).
这两个不等式将切比雪夫不等式拆分成单侧偏差的概率估计。
4. 概率离散化形式
设随机变量 X X X的概率分布是离散的,且具有有限的数学期望和方差,则切比雪夫不等式可以写成:
∑ ∣ X − μ ∣ ≥ k σ P ( X ) ≤ 1 k 2 . \sum_{|X - \mu| \geq k\sigma} P(X) \leq \frac{1}{k^2}. ∣X−μ∣≥kσ∑P(X)≤k21.
- 这里的 ∑ ∣ X − μ ∣ ≥ k σ \sum_{|X - \mu| \geq k\sigma} ∑∣X−μ∣≥kσ表示所有使得随机变量 X X X偏离其期望值 μ \mu μ至少 k σ k\sigma kσ的离散值的概率总和。
5. 归一化形式(标准正态化)
将随机变量 X X X标准化为零均值单位方差的形式 X − μ σ \frac{X - \mu}{\sigma} σX−μ,切比雪夫不等式可以写为:
P ( ∣ X − μ σ ∣ ≥ k ) ≤ 1 k 2 , k > 0. P\left(\left|\frac{X - \mu}{\sigma}\right| \geq k\right) \leq \frac{1}{k^2}, \quad k > 0. P( σX−μ ≥k)≤k21,k>0.
这一形式特别适合对归一化随机变量进行概率界限的估计。
6. 期望导出形式
对于非中心点的偏差概率(例如偏离一个常数 a a a):
P ( ∣ X − a ∣ ≥ ϵ ) ≤ E [ ( X − a ) 2 ] ϵ 2 , ϵ > 0. P(|X - a| \geq \epsilon) \leq \frac{\mathbb{E}[(X - a)^2]}{\epsilon^2}, \quad \epsilon > 0. P(∣X−a∣≥ϵ)≤ϵ2E[(X−a)2],ϵ>0.
此形式直接利用二阶矩 E [ ( X − a ) 2 ] \mathbb{E}[(X - a)^2] E[(X−a)2],可以灵活应用于非对称分布或不同的中心点。
总结
这些形式的核心思想是一致的:用有限的期望和方差信息估计随机变量偏离的概率。根据具体问题的背景(对称性、中心点选择、分布特性等),可以选择合适的形式。
相关文章:
【返璞归真】-切比雪夫不等式(Chebyshev‘s Inequality)
切比雪夫不等式(Chebyshev’s Inequality) 切比雪夫不等式是概率论中的一个基本不等式,用于估计随机变量偏离其期望值一定范围的概率。它对于任何具有有限期望和有限方差的随机变量都成立。 公式表达 切比雪夫不等式的基本形式如下…...
【Django】在view中调用channel来主动进行websocket通信
前提:consumer中已经写好了建立连接的代码,并且能够成功把连接加入到通道层的组内 可以参考我的另一个博客: LuckySheet协同编辑后端示例(DjangoChannel,Websocket通信)_lucksheet 协同编辑-CSDN博客 我是懒得去折腾luckysheet的源码&…...
18.[极客大挑战 2019]BabySQL1
进入靶场 随便输输 再输输 可以判断是单引号闭合 再随便输输 查询字段数量 得,过滤了 关键字也过滤了 只能双写了 根据回显,这样可以,只是需要改改 1,2不行 1,2,3行 1,2,3,4不行 可以尝试得到库名,表名了 库名 database(…...
Python快速入门二:Python3 基础语法
一、编码 默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。 当然你也可以为源码文件指定不同的编码: # -*- coding: cp-1252 -*-上述定义允许在源文件中使用 Windows-1252 字符集中的字符编码,对应适…...
1-1 C语言链表
目录 目录 1.0 定义 2.0 为什么使用链表 3.0 链表原理 4.0 创建链表节点 5.0 链表原理续 6.0 链表实现 6.0.1 创建节点 6.0.2 初始化链表 6.0.3 添加链表节点 6.0.4 循环遍历 6.0.5 插入节点 6.0.6 插入头结点main函数 7.0 完整代码 8.0 节点添加方案二 8.0.1 …...
[0629].第29节:配置中心业务规则与动态刷新
我的后端学习大纲 SpringCloud学习大纲 1、编码实现3377服务: 1.1.建module: 1.2.改pom: 1.3.写YML: 1.Nacos同Consul一样,在项目初始化时,要保证先从配置中心进行配置拉取,拉取配置之后,才能保证项目的正…...
mac: docker : Command not found解决
描述: 安装docker但是docker命令显示Command not found 分析: mac没有配置对应的环境变量 解决方案: 打开配置文件: vim ~/.zshrc写docker环境变量: export PATH"/Applications/Docker.app/Contents/Resources/bin:$PATH"保存退出: esc,输入wq,按enter 配置文…...
Django drf基于APIView 快速使用
1. 注册 # settings.pyINSTALLED_APPS [,rest_framework, ]2. 路由 from django.urls import pathurlpatterns [path(task/, views.TaskAPIView.as_view()) ]3. 视图 from rest_framework.views import APIView from rest_framework.response import Responseclass TaskAPIV…...
【MarsCode】每日一题数组 之 数字分组求偶数和
数字分组求偶数和 1.问题描述 问题描述 小M面对一组从 1 到 9 的数字,这些数字被分成多个小组,并从每个小组中选择一个数字组成一个新的数。目标是使得这个新数的各位数字之和为偶数。任务是计算出有多少种不同的分组和选择方法可以达到这一目标。 n…...
解决:error: subprocess-exited-with-error 的问题
系统和配置: ubuntu20.04 python3.10 torch2.5.1 pip install时报错如下 (实际指令是:pip3 install -r drl_grasping/python_requirements.txt) Collecting python-xlib>0.17 (from pynput1.7.6->-r drl_grasping/python_…...
使用腾讯混元(HunYuanVideo)视频模型FP8量化版本来生成绅士动画,模型体积30G,8G甜品卡可玩,2秒视频需要15分钟
腾讯混元(HunYuanVideo)视频模型发布以来,视频效果有口皆碑,但由于推理门槛比较高,消费级显卡用户望而却步,最近大神Kijai发布了FP8量化版本模型,使得甜品卡用户也有了一餐秀色的可能。 本次我们利用HunYuanVideo量化…...
使用Ancona安装node,安装vue
搜索Conda仓库中可用的Node.js版本 conda search nodejs 通过Conda安装Node.js conda install nodejs 检查已安装的Node.js版本 node -v 安装中国npm镜像(cnpm) conda install cnpm 使用cnpm全局安装Vue CLI cnpm install -g vue/cli...
如何“安装Android SDK“?
一、下载 https://android-sdk.en.softonic.com/ 二、解压(不能有中文) 三、配置环境变量 1、ANDROID_HOME:D:\android-sdk 2、在Path添加文件路径 四、验证 adb version...
天童教育:提升孩子的语言表达能力
语言表达能力如同阳光、空气和水,无处不在,无时不用。然而,很多人并没有意识到,想要让孩子能够良好适应社会生活,提升他们的语言表达能力是至关重要的。大连天童教育认为,我们务必重视孩子的语言表达能力&a…...
Node.js中JWT的token完整生命周期管理:从生成到销毁
Node.js中JWT的token完整生命周期管理:从生成到销毁 在Node.js中使用JWT(JSON Web Token)进行身份验证和授权是一种常见的实践。下面详细介绍JWT从生成到销毁的过程。 JWT生成 安装jsonwebtoken库: 要生成JWT,首先…...
Kotlin报错:lateinit property xxx has not been initialized
Kotlin报错:lateinit property xxx has not been initialized 发生在定义了一个名为xxx的lateinit变量。 解决,在调用前,可以先判断一层该xxx变量是否已经初始化: if (this::xxx.isInitialized) {//正常使用该变量} kotlin.Unini…...
debian编译失败
A、缘由和分析 debian的代码在删除该路径下的2个包后, 重新全编,编译不过的问题。 至于我为什么删除这2个包,这是因为在sdk第一次编译时一些文件已经打包进去了,我现在的修改无法更新进img中,而现在我的项目中不需要…...
flink-connector-mysql-cdc:03 mysql-cdc常见问题汇总
flink-connector-mysql-cdc: 01 mysql-cdc基础配置代码演示02 mysql-cdc高级扩展03 mysql-cdc常见问题汇总04 mysql-cdc-kafka生产级代码分享05 flink-kafka-doris生产级代码分享06 flink-kafka-hudi生产级代码分享flink-cdc版本:3.2.0 flink版本:flink-1.18.0 mysql版本:…...
JSP技术发展现状
多年前,Java入门时学习的JSP可谓时风光无限,J2EE如日中天,短短数年,技术迭代更新光速般发展,有些技术慢慢就退出历史舞台。 JSP(Java Server Pages) 技术在早期 Java Web 开发中曾是构建动态网…...
浏览器同源策略、跨域、跨域请求,服务器处理没、跨域解决方案
目录 什么是同源策略什么是跨域发生跨域时,服务器有没有接到请求并处理响应:(两种情况) 如何解决跨域 什么是同源策略 概念: 同源策略是浏览器的一种安全机制,用于防止恶意网站对用户的敏感数据进行未经授…...
多模态2025:技术路线“神仙打架”,视频生成冲上云霄
文|魏琳华 编|王一粟 一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,…...
大话软工笔记—需求分析概述
需求分析,就是要对需求调研收集到的资料信息逐个地进行拆分、研究,从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。 需求分析的作用非常重要,后续设计的依据主要来自于需求分析的成果,包括: 项目的目的…...
Oracle查询表空间大小
1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...
为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...
【大模型RAG】Docker 一键部署 Milvus 完整攻略
本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...
【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表
1、行为树节点分类 在 Nav2(Navigation2)的行为树框架中,行为树节点插件按照功能分为 Action(动作节点)、Condition(条件节点)、Control(控制节点) 和 Decorator(装饰节点) 四类。 1.1 动作节点 Action 执行具体的机器人操作或任务,直接与硬件、传感器或外部系统…...
Spring Boot面试题精选汇总
🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...
css的定位(position)详解:相对定位 绝对定位 固定定位
在 CSS 中,元素的定位通过 position 属性控制,共有 5 种定位模式:static(静态定位)、relative(相对定位)、absolute(绝对定位)、fixed(固定定位)和…...
拉力测试cuda pytorch 把 4070显卡拉满
import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小,增大可提高计算复杂度duration: 测试持续时间(秒&…...
select、poll、epoll 与 Reactor 模式
在高并发网络编程领域,高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表,以及基于它们实现的 Reactor 模式,为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。 一、I…...
