从0开始学统计-什么是中心极限定理
引言
中心极限定理(Central Limit Theorem, CLT)是统计学中的一块基石,它揭示了一个难以置信的数学现象:无论一个随机变量的原始分布如何,只要我们取足够大的样本量,这些样本的平均值(或总和)的分布将趋近于正态分布,这种分布也被称为高斯分布。中心极限定理不仅为我们使用正态分布进行推断提供了理论基础,还让正态分布成了统计学中最为重要的分布之一。
历史
在统计学史上,中心极限定理的发展是一个渐进的过程。它不是一夜之间形成的,而是经过几个世纪的逐步完善,包含了多个数学家和统计学家的贡献。
18世纪,数学家棣莫弗(Abraham de Moivre)和拉普拉斯(Pierre-Simon Laplace)等开始探索二项分布的性质。1718年,在第一本概率理论书籍《道德和机遇的教训》(“The Doctrine of Chances”)中,棣莫弗首次提出了二项分布在大样本极限下趋近于正态分布的概念,这可以看作是中心极限定理的早期形态。拉普拉斯进一步扩展了这个概念,在1812年的《概率分析理论》(“Théorie Analytique des Probabilités”)中,他通过拉普拉斯展开(Laplace expansion)详细论述了这一点,说明在大数极限下,还有更多的分布趋近于正态分布。
1901年,李雅普诺夫(Aleksandr Lyapunov)证明了一个更一般形式的中心极限定理。该定理不仅适用于二项分布,而且适用于任意有限方差的独立随机变量。李雅普诺夫的工作标志着中心极限定理现代形式的开始。
20世纪中叶,数学家们进一步扩展了中心极限定理的适用范围和形式,其中包括对独立但不同分布的随机变量之和的考虑,以及对随机变量序列弱依赖条件下的应用。
什么是中心极限?
让我们来看一个经典的例子,抛硬币实验。假设我们抛硬币的结果只有两种可能:正面(我们记为1)和反面(我们记为0)。每次抛硬币是一个独立的随机试验,结果的分布是二项分布。
现在,我们进行一系列实验。在每个实验中,我们不止抛一次硬币,而是连续抛硬币n次,并记录正面出现的次数。为了直观展示中心极限定理,我们可以重复进行多个这样的实验(例如,1000次),每次都记录下正面出现的比例。例如,做10个抛10次硬币的实验,在4个左右的实验中,有5次朝上,如图所示:
根据中心极限定理,不管单次抛硬币的结果分布如何,只要我们重复足够多次抛硬币操作,并且记录下正面出现的比例,这些比例的分布会趋近于正态分布。具体来说,随着实验次数的增加,这些比例的分布会越来越接近于一个均值为μ=0.5、方差为σ2/n(2指平方)的正态分布,其中σ2=0.25是单次抛硬币结果的方差,n是每次实验中抛硬币的次数。
抛硬币实验说明,即使基础数据(正面或反面)不服从正态分布,大量独立实验的平均结果(或求和结果)也将趋向于正态分布。
什么是期望值?
期望值(Expected Value),也称为数学期望或均值,指在多次随机试验中某个随机变量可能结果的加权平均。对于离散随机变量,期望值是各可能值与其发生概率乘积的总和;对于连续随机变量,期望值是随机变量的概率密度函数乘以随机变量值的积分。
举个例子,假设你有一个标准的六面骰子,每面上的数字分别是1到6。这个实验的随机变量X就是骰子显示的面的数字。因为骰子是公平的,所以每个数字出现的概率都是相同的,即1/6。
我们想计算这个随机变量的期望值,也就是你在多次的掷骰子实验中,可以期待的平均骰子点数。期望值E(X)的计算公式是:

其中xi是第i面的数字,P(X=xi)是该面出现的概率。因此,对于六面骰子,期望值计算如下:

这意味着,虽然你不可能真的掷出3.5(因为骰子的面上没有3.5),但如果你做了很多次实验,那么平均每次掷出的期望是3.5。换句话说,期望值给出了在大量重复实验中,观察到的平均结果。
期望值是理论上的平均值。在实际的骰子游戏中,你每次掷骰子的结果是1到6中的一个整数,但如果你记录下非常多次掷骰子的结果,计算平均值,这个平均值会接近于3.5,这就是期望值的含义。
什么是二项分布?
二项分布( binomial distribution)是一种离散概率分布,它描述了在一系列独立的是/非(成功/失败)实验中,获得固定数量成功次数的概率。在独立的是/非(成功/失败)多次实验中,每次实验都被称为伯努利试验,它只有两种可能的结果:成功或失败。二项分布的典型特征是每次试验的成功概率不变。
让我们来看一个具体的例子,一个篮球运动员进行自由投篮训练。假设一个篮球运动员进行10次自由投篮,每次投篮成功的概率是0.5(即50%)。我们想要知道这个运动员在10次投篮中恰好投中5次的概率是多少。这个实验是一个典型的二项分布情景,因为:每次投篮(试验)只有两种可能结果:成功(投中)或失败(未投中)。每次投篮是独立的,即每次投篮的成功概率保持不变,不受前一次投篮结果的影响。我们关注的是在固定次数(n=10次投篮)的试验中成功的次数。使用二项分布的计算公式:
代入数值:

其中,0.5是5次成功的概率,(1-0.5)的5次方部分是剩下的5次试验中失败的概率。计算结果为24.6%。因此,这位篮球运动员在10次自由投篮中恰好投中5次的概率大约是24.6%。
小结
中心极限定理的发展历程凝聚了多位数学家和统计学家的智慧。今天,中心极限定理不仅在统计学中占据着中心地位,也在社会科学、自然科学乃至于质量控制和金融工程等应用领域发挥着至关重要的作用。
相关文章:
从0开始学统计-什么是中心极限定理
引言 中心极限定理(Central Limit Theorem, CLT)是统计学中的一块基石,它揭示了一个难以置信的数学现象:无论一个随机变量的原始分布如何,只要我们取足够大的样本量,这些样本的平均值(或总和&a…...
工具方法 - 个人活动的分类
人类活动的分类是一个复杂的话题,因为人类的活动范围非常广泛且相互交叉。然而,我们可以尝试将人类的活动大致分为以下几个主要类别: 工作活动 工作活动是人类生活中不可或缺的一部分,通常包括以下方面: 1. 职业工作&a…...
11.1组会汇报-基于区块链的安全多方计算研究现状与展望
基础知识 *1.背书,这个词源来自银行票据业务,是指票据转让时,原持有人在票据背面加盖自己的印鉴,证明该票据真实有效、如果有问题就可以找原持有人。 区块链中的背书就好理解了。可以简单的理解为验证交易并声明此交易合法&…...
ubuntu【桌面】 配置NAT模式固定IP
DHCP分配导致虚拟机IP老变,SSH老要重新配置,设成静态方便些 一、设NAT模式 1、设为NAT模式 2、看模式对应的虚拟网卡 - VMnet8 3、共享主机网卡网络到虚拟网卡 - VMnet8 二、为虚拟网卡设置静态IP 记住这个IP 三、设置ubuntu固定IP 1、关闭DHCP并…...
评估 机器学习 回归模型 的性能和准确度
回归 是一种常用的预测模型,用于预测一个连续因变量和一个或多个自变量之间的关系。 那么,最后评估 回归模型 的性能和准确度非常重要,可以帮助我们判断模型是否有效并进行改进。 接下来,和大家分享如何评估 回归模型 的性能和准…...
如何下载安装TestLink?
一、下载TestLink、XAMPP TestLink 下载 |SourceForge.net 备用:GitHub - TestLinkOpenSourceTRMS/testlink-code: TestLink开源测试和需求管理系统 下载XAMPP: Download XAMPP 注意:TestLink与PHP版本有关系,所以XA…...
基于SSM+微信小程序的订餐管理系统(点餐2)
👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍 基于SSM微信小程序的订餐管理系统实现了管理员和用户。管理端实现了 首页、个人中心、用户管理、菜品分类管理、菜品信息管理、订单信息管理、配送信息管理、菜品评价管理、订单投诉管理、…...
【C++排序 双指针】1996. 游戏中弱角色的数量|1996
本文涉及的基础知识点 排序 C算法:滑动窗口及双指针总结 本题其它解法 【C单调栈 排序】1996. 游戏中弱角色的数量|1996 LeetCode1996. 游戏中弱角色的数量 你正在参加一个多角色游戏,每个角色都有两个主要属性:攻击 和 防御 。给你一个…...
GESP4级考试语法知识(捕捉异常)
参考程序代码: #include <iostream> using namespace std;double divide(double a, double b) {if (b 0) {throw "Division by zero error"; // 抛出异常}return a / b; }int main() {double num1, num2;cout << "Enter two numbers:…...
HTML 基础标签——元数据标签 <meta>
文章目录 1. `<meta>` 标签概述2. 属性详解2.1 `charset` 属性2.2 `name` 属性2.3 `content` 属性2.4 `http-equiv` 属性3. 其他常见属性小结在 HTML 文档中,元数据标签 <meta> 是一种重要的标签,用于提供关于文档的信息,这些信息不直接显示在网页内容中,但对于…...
栈虚拟机和寄存器虚拟机,有什么不同?
本来这节内容是打算直接讲字节码指令的,但讲之前又必须得先讲指令集架构,而指令集架构又分为两种,一种是基于栈的,一种是基于寄存器的。 那不妨我们这节就单独来讲讲栈虚拟机和寄存器虚拟机,它们有什么不同࿰…...
Windows下基于fping进行批量IP测试
fping是Linux下一个很好用的IP测试工具,结合代码可以完成批量的IP测试,在网络调试中用途很广。本文是基于fping for Windows结合bat批处理,定制的测试脚本样例。 一、程序信息 本次测试使用fpingV5.1 for Windows版,版本信息如下…...
一款实用的Word文档图片转换与水印保护工具
目录 前言软件功能简介软件实现方法及关键代码 1. Word 文档转图片的实现2. 图片水印添加功能3. 生成数字指纹(哈希值)4. 保存图片信息到 JSON 文件 软件的实际使用场景软件操作指南 1. 下载和安装2. 操作流程 总结 1,前言 在日常办公和内…...
优化用于传感应用的衬底集成波导技术
ANSYS HFSS 是一款功能强大的电磁仿真软件,支持为微流体生物传感器应用设计和分析衬底集成波导 (SIW) 技术。它为快速设计优化、材料选择、系统集成和虚拟原型制作提供了一个强大的平台。借助 ANSYS HFSS,研究人员和工程师可以高效…...
Java多态特性的向上转型
Java的多态特性通过向上转型来实现。向上转型指的是将子类对象赋值给父类引用变量的操作。这样做的好处是可以使用父类引用变量来调用子类对象的方法。 例如,有一个父类Animal和一个子类Dog,可以这样进行向上转型: Animal animal new Dog(…...
C++ 判断语句的深入解析
C 判断语句的深入解析 C 是一种广泛使用的编程语言,以其高效性和灵活性著称。在 C 中,判断语句是控制程序流程的关键组成部分,它们允许程序根据不同的条件执行不同的代码路径。本文将深入探讨 C 中的判断语句,包括 if、else if、…...
15分钟学 Go 第 33 天:项目结构
第33天:项目结构 目标:了解Go项目的典型结构 在Go语言的开发中,项目结构的合理性直接影响着代码的可维护性、可扩展性和团队协作效率。本篇文章将深入探讨Go语言的典型项目结构,并提供实际示例代码和相关的流程图。 一、Go项目…...
conda迁移虚拟环境路径
方法一:使用软连接 ln -s ~/Anaconda3/envs /new/path/envs 方法二:修改~/.condarc文件 1.打开~/.condarc文件 #添加下面参数 envs_dirs: - /newpath/anaconda3/envs pkgs_dirs: - /newpath/anaconda3/pkgs 2. source ~/.bashrc 3.查看是否成功con…...
(八)JavaWeb后端开发——Tomcat
目录 1.Web服务器概念 2.tomcat 1.Web服务器概念 服务器:安装了服务器软件的计算机服务器软件:接收用户的请求,处理请求,做出响应web服务器软件:在web服务器软件中,可以部署web项目,让用户通…...
yocto中通常不直接修改提供的recipes的bb文件
不直接在 Yocto 官方提供的 recipe 中修改 通常是创建新的 metadata 和 recipe 来配置相关软件编译等过程 主要有以下几个原因: 1. 便于维护和升级 隔离自定义修改:Yocto 官方的 recipe 可能会随着版本更新而变化。如果直接修改官方 recipe࿰…...
IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
【Python】 -- 趣味代码 - 小恐龙游戏
文章目录 文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架 这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现,玩家控制一个角色(龙)躲避障碍物(仙人掌和乌鸦)。以下是代码的详细介绍:…...
Vue记事本应用实现教程
文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展:显示创建时间8. 功能扩展:记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...
Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...
【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...
DockerHub与私有镜像仓库在容器化中的应用与管理
哈喽,大家好,我是左手python! Docker Hub的应用与管理 Docker Hub的基本概念与使用方法 Docker Hub是Docker官方提供的一个公共镜像仓库,用户可以在其中找到各种操作系统、软件和应用的镜像。开发者可以通过Docker Hub轻松获取所…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
UE5 学习系列(三)创建和移动物体
这篇博客是该系列的第三篇,是在之前两篇博客的基础上展开,主要介绍如何在操作界面中创建和拖动物体,这篇博客跟随的视频链接如下: B 站视频:s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
uniapp中使用aixos 报错
问题: 在uniapp中使用aixos,运行后报如下错误: AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...
