看见统计——第四章 统计推断:频率学派
看见统计——第四章 统计推断:频率学派
接下来三节的主题是中心极限定理的应用。在不了解随机变量序列 {Xi}\{X_i\}{Xi} 的潜在分布的情况下,对于大样本量,中心极限定理给出了关于样本均值的声明。例如,如果 YYY 是一个 N(0,1)N(0,1)N(0,1) 随机变量,并且{Xi}\{X_i\}{Xi}的独立同分布具有平均值 μμμ 和方差 σ2σ^2σ2,那么
P(X‾−μσ/n∈A)≈P(Y∈A)P(\frac{\overline{X}-\mu}{\sigma /\sqrt{n}}\in A)\approx P(Y\in A) P(σ/nX−μ∈A)≈P(Y∈A)
特别是,如果我们想要一个 YYY 以概率 0.950.950.95 落点的区间,我们可以在网上或书中查找 zzz 表,,对于 N(0,1)N(0,1)N(0,1) 随机变量 YYY ,
P(Y∈(−1.96,1.96))=P(−1.96≤Y≤1.96)=0.95P(Y\in(-1.96,1.96))=P(-1.96\le Y\le 1.96) = 0.95 P(Y∈(−1.96,1.96))=P(−1.96≤Y≤1.96)=0.95
由于X‾−μσ/n\frac{\overline{X}-\mu}{\sigma /\sqrt{n}}σ/nX−μ 接近于 N(0,1)N(0,1)N(0,1) ,这意味着
P(−1.96≤X‾−μσ/n≤1.96)=0.95P(-1.96\le \frac{\overline{X}-\mu}{\sigma /\sqrt{n}}\le 1.96) = 0.95 P(−1.96≤σ/nX−μ≤1.96)=0.95
从上述声明中,我们可以对实验进行陈述,以量化置信度,接受或拒绝假设。
置信区间Confidence Intervals
假设在美国总统选举期间,我们对倾向于支持希拉里而非特朗普的人所占的比例 ppp 感兴趣。我们可以打电话给这个国家的每个人,记录他们支持的人,这种做法显然不现实。相反,我们可以取一堆样本X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn,其中
Xi={1第i个人更支持希拉里0其它X_i=\begin{cases} 1& 第i个人更支持希拉里\\ 0& 其它 \end{cases} Xi={10第i个人更支持希拉里其它
那么样本均 X‾=1n∑i=1nXi\overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_iX=n1∑i=1nXi 就是我们样本中偏爱希拉里的比例。假设 ppp 是更喜欢希拉里的真实比例( ppp 未知)。注意E(X‾)=pE(\overline{X})=pE(X)=p。然后通过 CLTCLTCLT(中心极限定理),
X‾−μσ/n∼N(0,1)\frac{\overline{X}-\mu}{\sigma /\sqrt{n}} \sim N(0,1) σ/nX−μ∼N(0,1)
由于我们不知道 σσσ 的真实值,我们使用样本方差来估计它,定义如下:
S2≐1n−1∑i=1n(Xi−X‾)2S^2\doteq \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2 S2≐n−11i=1∑n(Xi−X)2
这是 σ2σ^2σ2 的一致估计量,因此当 nnn 很大时,它与真方差 σ2σ^2σ2 相差很大的概率很小。因此,我们可以将表达式中的σσσ 替换为 S=1n−1∑i=1n(Xi−X‾)2S= \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2}S=n−11∑i=1n(Xi−X)2。由于X‾−μS/n\frac{\overline{X}-\mu}{S /\sqrt{n}}S/nX−μ 接近于 N(0,1)N(0,1)N(0,1) ,这意味着
P(−1.96≤X‾−μS/n≤1.96)=0.95P(-1.96\le \frac{\overline{X}-\mu}{S /\sqrt{n}}\le 1.96) = 0.95 P(−1.96≤S/nX−μ≤1.96)=0.95
重新排列 ppp 的表达式,我们有

即使我们不知道 ppp 的真实值,我们可以从上面的表达式得出结论, ppp 有0.95的概率在如下区间中:
(X‾−1.96⋅Sn,X‾+1.96⋅Sn)(\overline{X}-1.96 \cdot \frac{S}{\sqrt{n}},\overline{X}+1.96 \cdot \frac{S}{\sqrt{n}}) (X−1.96⋅nS,X+1.96⋅nS)
这被称为参数 ppp 的95%的置信度区间。此近似适用于较大的 nnn 值,通常要确保 n>30n>30n>30 。可视化如下:

假设检验Hypothesis Testing
让我们回到2016年总统选举中决定选民偏好的例子。假设我们怀疑支持希拉里的选民比例大于1/21/21/2 ,并且我们从美国人口中抽取了标记为 {Xi}in=1\{X_i\}^n_i=1{Xi}in=1的样本。基于这些样本,我们能支持或否定希拉里更受欢迎的假设吗?我们对我们的结论有多大的信心?假设检验是帮助回答这些问题的完美工具。
构建一个测试
本文中的假设是关于感兴趣的参数的声明。在总统选举的例子中,感兴趣的参数是 ppp ,即支持希拉里的人所占的比。那么一个假设可能是 p>0.5p>0.5p>0.5 ,即超过一半的人支持希拉里。
假设检验有四个主要组成部分。
-
备择假设alternative hypothesis,表示为HaH_aHa ,是一个我们想要支持的主张。在前面的例子中,备择假设为 p>0.5p>0.5p>0.5 。
-
零假设null hypothesis,记为 H0H_0H0,与备择假设相反。在这种情况下,零假设是 p≤0.5p≤0.5p≤0.5 ,即只有不到一半的人支持希拉里。
-
检验统计量test statistic,是样本观测值的函数。基于检验统计量,我们将接受或拒绝零假设。在前面的例子中,检验统计量是样本均值 X‾\overline{X}X 。样本均值通常是许多假设检验的检验统计量。
-
拒绝域rejection region是样本空间 ΩΩΩ 的子集,它决定是否拒绝零假设。如果检验统计量落在拒绝域,那么我们拒绝原假设。否则,我们接受。在总统选举的例子中,拒绝区域为
RR:{(x1,x2,...,xn):X‾>k}RR:\{(x_1,x_2,...,x_n):\overline{X}>k\} RR:{(x1,x2,...,xn):X>k}
这种表示法意味着如果 X‾\overline{X}X 落在区间 (k,∞)(k,∞)(k,∞),我们将拒绝,其中 kkk 是我们必须确定的某个数字。kkk由Type I error决定,它在下一节中定义。一旦计算出 kkk ,我们根据检验统计量的值拒绝或接受零假设,检验完成。

错误类型
在假设检验中有两种基本类型的错误。它们分别表示为 III 型和 IIIIII 型错误。
🔥 定义 :当 H0H_0H0 实际上为真,我们却拒绝它时,就犯了 III 型错误。Type I error的概率通常记为 ααα。
换句话说,ααα 是假阳性的概率。
🔥 定义 :当 H0H_0H0 实际上为假,我们却接受它时,就犯了 IIIIII 型错误。Type II error的概率通常记为 βββ。
换句话说, βββ 是假阴性的概率。
在假设检验的背景下, ααα 将决定拒绝域。如果我们将假阳性的概率限制在小于0.05,那么我们有
P(X‾∈RR∣H0)≤0.05P(\overline{X}\in RR|H_0)\le 0.05 P(X∈RR∣H0)≤0.05
即假设 H0H_0H0 为真,我们的检验统计量落在拒绝域(意味着我们拒绝 H0H_0H0 ),概率为0.05。继续我们的总统选举的例子,拒绝域的形式是 X‾>k\overline{X} > kX>k,零假设是 p≤0.5p≤0.5p≤0.5。我们上面的表达式就变成了
P(X‾>k∣p≤5)≤0.05P(\overline{X}>k|p\le 5)\le 0.05 P(X>k∣p≤5)≤0.05
如果 n>30n>30n>30 ,那我们可以应用中心极限定理

其中 YYY 是 N(0,1)N(0,1)N(0,1) 的随机变量。由于 p≤0.5p≤0.5p≤0.5 意味着 k−pS/n≥k−0.5S/n\frac{k-p}{S/\sqrt{n}} \ge \frac{k-0.5}{S/\sqrt{n}}S/nk−p≥S/nk−0.5,我们也必须有

因此

因此,如果我们将不等式右侧的概率限定为0.05,那么我们也将不等式左侧的概率(I型误差 ααα )限定为0.05。由于 YYY 是 N(0,1)N(0,1)N(0,1) 的随机变量,我们可以查 zzz 表,找到 z0.05=−1.64z_{0.05} =−1.64z0.05=−1.64,因此

设k−0.5S/n=1.64\frac{k-0.5}{S/\sqrt{n}}=1.64S/nk−0.5=1.64,我们可以求解 kkk 来确定拒绝域:
k=0.5+1.64⋅Snk=0.5+1.64\cdot \frac{S}{\sqrt{n}} k=0.5+1.64⋅nS
由于我们的拒绝域形式为 X‾>k\overline{X} > kX>k,我们只需检查 X‾>0.5+1.64⋅Sn\overline{X} > 0.5+1.64\cdot \frac{S}{\sqrt{n}}X>0.5+1.64⋅nS。如果这是真的,那么我们拒绝零假设,并得出结论,超过一半的人口支持希拉里。因为我们设 α=0.05α = 0.05α=0.05 ,所以我们有 1−α=0.951−α = 0.951−α=0.95 的把握相信我们的结论是正确的。
在上面的例子中,我们通过为 ppp 代入0.5来确定拒绝域,即使零假设为 p≤0.5p≤0.5p≤0.5 。这就好像我们的零假设是H0:p=0.5H_0: p = 0.5H0:p=0.5,而不是H0:p≤0.5H_0: p≤0.5H0:p≤0.5。一般来说,当我们确定拒绝域时,可以简化 H0H_0H0 ,并假设边界情况(在这种情况下 p=0.5p = 0.5p=0.5)。
p-Values
正如我们在上一节中看到的,选定的 ααα 确定了拒绝域,因此假阳性的概率小于 ααα 。现在假设我们观察一些检验统计数据,比如说,支持希拉里的选民 X‾\overline{X}X 的样本比例。然后,我们提出以下问题。给定 X‾\overline{X}X,使我们仍然拒绝零假设的 ααα 的最小值是多少?这将引出以下定义。
p=min{α∈(0,1):Reject H0using an α level test}p =\min\{\alpha \in(0,1):\text{Reject}\ H_0\ \text{using an α level test}\} p=min{α∈(0,1):Reject H0 using an α level test}
ppp 值即我们仍然拒绝零假设的 ααα 的最小值。
下面我们通过一个例子来说明。
🍌 假设我们对 nnn 个人进行抽样,问他们更喜欢哪个候选人。就像我们之前做的那样,我们可以将每个人表示为一个指标函数,
Xi={1第i个人更支持希拉里0其它X_i=\begin{cases} 1& 第i个人更支持希拉里\\ 0& 其它 \end{cases} Xi={10第i个人更支持希拉里其它
那么 X‾\overline{X}X 是样本中倾向于希拉里的比例。在取了 nnn 个样本后,假设我们观察到 X‾=0.7\overline{X}=0.7X=0.7 。如果我们要建立一个假设检验,我们的假设,检验统计量和拒绝域将是

其中 qqq 是整个美国人口中支持希拉里的真实比例。使用直观的定义,ppp 值是我们观察到比 0.70.70.7 更极端的概率。由于零假设是 q≤0.5q≤0.5q≤0.5 ,在这种情况下,"更极端” 意味着 “大于0.7”。因此,ppp 值是指在给定一个新的样本时,我们观察到新 X‾\overline{X}X 大于0.7的概率,假设无效,即 q≤0.5q≤0.5q≤0.5。 X‾\overline{X}X 归一化有
P(X‾>0.7∣H0)=P(X‾−0.5S/n>0.7−0.5S/n)≈P(Y>0.7−0.5S/n)≐pP( \overline{X}>0.7|H_0 )=P(\frac{\overline{X}-0.5}{S/\sqrt{n}}>\frac{0.7-0.5}{S/\sqrt{n}})\approx P(Y>\frac{0.7-0.5}{S/\sqrt{n}})\doteq p P(X>0.7∣H0)=P(S/nX−0.5>S/n0.7−0.5)≈P(Y>S/n0.7−0.5)≐p
其中 Y∼N(0,1)Y\sim N(0,1)Y∼N(0,1)。然后,我们将计算值 zp≐0.7−0.5S/nz_p\doteq \frac{0.7-0.5}{S/\sqrt{n}}zp≐S/n0.7−0.5。然后,我们将查找 zzz 表并找到与 zpz_pzp 对应的概率,记为 ppp (就是我们的 ppp 值)。
Bootstrap
Bootstrap又称自展法、自举法、自助法、靴带法 , 是统计学习中一种重采样(Resampling)技术,用来估计标准误差、置信区间和偏差
Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。机器学习中的Bagging,AdaBoost等方法其实都蕴含了Boostrap的思想,在集成学习的范畴里 Bootstrap直接派生出了Bagging模型.
子样本之于样本,可以类比样本之于总体

参考
- https://github.com/seeingtheory/Seeing-Theory
- 统计学中的Bootstrap方法(Bootstrap抽样)
相关文章:
看见统计——第四章 统计推断:频率学派
看见统计——第四章 统计推断:频率学派 接下来三节的主题是中心极限定理的应用。在不了解随机变量序列 {Xi}\{X_i\}{Xi} 的潜在分布的情况下,对于大样本量,中心极限定理给出了关于样本均值的声明。例如,如果 YYY 是一个 N(0&am…...
2023年2月访问学者博士后热门国家出入境政策变化汇总
近期关于出国的咨询量日益增多,出入境政策也是其中之一。所以本期知识人网小编汇总了最新访问学者和博士后关注的热门国家及地区入境政策变化,提供给大家。目前各国入境政策大致分为三种:一、 无法入境的国家如:摩洛哥、朝鲜等。二…...
“离开浪浪山”是假象,80%年轻人下班后还在学习,真实是想先上个山。
最近,又有一个关于年轻人与职场的新词横空出世—— 浪浪山。 什么是浪浪山? 每个人心中都有一座浪浪山。 浪浪山,其实是人生的一种状态,步入社会时满腔热血,然而很快就被现实给修理了一顿;想要辞职不干出去…...
Kotlin 33. CompileSdkVersion 和 targetSdkVersion 有什么区别?
CompileSdkVersion 和 targetSdkVersion 有什么区别? 在 build.gradle (Module) 文件中,我们通常会看到 CompileSdkVersion 和 targetSdkVersion 的使用,比如下面是一个完整的 build.gradle (Module) 文件: plugins {id com.and…...
实用调试技巧——“C”
各位CSDN的uu们你们好呀,今天小雅兰的内容是实用调试技巧,其实小雅兰一开始,也不知道调试到底是什么,一遇到问题,首先就是观察程序,改改这里改改那里,最后导致bug越修越多,或者是问别…...
JavaScript - 函数
文章目录一、箭头函数二、函数名三、理解参数3.1 箭头函数中的参数四、没有重载五、默认参数值5.1 默认参数作用域与暂时性死区六、参数扩展与收集6.1 扩展参数6.2 收集参数七、函数声明与函数表达式八、函数作为值九、函数内部9.1 arguments9.2 this9.3 caller9.4 new.target十…...
Cesium 卫星轨迹、卫星通信、卫星过境,模拟数据传输。
起因:看了cesium官网卫星通信示例发现只有cmzl版本的,决定自己动手写一个。欢迎大家一起探讨,评论留言。 效果 全部代码在最后 起步 寻找卫星轨迹数据,在网站space-track上找的,自己注册账号QQ邮箱即可。 卫星轨道类…...
2023年湖北中级职称(工程类建筑类)报名条件和要求是什么?
2023年湖北中级职称(工程类建筑类)报名条件和要求是什么? 中级职称分为计算机类、医药类、卫生类、教师类、工程类、经济类等各大类,今天主要就是跟大家说一下工程类中级职称评审的一个条件和要求,这也是评职称人员应该…...
socket编程复习
再次用到socket编程,将socket相关的知识点做了简单整理,根据网络上大家的整理,又做了一些调整和汇总。 API列表 sokect常见的API大致有列表里面这么多,不同平台的实现可能有些微的差别,下面对常用API的参数和用法做了…...
深度学习神经网络基础知识(三)前向传播,反向传播和计算图
专栏:神经网络复现目录 深度学习神经网络基础知识(三) 本文讲述神经网络基础知识,具体细节讲述前向传播,反向传播和计算图,同时讲解神经网络优化方法:权重衰减,Dropout等方法,最后进行Kaggle实…...
一图说明 monorepo 落地流程方案
关于 monorepo 初次讨论已有2年载,目前团队已经沉淀了成熟的技术方案且经受住了实战考验。所以特梳理相关如下: 也算是关于之前发起的 monorepo–依赖 的解答篇。 上图为目前团队贡献的主流程:① 本地开发 > ② 提交Git仓库 > ③ 触发…...
SAP ABAP WRITE语法大全
列表是ABAP/4报表程序数据的输出媒介。每个ABAP/4报表程序将其输出数据传递到直接与该程序连接的列表中。每个程序最多生成21个列表:1个基本列表和20个辅助列表。 将数据写入列表的基本ABAP/4语句是WRITE、SKIP和ULINE输出语句。 一、标准列表结构 (1&…...
微信小程序自定义全局组件showModal
开发过程中微信提供的showmodal样式不符合ui风格,又不想写成组件用的页面都引入,就考虑模拟showmodal写一个自定义的弹框组件 一,在components中新建一个navModal组件 navModal.wxml <view class="modal_mask" hidden={{hidden}}><view class="mo…...
4|无线传感器网络与应用|无线传感器网络原理及方法-许毅版|考试知识点
《无线传感器网络原理及方法》第1章无线传感器网络概述1.1无线传感器网络的基本概念1.2无线传感器网络的特征1.2.1与现有无线网络的区别1.2.2与现场总线的区别1.2.3传感器节点的限制1.2.4传感器组网的特点1.3无线传感器网络的关键性能指标1.4无线传感器网络的应用1.5无线传感器…...
startForegroundService与startService 使用浅析
一. 了解服务(Service)的概念 service是安卓开发中一个很重要组件,意为“服务”。与我们常见的activity不同,“服务”是默默的在背后进行工作的,通常,它用于在后台为我们执行一些耗时,或者需要…...
django项目实战三(django+bootstrap实现增删改查)进阶分页
目录 一、分页 1、修改case_list.html页面 2、修改views.py的case_list方法(分页未封装) 二、分页封装 1、新建类Pagination 2、修改views.py的case_list方法 三、再优化,实现搜索分页qing情况 四、优化其他查询页面实现分页和查询 五…...
Python 之 Pandas DataFrame 数据类型的简介、创建的列操作
文章目录一、DataFrame 结构简介二、DataFrame 对象创建1. 使用普通列表创建2. 使用嵌套列表创建3 指定数值元素的数据类型为 float4. 字典嵌套列表创建5. 添加自定义的行标签6. 列表嵌套字典创建 DataFrame 对象7. Series 创建 DataFrame 对象三、DataFrame 列操作1. 选取数据…...
华为OD机试真题Python实现【5键键盘的输出】真题+解题思路+代码(20222023)
🔥系列专栏 华为OD机试(Python)真题目录汇总华为OD机试(JAVA)真题目录汇总华为OD机试(C++)真题目录汇总华为OD机试(JavaScript)真题目录汇总文章目录 🔥系列专栏题目输入输出描述:示例1:示例2:解题思路代码实现运行结果:版权说明:题目...
IDEA全家桶式讲解 | IDEA安装、使用、断点调试、Git、插件 (第二篇)
目录 一:JavaEE阶段需要掌握的IDEA技能 1. 配置Tomcat 2. 配置Maven 3. IDEA连接数据库 4. 方便的特殊功能 5. 断点调试(重点) 6. IDEA中常用Git协同开发(重点) 7. 常用插件安装 一:JavaEE阶段需要…...
音视频基础之封装格式与音视频同步
封装格式的概念 封装格式(也叫容器)就是将已经编码压缩好的视频流、音频流及字幕按照一定的方案放到一个文件中,便于播放软件播放。 一般来说,视频文件的后缀名就是它的封装格式。 封装的格式不一样,后缀名也就不一样。 比如&a…...
进程地址空间(比特课总结)
一、进程地址空间 1. 环境变量 1 )⽤户级环境变量与系统级环境变量 全局属性:环境变量具有全局属性,会被⼦进程继承。例如当bash启动⼦进程时,环 境变量会⾃动传递给⼦进程。 本地变量限制:本地变量只在当前进程(ba…...
Objective-C常用命名规范总结
【OC】常用命名规范总结 文章目录 【OC】常用命名规范总结1.类名(Class Name)2.协议名(Protocol Name)3.方法名(Method Name)4.属性名(Property Name)5.局部变量/实例变量(Local / Instance Variables&…...
【大模型RAG】Docker 一键部署 Milvus 完整攻略
本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...
OkHttp 中实现断点续传 demo
在 OkHttp 中实现断点续传主要通过以下步骤完成,核心是利用 HTTP 协议的 Range 请求头指定下载范围: 实现原理 Range 请求头:向服务器请求文件的特定字节范围(如 Range: bytes1024-) 本地文件记录:保存已…...
根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:
根据万维钢精英日课6的内容,使用AI(2025)可以参考以下方法: 四个洞见 模型已经比人聪明:以ChatGPT o3为代表的AI非常强大,能运用高级理论解释道理、引用最新学术论文,生成对顶尖科学家都有用的…...
【学习笔记】深入理解Java虚拟机学习笔记——第4章 虚拟机性能监控,故障处理工具
第2章 虚拟机性能监控,故障处理工具 4.1 概述 略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具 命令:jps [options] [hostid] 功能:本地虚拟机进程显示进程ID(与ps相同),可同时显示主类&#x…...
Swagger和OpenApi的前世今生
Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章,二者共同塑造了现代RESTful API的开发范式。 本期就扒一扒其技术演进的关键节点与核心逻辑: 🔄 一、起源与初创期:Swagger的诞生(2010-2014) 核心…...
蓝桥杯 冶炼金属
原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述 小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V,是一个正整数,表示每 V V V 个普通金属 O O O 可以冶炼出 …...
《Docker》架构
文章目录 架构模式单机架构应用数据分离架构应用服务器集群架构读写分离/主从分离架构冷热分离架构垂直分库架构微服务架构容器编排架构什么是容器,docker,镜像,k8s 架构模式 单机架构 单机架构其实就是应用服务器和单机服务器都部署在同一…...
上位机开发过程中的设计模式体会(1):工厂方法模式、单例模式和生成器模式
简介 在我的 QT/C 开发工作中,合理运用设计模式极大地提高了代码的可维护性和可扩展性。本文将分享我在实际项目中应用的三种创造型模式:工厂方法模式、单例模式和生成器模式。 1. 工厂模式 (Factory Pattern) 应用场景 在我的 QT 项目中曾经有一个需…...
