3.5 统计初步
本章系统阐述统计推断理论基础,涵盖大数定律、抽样分布、参数估计与假设检验等核心内容。以下从六个核心考点系统梳理知识体系:
考点一:大数定律与中心极限定理
1. 大数定律
- 切比雪夫不等式:
设随机变量 X X X 的数学期望 E ( X ) = μ E(X)=\mu E(X)=μ,方差 D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2,则对任意 ε > 0 \varepsilon>0 ε>0:
P { ∣ X − μ ∣ ≥ ε } ≤ σ 2 ε 2 P\{|X-\mu| \geq \varepsilon\} \leq \frac{\sigma^2}{\varepsilon^2} P{∣X−μ∣≥ε}≤ε2σ2 - 辛钦大数定律:
设独立同分布序列 { X n } \{X_n\} {Xn} 满足 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ,则对任意 ε > 0 \varepsilon>0 ε>0:
lim n → ∞ P { ∣ 1 n ∑ k = 1 n X k − μ ∣ < ε } = 1 \lim_{n \to \infty} P\left\{ \left| \frac{1}{n}\sum_{k=1}^n X_k - \mu \right| < \varepsilon \right\} = 1 n→∞limP{ n1k=1∑nXk−μ <ε}=1
核心思想:大量样本的平均值具有稳定性,依概念收敛于理论均值。
2. 中心极限定理
设独立同分布序列 { X n } \{X_n\} {Xn} 满足 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ, D ( X i ) = σ 2 D(X_i)=\sigma^2 D(Xi)=σ2,则:
lim n → ∞ P { ∑ k = 1 n X k − n μ σ n ≤ x } = Φ ( x ) \lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^n X_k - n\mu}{\sigma\sqrt{n}} \leq x \right\} = \Phi(x) n→∞limP{σn∑k=1nXk−nμ≤x}=Φ(x)
核心思想:大量样本和 ∑ X k \sum X_k ∑Xk 近似服从正态分布 N ( n μ , n σ 2 ) N(n\mu, n\sigma^2) N(nμ,nσ2)。
考点二:抽样分布
1. 统计量定义
- 样本均值: X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i Xˉ=n1∑i=1nXi
- 样本方差: S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 S2=n−11∑i=1n(Xi−Xˉ)2
- 次序统计量: X ( 1 ) = min ( X i ) , X ( n ) = max ( X i ) X_{(1)} = \min(X_i),\ X_{(n)} = \max(X_i) X(1)=min(Xi), X(n)=max(Xi)
2. 三大抽样分布
| 分布类型 | 定义 | 重要性质 |
|---|---|---|
| χ 2 \chi^2 χ2分布 | X 1 , . . . , X n ∼ N ( 0 , 1 ) X_1,...,X_n \sim N(0,1) X1,...,Xn∼N(0,1),则 ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \sum_{i=1}^n X_i^2 \sim \chi^2(n) ∑i=1nXi2∼χ2(n) | 可加性(独立): χ 2 ( n 1 ) + χ 2 ( n 2 ) ∼ χ 2 ( n 1 + n 2 ) \chi^2(n_1) + \chi^2(n_2) \sim \chi^2(n_1+n_2) χ2(n1)+χ2(n2)∼χ2(n1+n2) |
| t t t分布 | X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1),\ Y \sim \chi^2(n) X∼N(0,1), Y∼χ2(n),则 t = X Y / n ∼ t ( n ) t = \frac{X}{\sqrt{Y/n}} \sim t(n) t=Y/nX∼t(n) | 对称性: t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n) = -t_{\alpha}(n) t1−α(n)=−tα(n) |
| F F F分布 | U ∼ χ 2 ( m ) , V ∼ χ 2 ( n ) U \sim \chi^2(m),\ V \sim \chi^2(n) U∼χ2(m), V∼χ2(n),则 F = U / m V / n ∼ F ( m , n ) F = \frac{U/m}{V/n} \sim F(m,n) F=V/nU/m∼F(m,n) | 倒数性质: F 1 − α ( m , n ) = 1 F α ( n , m ) F_{1-\alpha}(m,n) = \frac{1}{F_{\alpha}(n,m)} F1−α(m,n)=Fα(n,m)1 |
3. 正态总体下的抽样分布
设 X 1 , . . . , X n ∼ N ( μ , σ 2 ) X_1,...,X_n \sim N(\mu,\sigma^2) X1,...,Xn∼N(μ,σ2),则:
- X ˉ ∼ N ( μ , σ 2 n ) \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) Xˉ∼N(μ,nσ2),标准化得 U = X ˉ − μ σ / n ∼ N ( 0 , 1 ) U = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/nXˉ−μ∼N(0,1)
- ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1),且 X ˉ \bar{X} Xˉ 与 S 2 S^2 S2 独立
- T = X ˉ − μ S / n ∼ t ( n − 1 ) T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1) T=S/nXˉ−μ∼t(n−1)
- χ 2 = 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 ∼ χ 2 ( n ) \chi^2 = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \mu)^2 \sim \chi^2(n) χ2=σ21∑i=1n(Xi−μ)2∼χ2(n)
考点三:统计量的数字特征
| 统计量 | 期望 | 方差 |
|---|---|---|
| 样本均值 X ˉ \bar{X} Xˉ | E ( X ˉ ) = μ E(\bar{X}) = \mu E(Xˉ)=μ | D ( X ˉ ) = σ 2 n D(\bar{X}) = \frac{\sigma^2}{n} D(Xˉ)=nσ2 |
| 样本方差 S 2 S^2 S2 | E ( S 2 ) = σ 2 E(S^2) = \sigma^2 E(S2)=σ2 | D ( S 2 ) = 2 σ 4 n − 1 D(S^2) = \frac{2\sigma^4}{n-1} D(S2)=n−12σ4 |
| 样本协方差 S X Y S_{XY} SXY | E ( S X Y ) = Cov ( X , Y ) E(S_{XY}) = \text{Cov}(X,Y) E(SXY)=Cov(X,Y) | 复杂表达式需特殊计算 |
考点四:参数估计
1. 矩估计法
- 核心思想:用样本矩估计总体矩
1 n ∑ i = 1 n X i k → E ( X k ) \frac{1}{n}\sum_{i=1}^n X_i^k \to E(X^k) n1i=1∑nXik→E(Xk) - 步骤:
- 建立方程 μ ^ k = E ( X k ) \hat{\mu}_k = E(X^k) μ^k=E(Xk)
- 解方程得参数估计量
2. 最大似然估计
- 似然函数:
离散型: L ( θ ) = ∏ i = 1 n P ( X i ; θ ) L(\theta) = \prod_{i=1}^n P(X_i;\theta) L(θ)=∏i=1nP(Xi;θ)
连续型: L ( θ ) = ∏ i = 1 n f ( X i ; θ ) L(\theta) = \prod_{i=1}^n f(X_i;\theta) L(θ)=∏i=1nf(Xi;θ) - 求解步骤:
- 取对数 ln L ( θ ) \ln L(\theta) lnL(θ)
- 对 θ \theta θ 求导并令导数为零
- 解方程得 θ ^ M L E \hat{\theta}_{MLE} θ^MLE
考点五:估计量的评选标准
| 标准 | 数学定义 | 判定方法 |
|---|---|---|
| 无偏性 | E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ | 计算期望验证等式成立 |
| 有效性 | D ( θ ^ 1 ) < D ( θ ^ 2 ) D(\hat{\theta}_1) < D(\hat{\theta}_2) D(θ^1)<D(θ^2) | 比较方差大小 |
| 一致性 | lim n → ∞ P ( ∣ θ ^ − θ ∣ ≥ ε ) = 0 \lim_{n \to \infty} P(|\hat{\theta}-\theta| \geq \varepsilon) = 0 limn→∞P(∣θ^−θ∣≥ε)=0 | 应用大数定律或切比雪夫不等式 |
考点六:区间估计与假设检验
1. 区间估计
- 步骤:
- 构造枢轴量 T ( X , θ ) T(X,\theta) T(X,θ)(如 U = X ˉ − μ σ / n U = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} U=σ/nXˉ−μ)
- 确定置信区间 P ( a < T < b ) = 1 − α P(a < T < b) = 1-\alpha P(a<T<b)=1−α
- 反解得到 θ \theta θ 的区间估计
正态总体均值区间估计:
- σ 2 \sigma^2 σ2 已知: μ ∈ ( X ˉ ± z α / 2 σ n ) \mu \in \left( \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) μ∈(Xˉ±zα/2nσ)
- σ 2 \sigma^2 σ2 未知: μ ∈ ( X ˉ ± t α / 2 ( n − 1 ) S n ) \mu \in \left( \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right) μ∈(Xˉ±tα/2(n−1)nS)
2. 假设检验
-
两类错误:
错误类型 概率符号 发生条件 第一类错误 α \alpha α H 0 H_0 H0 为真但被拒绝(弃真) 第二类错误 β \beta β H 0 H_0 H0 为假但被接受(存伪) -
检验步骤:
- 建立原假设 H 0 H_0 H0 与备择假设 H 1 H_1 H1
- 确定检验统计量及其分布
- 给定显著性水平 α \alpha α,确定拒绝域
- 根据样本计算统计量值,判断是否拒绝 H 0 H_0 H0
总结
本章重点掌握:
- 大数定律与中心极限定理的理论联系与区别
- 三大抽样分布的定义与正态总体的抽样分布性质
- 参数估计的双重方法(矩估计与极大似然估计)
- 假设检验的逻辑框架与两类错误的实际意义
相关文章:
3.5 统计初步
本章系统阐述统计推断理论基础,涵盖大数定律、抽样分布、参数估计与假设检验等核心内容。以下从六个核心考点系统梳理知识体系: 考点一:大数定律与中心极限定理 1. 大数定律 切比雪夫不等式: 设随机变量 X X X 的数学期望 E (…...
数字IC后端实现教程 | Early Clock Flow和Useful skew完全不是一个东西
数字后端零基础入门系列 | Innovus零基础LAB学习Day10 Q: Early clock flow和useful skew都是做短某段路径,这两个有什么区别呢,既然这样还用useful skew是不是有点多余了? Useful Skew技术 在不使用useful skew技术,第一级FF到第二级FF的…...
.Net HttpClient 管理客户端(初始化与生命周期管理)
HttpClient 初始化与生命周期管理 HttpClient 旨在实例化一次,并在应用程序的整个生命周期内重复使用。 为实现复用,HttpClient类库默认使用连接池和请求管道,可以手动管理(连接池、配置管道、使用Polly); 结合IoC容器、工厂模式(提供了IHt…...
【Docker】Docker环境下快速部署Ollama与Open-WebUI:详细指南
Docker环境下快速部署Ollama与Open-WebUI:详细指南 在本篇文章中,我们将深入探讨如何在Docker中高效部署 Ollama 和 Open-WebUI,并解决在实际使用中常见的问题,确保你的模型服务稳定高效地运行。 一、Ollama 和 Open-WebUI 快速部…...
MySQL OCP试题解析(3)
试题如图所示: 一、解析 正确选项:D)The backup can be impacted when DDL operations run during the backup(备份期间运行的 DDL 操作可能影响备份) 1. 关键知识点解析: 题目中的命令 mysqlbackup 使用了…...
SpringCloud之Gateway基础认识-服务网关
0、Gateway基本知识 Gateway 是在 Spring 生态系统之上构建的 API 网关服务,基于 Spring ,Spring Boot 和 Project Reactor 等技术。 Gateway 旨在提供一种简单而有效的方式来对 API 进行路由,以及提供一些强大的过滤器功能,例如…...
ubuntu----100,常用命令2
目录 文件与目录管理系统信息与管理用户与权限管理网络配置与管理软件包管理打包与压缩系统服务与任务调度硬件信息查看系统操作高级工具开发相关其他实用命令 在 Ubuntu 系统中,掌握常用命令可以大幅提升操作效率。以下是一些常用的命令,涵盖了文件管理…...
数字ic后端设计从入门到精通4(含fusion compiler, tcl教学)CMOS VLSI Design
Layout Design Rules 一、什么是 Layout Design Rules? 布局设计规则是一套用于指导芯片物理设计的几何约束条件,确保设计可以在特定制造工艺下被正确制造。这些规则通常由代工厂(foundry)提供,规定了最小线宽、间距、…...
win10 局域网内聊天
在 Windows 10 的局域网 中,如果你想实现 多个用户之间的聊天功能,可以选择以下几种方案,取决于你需要的是: • ✅ 命令行纯文字聊天(如 Linux talk) • ✅ 图形界面聊天室 • ✅ 局域网广播消息 • ✅ 多人…...
STM32-DMA数据转运(8)
目录 一、简介 二、存储器映像 三、DMA框图编辑 四、DMA基本结构 五、两个数据转运的实例 一、简介 直接存储器存取简称DMA(Direct Memory Access),它是一个数据转运小助手,主要用来协助CPU,完成数据转运的工作…...
电机控制储备知识学习(一) 电机驱动的本质分析以及与磁相关的使用场景
目录 电机控制储备知识学习(一)一、电机驱动的本质分析以及与磁相关的使用场景1)电机为什么能够旋转2)电磁原理的学习重要性 二、电磁学理论知识1)磁场基础知识2)反电动势的公式推导 附学习参考网址欢迎大家…...
使用 React 实现语音识别并转换功能
在现代 Web 开发中,语音识别技术的应用越来越广泛。它为用户提供了更加便捷、自然的交互方式,例如语音输入、语音指令等。本文将介绍如何使用 React 实现一个简单的语音识别并转换的功能。 功能概述 我们要实现的功能是一个语音识别测试页面࿰…...
[Git]ssh下用Tortoisegit每次提交都要输密码
问题描述 ssh模式下,用小乌龟提交代码,即使在git服务端存储了公钥,仍然要每次输入密码。 原因分析 小乌龟需要额外配置自己的密钥,才能免除每次输密码。 解决方案 1.配置好ssh密钥 具体方法参考我前一篇文章: […...
如何查看项目是否支持最新 Android 16K Page Size 一文汇总
前几天刚聊过 《Google 开始正式强制 Android 适配 16 K Page Size》 之后,被问到最多的问题是「怎么查看项目是否支持 16K Page Size」 ?其实有很多直接的方式,但是最难的是当你的项目有很多依赖时,怎么知道这个「不支持的动态库…...
ESP32C3连接wifi
文章目录 🔧 一、ESP32-C3 连接 Wi-Fi 的基本原理(STA 模式)✅ 二、完整代码 注释讲解(适配 ESP32-C3)📌 三、几个关键点解释🔚 四、小结 🔧 一、ESP32-C3 连接 Wi-Fi 的基本原理&a…...
HTTP方法和状态码(Status Code)
HTTP方法 HTTP方法(也称HTTP动词)主要用于定义对资源的操作类型。根据HTTP/1.1规范(RFC 7231)以及后续扩展,常用的HTTP方法有以下几种: GET:请求获取指定资源的表示形式。POST:向指…...
机器学习中分类模型的常用评价指标
评价指标是针对模型性能优劣的一个定量指标。 一种评价指标只能反映模型一部分性能,如果选择的评价指标不合理,那么可能会得出错误的结论,故而应该针对具体的数据、模型选取不同的的评价指标。 本文将详细介绍机器学习分类任务的常用评价指…...
# YOLOv3:基于 PyTorch 的目标检测模型实现
YOLOv3:基于 PyTorch 的目标检测模型实现 引言 YOLOv3(You Only Look Once)是一种流行的单阶段目标检测算法,它能够直接在输入图像上预测边界框和类别概率。YOLOv3 的优势在于其高效性和准确性,使其在实时目标检测任…...
MySQL的Docker版本,部署在ubantu系统
前言 MySQL的Docker版本,部署在ubantu系统,出现问题: 1.执行一个SQL,只有错误编码,没有错误提示信息,主要影响排查SQL运行问题; 2.这个问题,并不影响实际的MySQL运行,如…...
Mac QT水平布局和垂直布局
首先上代码 #include "mainwindow.h" #include "ui_mainwindow.h" #include <QPushButton> #include<QVBoxLayout>//垂直布局 #include<QHBoxLayout>//水平布局头文件 MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), …...
服务器制造业中,L2、L6、L10等表示什么意思
在服务器制造业中,L2、L6、L10等是用于描述服务器生产流程集成度的分级体系,从基础零件到完整机架系统共分为L1-L12共12个等级。不同等级对应不同的生产环节和交付形态,以下是核心级别的具体含义: L2(Level 2…...
回答 | 图形数据库neo4j社区版可以应用小型企业嘛?
刚在知乎上看到了一个提问,挺有意思,于是乎,贴到这里再简聊一二。 转自知乎提问 当然可以,不过成本问题不容小觑。另外还有性能上的考量。 就在最近,米国国家航空航天局——NASA因为人力成本问题,摒弃了使…...
Linux操作系统从入门到实战(二)手把手教你安装VMware17pro与CentOS 9 stream,实现Vim配置,并配置C++环境
Linux操作系统从入门到实战(二)手把手教你安装VMware17pro与CentOS 9.0 stream,实现Vim配置,并编译C文件 前言一、安装VMware17pro二、安装CentOS9.02.1 为什么选择CentOS9,与CentOS7对比2.1 官网下载CentOS9.02.2 国内…...
软考架构师考试-UML图总结
考点 选择题 2-4分 案例分析0~1题和面向对象结合考察,前几年固定一题。近3次考试没有出现。但还是有可能考。 UML图概述 1.用例图:描述系统功能需求和用户(参与者)与系统之间的交互关系,聚焦于“做什么”。 2.类图&…...
后端系统做国际化改造,生成多语言包
要将你当前系统中的 中文文案提取并翻译为英文语言包,建议采用 自动扫描 翻译辅助 语言包生成 的方式,流程如下: ✅ 一、目标总结 提取:扫描后端 C# 和 Java 代码中的 中文字符串 翻译:将中文自动翻译为英文&#x…...
论文学习_Trex: Learning Execution Semantics from Micro-Traces for Binary Similarity
摘要:检测语义相似的函数在漏洞发现、恶意软件分析及取证等安全领域至关重要,但该任务面临实现差异大、跨架构、多编译优化及混淆等挑战。现有方法多依赖语法特征,难以捕捉函数的执行语义。对此,TREX 提出了一种基于迁移学习的框架…...
在VirtualBox中安装虚拟机后不能全屏显示的问题及解决办法
在VirtualBox中安装Windows或Linux虚拟机后,将遇到启动虚拟机后,只能在屏幕中的一块区域里显示虚拟机桌面,却不能全屏显示的问题。要解决此问题,需要在虚拟机中安装与VirtualBox版本相对应的VBox GuestAdditons软件。 这里…...
《大规模电动汽车充换电设施可调能力聚合评估与预测》MATLAB实现计划
模型概述 根据论文,我将复刻实现结合长短期记忆网络(LSTM)和条件变分自编码器(CVAE)的预测方法,用于电动汽车充换电设施可调能力的聚合评估与预测。 实现步骤 1. 数据预处理 导入充电数据 (Charging_Data.csv)导入天气数据 (Weather_Data.csv)导入电…...
CSS flex:1
在 CSS 中,flex: 1 是一个用于弹性布局(Flexbox)的简写属性,主要用于控制 flex 项目(子元素)如何分配父容器的剩余空间。以下是其核心作用和用法: 核心作用 等分剩余空间:让 flex …...
Python 字典键 “三变一” 之谜
开头:读者的“玄学”字典谜题 上周,朋友发来了一段让他抓耳挠腮的代码: >>> {True: foo, 1: bar, 1.0: baz} {True: baz} “我明明定义了布尔True、整数1、浮点数1.0三个键,结果字典里只剩True一个键,值…...
