当前位置：首页 > article >正文

3.5 统计初步

article 2026/2/8 14:51:46

本章系统阐述统计推断理论基础，涵盖大数定律、抽样分布、参数估计与假设检验等核心内容。以下从六个核心考点系统梳理知识体系：

考点一：大数定律与中心极限定理

1. 大数定律

切比雪夫不等式：
设随机变量 $X$ 的数学期望 $E(X)=\mu$ ，方差 $D(X)=\sigma^2$ ，则对任意 $\varepsilon>0$ ：
$P\{|X-\mu| \geq \varepsilon\} \leq \frac{\sigma^2}{\varepsilon^2}$
辛钦大数定律：
设独立同分布序列 ${X_n\}$ 满足 $E(X_i)=\mu$ ，则对任意 $\varepsilon>0$ ：
$\lim_{n \to \infty} P\left\{ \left| \frac{1}{n}\sum_{k=1}^n X_k - \mu \right| < \varepsilon \right\} = 1$

核心思想：大量样本的平均值具有稳定性，依概念收敛于理论均值。

2. 中心极限定理

设独立同分布序列 ${X_n\}$ 满足 $E(X_i)=\mu$ ， $D(X_i)=\sigma^2$ ，则：
$\lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^n X_k - n\mu}{\sigma\sqrt{n}} \leq x \right\} = \Phi(x)$

核心思想：大量样本和 $\sum X_k$ 近似服从正态分布 $N(n\mu, n\sigma^2)$ 。

考点二：抽样分布

1. 统计量定义

样本均值： $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$
样本方差： $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$
次序统计量： $X_{(1)} = \min(X_i),\ X_{(n)} = \max(X_i)$

2. 三大抽样分布

分布类型	定义	重要性质
$\chi^2$ 分布	$X_1,...,X_n \sim N(0,1)$ ，则 $\sum_{i=1}^n X_i^2 \sim \chi^2(n)$	可加性（独立）： $\chi^2(n_1) + \chi^2(n_2) \sim \chi^2(n_1+n_2)$
$t$ 分布	$\sim N(0,1),\ Y \sim \chi^2(n)$ ，则 $\frac{X}{\sqrt{Y/n}} \sim t(n)$	对称性： $t_{1-\alpha}(n) = -t_{\alpha}(n)$
$F$ 分布	$\sim \chi^2(m),\ V \sim \chi^2(n)$ ，则 $\frac{U/m}{V/n} \sim F(m,n)$	倒数性质： $F_{1-\alpha}(m,n) = \frac{1}{F_{\alpha}(n,m)}$

3. 正态总体下的抽样分布

设 $X_1,...,X_n \sim N(\mu,\sigma^2)$ ，则：

$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$ ，标准化得 $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$
$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ ，且 $\bar{X}$ 与 $S^2$ 独立
$\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$
$\chi^2 = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \mu)^2 \sim \chi^2(n)$

考点三：统计量的数字特征

统计量	期望	方差
样本均值 $\bar{X}$	$E(\bar{X}) = \mu$	$D(\bar{X}) = \frac{\sigma^2}{n}$
样本方差 $S^2$	$E(S^2) = \sigma^2$	$D(S^2) = \frac{2\sigma^4}{n-1}$
样本协方差 $S_{XY}$	$E(S_{XY}) = \text{Cov}(X,Y)$	复杂表达式需特殊计算

考点四：参数估计

1. 矩估计法

核心思想：用样本矩估计总体矩
$\frac{1}{n}\sum_{i=1}^n X_i^k \to E(X^k)$
步骤：
1. 建立方程 $\hat{\mu}_k = E(X^k)$
2. 解方程得参数估计量

2. 最大似然估计

似然函数：
离散型： $L(\theta) = \prod_{i=1}^n P(X_i;\theta)$
连续型： $L(\theta) = \prod_{i=1}^n f(X_i;\theta)$
求解步骤：
1. 取对数 $\ln L(\theta)$
2. 对 $\theta$ 求导并令导数为零
3. 解方程得 $\hat{\theta}_{MLE}$

考点五：估计量的评选标准

标准	数学定义	判定方法
无偏性	$E(\hat{\theta}) = \theta$	计算期望验证等式成立
有效性	$D(\hat{\theta}_1) < D(\hat{\theta}_2)$	比较方差大小
一致性	$\lim_{n \to \infty} P(\|\hat{\theta}-\theta\| \geq \varepsilon) = 0$	应用大数定律或切比雪夫不等式

考点六：区间估计与假设检验

1. 区间估计

步骤：
1. 构造枢轴量 $T(X,\theta)$ （如 $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}$ ）
2. 确定置信区间 $1-\alpha$
3. 反解得到 $\theta$ 的区间估计

正态总体均值区间估计：

$\sigma^2$ 已知： $\mu \in \left( \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right)$
$\sigma^2$ 未知： $\mu \in \left( \bar{X} \pm t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right)$

2. 假设检验

两类错误：

错误类型概率符号发生条件
第一类错误 $\alpha$ $H_0$ 为真但被拒绝（弃真）
第二类错误 $\beta$ $H_0$ 为假但被接受（存伪）
检验步骤：
1. 建立原假设 $H_0$ 与备择假设 $H_1$
2. 确定检验统计量及其分布
3. 给定显著性水平 $\alpha$ ，确定拒绝域
4. 根据样本计算统计量值，判断是否拒绝 $H_0$

错误类型	概率符号	发生条件
第一类错误	$\alpha$	$H_0$ 为真但被拒绝（弃真）
第二类错误	$\beta$	$H_0$ 为假但被接受（存伪）

总结

本章重点掌握：

大数定律与中心极限定理的理论联系与区别
三大抽样分布的定义与正态总体的抽样分布性质
参数估计的双重方法（矩估计与极大似然估计）
假设检验的逻辑框架与两类错误的实际意义

3.5 统计初步

本章系统阐述统计推断理论基础，涵盖大数定律、抽样分布、参数估计与假设检验等核心内容。以下从六个核心考点系统梳理知识体系： 考点一：大数定律与中心极限定理 1. 大数定律切比雪夫不等式： 设随机变量 X X X 的数学期望 E (…...

编程日记 2026/1/23 8:21:51

数字IC后端实现教程 | Early Clock Flow和Useful skew完全不是一个东西

数字后端零基础入门系列 | Innovus零基础LAB学习Day10 Q: Early clock flow和useful skew都是做短某段路径，这两个有什么区别呢，既然这样还用useful skew是不是有点多余了? Useful Skew技术在不使用useful skew技术，第一级FF到第二级FF的…...

编程日记 2026/1/26 7:04:00

.Net HttpClient 管理客户端(初始化与生命周期管理)

HttpClient 初始化与生命周期管理 HttpClient 旨在实例化一次，并在应用程序的整个生命周期内重复使用。为实现复用，HttpClient类库默认使用连接池和请求管道，可以手动管理(连接池、配置管道、使用Polly); 结合IoC容器、工厂模式(提供了IHt…...

编程日记 2026/1/19 18:01:42

【Docker】Docker环境下快速部署Ollama与Open-WebUI：详细指南

Docker环境下快速部署Ollama与Open-WebUI：详细指南在本篇文章中，我们将深入探讨如何在Docker中高效部署 Ollama 和 Open-WebUI，并解决在实际使用中常见的问题，确保你的模型服务稳定高效地运行。一、Ollama 和 Open-WebUI 快速部…...

编程日记 2026/2/5 21:37:00

MySQL OCP试题解析（3）

试题如图所示： 一、解析正确选项：D）The backup can be impacted when DDL operations run during the backup（备份期间运行的 DDL 操作可能影响备份） 1. 关键知识点解析： 题目中的命令 mysqlbackup 使用了…...

编程日记 2026/1/26 11:41:39

SpringCloud之Gateway基础认识-服务网关

0、Gateway基本知识 Gateway 是在 Spring 生态系统之上构建的 API 网关服务，基于 Spring ，Spring Boot 和 Project Reactor 等技术。 Gateway 旨在提供一种简单而有效的方式来对 API 进行路由，以及提供一些强大的过滤器功能，例如…...

编程日记 2026/1/27 14:23:50

ubuntu----100，常用命令2

目录文件与目录管理系统信息与管理用户与权限管理网络配置与管理软件包管理打包与压缩系统服务与任务调度硬件信息查看系统操作高级工具开发相关其他实用命令在 Ubuntu 系统中，掌握常用命令可以大幅提升操作效率。以下是一些常用的命令，涵盖了文件管理…...

编程日记 2026/1/19 18:50:52

数字ic后端设计从入门到精通4（含fusion compiler, tcl教学）CMOS VLSI Design

Layout Design Rules 一、什么是 Layout Design Rules？ 布局设计规则是一套用于指导芯片物理设计的几何约束条件，确保设计可以在特定制造工艺下被正确制造。这些规则通常由代工厂（foundry）提供，规定了最小线宽、间距、…...

编程日记 2026/1/20 4:38:00

win10 局域网内聊天

在 Windows 10 的局域网中，如果你想实现多个用户之间的聊天功能，可以选择以下几种方案，取决于你需要的是： • ✅ 命令行纯文字聊天（如 Linux talk） • ✅ 图形界面聊天室 • ✅ 局域网广播消息 • ✅ 多人…...

编程日记 2026/1/23 8:28:55

STM32-DMA数据转运（8）

目录一、简介二、存储器映像三、DMA框图编辑四、DMA基本结构五、两个数据转运的实例一、简介直接存储器存取简称DMA（Direct Memory Access），它是一个数据转运小助手，主要用来协助CPU，完成数据转运的工作…...

编程日记 2026/1/24 12:04:08

电机控制储备知识学习（一）电机驱动的本质分析以及与磁相关的使用场景

目录电机控制储备知识学习（一）一、电机驱动的本质分析以及与磁相关的使用场景1）电机为什么能够旋转2）电磁原理的学习重要性二、电磁学理论知识1）磁场基础知识2）反电动势的公式推导附学习参考网址欢迎大家…...

编程日记 2026/1/27 8:31:25

使用 React 实现语音识别并转换功能

在现代 Web 开发中，语音识别技术的应用越来越广泛。它为用户提供了更加便捷、自然的交互方式，例如语音输入、语音指令等。本文将介绍如何使用 React 实现一个简单的语音识别并转换的功能。功能概述我们要实现的功能是一个语音识别测试页面&#xff0…...

编程日记 2026/1/31 13:42:21

[Git]ssh下用Tortoisegit每次提交都要输密码

问题描述 ssh模式下，用小乌龟提交代码，即使在git服务端存储了公钥，仍然要每次输入密码。原因分析小乌龟需要额外配置自己的密钥，才能免除每次输密码。解决方案 1.配置好ssh密钥具体方法参考我前一篇文章： […...

编程日记 2026/1/29 12:06:54

如何查看项目是否支持最新 Android 16K Page Size 一文汇总

前几天刚聊过《Google 开始正式强制 Android 适配 16 K Page Size》之后，被问到最多的问题是「怎么查看项目是否支持 16K Page Size」 ？其实有很多直接的方式，但是最难的是当你的项目有很多依赖时，怎么知道这个「不支持的动态库…...

编程日记 2026/2/1 6:59:12

ESP32C3连接wifi

文章目录 🔧 一、ESP32-C3 连接 Wi-Fi 的基本原理（STA 模式）✅ 二、完整代码注释讲解（适配 ESP32-C3）📌 三、几个关键点解释🔚 四、小结 🔧 一、ESP32-C3 连接 Wi-Fi 的基本原理&a…...

编程日记 2026/1/25 3:43:31

HTTP方法和状态码（Status Code）

HTTP方法 HTTP方法（也称HTTP动词）主要用于定义对资源的操作类型。根据HTTP/1.1规范（RFC 7231）以及后续扩展，常用的HTTP方法有以下几种： GET：请求获取指定资源的表示形式。POST：向指…...

编程日记 2026/1/22 0:54:29

机器学习中分类模型的常用评价指标

评价指标是针对模型性能优劣的一个定量指标。一种评价指标只能反映模型一部分性能，如果选择的评价指标不合理，那么可能会得出错误的结论，故而应该针对具体的数据、模型选取不同的的评价指标。本文将详细介绍机器学习分类任务的常用评价指…...

编程日记 2026/1/30 6:22:14

# YOLOv3：基于 PyTorch 的目标检测模型实现

YOLOv3：基于 PyTorch 的目标检测模型实现引言 YOLOv3（You Only Look Once）是一种流行的单阶段目标检测算法，它能够直接在输入图像上预测边界框和类别概率。YOLOv3 的优势在于其高效性和准确性，使其在实时目标检测任…...

编程日记 2026/2/4 18:17:18

MySQL的Docker版本，部署在ubantu系统

前言 MySQL的Docker版本，部署在ubantu系统，出现问题： 1.执行一个SQL，只有错误编码，没有错误提示信息，主要影响排查SQL运行问题； 2.这个问题，并不影响实际的MySQL运行，如…...

编程日记 2026/1/31 14:38:10

首先上代码 #include "mainwindow.h" #include "ui_mainwindow.h" #include <QPushButton> #include<QVBoxLayout>//垂直布局 #include<QHBoxLayout>//水平布局头文件 MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), …...

编程日记 2026/2/1 12:39:45

服务器制造业中，L2、L6、L10等表示什么意思

在服务器制造业中，L2、L6、L10等是用于描述服务器生产流程集成度的分级体系，从基础零件到完整机架系统共分为L1-L12共12个等级。不同等级对应不同的生产环节和交付形态，以下是核心级别的具体含义： L2（Level 2&#xf…...

编程日记 2026/1/22 18:52:29

回答 | 图形数据库neo4j社区版可以应用小型企业嘛？

刚在知乎上看到了一个提问，挺有意思，于是乎，贴到这里再简聊一二。转自知乎提问当然可以，不过成本问题不容小觑。另外还有性能上的考量。就在最近，米国国家航空航天局——NASA因为人力成本问题，摒弃了使…...

编程日记 2026/1/31 11:05:55

Linux操作系统从入门到实战（二）手把手教你安装VMware17pro与CentOS 9 stream，实现Vim配置，并配置C++环境

Linux操作系统从入门到实战（二）手把手教你安装VMware17pro与CentOS 9.0 stream，实现Vim配置，并编译C文件前言一、安装VMware17pro二、安装CentOS9.02.1 为什么选择CentOS9，与CentOS7对比2.1 官网下载CentOS9.02.2 国内…...

编程日记 2026/2/1 12:39:14