当前位置：首页 > news >正文

假设检验的基本思想

news 2026/2/8 19:58:24

假设检验

首先了解参数估计，比如有服从正态分布的数据集 $X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})$ ，我们希望根据样本 $x_{1},...x_{n}$ 估计出参数 $μ,σ\mu,\sigma$ ，这些参数可以是一个具体值，也可以是一个范围（即一个区间）。

对于假设检验，分为两种情况：

参数假设检验：这种情况下，我们知道总体分布，比如我们已知数据集服从正态分布 $X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})$ ，但参数 $μ,σ\mu,\sigma$ 我们是不知道的，我们假设 $μ=μ0,σ=σ0\mu=\mu_{0},\sigma=\sigma_{0}$ ，现在，我们依然根据样本 $x_{1},...x_{n}$ 去判断 $μ\mu$ 是否等于 $μ0\mu_{0}$ ，即根据样本判断假设是否成立。
非参数假设检验：这是对于分布未知的情况。

总之，假设检验的目的是根据样本判断假设是否成立。

通常存在两种假设，以前面参数假设检验为例：

原假设 $H_{0}$ ：假设 $μ=μ0\mu=\mu_{0}$ ；原假设的概率通常较大；
备择假设 $H_{1}$ ：假设 $μ≠μ0\mu\neq\mu_{0}$ ；

如果根据样本检验后发现，原假设不成立，备择假设成立，则称 $[x1,...,xn]∈K0[x_{1},...,x_{n}]\in K_{0}$ ，样本属于拒绝域 $K_{0}$ 。换言之，如果原假设不成立，我们应拒绝原假设。

在拒绝域中的样本才能判断出假设不成立，如果样本不在拒绝域中，我们才能接受原假设。

我们根据样本判断假设，但存在局限性，因为样本数量有限，样本数量多只能降低检验出错的概率，不能代表检验结果完全正确。因此假设检验应考虑到两种错误：

原假设成立，但检验后却拒绝了原假设，即弃真错误；
我们把概率 $P{拒绝H0∣H0成立}=αP\left\{拒绝H_{0}|H_{0}成立\right\}=\alpha$ ， $α\alpha$ 称为显著性水平，通常， $α\alpha$ 的值是很小的。如果样本落在拒绝域内的概率 $P{[x1,...,xn]∈K0}≤αP\left\{[x_{1},...,x_{n}]\in K_{0}\right\}\leq\alpha$ ，我们就接受原假设，因为此时检验出错的概率已经很低。
反过来，如果 $P{[x1,...,xn]∈K0}>αP\left\{[x_{1},...,x_{n}]\in K_{0}\right\}>\alpha$ ，我们应当拒绝原假设。
原假设不成立，但检验后接受了原假设，即取伪错误；

p-value

p值是假设检验中，判断是否要拒绝原假设的指标，p值是一个概率。

p值：原假设正确时，样本观测值取得某一结果（以及比这个结果更极端结果）的概率。

举例：判断硬币是否公平（出现正面的概率为50%）

原假设：抛硬币结果为正面的概率为50%；
备择假设：抛硬币结果为正面的概率不为50%；

样本，抛硬币500次，正面出现次数10次，反面出现490次。

对于抛硬币500次，整体应服从二项分布：
fig1

因此，在原假设正确时，预期应该是250次正面，然而实际情况是10次正面，比该结果更极端的情况是正面次数为0次-9次。

另外，如果正面出现超过490次也属于极端情况，因此，图中红色区域表示当前结果以及极端结果。

p值就是图中红色区域对应的概率（面积）。如果p值很小，则意味着，在原假设正确的情况下，小概率事件发生了，比如p值只有1%，即我们只有1%的概率得到目前的观测结果，既然小概率事件发生，我们就有更大概率怀疑这个原假设，因此我们可以拒绝原假设。

通常，只要p值小于显著性水平 $α\alpha$ ，我们就拒绝原假设。

假设检验的基本思想

假设检验

p-value

相关文章：

假设检验的基本思想

c语言机试练习

Python的PyQt框架的使用-资源文件夹的使用

如何遍历HashMap

11技术太卷我学APEX-数据加载

JVM记录

盘点机器学习实战中最频繁使用的AutoML工具库

50-Jenkins-Lockable Resources插件实现资源锁定

测试员，如果未来5年你不想失业……你得学会自动化测试

腾讯开源的 hel 提供了加载远程模块的能力，谈谈它的实现原理

【运动控制】CNC三轴小线段路径规划

渗透测试之DNS域名信息探测实验

ASE140N04-ASEMI低压MOS管ASE140N04

Qt——QLineEdit

前端-HTML-zxst

终极方案，清理 docker 占用磁盘过大问题，亲测有效！

puzzle（1321）时间旅人

活动预告 | 2023 Meet TVM 开年首聚，上海我们来啦！

CoreIDRAW 软件的强大功能及适用性

JavaScript Window History

Vim 调用外部命令学习笔记

C++初阶-list的底层

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

3403. 从盒子中找出字典序最大的字符串 I

力扣-35.搜索插入位置

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

Python ROS2【机器人中间件框架】简介

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

scikit-learn机器学习

深入理解Optional：处理空指针异常