[概率论基本概念4]什么是无偏估计
关键词:Unbiased Estimation
一、说明
对于无偏和有偏估计,需要了解其叙事背景,是指整体和抽样的关系,也就是说整体的叙事是从理论角度的,而估计器原理是从实践角度说事;为了表明概率理论(不可操作)和统计学(可操作)的实践的一致性,于是提出有偏和无偏的观点。
二、关于无偏和有偏
如果给定参数的估计量 的 预期值等于该参数的真实值, 则称该估计量是无偏的 。另一个说法,如果估计量产生的参数估计平均而言是正确的,那么它就是无偏的。
我们先做一个思想实验,如通过打靶考核射手的水平,假如决定射手的因素有两个:眼力和手平衡。
于是对于任意一个选手,这个选手的属性如下:
<眼力=1,手平衡=1>,<眼力=0,手平衡=1>,<眼力=1,手平衡=0>,
<眼力=0,手平衡=0>
打靶结果
我们从上面例子解释“无偏”和“有偏”的关系。在以上打靶结果中,
<眼力=1,手平衡=1>和<眼力=1,手平衡=0>属于“无偏”
<眼力=0,手平衡=1>和<眼力=0,手平衡=0>属于“有偏”
为什么呢?
我们考虑打靶的重心值:
X ˉ = ∑ i = 1 3 X i \bar{X}=\sum^{3}_{i=1}X_i Xˉ=∑i=13Xi
当 X ˉ \bar{X} Xˉ的极限等于把心c,那么就是无偏的,否则就是有偏的。
注意:有偏估计也不是没有意义的。只要能给出固定偏移,不难将无偏估计转化成无偏估计。
三、偏差和无偏差估计器
如果估计器 u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,…,Xn)以下情况成立:
E [ u ( X 1 , X 2 , … , X n ) ] = θ E[u(X_1,X_2,\ldots,X_n)]=\theta E[u(X1,X2,…,Xn)]=θ那么统计 u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,…,Xn)是参数的无偏估计量 θ \theta θ。 否则, u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,…,Xn)是一个有偏估计 θ \theta θ。
3.1 贝努力变量p的无偏估计
如果 X i X_i Xi是具有参数的伯努利随机变量 p p p, 那么:
p ^ = 1 n ∑ i = 1 n X i \hat{p}=\dfrac{1}{n}\sum\limits_{i=1}^nX_i p^=n1i=1∑nXi
是最大似然估计量(MLE) p ^ \hat{p} p^ 是p的无偏估计量.
证明:
回想一下,如果 X i X_i Xi是具有参数的伯努利随机变量 p p p, 那么 E ( X i ) = p E(X_i)=p E(Xi)=p
。 这里对估计器求期望:
E ( p ^ ) = E ( 1 n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = 1 n ∑ i = 1 n p = 1 n ( n p ) = p E(\hat{p})=E\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n}\sum\limits_{i=1}^nE(X_i)=\dfrac{1}{n}\sum\limits_{i=1}^np=\dfrac{1}{n}(np)=p E(p^)=E(n1i=1∑nXi)=n1i=1∑nE(Xi)=n1i=1∑np=n1(np)=p
第一个等式成立,因为我们只是替换了 p ^ \hat{p} p^及其定义。第二个等式根据线性组合的期望规则成立。第三个等式成立,因为 E ( X i ) = p E(X_i)=p E(Xi)=p。第四个等式成立,因为当你添加值p向上连加n次,你得到np。当然,最后一个等式是简单的代数。
总而言之,我们已经证明: E ( p ^ ) = p E(\hat {p})= p E(p^)=p
因此,最大似然估计量是p。
3.2 正态分布的无偏估计
如果 X i X_i Xi是具有均值的正态分布的随机变量,参数 μ \mu μ和方差 σ 2 \sigma^2 σ2的无偏估计是:
μ ^ = ∑ X i n = X ˉ \hat{\mu}=\dfrac{\sum X_i}{n}=\bar{X} μ^=n∑Xi=Xˉ
σ ^ 2 = ∑ ( X i − X ˉ ) 2 n \hat{\sigma}^2=\dfrac{\sum(X_i-\bar{X})^2}{n} σ^2=n∑(Xi−Xˉ)2
下面用无偏性估计定义进行验证:
只要证明: E ( X i ) = μ E(X_i)=\mu E(Xi)=μ和 Var ( X i ) = σ 2 \text{Var}(X_i)=\sigma^2 Var(Xi)=σ2就可以。
E ( X ˉ ) = E ( 1 n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = 1 n ∑ i = 1 μ = 1 n ( n μ ) = μ E(\bar{X})=E\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n}\sum\limits_{i=1}^nE(X_i)=\dfrac{1}{n}\sum\limits_{i=1}\mu=\dfrac{1}{n}(n\mu)=\mu E(Xˉ)=E(n1i=1∑nXi)=n1i=1∑nE(Xi)=n1i=1∑μ=n1(nμ)=μ
第一个等式成立,因为我们只是用 X ˉ \bar{X} Xˉ及其定义。同样,第二个相等性符合线性组合的期望规则。第三个相等性成立,因为 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ.第四个相等性成立,因为当您将值 μ \mu μ累加n次倍,你会得到np。最后一个相等是简单代数。
总之,我们已经证明: E ( X ˉ ) = μ E(\bar{X})=\mu E(Xˉ)=μ
因此,最大似然估计量为 μ \mu μ是公正的.
下面我们证明 σ ^ 2 = ∑ ( X i − X ˉ ) 2 n \hat{\sigma}^2=\dfrac{\sum(X_i-\bar{X})^2}{n} σ^2=n∑(Xi−Xˉ)2也是公正无偏的。
首先回顾方差的基本定义:
V a r ( X ) = E ( ( X − E ( X ) ) 2 ) = E ( X 2 ) − E ( X ) 2 Var(X)=E( (X-E(X))^2)=E(X^2)-E(X)^2 Var(X)=E((X−E(X))2)=E(X2)−E(X)2
对于独立同分布的抽样样本 ( X 1 , X 2 , … , X n ) (X_1,X_2,\ldots,X_n) (X1,X2,…,Xn),每个随机变量数值特征是一样的,也就是说:
E ( X 1 ) = E ( X 2 ) = , … , E ( X n ) = μ E(X_1)=E(X_2)=,\ldots,E(X_n)=\mu E(X1)=E(X2)=,…,E(Xn)=μ
V a r ( X ) = V a r ( X 1 ) = V a r ( X 2 ) = , … , V a r ( X n ) = σ 2 Var(X)=Var(X_1)=Var(X_2)=,\ldots,Var(X_n)=\sigma^2 Var(X)=Var(X1)=Var(X2)=,…,Var(Xn)=σ2
下面我们将给出证明
E ( σ ^ 2 ) = E ( ∑ ( X i − X ˉ ) 2 n ) = ∑ E ( X i − X ˉ ) 2 n = ∑ E ( X i 2 − 2 X 2 X ˉ + X ˉ 2 ) n = ∑ [ E ( X i 2 ) − 2 E ( X i X ˉ ) + E ( X ˉ ) 2 ] n = ∑ [ E ( X i 2 ) − 2 E ( X i ) X ˉ + ( X ˉ ) 2 ) n = ∑ [ E ( X i 2 ) − X ˉ 2 ] n = n [ E ( X 2 ) − E X ˉ 2 ] n = E ( X 2 ) − E X ˉ 2 = σ 2 E(\hat{\sigma}^2)=E(\dfrac{\sum(X_i-\bar{X})^2}{n})=\dfrac{\sum E(X_i-\bar{X})^2}{n}=\dfrac{\sum E(X_i^2-2X_2\bar{X}+\bar{X}^2)}{n}=\dfrac{\sum[ E(X_i^2)-2E(X_i\bar{X})+E(\bar{X})^2]}{n}=\dfrac{\sum[ E(X_i^2)-2E(X_i)\bar{X}+(\bar{X})^2)}{n}=\dfrac{\sum[ E(X_i^2)- \bar{X}^2]}{n}=\dfrac{n[ E(X^2)- E\bar{X}^2]}{n}= E(X^2)- E\bar{X}^2=\sigma^2 E(σ^2)=E(n∑(Xi−Xˉ)2)=n∑E(Xi−Xˉ)2=n∑E(Xi2−2X2Xˉ+Xˉ2)=n∑[E(Xi2)−2E(XiXˉ)+E(Xˉ)2]=n∑[E(Xi2)−2E(Xi)Xˉ+(Xˉ)2)=n∑[E(Xi2)−Xˉ2]=nn[E(X2)−EXˉ2]=E(X2)−EXˉ2=σ2
第一个等号是等价代换,第二个等号E(期望)的线性等价性质。第三个等号。代数展开。第四个等号,期望线性恒等式。第五个等式,因为 X ˉ \bar X Xˉ不是随机变量,而 X i X_i Xi是随机变量,因此用 E ( c X ) = c E ( X ) E(cX)=cE(X) E(cX)=cE(X)和 E ( X ˉ ) = X ˉ E(\bar X)=\bar X E(Xˉ)=Xˉ简化;第六个等式,因为 E ( X i ) = E ( X ) E(X_i)=E(X) E(Xi)=E(X)这是因为两个随机变量的期望是一致的。第七个等式代数加和展开。第八等式,正态分布方差公式简化版。从而 E ( σ 2 ^ ) = σ 2 E(\hat{\sigma^2})=\sigma^2 E(σ2^)=σ2得证。
四、结论
这里需要首先肯定得是,有偏/无偏与误差偏差无关,不是说误差越大越有偏;一种可能是估计器误差很大,但他是无偏估计;另一种可能是估计器误差很小,但他是有偏估计。一个抽样有偏和无偏得判断措施就是对他求期望,该期望与整体得期望比较,发现有/无偏性。
相关文章:

[概率论基本概念4]什么是无偏估计
关键词:Unbiased Estimation 一、说明 对于无偏和有偏估计,需要了解其叙事背景,是指整体和抽样的关系,也就是说整体的叙事是从理论角度的,而估计器原理是从实践角度说事;为了表明概率理论(不可…...
乐观锁与悲观锁的实现和应用
乐观锁与悲观锁:原理、实现与应用详解 在并发编程和数据库操作中,乐观锁和悲观锁是两种重要的并发控制策略,它们在原理、实现方式和应用场景上存在显著差异。下面我们将通过图文结合的方式,深入探讨这两种锁机制。 一、基本概念 1…...

PL/SQLDeveloper中数值类型字段查询后显示为科学计数法的处理方式
PL/SQLDeveloper中数值类型字段查询后显示为科学计数法的处理方式 文章目录 PL/SQLDeveloper中数值类型字段查询后显示为科学计数法的处理方式1. 查询效果2. 处理方式3. 再次查询 1. 查询效果 2. 处理方式 3. 再次查询...

【vue】Uniapp 打包Android 文件选择上传问题详解~
需求 uniapp兼容android app,pc,h5的文件选择并上传功能。 需要支持拍照和相册选择,以及选择其他类型文件上传~ 实践过程和问题 开始使用uni-file-picker组件 以为很顺利,android模拟器测试…… 忽略了平台兼容性提示~&#…...
ASR技术(自动语音识别)深度解析
ASR技术(自动语音识别)深度解析 自动语音识别(Automatic Speech Recognition,ASR)是将人类语音转换为文本的核心技术,以下是其全面解析: 一、技术原理架构 #mermaid-svg-QlJOWpMtlGi9LNeF {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:1…...
图论水题2
div2 361 D. Tree Requests 题意 对于一颗 n n n节点的树,每个节点有一个字母,有 m m m次询问,每次询问求对于顶点 v v v的子树中深度为 h h h的结点能否组成一个回文串$ (1 \leq n \leq m \leq 5 \cdot 10^5) $ 思路 关于 v v v的子树结…...

Ctrl-Crash 助力交通安全:可控生成逼真车祸视频,防患于未然
视频扩散技术虽发展显著,但多数驾驶数据集事故事件少,难以生成逼真车祸图像,而提升交通安全又急需逼真可控的事故模拟。为此,论文提出可控车祸视频生成模型 Ctrl-Crash,它以边界框、碰撞类型、初始图像帧等为条件&…...

网络编程之服务器模型与UDP编程
一、服务器模型 在网络通信中,通常要求一个服务器连接多个客户端 为了处理多个客户端的请求,通常有多种表现形式 1、循环服务器模型 一个服务器可以连接多个客户端,但同一时间只能连接并处理一个客户的请求 socket() 结构体 bind() listen() …...

Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五模型时序预测
Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五模型时序预测 目录 Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五模型时序预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五…...

阿里云服务器安装nginx并配置前端资源路径(前后端部署到一台服务器并成功访问)
运行以下命令,安装Nginx相关依赖。 yum install -y gcc-c yum install -y pcre pcre-devel yum install -y zlib zlib-devel yum install -y openssl openssl-devel 运行wget命令下载Nginx 1.21.6。 您可以通过Nginx开源社区直接获取对应版本的安装包URL&…...
Ubuntu 下开机自动执行命令的方法
Ubuntu 下开机自动执行命令的方法(使用 crontab) 在日常使用 Ubuntu 或其他 Linux 系统时,我们常常需要让某些程序或脚本在系统启动后自动运行。例如:启动 Clash 代理、初始化服务、定时同步数据等。 本文将介绍一种简单且常用的…...

C++11新增重要标准(下)
前言 一,forward(完美转发) 二,可变参数模板 三,emplace系列接口 四,新增类功能 五,default与delete 六,lambda表达式 七,包装器 八,bind 在C11中新增…...

【第六篇】 SpringBoot的日志基础操作
简介 日志系统在软件开发中至关重要,用于调试代码、记录运行信息及错误堆栈。本篇文章不仅详细介绍了日志对象的创建及快速使用,还说明了日志持久化的两种配置方式和滚动日志的设置。实际开发需根据场景选择合适的日志级别和存储策略。文章内容若存在错误…...

Pluto论文阅读笔记
主要还是参考了这一篇论文笔记:https://zhuanlan.zhihu.com/p/18319150220 Pluto主要有三个创新点: 横向纵向用lane的query来做将轨迹投回栅格化地图,计算碰撞loss对数据进行正增强和负增强,让正增强的结果也无增强的结果相近&a…...
ubuntu显示器未知
在Ubuntu系统中,当外接显示器被识别为“未知设备”时,可通过以下日志文件进行问题诊断,结合Xorg日志和内核日志综合分析: 🔍 一、查看Xorg显示服务日志(核心) Xorg日志记录了图形界面的详细事…...
Faiss向量数据库全面解析:从原理到实战
Faiss向量数据库全面解析:从原理到实战 引言:向量搜索的时代需求 在AI技术爆发的今天,向量数据已成为表示文本、图像、音视频等内容的核心形式。Facebook AI研究院开源的Faiss(Facebook AI Similarity Search)作为高…...

matlab 2024a 工具箱Aerospsce Toolbox报错
Matlab R2024a中Aerospsce Toolbox报错 警告:Aerospace Toolbox and Aerospace Blockset licenses are required in ‘built-in/Spacecraft Dynamics’ 找到安装路径\MATLAB\R2024a\licenses文件夹license_****_R2024a.lic 里面工具箱名称出错,手动修改…...

使用有限计算实现视频生成模型的高效训练
大家读完觉得有帮助记得关注和点赞!!! 抽象 视频生成的最新进展需要越来越高效的训练配方,以减轻不断上升的计算成本。在本报告中,我们介绍了 ContentV,这是一种 8B 参数文本到视频模型,在 256 …...

Server2003 B-1 Windows操作系统渗透
任务环境说明: 服务器场景:Server2003(开放链接) 服务器场景操作系统:Windows7 1.通过本地PC中渗透测试平台Kali对服务器场景Windows进行系统服务及版本扫描渗透测试,并将该操作显示结果中Telnet服务对应的…...

一次Oracle的非正常关闭
数据库自己会关闭吗? 从现象来说Oracle MySQL Redis等都会出现进程意外停止的情况。而这些停止都是非人为正常关闭或者暴力关闭(abort或者kill 进程) 一次测试环境的非关闭 一般遇到这种情况先看一下错误日志吧。 2025-06-01T06:26:06.35…...
AI不会杀死创作,但会杀死平庸
作为一个敲了8年Java代码的普通本科程序员,日常主要泡在会议后台管理系统的开发里。从2023年底被朋友拽着试了第一把AI工具到现在,电脑手机上的AI软件比外卖App还多——写代码的Copilot、画时序图的工具、聊天的ChatGPT、Deepseek,基本市面上…...
JeecgBoot低代码管理平台
一、一句话理解 JeecgBoot JeecgBoot 是一个基于 Java 技术栈(主要是 Spring Boot 和 Vue)的快速开发脚手架。它的核心理念是:通过代码生成器和一系列预置模块,极大地减少程序员在开发企业级后台管理系统时重复的、模板化的工作&…...
Fetch与Axios:区别、联系、优缺点及使用差异
Fetch与Axios:区别、联系、优缺点及使用差异 文章目录 Fetch与Axios:区别、联系、优缺点及使用差异一、联系二、区别1. 浏览器支持与兼容性2. 响应处理3. 请求拦截和响应拦截4. 错误处理 三、优缺点1. Fetch API优点缺点 2. Axios优点缺点 四、使用上的差…...

YOLO11解决方案之分析
概述 Ultralytics提供了一系列的解决方案,利用YOLO11解决现实世界的问题,包括物体计数、模糊处理、热力图、安防系统、速度估计、物体追踪等多个方面的应用。 Ultralytics提供了三种基本的数据可视化类型:折线图(面积图…...

yolov11与双目测距结合,实现目标的识别和定位测距(onnx版本)
一、yolov11双目测距基本流程 yolov11 双目测距的大致流程就是: 双目标定 --> 立体校正(含消除畸变) --> 立体匹配 --> 视差计算 --> 深度计算(3D坐标)计算 --> 目标检测 --> 目标距离计算及可视化 下面将分别阐述每…...

基于51单片机和8X8点阵屏、独立按键的填充消除类小游戏
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码1、8X8点阵屏2、独立按键3、定时器04、定时器1 四、主函数总结 系列文章目录 前言 使用的是普中A2开发板。 【单片机】STC89C52RC 【频率】12T11.0592MHz 【外设】8X8点阵屏、独立按键 效果查看/操作演示&#x…...
将数据库表导出为C#实体对象
数据库方式 use 数据库;declare TableName sysname 表名 declare Result varchar(max) /// <summary> /// TableName /// </summary> public class TableName {select Result Result /// <summary>/// CONVERT(NVARCHAR(500), ISNULL(ColN…...

物联网技术发展与应用研究分析
文章目录 引言一、物联网的基本架构(一)感知层(二)网络层(三)平台层(四)应用层 二、物联网的关键技术(一)传感器技术(二)通信技术&…...

金融系统渗透测试
金融系统渗透测试是保障金融机构网络安全的核心环节,它的核心目标是通过模拟攻击手段主动发现系统漏洞,防范数据泄露、资金盗取等重大风险。 一、金融系统渗透测试的核心框架 合规性驱动 需严格遵循《网络安全法》《数据安全法》及金融行业监管要求&am…...
C++ 信息学奥赛总复习题
第一章 C 基础语法 一、填空题 C 源文件的扩展名通常是______。C 程序的入口函数是______。在 C 中,注释有两种形式,分别是______和______。声明一个整型变量 a 的语句是______。输出语句的关键字是______。 二、判断题 C 区分大小写。( …...