正态分布的奇妙性质:为什么奇数阶中心矩(odd central moments)为零?
正态分布的奇妙性质:为什么奇数阶矩为零?
正态分布(Normal Distribution)是统计学中最常见的分布之一,它的钟形曲线几乎无处不在,从身高体重到测量误差,都能看到它的影子。除了均值和方差这两个核心参数,正态分布还有一个有趣的特性:它的奇数阶中心矩(odd central moments)全部为零,比如 ( E [ x − μ ] = 0 E[x - \mu] = 0 E[x−μ]=0 ) 和 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(x−μ)3]=0 )。这到底是怎么回事?今天我们就来聊聊这个性质的由来、证明,以及它背后的意义。
什么是中心矩?
在探讨奇数阶矩之前,我们先明白什么是中心矩。中心矩是描述随机变量偏离其均值 ( μ \mu μ ) 的统计量,定义为:
μ k = E [ ( x − μ ) k ] \mu_k = E[(x - \mu)^k] μk=E[(x−μ)k]
- ( k = 1 k = 1 k=1 ):一阶中心矩,( E [ x − μ ] E[x - \mu] E[x−μ] ),总是等于零(因为 ( E [ x ] = μ E[x] = \mu E[x]=μ ))。
- ( k = 2 k = 2 k=2 ):二阶中心矩,就是方差 ( σ 2 \sigma^2 σ2 )。
- ( k = 3 k = 3 k=3 ):三阶中心矩,衡量分布的偏度(skewness)。
- ( k = 4 k = 4 k=4 ):四阶中心矩,与峰度(kurtosis)相关。
对于正态分布,我们关心的是这些矩的特性,尤其是奇数阶(( k = 1 , 3 , 5 , … k = 1, 3, 5, \dots k=1,3,5,… ))的中心矩。
正态分布的奇数阶矩为零
正态分布的概率密度函数为:
p ( x ∣ μ , σ 2 ) = 1 2 π σ 2 exp ( − ( x − μ ) 2 2 σ 2 ) p(x | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) p(x∣μ,σ2)=2πσ21exp(−2σ2(x−μ)2)
它的一个显著特点是对称性:以均值 ( μ \mu μ ) 为中心,左右两侧完全对称。这种对称性直观地暗示了一个结论:奇数阶中心矩为零。为什么呢?
通俗解释
想象你在玩一个对称的跷跷板,中间是均值 ( μ \mu μ )。你把 ( x − μ x - \mu x−μ )(偏离均值的距离)拿来计算奇数次方,比如 ( ( x − μ ) 3 (x - \mu)^3 (x−μ)3 )。因为正态分布是对称的,对于每一个正的 ( x − μ x - \mu x−μ )(比如 +2),总有一个对应的负的 ( − ( x − μ ) - (x - \mu) −(x−μ) )(比如 -2),它们的概率密度相等。奇数次方会保留正负号:
- ( ( + 2 ) 3 = 8 (+2)^3 = 8 (+2)3=8 )
- ( ( − 2 ) 3 = − 8 (-2)^3 = -8 (−2)3=−8 )
当你把这些值按概率加权平均时,正负项正好抵消,结果为零。这种对称性是奇数阶矩为零的直观原因。
数学证明
现在,让我们用数学来证明这个性质。以 ( k = 3 k = 3 k=3 )(三阶中心矩)为例,证明 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(x−μ)3]=0 ),其他奇数阶的证明类似。
步骤 1:定义期望
对于 ( x ∼ N ( μ , σ 2 ) x \sim N(\mu, \sigma^2) x∼N(μ,σ2) ),三阶中心矩是:
E [ ( x − μ ) 3 ] = ∫ − ∞ ∞ ( x − μ ) 3 ⋅ 1 2 π σ 2 exp ( − ( x − μ ) 2 2 σ 2 ) d x E[(x - \mu)^3] = \int_{-\infty}^{\infty} (x - \mu)^3 \cdot \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) \, dx E[(x−μ)3]=∫−∞∞(x−μ)3⋅2πσ21exp(−2σ2(x−μ)2)dx
步骤 2:变量替换
为了简化计算,令 ( z = x − μ σ z = \frac{x - \mu}{\sigma} z=σx−μ ),则 ( x − μ = σ z x - \mu = \sigma z x−μ=σz ),( d x = σ d z dx = \sigma \, dz dx=σdz ),且 ( z ∼ N ( 0 , 1 ) z \sim N(0, 1) z∼N(0,1))(标准正态分布),概率密度为:
ϕ ( z ) = 1 2 π e − z 2 2 \phi(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} ϕ(z)=2π1e−2z2
代入后:
E [ ( x − μ ) 3 ] = ∫ − ∞ ∞ ( σ z ) 3 ⋅ 1 2 π e − z 2 2 ⋅ σ d z E[(x - \mu)^3] = \int_{-\infty}^{\infty} (\sigma z)^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \cdot \sigma \, dz E[(x−μ)3]=∫−∞∞(σz)3⋅2π1e−2z2⋅σdz
= σ 3 ∫ − ∞ ∞ z 3 ⋅ 1 2 π e − z 2 2 d z = \sigma^3 \int_{-\infty}^{\infty} z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz =σ3∫−∞∞z3⋅2π1e−2z2dz
步骤 3:分析被积函数
被积函数是 ( f ( z ) = z 3 ⋅ 1 2 π e − z 2 2 f(z) = z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} f(z)=z3⋅2π1e−2z2 )。我们需要判断这个积分是否为零。关键在于 ( f ( z ) f(z) f(z) ) 的性质:
- ( z 3 z^3 z3 ) 是奇函数(odd function),因为 ( ( − z ) 3 = − z 3 (-z)^3 = -z^3 (−z)3=−z3 )。
- ( 1 2 π e − z 2 2 \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} 2π1e−2z2 ) 是偶函数(even function),因为 ( e − ( − z ) 2 2 = e − z 2 2 e^{-\frac{(-z)^2}{2}} = e^{-\frac{z^2}{2}} e−2(−z)2=e−2z2 )。
奇函数乘以偶函数的结果还是奇函数:
f ( − z ) = ( − z ) 3 ⋅ 1 2 π e − ( − z ) 2 2 = − z 3 ⋅ 1 2 π e − z 2 2 = − f ( z ) f(-z) = (-z)^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{(-z)^2}{2}} = -z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} = -f(z) f(−z)=(−z)3⋅2π1e−2(−z)2=−z3⋅2π1e−2z2=−f(z)
步骤 4:奇函数积分的性质
对于任意奇函数 ( f ( z ) f(z) f(z) ),在对称区间 ( [ − ∞ , ∞ ] [-\infty, \infty] [−∞,∞] ) 上积分(假设积分收敛):
∫ − ∞ ∞ f ( z ) d z = ∫ − ∞ 0 f ( z ) d z + ∫ 0 ∞ f ( z ) d z \int_{-\infty}^{\infty} f(z) \, dz = \int_{-\infty}^{0} f(z) \, dz + \int_{0}^{\infty} f(z) \, dz ∫−∞∞f(z)dz=∫−∞0f(z)dz+∫0∞f(z)dz
令 ( u = − z u = -z u=−z ),则:
∫ − ∞ 0 f ( z ) d z = ∫ ∞ 0 f ( − u ) ( − d u ) = ∫ 0 ∞ − f ( u ) d u = − ∫ 0 ∞ f ( u ) d u \int_{-\infty}^{0} f(z) \, dz = \int_{\infty}^{0} f(-u) (-du) = \int_{0}^{\infty} -f(u) \, du = -\int_{0}^{\infty} f(u) \, du ∫−∞0f(z)dz=∫∞0f(−u)(−du)=∫0∞−f(u)du=−∫0∞f(u)du
所以:
∫ − ∞ ∞ f ( z ) d z = − ∫ 0 ∞ f ( z ) d z + ∫ 0 ∞ f ( z ) d z = 0 \int_{-\infty}^{\infty} f(z) \, dz = -\int_{0}^{\infty} f(z) \, dz + \int_{0}^{\infty} f(z) \, dz = 0 ∫−∞∞f(z)dz=−∫0∞f(z)dz+∫0∞f(z)dz=0
对于 ( f ( z ) = z 3 ⋅ 1 2 π e − z 2 2 f(z) = z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} f(z)=z3⋅2π1e−2z2 ),由于 ( e − z 2 2 e^{-\frac{z^2}{2}} e−2z2 ) 衰减很快,积分收敛,奇函数性质保证:
∫ − ∞ ∞ z 3 ⋅ 1 2 π e − z 2 2 d z = 0 \int_{-\infty}^{\infty} z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz = 0 ∫−∞∞z3⋅2π1e−2z2dz=0
因此:
E [ ( x − μ ) 3 ] = σ 3 ⋅ 0 = 0 E[(x - \mu)^3] = \sigma^3 \cdot 0 = 0 E[(x−μ)3]=σ3⋅0=0
推广到所有奇数阶
对于任意奇数 ( k = 2 n + 1 k = 2n + 1 k=2n+1 )(( n = 0 , 1 , 2 , … n = 0, 1, 2, \dots n=0,1,2,… )),( ( x − μ ) 2 n + 1 (x - \mu)^{2n+1} (x−μ)2n+1 ) 是奇函数,乘以偶函数 ( 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} 2πσ21e−2σ2(x−μ)2 ) 后仍为奇函数,积分从 ( − ∞ -\infty −∞ ) 到 ( ∞ \infty ∞ ) 为零。所以,所有奇数阶中心矩都为零。
补充信息
1. 为什么偶数阶矩不为零?
偶数次方(如 ( ( x − μ ) 2 (x - \mu)^2 (x−μ)2 ) 或 ( ( x − μ ) 4 (x - \mu)^4 (x−μ)4 ))是偶函数,乘以偶函数后仍是偶函数,积分不会抵消。例如:
- ( E [ ( x − μ ) 2 ] = σ 2 E[(x - \mu)^2] = \sigma^2 E[(x−μ)2]=σ2 )(方差)
- ( E [ ( x − μ ) 4 ] = 3 σ 4 E[(x - \mu)^4] = 3\sigma^4 E[(x−μ)4]=3σ4 )(四阶矩)
这些值反映了分布的宽度和形状。
2. 偏度的含义
三阶中心矩 ( E [ ( x − μ ) 3 ] E[(x - \mu)^3] E[(x−μ)3] ) 与偏度相关。偏度为零意味着分布没有左偏或右偏,正态分布的对称性恰好保证了这一点。如果分布不对称(例如指数分布),奇数阶矩就不为零。
3. 在统计中的应用
奇数阶矩为零在统计推断中很有用。例如,在计算Fisher信息矩阵时:
I 12 = E [ x − μ σ 2 ⋅ ( − 1 2 σ 2 + ( x − μ ) 2 2 ( σ 2 ) 2 ) ] I_{12} = E\left[ \frac{x - \mu}{\sigma^2} \cdot \left( -\frac{1}{2\sigma^2} + \frac{(x - \mu)^2}{2(\sigma^2)^2} \right) \right] I12=E[σ2x−μ⋅(−2σ21+2(σ2)2(x−μ)2)]
因为 ( E [ x − μ ] = 0 E[x - \mu] = 0 E[x−μ]=0 ) 和 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(x−μ)3]=0 ),交叉项为零,说明 ( μ \mu μ ) 和 ( σ 2 \sigma^2 σ2 ) 信息正交。
具体参考参考笔者的另一篇博客:Fisher信息矩阵(Fisher Information Matrix,简称FIM)
4. 其他分布呢?
并非所有分布的奇数阶矩都为零。例如:
- 指数分布 ( f ( x ) = λ e − λ x f(x) = \lambda e^{-\lambda x} f(x)=λe−λx )(( x ≥ 0 x \geq 0 x≥0 )),( E [ ( x − μ ) 3 ] ≠ 0 E[(x - \mu)^3] \neq 0 E[(x−μ)3]=0 ),因为它右偏。
- 对称的均匀分布也有奇数阶矩为零,但范围有限。
正态分布的无限对称支持和指数衰减共同造就了这个特性。
总结
正态分布的奇数阶中心矩为零源于其完美的对称性。奇函数与偶函数相乘后,积分在对称区间上抵消,数学上严谨地证明了这一点。这个性质不仅让正态分布更加“优雅”,还在统计估计、信息理论中简化了计算,比如保证参数间的正交性。下次看到正态分布的钟形曲线,不妨想想它隐藏的这些奇妙特性!
后记
2025年2月24日22点07分于上海,在Grok3大模型辅助下完成。
相关文章:
正态分布的奇妙性质:为什么奇数阶中心矩(odd central moments)为零?
正态分布的奇妙性质:为什么奇数阶矩为零? 正态分布(Normal Distribution)是统计学中最常见的分布之一,它的钟形曲线几乎无处不在,从身高体重到测量误差,都能看到它的影子。除了均值和方差这两个…...
【入门音视频】音视频基础知识
🌈前言🌈 这个系列在我学习过程中,对音视频知识归纳总结的笔记。因为音视频相关讲解非常稀少,所以我希望通过这个音视频系列,跟大家一起学习音视频,希望减少初学者在学习上的压力。同时希望也欢迎指出文章的…...
游戏引擎学习第120天
仓库:https://gitee.com/mrxiao_com/2d_game_3 上次回顾:周期计数代码 我们正在进行一个项目的代码优化工作,目标是提高性能。当前正在优化某个特定的代码片段,已经将其执行周期减少到48个周期。为了实现这一目标,我们设计了一个…...
【Qt之QQuickWidget】QML嵌入QWidget中
由于我项目开始使用Widgets,换公司后直接使用QML开发,没有了解过如何实现widget到qml过渡,恰逢面试时遇到一家公司希望从widget迁移到qml开发,询问相关实现,一时语塞,很尴尬,粗略研究并总结下。 对qwidget嵌…...
Vue 3 + Vite 项目中配置代理解决开发环境中跨域请求问题
在 Vue 3 Vite 项目中,配置代理是解决开发环境中跨域请求问题的常见方法。通过在 Vite 的配置文件中设置代理,可以将前端请求转发到后端服务器,从而避免浏览器的同源策略限制。 1. 创建 Vue 3 Vite 项目 首先,确保你已经安装了…...
Eureka、ZooKeeper 和 Nacos 之间的对比
Eureka、ZooKeeper 和 Nacos 都是分布式系统中常用的服务注册与发现工具,但它们的定位、功能和适用场景有所不同。作为一名开发者,理解它们之间的对比有助于选择合适的技术栈。以下从多个维度进行详细比较: 1. 基本概述 Eureka 来源ÿ…...
CSS中padding和margin属性的使用
在 HTML 中,padding 和 margin 是用于控制元素布局和间距的重要属性。 一、Padding(内边距) 定义:Padding 是指元素内容与元素边框之间的距离。它可以在元素内部创造出空白区域,使得内容不会紧贴着边框。 作用 增加元…...
【Python爬虫(49)】分布式爬虫:在新兴技术浪潮下的蜕变与展望
【Python爬虫】专栏简介:本专栏是 Python 爬虫领域的集大成之作,共 100 章节。从 Python 基础语法、爬虫入门知识讲起,深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑,覆盖网页、图片、音频等各类数据爬取ÿ…...
网络安全-系统层攻击流程及防御措施
系统层攻击流程涉及多个阶段,攻击者通过逐步渗透以获取控制权或窃取数据。以下是详细的流程及防御措施: 1. 侦察(Reconnaissance) 信息收集: 主动扫描:使用工具如Nmap、Masscan扫描目标IP、开放端口、服务…...
centos 7 安装python3 及pycharm远程连接方法
安装openssl 使用pip3安装 virtualenv的时候会提示WARNING: pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available. 这是因为缺少openssl 2.0以上版本 解决办法: 一、先确认版本 openssl version 二、安…...
【llm对话系统】如何快速开发一个支持openai接口的llm server呢
核心思路:使用轻量级 Web 框架,将 OpenAI API 请求转换为你现有推理脚本的输入格式,并将推理脚本的输出转换为 OpenAI API 的响应格式。 快速开发步骤列表: 选择合适的 Web 框架 (快速 & 简单): FastAPI: Python 最佳选择&am…...
跟着柳叶刀数字健康,学习如何通过病理切片预测分子分类对预后的影响|项目复现
小罗碎碎念 项目复现 今天和大家分享一个非常具有参考价值的项目,手把手带着大家复现一篇发表在柳叶刀数字健康的文章。 花了六个小时才完成的这篇推送,信息量非常大,遇到了很多报错问题,但是解决以后的感觉是非常爽的,先给大家展示一下最终的成果——在同一张切片上,通…...
deepseek_清华大学指导手册_pdf_1-5
deepseek_清华大学指导手册_pdf_1-5 无套路,无需关注,无需登录,无需app,直接下载: 下载地址 文件列表: 001_清华大学_DeepSeek从入门到精通.pdf 002_清华大学_DeepSeek如何赋能职场应用.pdf 003_清华大学…...
数据库(MySQL)二
MySQL 六、MySQL索引视图6.1 索引底层原理6.1.1 索引hash算法6.1.2 索引二叉树算法6.1.3 索引平衡二叉树算法6.1.4 索引BTREE树算法6.1.5 普通SQL全表扫描过程 6.2 索引分类6.2.1 按数据结构层次分类6.2.2 按字段数量层次分类6.2.3 按功能逻辑层次分类(面试题&#…...
第15届 蓝桥杯 C++编程青少组中/高级选拔赛 202401 真题答案及解析
第 1 题 【 单选题 】 表达式117 % 16 的结果是( )。 A:0 B:5 C:7 D:10 解析: % 是取模运算符,用于计算两个数相除后的余数。 计算 117 / 16,结果是 7,余数是 5。因此,117 % 16 = 5。答案: B 第 2 题 【 单选题 】 下列选项中,字符数组定义正确的是( …...
《AI大模型趣味实战》第10集:开发一个基于Mermaid的AI绘图网站
《AI大模型趣味实战》第10集:开发一个基于Mermaid的AI绘图网站 抱歉不按顺序出牌,先出一个第10集,第1到第9集慢慢来,后续也不会按顺序,总之凑满36集,可能或补充12集。 AI大模型趣味实战专栏 所有36个主题预…...
androidstudio 运行项目加载很慢,优化方法
一、Android Studio 运行项目加载缓慢可能由多种原因引起,以下是一些优化建议: 1. 升级硬件配置 内存:建议至少 8GB,16GB 或以上更佳。 SSD:使用 SSD 替代 HDD 以加快读写速度。 CPU:多核处理器有助于提…...
python脚本实现接入企微机器人
企业微信中的群聊机器人在日常办公中无处不在,对提升工作效率、保证消息及时送达提供了重要的技术保障。例如:DevOps助手、JIRA、构建通知等;还常常使用在运维服务器中配合Prometheus监控体系及时发送告警信息等 文章目录 源码示例Demo源码处…...
《论面向对象的建模及应用》审题技巧 - 系统架构设计师
论面向对象的建模及应用写作框架 一、考点概述 本论题“论面向对象的建模及应用”主要考察软件测试工程师对面向对象建模技术的理解和应用能力。具体涵盖以下几个方面: 面向对象建模的基本概念 :这包括理解面向对象编程(OOP)的基…...
【Godot4.3】自定义圆角容器
概述 Godot控件想要完全实现现代UI风格,需要进行大量的自定义组件设计。本篇就依托于笔者自己对现代UI设计中的圆角面板元素模仿来制作圆角容器组件。 圆角容器 圆角元素在现代的扁平UI设计中非常常见,在Godot中可以通过改进PanelContainer来或者自定…...
stm32G473的flash模式是单bank还是双bank?
今天突然有人stm32G473的flash模式是单bank还是双bank?由于时间太久,我真忘记了。搜搜发现,还真有人和我一样。见下面的链接:https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...
应用升级/灾备测试时使用guarantee 闪回点迅速回退
1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...
椭圆曲线密码学(ECC)
一、ECC算法概述 椭圆曲线密码学(Elliptic Curve Cryptography)是基于椭圆曲线数学理论的公钥密码系统,由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA,ECC在相同安全强度下密钥更短(256位ECC ≈ 3072位RSA…...
树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
使用rpicam-app通过网络流式传输视频 使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 使用 rpicam-app 通过网络流式传输视频 本节介绍来自 rpica…...
深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...
【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...
基于matlab策略迭代和值迭代法的动态规划
经典的基于策略迭代和值迭代法的动态规划matlab代码,实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...
python执行测试用例,allure报乱码且未成功生成报告
allure执行测试用例时显示乱码:‘allure’ �����ڲ����ⲿ���Ҳ���ǿ�&am…...
鸿蒙DevEco Studio HarmonyOS 5跑酷小游戏实现指南
1. 项目概述 本跑酷小游戏基于鸿蒙HarmonyOS 5开发,使用DevEco Studio作为开发工具,采用Java语言实现,包含角色控制、障碍物生成和分数计算系统。 2. 项目结构 /src/main/java/com/example/runner/├── MainAbilitySlice.java // 主界…...
10-Oracle 23 ai Vector Search 概述和参数
一、Oracle AI Vector Search 概述 企业和个人都在尝试各种AI,使用客户端或是内部自己搭建集成大模型的终端,加速与大型语言模型(LLM)的结合,同时使用检索增强生成(Retrieval Augmented Generation &#…...
