当前位置: 首页 > news >正文

正态分布的奇妙性质:为什么奇数阶中心矩(odd central moments)为零?

正态分布的奇妙性质:为什么奇数阶矩为零?

正态分布(Normal Distribution)是统计学中最常见的分布之一,它的钟形曲线几乎无处不在,从身高体重到测量误差,都能看到它的影子。除了均值和方差这两个核心参数,正态分布还有一个有趣的特性:它的奇数阶中心矩(odd central moments)全部为零,比如 ( E [ x − μ ] = 0 E[x - \mu] = 0 E[xμ]=0 ) 和 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(xμ)3]=0 )。这到底是怎么回事?今天我们就来聊聊这个性质的由来、证明,以及它背后的意义。


什么是中心矩?

在探讨奇数阶矩之前,我们先明白什么是中心矩。中心矩是描述随机变量偏离其均值 ( μ \mu μ ) 的统计量,定义为:

μ k = E [ ( x − μ ) k ] \mu_k = E[(x - \mu)^k] μk=E[(xμ)k]

  • ( k = 1 k = 1 k=1 ):一阶中心矩,( E [ x − μ ] E[x - \mu] E[xμ] ),总是等于零(因为 ( E [ x ] = μ E[x] = \mu E[x]=μ ))。
  • ( k = 2 k = 2 k=2 ):二阶中心矩,就是方差 ( σ 2 \sigma^2 σ2 )。
  • ( k = 3 k = 3 k=3 ):三阶中心矩,衡量分布的偏度(skewness)。
  • ( k = 4 k = 4 k=4 ):四阶中心矩,与峰度(kurtosis)相关。

对于正态分布,我们关心的是这些矩的特性,尤其是奇数阶(( k = 1 , 3 , 5 , … k = 1, 3, 5, \dots k=1,3,5, ))的中心矩。


正态分布的奇数阶矩为零

正态分布的概率密度函数为:

p ( x ∣ μ , σ 2 ) = 1 2 π σ 2 exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) p(x | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) p(xμ,σ2)=2πσ2 1exp(2σ2(xμ)2)

它的一个显著特点是对称性:以均值 ( μ \mu μ ) 为中心,左右两侧完全对称。这种对称性直观地暗示了一个结论:奇数阶中心矩为零。为什么呢?

通俗解释

想象你在玩一个对称的跷跷板,中间是均值 ( μ \mu μ )。你把 ( x − μ x - \mu xμ )(偏离均值的距离)拿来计算奇数次方,比如 ( ( x − μ ) 3 (x - \mu)^3 (xμ)3 )。因为正态分布是对称的,对于每一个正的 ( x − μ x - \mu xμ )(比如 +2),总有一个对应的负的 ( − ( x − μ ) - (x - \mu) (xμ) )(比如 -2),它们的概率密度相等。奇数次方会保留正负号:

  • ( ( + 2 ) 3 = 8 (+2)^3 = 8 (+2)3=8 )
  • ( ( − 2 ) 3 = − 8 (-2)^3 = -8 (2)3=8 )

当你把这些值按概率加权平均时,正负项正好抵消,结果为零。这种对称性是奇数阶矩为零的直观原因。


数学证明

现在,让我们用数学来证明这个性质。以 ( k = 3 k = 3 k=3 )(三阶中心矩)为例,证明 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(xμ)3]=0 ),其他奇数阶的证明类似。

步骤 1:定义期望

对于 ( x ∼ N ( μ , σ 2 ) x \sim N(\mu, \sigma^2) xN(μ,σ2) ),三阶中心矩是:

E [ ( x − μ ) 3 ] = ∫ − ∞ ∞ ( x − μ ) 3 ⋅ 1 2 π σ 2 exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) d x E[(x - \mu)^3] = \int_{-\infty}^{\infty} (x - \mu)^3 \cdot \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) \, dx E[(xμ)3]=(xμ)32πσ2 1exp(2σ2(xμ)2)dx

步骤 2:变量替换

为了简化计算,令 ( z = x − μ σ z = \frac{x - \mu}{\sigma} z=σxμ ),则 ( x − μ = σ z x - \mu = \sigma z xμ=σz ),( d x = σ d z dx = \sigma \, dz dx=σdz ),且 ( z ∼ N ( 0 , 1 ) z \sim N(0, 1) zN(0,1))(标准正态分布),概率密度为:

ϕ ( z ) = 1 2 π e − z 2 2 \phi(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} ϕ(z)=2π 1e2z2

代入后:

E [ ( x − μ ) 3 ] = ∫ − ∞ ∞ ( σ z ) 3 ⋅ 1 2 π e − z 2 2 ⋅ σ d z E[(x - \mu)^3] = \int_{-\infty}^{\infty} (\sigma z)^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \cdot \sigma \, dz E[(xμ)3]=(σz)32π 1e2z2σdz

= σ 3 ∫ − ∞ ∞ z 3 ⋅ 1 2 π e − z 2 2 d z = \sigma^3 \int_{-\infty}^{\infty} z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz =σ3z32π 1e2z2dz

步骤 3:分析被积函数

被积函数是 ( f ( z ) = z 3 ⋅ 1 2 π e − z 2 2 f(z) = z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} f(z)=z32π 1e2z2 )。我们需要判断这个积分是否为零。关键在于 ( f ( z ) f(z) f(z) ) 的性质:

  • ( z 3 z^3 z3 ) 是奇函数(odd function),因为 ( ( − z ) 3 = − z 3 (-z)^3 = -z^3 (z)3=z3 )。
  • ( 1 2 π e − z 2 2 \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} 2π 1e2z2 ) 是偶函数(even function),因为 ( e − ( − z ) 2 2 = e − z 2 2 e^{-\frac{(-z)^2}{2}} = e^{-\frac{z^2}{2}} e2(z)2=e2z2 )。

奇函数乘以偶函数的结果还是奇函数:

f ( − z ) = ( − z ) 3 ⋅ 1 2 π e − ( − z ) 2 2 = − z 3 ⋅ 1 2 π e − z 2 2 = − f ( z ) f(-z) = (-z)^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{(-z)^2}{2}} = -z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} = -f(z) f(z)=(z)32π 1e2(z)2=z32π 1e2z2=f(z)

步骤 4:奇函数积分的性质

对于任意奇函数 ( f ( z ) f(z) f(z) ),在对称区间 ( [ − ∞ , ∞ ] [-\infty, \infty] [,] ) 上积分(假设积分收敛):

∫ − ∞ ∞ f ( z ) d z = ∫ − ∞ 0 f ( z ) d z + ∫ 0 ∞ f ( z ) d z \int_{-\infty}^{\infty} f(z) \, dz = \int_{-\infty}^{0} f(z) \, dz + \int_{0}^{\infty} f(z) \, dz f(z)dz=0f(z)dz+0f(z)dz

令 ( u = − z u = -z u=z ),则:

∫ − ∞ 0 f ( z ) d z = ∫ ∞ 0 f ( − u ) ( − d u ) = ∫ 0 ∞ − f ( u ) d u = − ∫ 0 ∞ f ( u ) d u \int_{-\infty}^{0} f(z) \, dz = \int_{\infty}^{0} f(-u) (-du) = \int_{0}^{\infty} -f(u) \, du = -\int_{0}^{\infty} f(u) \, du 0f(z)dz=0f(u)(du)=0f(u)du=0f(u)du

所以:

∫ − ∞ ∞ f ( z ) d z = − ∫ 0 ∞ f ( z ) d z + ∫ 0 ∞ f ( z ) d z = 0 \int_{-\infty}^{\infty} f(z) \, dz = -\int_{0}^{\infty} f(z) \, dz + \int_{0}^{\infty} f(z) \, dz = 0 f(z)dz=0f(z)dz+0f(z)dz=0

对于 ( f ( z ) = z 3 ⋅ 1 2 π e − z 2 2 f(z) = z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} f(z)=z32π 1e2z2 ),由于 ( e − z 2 2 e^{-\frac{z^2}{2}} e2z2 ) 衰减很快,积分收敛,奇函数性质保证:

∫ − ∞ ∞ z 3 ⋅ 1 2 π e − z 2 2 d z = 0 \int_{-\infty}^{\infty} z^3 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz = 0 z32π 1e2z2dz=0

因此:

E [ ( x − μ ) 3 ] = σ 3 ⋅ 0 = 0 E[(x - \mu)^3] = \sigma^3 \cdot 0 = 0 E[(xμ)3]=σ30=0

推广到所有奇数阶

对于任意奇数 ( k = 2 n + 1 k = 2n + 1 k=2n+1 )(( n = 0 , 1 , 2 , … n = 0, 1, 2, \dots n=0,1,2, )),( ( x − μ ) 2 n + 1 (x - \mu)^{2n+1} (xμ)2n+1 ) 是奇函数,乘以偶函数 ( 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} 2πσ2 1e2σ2(xμ)2 ) 后仍为奇函数,积分从 ( − ∞ -\infty ) 到 ( ∞ \infty ) 为零。所以,所有奇数阶中心矩都为零。


补充信息

1. 为什么偶数阶矩不为零?

偶数次方(如 ( ( x − μ ) 2 (x - \mu)^2 (xμ)2 ) 或 ( ( x − μ ) 4 (x - \mu)^4 (xμ)4 ))是偶函数,乘以偶函数后仍是偶函数,积分不会抵消。例如:

  • ( E [ ( x − μ ) 2 ] = σ 2 E[(x - \mu)^2] = \sigma^2 E[(xμ)2]=σ2 )(方差)
  • ( E [ ( x − μ ) 4 ] = 3 σ 4 E[(x - \mu)^4] = 3\sigma^4 E[(xμ)4]=3σ4 )(四阶矩)

这些值反映了分布的宽度和形状。

2. 偏度的含义

三阶中心矩 ( E [ ( x − μ ) 3 ] E[(x - \mu)^3] E[(xμ)3] ) 与偏度相关。偏度为零意味着分布没有左偏或右偏,正态分布的对称性恰好保证了这一点。如果分布不对称(例如指数分布),奇数阶矩就不为零。

3. 在统计中的应用

奇数阶矩为零在统计推断中很有用。例如,在计算Fisher信息矩阵时:

I 12 = E [ x − μ σ 2 ⋅ ( − 1 2 σ 2 + ( x − μ ) 2 2 ( σ 2 ) 2 ) ] I_{12} = E\left[ \frac{x - \mu}{\sigma^2} \cdot \left( -\frac{1}{2\sigma^2} + \frac{(x - \mu)^2}{2(\sigma^2)^2} \right) \right] I12=E[σ2xμ(2σ21+2(σ2)2(xμ)2)]

因为 ( E [ x − μ ] = 0 E[x - \mu] = 0 E[xμ]=0 ) 和 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(xμ)3]=0 ),交叉项为零,说明 ( μ \mu μ ) 和 ( σ 2 \sigma^2 σ2 ) 信息正交。
具体参考参考笔者的另一篇博客:Fisher信息矩阵(Fisher Information Matrix,简称FIM)

4. 其他分布呢?

并非所有分布的奇数阶矩都为零。例如:

  • 指数分布 ( f ( x ) = λ e − λ x f(x) = \lambda e^{-\lambda x} f(x)=λeλx )(( x ≥ 0 x \geq 0 x0 )),( E [ ( x − μ ) 3 ] ≠ 0 E[(x - \mu)^3] \neq 0 E[(xμ)3]=0 ),因为它右偏。
  • 对称的均匀分布也有奇数阶矩为零,但范围有限。

正态分布的无限对称支持和指数衰减共同造就了这个特性。


总结

正态分布的奇数阶中心矩为零源于其完美的对称性。奇函数与偶函数相乘后,积分在对称区间上抵消,数学上严谨地证明了这一点。这个性质不仅让正态分布更加“优雅”,还在统计估计、信息理论中简化了计算,比如保证参数间的正交性。下次看到正态分布的钟形曲线,不妨想想它隐藏的这些奇妙特性!

后记

2025年2月24日22点07分于上海,在Grok3大模型辅助下完成。

相关文章:

正态分布的奇妙性质:为什么奇数阶中心矩(odd central moments)为零?

正态分布的奇妙性质:为什么奇数阶矩为零? 正态分布(Normal Distribution)是统计学中最常见的分布之一,它的钟形曲线几乎无处不在,从身高体重到测量误差,都能看到它的影子。除了均值和方差这两个…...

【入门音视频】音视频基础知识

🌈前言🌈 这个系列在我学习过程中,对音视频知识归纳总结的笔记。因为音视频相关讲解非常稀少,所以我希望通过这个音视频系列,跟大家一起学习音视频,希望减少初学者在学习上的压力。同时希望也欢迎指出文章的…...

游戏引擎学习第120天

仓库:https://gitee.com/mrxiao_com/2d_game_3 上次回顾:周期计数代码 我们正在进行一个项目的代码优化工作,目标是提高性能。当前正在优化某个特定的代码片段,已经将其执行周期减少到48个周期。为了实现这一目标,我们设计了一个…...

【Qt之QQuickWidget】QML嵌入QWidget中

由于我项目开始使用Widgets,换公司后直接使用QML开发,没有了解过如何实现widget到qml过渡,恰逢面试时遇到一家公司希望从widget迁移到qml开发,询问相关实现,一时语塞,很尴尬,粗略研究并总结下。 对qwidget嵌…...

Vue 3 + Vite 项目中配置代理解决开发环境中跨域请求问题

在 Vue 3 Vite 项目中,配置代理是解决开发环境中跨域请求问题的常见方法。通过在 Vite 的配置文件中设置代理,可以将前端请求转发到后端服务器,从而避免浏览器的同源策略限制。 1. 创建 Vue 3 Vite 项目 首先,确保你已经安装了…...

Eureka、ZooKeeper 和 Nacos 之间的对比

Eureka、ZooKeeper 和 Nacos 都是分布式系统中常用的服务注册与发现工具,但它们的定位、功能和适用场景有所不同。作为一名开发者,理解它们之间的对比有助于选择合适的技术栈。以下从多个维度进行详细比较: 1. 基本概述 Eureka 来源&#xff…...

CSS中padding和margin属性的使用

在 HTML 中,padding 和 margin 是用于控制元素布局和间距的重要属性。 一、Padding(内边距) 定义:Padding 是指元素内容与元素边框之间的距离。它可以在元素内部创造出空白区域,使得内容不会紧贴着边框。 作用 增加元…...

【Python爬虫(49)】分布式爬虫:在新兴技术浪潮下的蜕变与展望

【Python爬虫】专栏简介:本专栏是 Python 爬虫领域的集大成之作,共 100 章节。从 Python 基础语法、爬虫入门知识讲起,深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑,覆盖网页、图片、音频等各类数据爬取&#xff…...

网络安全-系统层攻击流程及防御措施

系统层攻击流程涉及多个阶段,攻击者通过逐步渗透以获取控制权或窃取数据。以下是详细的流程及防御措施: 1. 侦察(Reconnaissance) 信息收集: 主动扫描:使用工具如Nmap、Masscan扫描目标IP、开放端口、服务…...

centos 7 安装python3 及pycharm远程连接方法

安装openssl 使用pip3安装 virtualenv的时候会提示WARNING: pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available. 这是因为缺少openssl 2.0以上版本 解决办法: 一、先确认版本 openssl version 二、安…...

【llm对话系统】如何快速开发一个支持openai接口的llm server呢

核心思路:使用轻量级 Web 框架,将 OpenAI API 请求转换为你现有推理脚本的输入格式,并将推理脚本的输出转换为 OpenAI API 的响应格式。 快速开发步骤列表: 选择合适的 Web 框架 (快速 & 简单): FastAPI: Python 最佳选择&am…...

跟着柳叶刀数字健康,学习如何通过病理切片预测分子分类对预后的影响|项目复现

小罗碎碎念 项目复现 今天和大家分享一个非常具有参考价值的项目,手把手带着大家复现一篇发表在柳叶刀数字健康的文章。 花了六个小时才完成的这篇推送,信息量非常大,遇到了很多报错问题,但是解决以后的感觉是非常爽的,先给大家展示一下最终的成果——在同一张切片上,通…...

deepseek_清华大学指导手册_pdf_1-5

deepseek_清华大学指导手册_pdf_1-5 无套路,无需关注,无需登录,无需app,直接下载: 下载地址 文件列表: 001_清华大学_DeepSeek从入门到精通.pdf 002_清华大学_DeepSeek如何赋能职场应用.pdf 003_清华大学…...

数据库(MySQL)二

MySQL 六、MySQL索引视图6.1 索引底层原理6.1.1 索引hash算法6.1.2 索引二叉树算法6.1.3 索引平衡二叉树算法6.1.4 索引BTREE树算法6.1.5 普通SQL全表扫描过程 6.2 索引分类6.2.1 按数据结构层次分类6.2.2 按字段数量层次分类6.2.3 按功能逻辑层次分类(面试题&#…...

第15届 蓝桥杯 C++编程青少组中/高级选拔赛 202401 真题答案及解析

第 1 题 【 单选题 】 表达式117 % 16 的结果是( )。 A:0 B:5 C:7 D:10 解析: % 是取模运算符,用于计算两个数相除后的余数。 计算 117 / 16,结果是 7,余数是 5。因此,117 % 16 = 5。答案: B 第 2 题 【 单选题 】 下列选项中,字符数组定义正确的是( …...

《AI大模型趣味实战》第10集:开发一个基于Mermaid的AI绘图网站

《AI大模型趣味实战》第10集:开发一个基于Mermaid的AI绘图网站 抱歉不按顺序出牌,先出一个第10集,第1到第9集慢慢来,后续也不会按顺序,总之凑满36集,可能或补充12集。 AI大模型趣味实战专栏 所有36个主题预…...

androidstudio 运行项目加载很慢,优化方法

一、Android Studio 运行项目加载缓慢可能由多种原因引起,以下是一些优化建议: 1. 升级硬件配置 内存:建议至少 8GB,16GB 或以上更佳。 SSD:使用 SSD 替代 HDD 以加快读写速度。 CPU:多核处理器有助于提…...

python脚本实现接入企微机器人

企业微信中的群聊机器人在日常办公中无处不在,对提升工作效率、保证消息及时送达提供了重要的技术保障。例如:DevOps助手、JIRA、构建通知等;还常常使用在运维服务器中配合Prometheus监控体系及时发送告警信息等 文章目录 源码示例Demo源码处…...

《论面向对象的建模及应用》审题技巧 - 系统架构设计师

论面向对象的建模及应用写作框架 一、考点概述 本论题“论面向对象的建模及应用”主要考察软件测试工程师对面向对象建模技术的理解和应用能力。具体涵盖以下几个方面: 面向对象建模的基本概念 :这包括理解面向对象编程(OOP)的基…...

【Godot4.3】自定义圆角容器

概述 Godot控件想要完全实现现代UI风格,需要进行大量的自定义组件设计。本篇就依托于笔者自己对现代UI设计中的圆角面板元素模仿来制作圆角容器组件。 圆角容器 圆角元素在现代的扁平UI设计中非常常见,在Godot中可以通过改进PanelContainer来或者自定…...

【网络】每天掌握一个Linux命令 - iftop

在Linux系统中,iftop是网络管理的得力助手,能实时监控网络流量、连接情况等,帮助排查网络异常。接下来从多方面详细介绍它。 目录 【网络】每天掌握一个Linux命令 - iftop工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景…...

《通信之道——从微积分到 5G》读书总结

第1章 绪 论 1.1 这是一本什么样的书 通信技术,说到底就是数学。 那些最基础、最本质的部分。 1.2 什么是通信 通信 发送方 接收方 承载信息的信号 解调出其中承载的信息 信息在发送方那里被加工成信号(调制) 把信息从信号中抽取出来&am…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放

简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现(两者等价),用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例: 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

uniapp 字符包含的相关方法

在uniapp中,如果你想检查一个字符串是否包含另一个子字符串,你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的,但它们在处理方式和返回值上有所不同。 使用includes()方法 includes()方法用于判断一个字…...

android13 app的触摸问题定位分析流程

一、知识点 一般来说,触摸问题都是app层面出问题,我们可以在ViewRootImpl.java添加log的方式定位;如果是touchableRegion的计算问题,就会相对比较麻烦了,需要通过adb shell dumpsys input > input.log指令,且通过打印堆栈的方式,逐步定位问题,并找到修改方案。 问题…...

pikachu靶场通关笔记19 SQL注入02-字符型注入(GET)

目录 一、SQL注入 二、字符型SQL注入 三、字符型注入与数字型注入 四、源码分析 五、渗透实战 1、渗透准备 2、SQL注入探测 (1)输入单引号 (2)万能注入语句 3、获取回显列orderby 4、获取数据库名database 5、获取表名…...

系统掌握PyTorch:图解张量、Autograd、DataLoader、nn.Module与实战模型

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文通过代码驱动的方式,系统讲解PyTorch核心概念和实战技巧,涵盖张量操作、自动微分、数据加载、模型构建和训练全流程&#…...

论文阅读:Matting by Generation

今天介绍一篇关于 matting 抠图的文章,抠图也算是计算机视觉里面非常经典的一个任务了。从早期的经典算法到如今的深度学习算法,已经有很多的工作和这个任务相关。这两年 diffusion 模型很火,大家又开始用 diffusion 模型做各种 CV 任务了&am…...

Django RBAC项目后端实战 - 03 DRF权限控制实现

项目背景 在上一篇文章中,我们完成了JWT认证系统的集成。本篇文章将实现基于Redis的RBAC权限控制系统,为系统提供细粒度的权限控制。 开发目标 实现基于Redis的权限缓存机制开发DRF权限控制类实现权限管理API配置权限白名单 前置配置 在开始开发权限…...