统计学中的得分函数(Score Function)是什么?它和Fisher信息矩阵有什么关系?
得分函数:统计学中的“敏感探针”
在统计学和概率论中,得分函数(Score Function)是一个看似简单却非常重要的概念。它不仅是Fisher信息矩阵的核心组成部分,还在参数估计、模型优化等领域发挥着关键作用。今天,我们就来聊聊什么是得分函数,它有什么用,以及为什么它能揭示参数间的“正交性”——比如在正态分布中,均值 ( μ \mu μ ) 和方差 ( σ 2 \sigma^2 σ2 ) 的得分函数为何在期望上“互不干扰”。
什么是得分函数?
得分函数的定义非常直白:它是对数似然函数(log-likelihood)对某个参数的偏导数。假设我们有一个概率分布 ( p ( x ∣ θ ) p(x|\theta) p(x∣θ) ),其中 ( θ \theta θ ) 是参数(可以是一个标量或向量),对数似然函数是 ( log p ( x ∣ θ ) \log p(x|\theta) logp(x∣θ) )。那么,得分函数就是:
s ( θ ) = ∂ log p ( x ∣ θ ) ∂ θ s(\theta) = \frac{\partial \log p(x|\theta)}{\partial \theta} s(θ)=∂θ∂logp(x∣θ)
简单来说,得分函数衡量了当参数 ( θ \theta θ ) 发生微小变化时,对数似然函数的“敏感度”。它就像一个探针,告诉你数据对参数的依赖程度。
一个通俗的比喻
想象你在调收音机的频率,想找到最清晰的信号(最佳参数)。你轻轻转动旋钮,信号强度的变化就是“得分函数”——它告诉你当前频率是否接近最佳点。如果变化很大(得分函数值大),说明你离目标还远;如果变化趋于零,说明你可能已经调到最佳位置了。
得分函数的数学性质
得分函数不仅仅是一个偏导数,它还有一些有趣的统计性质,让它在理论和实践中都非常有用。
期望为零
一个关键性质是:得分函数在真实参数下的期望为零。数学上:
E [ ∂ log p ( x ∣ θ ) ∂ θ ∣ θ ] = 0 E\left[ \frac{\partial \log p(x|\theta)}{\partial \theta} \bigg| \theta \right] = 0 E[∂θ∂logp(x∣θ) θ]=0
为什么会这样?因为对数似然函数的导数反映了似然函数的“坡度”,而在真实参数 ( θ \theta θ ) 下,似然函数达到极大值(对于最大似然估计来说),坡度为零。这个性质可以通过积分证明:
E [ s ( θ ) ] = ∫ ∂ log p ( x ∣ θ ) ∂ θ p ( x ∣ θ ) d x = ∫ 1 p ( x ∣ θ ) ∂ p ( x ∣ θ ) ∂ θ p ( x ∣ θ ) d x = ∫ ∂ p ( x ∣ θ ) ∂ θ d x E[s(\theta)] = \int \frac{\partial \log p(x|\theta)}{\partial \theta} p(x|\theta) \, dx = \int \frac{1}{p(x|\theta)} \frac{\partial p(x|\theta)}{\partial \theta} p(x|\theta) \, dx = \int \frac{\partial p(x|\theta)}{\partial \theta} \, dx E[s(θ)]=∫∂θ∂logp(x∣θ)p(x∣θ)dx=∫p(x∣θ)1∂θ∂p(x∣θ)p(x∣θ)dx=∫∂θ∂p(x∣θ)dx
由于 ( p ( x ∣ θ ) p(x|\theta) p(x∣θ) ) 是概率密度函数,其积分恒等于 1,对 ( θ \theta θ ) 求导后:
∂ ∂ θ ∫ p ( x ∣ θ ) d x = ∫ ∂ p ( x ∣ θ ) ∂ θ d x = 0 \frac{\partial}{\partial \theta} \int p(x|\theta) \, dx = \int \frac{\partial p(x|\theta)}{\partial \theta} \, dx = 0 ∂θ∂∫p(x∣θ)dx=∫∂θ∂p(x∣θ)dx=0
所以期望为零。这说明得分函数的波动是围绕零对称的。
方差与Fisher信息
具体请看笔者的另一篇博客:Fisher信息矩阵(Fisher Information Matrix,简称FIM)
得分函数的方差却不是零,而是与Fisher信息密切相关。对于单个参数 ( θ \theta θ ):
I ( θ ) = E [ ( ∂ log p ( x ∣ θ ) ∂ θ ) 2 ∣ θ ] I(\theta) = E\left[ \left( \frac{\partial \log p(x|\theta)}{\partial \theta} \right)^2 \bigg| \theta \right] I(θ)=E[(∂θ∂logp(x∣θ))2 θ]
如果是多参数情况,Fisher信息矩阵的元素是:
I i j = E [ ∂ log p ∂ θ i ∂ log p ∂ θ j ∣ θ ] I_{ij} = E\left[ \frac{\partial \log p}{\partial \theta_i} \frac{\partial \log p}{\partial \theta_j} \bigg| \theta \right] Iij=E[∂θi∂logp∂θj∂logp θ]
这意味着Fisher信息捕捉了得分函数的“波动大小”或“信息含量”。
得分函数有什么用?
得分函数看似抽象,但在实际应用中非常强大。以下是它的几个主要用途:
1. 最大似然估计(MLE)
在最大似然估计中,我们通过求解得分函数等于零的点来估计参数:
∂ log p ( x ∣ θ ) ∂ θ = 0 \frac{\partial \log p(x|\theta)}{\partial \theta} = 0 ∂θ∂logp(x∣θ)=0
这就像找到山顶(似然函数的最大值)。例如,对于正态分布 ( N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) ):
- ( ∂ log p ∂ μ = x − μ σ 2 \frac{\partial \log p}{\partial \mu} = \frac{x - \mu}{\sigma^2} ∂μ∂logp=σ2x−μ ),令其为零,解得 ( μ ^ = x \hat{\mu} = x μ^=x )。
得分函数直接引导我们找到最佳估计。
2. Fisher信息与参数不确定性
Fisher信息矩阵由得分函数的二阶统计量构成,它告诉我们参数估计的精度有多高。Fisher信息的逆矩阵给出了参数估计方差的下界(Cramér-Rao下界),反映了估计的不确定性。
例如,在正态分布中:
- ( I μ μ = 1 σ 2 I_{\mu\mu} = \frac{1}{\sigma^2} Iμμ=σ21 ),说明 ( μ \mu μ ) 的估计方差下界与 ( σ 2 \sigma^2 σ2 ) 成正比。
3. 参数正交性与 ( I 12 = 0 I_{12} = 0 I12=0 )
当我们有多个参数时,得分函数之间的关系揭示了参数间的依赖性。如果 ( I i j = 0 I_{ij} = 0 Iij=0 )(( i ≠ j i \neq j i=j )),说明 ( θ i \theta_i θi ) 和 ( θ j \theta_j θj ) 的得分函数在期望上无关,这种情况称为“信息正交”。
以正态分布为例:
-
( ∂ log p ∂ μ = x − μ σ 2 \frac{\partial \log p}{\partial \mu} = \frac{x - \mu}{\sigma^2} ∂μ∂logp=σ2x−μ )
-
( ∂ log p ∂ σ 2 = − 1 2 σ 2 + ( x − μ ) 2 2 ( σ 2 ) 2 \frac{\partial \log p}{\partial \sigma^2} = -\frac{1}{2\sigma^2} + \frac{(x - \mu)^2}{2(\sigma^2)^2} ∂σ2∂logp=−2σ21+2(σ2)2(x−μ)2 )
计算交叉项:
I 12 = E [ x − μ σ 2 ⋅ ( − 1 2 σ 2 + ( x − μ ) 2 2 ( σ 2 ) 2 ) ] I_{12} = E\left[ \frac{x - \mu}{\sigma^2} \cdot \left( -\frac{1}{2\sigma^2} + \frac{(x - \mu)^2}{2(\sigma^2)^2} \right) \right] I12=E[σ2x−μ⋅(−2σ21+2(σ2)2(x−μ)2)]
展开后取期望,因为 ( E [ x − μ ] = 0 E[x - \mu] = 0 E[x−μ]=0 ) 和 ( E [ ( x − μ ) 3 ] = 0 E[(x - \mu)^3] = 0 E[(x−μ)3]=0 )(正态分布奇数阶矩为零),结果为 ( I 12 = 0 I_{12} = 0 I12=0 )。这表明 ( μ \mu μ ) 和 ( σ 2 \sigma^2 σ2 ) 的信息是独立的,估计一个参数不会干扰另一个。具体计算过程请看笔者的另一篇博客:Fisher信息矩阵(Fisher Information Matrix,简称FIM)
参数正交的意义
当 ( I 12 = 0 I_{12} = 0 I12=0 ) 时,参数在信息上是正交的,这有什么实际意义呢?
1. 估计的独立性
信息正交意味着估计 ( μ \mu μ ) 时,方差 ( σ 2 \sigma^2 σ2 ) 的不确定性不会混淆结果,反之亦然。这简化了统计推断,尤其在大样本下,估计的协方差矩阵是对角的。
2. 模型设计的启示
在参数化模型设计中,如果能让参数正交,就能减少估计时的相互干扰。例如,正态分布的自然参数化(用 ( 1 σ 2 \frac{1}{\sigma^2} σ21 ) 和 ( μ σ 2 \frac{\mu}{\sigma^2} σ2μ ))保持了这种正交性。
3. 机器学习中的应用
在深度学习中,Fisher信息矩阵用于优化(如自然梯度下降)。参数正交性可以帮助分离梯度方向,提高训练效率。
总结
得分函数是对数似然函数的偏导数,是统计学中的“敏感探针”。它不仅帮助我们找到最大似然估计,还通过Fisher信息揭示参数的信息含量和不确定性。当不同参数的得分函数交叉项期望为零(如 ( I 12 = 0 I_{12} = 0 I12=0 )),它们在信息上正交,意味着参数估计互不干扰。这种性质在正态分布等模型中尤为明显,也为统计建模和优化提供了重要指导。
后记
2025年2月24日21点53分于上海,在Grok3大模型辅助下完成。
相关文章:
统计学中的得分函数(Score Function)是什么?它和Fisher信息矩阵有什么关系?
得分函数:统计学中的“敏感探针” 在统计学和概率论中,得分函数(Score Function)是一个看似简单却非常重要的概念。它不仅是Fisher信息矩阵的核心组成部分,还在参数估计、模型优化等领域发挥着关键作用。今天…...
Spring Boot集成MyBatis访问MySQL:从项目搭建到基础数据库查询(基础入门)
Spring Boot集成MyBatis访问MySQL 一、引言 在当今企业级应用开发中,Spring Boot、MyBatis与MySQL的组合凭借其高效性和灵活性,成为构建数据驱动型应用的首选方案。本文将带你从零开始搭建项目,掌握Spring Boot集成MyBatis的基础入门内容。…...
ShenNiusModularity项目源码学习(14:ShenNius.Infrastructure项目分析)
ShenNius.Infrastructure项目用于定义ShenNius.Admin.Mvc项目和ShenNius.Admin.API项目共用的特性类、数据操作接口实现类、上下文类、通讯类,主要文件的用途如下: Attributes文件夹保存特性类或过滤器类定义,主要包括: …...
Linux 内核配置机制详细讲解
本文是对 Linux 内核配置机制 make menuconfig 的 超详细分步解析,涵盖其工作原理、界面操作、配置逻辑及底层实现: 一、内核配置系统概述 Linux 内核的配置系统是一个 基于文本的交互式配置工具链,核心目标是通过定义 CONFIG_XXX 宏来控制内…...
【C语言】第八期——指针、二维数组与字符串
目录 1 初始指针 2 获取变量的地址 3 定义指针变量、取地址、取值 3.1 定义指针变量 3.2 取地址、取值 4 对指针变量进行读写操作 5 指针变量作为函数参数 6 数组与指针 6.1 指针元素指向数组 6.2 指针加减运算(了解) 6.2.1 指针加减具体数字…...
Spring Boot集成Spring Security之HTTP请求授权
一、HTTP请求授权工作原理 基于Spring Security最新的Http请求授权讲解,不再使用旧版的请求授权 授权过滤器AuthorizationFilter获取认证信息 调用RequestMatcherDelegatingAuthorizationManager的check方法验证该用户是否具有该请求的授权 RequestMatcherDele…...
可以免费无限次下载PPT的网站
前言 最近发现了一个超实用的网站,想分享给大家。 在学习和工作的过程中,想必做PPT是一件让大家都很头疼的一件事。 想下载一些PPT模板减少做PPT的工作量,但网上大多精美的PPT都是需要付费才能下载使用。 即使免费也有次数限制࿰…...
DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!
引言 就在今天,2025年2月25日,DeepSeek 再次为人工智能社区带来了一场技术盛宴——DeepEP 项目的开源。这个旨在优化 GPU 性能的工具一经发布便迅速获得了广泛的关注和赞誉,短短两小时内就斩获了超过1000个 Star。本文将详细介绍 DeepEP 的功…...
GPT1 与 GPT2 的异同
1.什么是GPT1: GPT1介绍了一种通过生成式预训练(Generative Pre-Training)来提升语言理解能力的方法。这种方法首先在一个大型的未标注文本语料库上进行语言模型的预训练,然后针对具体的任务进行判别式微调(discrimin…...
从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了
来源 | 机器之心 近日,上海 AI Lab 具身智能中心研究团队在机器人控制领域取得了最新突破,提出的 HoST(Humanoid Standing-up Control)算法,成功让人形机器人在多种复杂环境中实现了自主站起,并展现出强大…...
基于Python socket库构建的基于 P2P 的文件共享系统示例
基于 P2P 的文件共享系统 实现方式: 使用 Python 的socket库构建 P2P 网络,节点之间通过 TCP 或 UDP 协议进行通信。每个节点维护一个文件列表,并向其他节点广播自己拥有的文件信息。当一个节点需要某个文件时,它会向网络中的其…...
【Kubernetes】API server 限流 之 maxinflight.go
这个文件实现了一个基于信号量(Channel)的简单限流器。 基础知识 总共有四种channel 带缓冲的channel nonMutatingChan、mutatingChan 都是带缓冲的channel ,这类channel 的特点是: 这允许最多 mutatingLimit /nonMutatingLimit 个请求同时获取令牌并执…...
Solr中得Core和Collection的作用和关系
Solr中得Core和Collection的作用和关系 一, 总结 在Apache Solr中,Core和Collection 是两个核心概念,他们分别用于单机模式和分布式模式(SolrCloud)中,用于管理和组织数据。 二,Core 定义&am…...
AI驱动的自动化留给人类的时间不多了
时间紧迫!时间紧迫!时间紧迫! 关于AI工作流催生的行业任务自动化时间窗口,结合技术成熟度、成本效益、行业特性等维度,可划分为以下阶段: 一、技术渗透阶段(2025-2028年) 高重复性任…...
嵌入式Qt的动平衡仪完整设计方案
一、系统架构总览 #mermaid-svg-R5q0e12ntMzsskep {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-R5q0e12ntMzsskep .error-icon{fill:#552222;}#mermaid-svg-R5q0e12ntMzsskep .error-text{fill:#552222;stroke:#5…...
使用 Containerd 通过 HTTP 协议拉取 Harbor 私有镜像仓库的镜像
在 Kubernetes 1.24及以上版本环境中,docker不再被支持,主要使用Containerd 是常用的容器运行。默认情况下,Containerd 使用 HTTPS 协议与镜像仓库通信。然而,在某些场景下(如测试环境或内部网络)ÿ…...
Python解决“比赛配对”问题
Python解决“比赛配对”问题 问题描述测试样例解决思路代码 问题描述 小R正在组织一个比赛,比赛中有 n 支队伍参赛。比赛遵循以下独特的赛制: 如果当前队伍数为 偶数,那么每支队伍都会与另一支队伍配对。总共进行 n / 2 场比赛,…...
Dify在Ubuntu20.04系统的部署
文章目录 一、dify 介绍1.核心功能优势2.应用场景 二、dify 安装(docker方式)1.代码库下载2.配置文件修改3.启动docker 容器 三、遇到问题与解决1.使用sudo docker compose up -d报错2.使用service docker start报错 一、dify 介绍 Dify 是一款开源的大语言模型(LL…...
达梦:内存相关参数
目录 28个相关参数1. 内存池相关MEMORY_POOLMEMORY_N_POOLSMEMORY_BAK_POOL 2. 大缓冲区相关HUGE_BUFFERHUGE_BUFFER_POOLS 3. 共享缓冲区相关BUFFERBUFFER_POOLSBUFFER_MODEMAX_BUFFER 4. 快速池相关FAST_POOL_PAGES 5. 回收池相关RECYCLE_POOLS 6. 回滚段池相关ROLLSEG_POOLS…...
计算机毕设-基于springboot的融合多源高校画像数据与协同过滤算法的高考择校推荐系统的设计与实现(附源码+lw+ppt+开题报告)
博主介绍:✌多个项目实战经验、多个大型网购商城开发经验、在某机构指导学员上千名、专注于本行业领域✌ 技术范围:Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战…...
《Qt动画编程实战:轻松实现头像旋转效果》
《Qt动画编程实战:轻松实现头像旋转效果》 Qt 提供了丰富的动画框架,可以轻松实现各种平滑的动画效果。其中,旋转动画是一种常见的 UI 交互方式,广泛应用于加载指示器、按钮动画、场景变换等。本篇文章将详细介绍如何使用 Qt 实现…...
SpringBoot3—快速入门
一、简介 (1)前置知识 Java17Spring、SpringMVC、MyBatisMaven、IDEA (2)环境要求 (3)SpringBoot3是什么 核心概念:Spring Boot 底层是 Spring,能简单、快速地创建一个独立的、生…...
【Eureka 缓存机制】
今天简单介绍一下Eureka server 的缓存机制吧✌️✌️✌️ 一、先来个小剧场:服务发现的"拖延症" 想象你是个外卖小哥(客户端),每次接单都要打电话问调度中心(Eureka Server):“现在…...
Python基于机器学习的微博舆情情感分析系统,微博评论情感分析可视化系统(全新升级)
大家好,今天为大家带来的是Python基于机器学习的微博舆情情感分析系统,微博评论情感分析可视化系统,这个系统在原本的系统上进行优化升级。 算法从开源框架的 snlow ,到支持机器学习的 lstm 算法可以手动输入语句,进行…...
Matlab地图绘制教程第2期—水陆填充图
上一期分享了海岸线图的绘制方法: 本着由浅入深的理念,本期再来分享一下水陆填充图的绘制方法。 先来看一下成品效果: 特别提示:Matlab地图绘制教程系列,旨在降低大家使用Matlab进行地图类科研绘图的门槛,…...
云创智城YunCharge 新能源二轮、四轮充电解决方案(云快充、万马爱充、中电联、OCPP1.6J等多个私有单车、汽车充电协议)之新能源充电行业系统说明书
云创智城YunCharge 新能源充电行业系统说明书 ⚡官方文档 ⚡官网地址 1. 引言 随着全球环境保护和能源危机的加剧,新能源汽车行业得到了快速发展,充电基础设施建设也随之蓬勃发展。新能源充电行业系统旨在提供高效、便捷的充电服务,满足电…...
(八)Java-Collection
一、Collection接口 1.特点 Collection实现子类可以存放多个元素,每个元素可以是Object; 有些Collection的实现类,可以存放重复的元素,有些不可以; 有些Collection的实现类,有些是有序的(Li…...
小程序高度问题背景scss
不同的机型,他的比例啥的都会不一样,同样的rpx也会有不同的效果。所以这里选择了取消高度。 <view class"box-border" :style"{padding-top: ${navHeight}px,}"><!-- 已登录 --><view v-if"userStore.userInfo&…...
HTML 日常开发常用标签
文章目录 HTML 日常开发常用标签1、基本结构标签2、内容标签3、多媒体标签4、表单标签5、列表和定义标签6、表格标签7、链接和图像8、元数据9、语义化标签(HTML5新增)10、框架和内联11、交互12、过时或不推荐使用的标签 HTML 日常开发常用标签 1、基本结…...
vue3表单验证的时候访问接口如果有值就通过否则不通过.主动去触发校验
页面有个身份证号码的校验。校验完身份证格式是否符合之后还要去访问接口查询这个用户是否存在。如果存在才通过验证。否则就校验不通过 <el-form ref"ruleFormRef" :model"form" label-width"140px" label-position"right" label…...
