举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤
协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。
下面我们将通过一个具体的例子,详细说明如何计算协方差。
示例数据
假设我们有两个变量 X X X 和 Y Y Y,它们的观测值如下:
| 样本编号 | X X X | Y Y Y |
|---|---|---|
| 1 | 2 | 5 |
| 2 | 4 | 9 |
| 3 | 6 | 12 |
| 4 | 8 | 15 |
| 5 | 10 | 17 |
我们将计算变量 X X X 和 Y Y Y 的协方差。
计算步骤
步骤1:计算 X X X 和 Y Y Y 的均值
首先,计算 X X X 和 Y Y Y 的均值(平均值)。
计算 X X X 的均值 X ˉ \bar{X} Xˉ:
X ˉ = 1 n ∑ i = 1 n X i = 2 + 4 + 6 + 8 + 10 5 = 30 5 = 6 \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = \frac{2 + 4 + 6 + 8 + 10}{5} = \frac{30}{5} = 6 Xˉ=n1i=1∑nXi=52+4+6+8+10=530=6
计算 Y Y Y 的均值 Y ˉ \bar{Y} Yˉ:
Y ˉ = 1 n ∑ i = 1 n Y i = 5 + 9 + 12 + 15 + 17 5 = 58 5 = 11.6 \bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i = \frac{5 + 9 + 12 + 15 + 17}{5} = \frac{58}{5} = 11.6 Yˉ=n1i=1∑nYi=55+9+12+15+17=558=11.6
步骤2:计算每个样本的偏差乘积
对于每个样本,计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
| 样本编号 | X i X_i Xi | Y i Y_i Yi | X i − X ˉ X_i - \bar{X} Xi−Xˉ | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) |
|---|---|---|---|---|---|
| 1 | 2 | 5 | 2 − 6 = − 4 2 - 6 = -4 2−6=−4 | 5 − 11.6 = − 6.6 5 - 11.6 = -6.6 5−11.6=−6.6 | ( − 4 ) ( − 6.6 ) = 26.4 (-4)(-6.6) = 26.4 (−4)(−6.6)=26.4 |
| 2 | 4 | 9 | 4 − 6 = − 2 4 - 6 = -2 4−6=−2 | 9 − 11.6 = − 2.6 9 - 11.6 = -2.6 9−11.6=−2.6 | ( − 2 ) ( − 2.6 ) = 5.2 (-2)(-2.6) = 5.2 (−2)(−2.6)=5.2 |
| 3 | 6 | 12 | 6 − 6 = 0 6 - 6 = 0 6−6=0 | 12 − 11.6 = 0.4 12 - 11.6 = 0.4 12−11.6=0.4 | ( 0 ) ( 0.4 ) = 0 (0)(0.4) = 0 (0)(0.4)=0 |
| 4 | 8 | 15 | 8 − 6 = 2 8 - 6 = 2 8−6=2 | 15 − 11.6 = 3.4 15 - 11.6 = 3.4 15−11.6=3.4 | ( 2 ) ( 3.4 ) = 6.8 (2)(3.4) = 6.8 (2)(3.4)=6.8 |
| 5 | 10 | 17 | 10 − 6 = 4 10 - 6 = 4 10−6=4 | 17 − 11.6 = 5.4 17 - 11.6 = 5.4 17−11.6=5.4 | ( 4 ) ( 5.4 ) = 21.6 (4)(5.4) = 21.6 (4)(5.4)=21.6 |
步骤3:求偏差乘积的和
将所有样本的 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) 相加:
∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 i=1∑n(Xi−Xˉ)(Yi−Yˉ)=26.4+5.2+0+6.8+21.6=60
步骤4:计算协方差
协方差的公式为:
Cov ( X , Y ) = 1 n ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n1i=1∑n(Xi−Xˉ)(Yi−Yˉ)
将上述计算结果代入:
Cov ( X , Y ) = 1 5 × 60 = 12 \text{Cov}(X, Y) = \frac{1}{5} \times 60 = 12 Cov(X,Y)=51×60=12
因此,变量 X X X 和 Y Y Y 的协方差为 12。
总结
通过以上步骤,我们计算出了 X X X 和 Y Y Y 的协方差为 12,表示 X X X 和 Y Y Y 之间存在正向的线性关系。当 X X X 增大时, Y Y Y 也倾向于增大。
额外说明
-
协方差的符号:
- 正值:表示两个变量倾向于同方向变化。
- 负值:表示两个变量倾向于反方向变化。
- 零或接近零:表示两个变量之间没有线性关系。
-
单位: 协方差的单位是 X X X 和 Y Y Y 单位的乘积,因此不易直接比较大小。
-
标准化协方差(相关系数): 为了消除量纲的影响,可以计算 皮尔逊相关系数,其计算公式为:
r X Y = Cov ( X , Y ) s X s Y r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} rXY=sXsYCov(X,Y)其中 s X s_X sX 和 s Y s_Y sY 分别是 X X X 和 Y Y Y 的标准差。
计算标准差和相关系数
计算 X X X 的标准差 s X s_X sX:
s X = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 s_X = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 } sX=n1i=1∑n(Xi−Xˉ)2
先计算 ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2:
| 样本编号 | X i − X ˉ X_i - \bar{X} Xi−Xˉ | ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2 |
|---|---|---|
| 1 | -4 | 16 |
| 2 | -2 | 4 |
| 3 | 0 | 0 |
| 4 | 2 | 4 |
| 5 | 4 | 16 |
求和:
∑ i = 1 n ( X i − X ˉ ) 2 = 16 + 4 + 0 + 4 + 16 = 40 \sum_{i=1}^{n} (X_i - \bar{X})^2 = 16 + 4 + 0 + 4 + 16 = 40 i=1∑n(Xi−Xˉ)2=16+4+0+4+16=40
计算标准差:
s X = 40 5 = 8 ≈ 2.8284 s_X = \sqrt{ \frac{40}{5} } = \sqrt{8} \approx 2.8284 sX=540=8≈2.8284
计算 Y Y Y 的标准差 s Y s_Y sY:
同样地,计算 ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2:
| 样本编号 | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2 |
|---|---|---|
| 1 | -6.6 | 43.56 |
| 2 | -2.6 | 6.76 |
| 3 | 0.4 | 0.16 |
| 4 | 3.4 | 11.56 |
| 5 | 5.4 | 29.16 |
求和:
∑ i = 1 n ( Y i − Y ˉ ) 2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 \sum_{i=1}^{n} (Y_i - \bar{Y})^2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 i=1∑n(Yi−Yˉ)2=43.56+6.76+0.16+11.56+29.16=91.2
计算标准差:
s Y = 91.2 5 = 18.24 ≈ 4.2720 s_Y = \sqrt{ \frac{91.2}{5} } = \sqrt{18.24} \approx 4.2720 sY=591.2=18.24≈4.2720
计算相关系数 r X Y r_{XY} rXY:
r X Y = Cov ( X , Y ) s X s Y = 12 2.8284 × 4.2720 = 12 12.092 ≈ 0.9923 r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} = \frac{12}{2.8284 \times 4.2720} = \frac{12}{12.092} \approx 0.9923 rXY=sXsYCov(X,Y)=2.8284×4.272012=12.09212≈0.9923
因此, X X X 和 Y Y Y 的相关系数约为 0.9923,表示它们之间存在非常强的正线性关系。
结论
通过这个例子,我们详细地演示了协方差的计算步骤:
- 计算均值:求 X X X 和 Y Y Y 的均值 X ˉ \bar{X} Xˉ 和 Y ˉ \bar{Y} Yˉ。
- 计算偏差乘积:对每个样本计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
- 求和并平均:将所有偏差乘积相加,除以样本数 n n n,得到协方差。
- (可选)计算相关系数:计算标准差,进一步求得相关系数,以量化变量之间的线性关系强度。
希望这个例子能帮助您理解协方差的计算方法。
相关文章:
举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤 协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。 下面我们将通过一个具体的例…...
2024/9/16论文赏析(均为1区或顶刊
Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation 代码链接:GitHub - xjiangmed/LTUDA 论文链接:Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ …...
IDEA 2024.3 EAP新特征早览!
0 前言 IntelliJ IDEA 2024.3 第一个 EAP 版本已发布,提前体验 下一个重大版本的一部分改进。 持续关注 EAP 更新,未来几周内将推出更多 IntelliJ IDEA 新功能。尝试这些新功能,分享您的反馈,共同完善 IDE。 1 AI 助手 1.1 内…...
如何在安卓設備上更換IP地址?
IP地址是設備在網路中的唯一標識,通過IP地址,網路能夠識別並與設備進行通信。本文將詳細介紹在安卓設備上更換IP地址的幾種方法。 在安卓設備上更換IP地址的方法 1. 使用Wi-Fi網路更換IP地址 最簡單的方法是通過Wi-Fi網路更換IP地址。步驟如下&#x…...
LINUX网络编程:TCP(1)
目录 1.认识Tcp的报头 2.确认应答机制(ACK) 序号与确认序号 捎带应答 3.超时重传机制 4.Tcp连接管理 三次握手 为什是三次握手 四次挥手 理解TIMEWAIT 1.认识Tcp的报头 源端口和目的端口号没什么说的 32位的序号和确认序号,之后会介…...
基于PHP的新闻管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于phpMySQL的新闻管理系统。…...
6.C++程序中的基本数据类型
数据类型是指在C中用于声明不同类型变量或函数的一个系统或抽象或者是一个分类,它决定了变量存储占用的内存空间以及解析存储的位模式。其实数据类型可以理解为固定内存大小的别名,是创建变量的模具,具体使用哪种模具(包括自定义&…...
oracle 11g写一个判断是否是身份证的函数,函数名称为:FUN_IS_IDENNO
下面是一个用于判断是否是身份证号码的Oracle 11g函数(FUN_IS_IDENNO)。身份证号码通常为18位(或者旧的15位),前17位为数字,第18位为数字或字母X,并且需要符合一定的规则,例如出生日…...
如何使用Spring Cloud Gateway搭建网关系统
使用Spring Cloud Gateway搭建网关系统是一个涉及多个步骤的过程,主要包括创建Spring Boot项目、添加 Spring Cloud Gateway依赖、配置路由规则以及运行和测试网关。以下是详细的步骤:一、创建Spring Boot项目 选择工具: 可以使用Spring Ini…...
油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型
油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…...
《拿下奇怪的前端报错》序章:报错输出个数值数组Buffer(475) [Uint8Array],我来教它说人话!
作为前端开发者,你可能会遇到过一些奇奇怪怪的报错(相信我你早晚会遇到),关键是它未给出具体错误的位置,或者是一些很奇怪的信息。 我以前都是还原代码,然后找到错误的位置。或者是瞎弄一通,测试…...
Docker 里面按照ifconfig
1. 进入Docker 容器内部 docker exec -it xxx bash2. 安装 net-tools iputils-ping apt-get update && apt-get install -y net-tools apt-get update && apt-get install -y iputils-ping 3. 执行ifconfig 执行ping...
DOS(Disk Operating System,磁盘操作系统)常用指令
目录 背景: 早期探索: DOS之父: 发展历程: 常用指令: 进入命令: 操作1.进入和回退: 操作2.增、删: 操作3.其它: 总结: 背景: 早期探索: DOS(Disk Operating System,磁盘操作系统)在…...
VSCode集成Python环境搭建配置详细步骤
1. 安装VSCode 在开始我们的Python编程之旅前,首先需要准备好我们的开发工具——Visual Studio Code,简称VSCode。VSCode是一款由微软开发的轻量级但功能强大的源代码编辑器,支持多种编程语言,并且拥有丰富的扩展生态系统。接下来,我们将一步步教你如何下载、安装以及汉化…...
OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…...
Windows【环境 01】服务器系统重装后的服务恢复(ES\Redis\Jafka\Tomcat)环境变量和服务注册
服务器系统重装后的服务恢复 1.原因2.问题处理2.1 JDK2.2 Elasticsearch2.3 Redis2.4 Jafka2.5 Tomcat 3.总结 1.原因 Windows 服务器系统盘损坏,换了硬盘并重做了系统,其他磁盘未损坏但安装的服务无法正常运行了,包括: Elastic…...
发现编程的全新境界——明基RD280U显示器使用体验
前言 在大学的四年里,我几乎每天都泡在实验室,盯着电脑屏幕,一行行地码代码。那时,学校提供的显示器是非常基础的款式,功能简单,几乎没有任何特别之处,甚至配置也比较低。那个时候,…...
使用阿里OCR身份证识别
1、开通服务 免费试用 2、获取accesskay AccessKeyId和AccessKeySecret 要同时复制保存下来 因为后面好像看不AccessKeySecret了 3.Api 参考 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeidcard?spma2c4g.11186623.0.0.7a9f4b1e5C…...
8. 详细描述一条 SQL 语句在 MySQL 中的执行过程。
一条SQL语句在MySQL中的执行过程包括多个步骤,从接收到SQL命令到返回结果,这些步骤涉及SQL解析、优化、执行以及最终的结果返回。以下是详细描述一条SQL语句在MySQL中的执行过程。 1. 客户端发送SQL请求 客户端应用程序:首先,客户…...
C++--类的实例化
一、实例化的概念 用类类型在屋里内存中创建对象的过程,称为类实例化出对象 类是对对象进行一种抽象描述,是一个模型一样的东西,限定了类有哪些成员变量,这些成员变量只是声明,没有分配空间,用类实例化出…...
51c自动驾驶~合集58
我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留,CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制(CCA-Attention),…...
ubuntu搭建nfs服务centos挂载访问
在Ubuntu上设置NFS服务器 在Ubuntu上,你可以使用apt包管理器来安装NFS服务器。打开终端并运行: sudo apt update sudo apt install nfs-kernel-server创建共享目录 创建一个目录用于共享,例如/shared: sudo mkdir /shared sud…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...
Java 加密常用的各种算法及其选择
在数字化时代,数据安全至关重要,Java 作为广泛应用的编程语言,提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景,有助于开发者在不同的业务需求中做出正确的选择。 一、对称加密算法…...
12.找到字符串中所有字母异位词
🧠 题目解析 题目描述: 给定两个字符串 s 和 p,找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义: 若两个字符串包含的字符种类和出现次数完全相同,顺序无所谓,则互为…...
SpringTask-03.入门案例
一.入门案例 启动类: package com.sky;import lombok.extern.slf4j.Slf4j; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.cache.annotation.EnableCach…...
智能分布式爬虫的数据处理流水线优化:基于深度强化学习的数据质量控制
在数字化浪潮席卷全球的今天,数据已成为企业和研究机构的核心资产。智能分布式爬虫作为高效的数据采集工具,在大规模数据获取中发挥着关键作用。然而,传统的数据处理流水线在面对复杂多变的网络环境和海量异构数据时,常出现数据质…...
GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...
JS手写代码篇----使用Promise封装AJAX请求
15、使用Promise封装AJAX请求 promise就有reject和resolve了,就不必写成功和失败的回调函数了 const BASEURL ./手写ajax/test.jsonfunction promiseAjax() {return new Promise((resolve, reject) > {const xhr new XMLHttpRequest();xhr.open("get&quo…...
Web中间件--tomcat学习
Web中间件–tomcat Java虚拟机详解 什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机,它可以执行Java字节码。Java虚拟机是Java平台的一部分,Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...
