当前位置: 首页 > news >正文

举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤

例子:协方差的计算步骤

协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。

下面我们将通过一个具体的例子,详细说明如何计算协方差。

示例数据

假设我们有两个变量 X X X Y Y Y,它们的观测值如下:

样本编号 X X X Y Y Y
125
249
3612
4815
51017

我们将计算变量 X X X Y Y Y 的协方差。

计算步骤

步骤1:计算 X X X Y Y Y 的均值

首先,计算 X X X Y Y Y 的均值(平均值)。

计算 X X X 的均值 X ˉ \bar{X} Xˉ
X ˉ = 1 n ∑ i = 1 n X i = 2 + 4 + 6 + 8 + 10 5 = 30 5 = 6 \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = \frac{2 + 4 + 6 + 8 + 10}{5} = \frac{30}{5} = 6 Xˉ=n1i=1nXi=52+4+6+8+10=530=6

计算 Y Y Y 的均值 Y ˉ \bar{Y} Yˉ
Y ˉ = 1 n ∑ i = 1 n Y i = 5 + 9 + 12 + 15 + 17 5 = 58 5 = 11.6 \bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i = \frac{5 + 9 + 12 + 15 + 17}{5} = \frac{58}{5} = 11.6 Yˉ=n1i=1nYi=55+9+12+15+17=558=11.6

步骤2:计算每个样本的偏差乘积

对于每个样本,计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (XiXˉ)(YiYˉ)

样本编号 X i X_i Xi Y i Y_i Yi X i − X ˉ X_i - \bar{X} XiXˉ Y i − Y ˉ Y_i - \bar{Y} YiYˉ ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (XiXˉ)(YiYˉ)
125 2 − 6 = − 4 2 - 6 = -4 26=4 5 − 11.6 = − 6.6 5 - 11.6 = -6.6 511.6=6.6 ( − 4 ) ( − 6.6 ) = 26.4 (-4)(-6.6) = 26.4 (4)(6.6)=26.4
249 4 − 6 = − 2 4 - 6 = -2 46=2 9 − 11.6 = − 2.6 9 - 11.6 = -2.6 911.6=2.6 ( − 2 ) ( − 2.6 ) = 5.2 (-2)(-2.6) = 5.2 (2)(2.6)=5.2
3612 6 − 6 = 0 6 - 6 = 0 66=0 12 − 11.6 = 0.4 12 - 11.6 = 0.4 1211.6=0.4 ( 0 ) ( 0.4 ) = 0 (0)(0.4) = 0 (0)(0.4)=0
4815 8 − 6 = 2 8 - 6 = 2 86=2 15 − 11.6 = 3.4 15 - 11.6 = 3.4 1511.6=3.4 ( 2 ) ( 3.4 ) = 6.8 (2)(3.4) = 6.8 (2)(3.4)=6.8
51017 10 − 6 = 4 10 - 6 = 4 106=4 17 − 11.6 = 5.4 17 - 11.6 = 5.4 1711.6=5.4 ( 4 ) ( 5.4 ) = 21.6 (4)(5.4) = 21.6 (4)(5.4)=21.6

步骤3:求偏差乘积的和

将所有样本的 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (XiXˉ)(YiYˉ) 相加:
∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 i=1n(XiXˉ)(YiYˉ)=26.4+5.2+0+6.8+21.6=60

步骤4:计算协方差

协方差的公式为:
Cov ( X , Y ) = 1 n ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n1i=1n(XiXˉ)(YiYˉ)

将上述计算结果代入:
Cov ( X , Y ) = 1 5 × 60 = 12 \text{Cov}(X, Y) = \frac{1}{5} \times 60 = 12 Cov(X,Y)=51×60=12

因此,变量 X X X Y Y Y 的协方差为 12

总结

通过以上步骤,我们计算出了 X X X Y Y Y 的协方差为 12,表示 X X X Y Y Y 之间存在正向的线性关系。当 X X X 增大时, Y Y Y 也倾向于增大。

额外说明

  • 协方差的符号:

    • 正值:表示两个变量倾向于同方向变化。
    • 负值:表示两个变量倾向于反方向变化。
    • 零或接近零:表示两个变量之间没有线性关系。
  • 单位: 协方差的单位是 X X X Y Y Y 单位的乘积,因此不易直接比较大小。

  • 标准化协方差(相关系数): 为了消除量纲的影响,可以计算 皮尔逊相关系数,其计算公式为:
    r X Y = Cov ( X , Y ) s X s Y r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} rXY=sXsYCov(X,Y)

    其中 s X s_X sX s Y s_Y sY 分别是 X X X Y Y Y 的标准差。

计算标准差和相关系数

计算 X X X 的标准差 s X s_X sX
s X = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 s_X = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 } sX=n1i=1n(XiXˉ)2

先计算 ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (XiXˉ)2

样本编号 X i − X ˉ X_i - \bar{X} XiXˉ ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (XiXˉ)2
1-416
2-24
300
424
5416

求和:
∑ i = 1 n ( X i − X ˉ ) 2 = 16 + 4 + 0 + 4 + 16 = 40 \sum_{i=1}^{n} (X_i - \bar{X})^2 = 16 + 4 + 0 + 4 + 16 = 40 i=1n(XiXˉ)2=16+4+0+4+16=40

计算标准差:
s X = 40 5 = 8 ≈ 2.8284 s_X = \sqrt{ \frac{40}{5} } = \sqrt{8} \approx 2.8284 sX=540 =8 2.8284

计算 Y Y Y 的标准差 s Y s_Y sY

同样地,计算 ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (YiYˉ)2

样本编号 Y i − Y ˉ Y_i - \bar{Y} YiYˉ ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (YiYˉ)2
1-6.643.56
2-2.66.76
30.40.16
43.411.56
55.429.16

求和:
∑ i = 1 n ( Y i − Y ˉ ) 2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 \sum_{i=1}^{n} (Y_i - \bar{Y})^2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 i=1n(YiYˉ)2=43.56+6.76+0.16+11.56+29.16=91.2

计算标准差:
s Y = 91.2 5 = 18.24 ≈ 4.2720 s_Y = \sqrt{ \frac{91.2}{5} } = \sqrt{18.24} \approx 4.2720 sY=591.2 =18.24 4.2720

计算相关系数 r X Y r_{XY} rXY
r X Y = Cov ( X , Y ) s X s Y = 12 2.8284 × 4.2720 = 12 12.092 ≈ 0.9923 r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} = \frac{12}{2.8284 \times 4.2720} = \frac{12}{12.092} \approx 0.9923 rXY=sXsYCov(X,Y)=2.8284×4.272012=12.092120.9923

因此, X X X Y Y Y 的相关系数约为 0.9923,表示它们之间存在非常强的正线性关系。

结论

通过这个例子,我们详细地演示了协方差的计算步骤:

  1. 计算均值:求 X X X Y Y Y 的均值 X ˉ \bar{X} Xˉ Y ˉ \bar{Y} Yˉ
  2. 计算偏差乘积:对每个样本计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (XiXˉ)(YiYˉ)
  3. 求和并平均:将所有偏差乘积相加,除以样本数 n n n,得到协方差。
  4. (可选)计算相关系数:计算标准差,进一步求得相关系数,以量化变量之间的线性关系强度。

希望这个例子能帮助您理解协方差的计算方法。

相关文章:

举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤

例子:协方差的计算步骤 协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。 下面我们将通过一个具体的例…...

2024/9/16论文赏析(均为1区或顶刊

Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation 代码链接:GitHub - xjiangmed/LTUDA 论文链接:Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ …...

IDEA 2024.3 EAP新特征早览!

0 前言 IntelliJ IDEA 2024.3 第一个 EAP 版本已发布,提前体验 下一个重大版本的一部分改进。 持续关注 EAP 更新,未来几周内将推出更多 IntelliJ IDEA 新功能。尝试这些新功能,分享您的反馈,共同完善 IDE。 1 AI 助手 1.1 内…...

如何在安卓設備上更換IP地址?

IP地址是設備在網路中的唯一標識,通過IP地址,網路能夠識別並與設備進行通信。本文將詳細介紹在安卓設備上更換IP地址的幾種方法。 在安卓設備上更換IP地址的方法 1. 使用Wi-Fi網路更換IP地址 最簡單的方法是通過Wi-Fi網路更換IP地址。步驟如下&#x…...

LINUX网络编程:TCP(1)

目录 1.认识Tcp的报头 2.确认应答机制(ACK) 序号与确认序号 捎带应答 3.超时重传机制 4.Tcp连接管理 三次握手 为什是三次握手 四次挥手 理解TIMEWAIT 1.认识Tcp的报头 源端口和目的端口号没什么说的 32位的序号和确认序号,之后会介…...

基于PHP的新闻管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于phpMySQL的新闻管理系统。…...

6.C++程序中的基本数据类型

数据类型是指在C中用于声明不同类型变量或函数的一个系统或抽象或者是一个分类,它决定了变量存储占用的内存空间以及解析存储的位模式。其实数据类型可以理解为固定内存大小的别名,是创建变量的模具,具体使用哪种模具(包括自定义&…...

oracle 11g写一个判断是否是身份证的函数,函数名称为:FUN_IS_IDENNO

下面是一个用于判断是否是身份证号码的Oracle 11g函数(FUN_IS_IDENNO)。身份证号码通常为18位(或者旧的15位),前17位为数字,第18位为数字或字母X,并且需要符合一定的规则,例如出生日…...

如何使用Spring Cloud Gateway搭建网关系统

使用Spring Cloud Gateway搭建网关系统是一个涉及多个步骤的过程,主要包括创建Spring Boot项目、添加 Spring Cloud Gateway依赖、配置路由规则以及运行和测试网关。以下是详细的步骤:一、创建Spring Boot项目 选择工具: 可以使用Spring Ini…...

油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型

油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…...

《拿下奇怪的前端报错》序章:报错输出个数值数组Buffer(475) [Uint8Array],我来教它说人话!

作为前端开发者,你可能会遇到过一些奇奇怪怪的报错(相信我你早晚会遇到),关键是它未给出具体错误的位置,或者是一些很奇怪的信息。 我以前都是还原代码,然后找到错误的位置。或者是瞎弄一通,测试…...

Docker 里面按照ifconfig

1. 进入Docker 容器内部 docker exec -it xxx bash2. 安装 net-tools iputils-ping apt-get update && apt-get install -y net-tools apt-get update && apt-get install -y iputils-ping 3. 执行ifconfig 执行ping...

DOS(Disk Operating System,磁盘操作系统)常用指令

目录 背景: 早期探索: DOS之父: 发展历程: 常用指令: 进入命令: 操作1.进入和回退: 操作2.增、删: 操作3.其它: 总结: 背景: 早期探索: DOS(Disk Operating System,磁盘操作系统)在…...

VSCode集成Python环境搭建配置详细步骤

1. 安装VSCode 在开始我们的Python编程之旅前,首先需要准备好我们的开发工具——Visual Studio Code,简称VSCode。VSCode是一款由微软开发的轻量级但功能强大的源代码编辑器,支持多种编程语言,并且拥有丰富的扩展生态系统。接下来,我们将一步步教你如何下载、安装以及汉化…...

OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上

往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…...

Windows【环境 01】服务器系统重装后的服务恢复(ES\Redis\Jafka\Tomcat)环境变量和服务注册

服务器系统重装后的服务恢复 1.原因2.问题处理2.1 JDK2.2 Elasticsearch2.3 Redis2.4 Jafka2.5 Tomcat 3.总结 1.原因 Windows 服务器系统盘损坏,换了硬盘并重做了系统,其他磁盘未损坏但安装的服务无法正常运行了,包括: Elastic…...

发现编程的全新境界——明基RD280U显示器使用体验

前言 在大学的四年里,我几乎每天都泡在实验室,盯着电脑屏幕,一行行地码代码。那时,学校提供的显示器是非常基础的款式,功能简单,几乎没有任何特别之处,甚至配置也比较低。那个时候,…...

使用阿里OCR身份证识别

1、开通服务 免费试用 2、获取accesskay AccessKeyId和AccessKeySecret 要同时复制保存下来 因为后面好像看不AccessKeySecret了 3.Api 参考 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeidcard?spma2c4g.11186623.0.0.7a9f4b1e5C…...

8. 详细描述一条 SQL 语句在 MySQL 中的执行过程。

一条SQL语句在MySQL中的执行过程包括多个步骤,从接收到SQL命令到返回结果,这些步骤涉及SQL解析、优化、执行以及最终的结果返回。以下是详细描述一条SQL语句在MySQL中的执行过程。 1. 客户端发送SQL请求 客户端应用程序:首先,客户…...

C++--类的实例化

一、实例化的概念 用类类型在屋里内存中创建对象的过程,称为类实例化出对象 类是对对象进行一种抽象描述,是一个模型一样的东西,限定了类有哪些成员变量,这些成员变量只是声明,没有分配空间,用类实例化出…...

Vue vs React vs Angular 的对比和选择

前端框架对比与选择指南 在前端开发的世界里,框架可谓是开发者手中的利器。无论是新手还是老手,面对 Vue、React、Angular 等主流前端框架的选择时,都会有一瞬间的犹豫:“我到底该选哪个框架?”选择一个合适的前端框架…...

Yolov8-pose关键点检测:一种新的自适应算法轻量级通道分割和变换(ALSS)模块,解决红外检测场景存在严重遮挡和重叠目标时的局限性

💡💡💡本文解决什么问题:红外检测场景存在严重遮挡和重叠目标时的局限性的问题点。 💡💡💡提出了一种新的自适应算法轻量级通道分割和变换(ALSS)模块。该模块采用自适应信道分裂策略优化特征提取,并集成信道变换机制增强信道间的信息交换。这改善了模糊特征的提…...

无人机飞手培训机构六旋翼训练无人机技术详解

六旋翼无人机作为多旋翼无人机的一种,以其独特的稳定性、灵活性和载重能力,在航拍、农业、救援、物流等多个领域展现出广泛的应用前景。它采用六个旋翼产生升力,通过复杂的飞行控制系统实现悬停、前后左右飞行、翻滚等复杂动作,为…...

CX8903:电动车手机充电器降压芯片,搭配协议实现快充

CX8903:一款专用于电动车手机充电器的降压芯片,搭配协议实现快充。 在城市的车水马龙中,电动自行车如灵动的精灵,便捷着我们的出行生活。在骑行的路上,随时保持连接,电动自行车手机充电器让手机电量满满。…...

leaflet加载GeoServer的WMS地图服务.md

leaflet加载GeoServer的WMS地图服务&#xff0c;该示例涵盖了涵盖了 “WMS图层加载、WMS图层动态投影、图层index顺序调整、图层添加、高德地图、腾讯地图OpenStreet地图”&#xff0c;WMS图层加载看代码中标注的核心代码部分即可。 <!DOCTYPE html> <html xmlns&qu…...

Shire 智能体市场:IDE 一键安装多智能体,协同打造集体智慧 Copilot

太长不看版&#xff1a;在新版本&#xff08;0.8&#xff09;的 Shire 中&#xff0c;你可以通过 Shire 智能体市场&#xff0c;一键下载和安装多个智能体&#xff0c;并直接在你的当前项目中使用。与此同时&#xff0c;你还可以 将你的 Shire 代码段或者智能体上传到 Shire 智…...

机器学习笔记(一)初识机器学习

1.定义 机器学习是一门多学科交叉专业&#xff0c;涵盖概率论知识&#xff0c;统计学知识&#xff0c;近似理论知识和复杂算法知识&#xff0c;使用计算机作为工具并致力于真实实时的模拟人类学习方式&#xff0c;并将现有内容进行知识结构划分来有效提高学习效率。 机器学习有…...

linux如何查看当前的目录所在位置

在Linux系统中&#xff0c;查看当前目录所在位置的常用命令是 pwd&#xff0c;它代表 "print working directory"&#xff08;打印工作目录&#xff09;。当你在终端中输入 pwd 并按下回车键时&#xff0c;它会显示当前所在的完整路径。 打开终端&#xff0c;然后输…...

【JavaEE】线程创建和终止,Thread类方法,变量捕获(7000字长文)

阿华代码&#xff0c;不是逆风&#xff0c;就是我疯&#xff0c;你们的点赞收藏是我前进最大的动力&#xff01;&#xff01;7000字长文&#xff0c;希望本文内容能够帮助到你&#xff01; 目录 一&#xff1a;创建线程五种方式 方式一&#xff1a;继承Thread类&#xff0c;…...

[Python数据可视化] Plotly:交互式数据可视化的强大工具

引言&#xff1a; 在数据分析和可视化的世界中&#xff0c;Plotly 是一颗耀眼的明星。它是一个开源的交互式图表库&#xff0c;支持多种编程语言&#xff0c;包括 Python、R 和 JavaScript。Plotly 的强大之处在于它能够创建出既美观又具有高度交互性的图表&#xff0c;使得数据…...