举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤
协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。
下面我们将通过一个具体的例子,详细说明如何计算协方差。
示例数据
假设我们有两个变量 X X X 和 Y Y Y,它们的观测值如下:
样本编号 | X X X | Y Y Y |
---|---|---|
1 | 2 | 5 |
2 | 4 | 9 |
3 | 6 | 12 |
4 | 8 | 15 |
5 | 10 | 17 |
我们将计算变量 X X X 和 Y Y Y 的协方差。
计算步骤
步骤1:计算 X X X 和 Y Y Y 的均值
首先,计算 X X X 和 Y Y Y 的均值(平均值)。
计算 X X X 的均值 X ˉ \bar{X} Xˉ:
X ˉ = 1 n ∑ i = 1 n X i = 2 + 4 + 6 + 8 + 10 5 = 30 5 = 6 \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = \frac{2 + 4 + 6 + 8 + 10}{5} = \frac{30}{5} = 6 Xˉ=n1i=1∑nXi=52+4+6+8+10=530=6
计算 Y Y Y 的均值 Y ˉ \bar{Y} Yˉ:
Y ˉ = 1 n ∑ i = 1 n Y i = 5 + 9 + 12 + 15 + 17 5 = 58 5 = 11.6 \bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i = \frac{5 + 9 + 12 + 15 + 17}{5} = \frac{58}{5} = 11.6 Yˉ=n1i=1∑nYi=55+9+12+15+17=558=11.6
步骤2:计算每个样本的偏差乘积
对于每个样本,计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
样本编号 | X i X_i Xi | Y i Y_i Yi | X i − X ˉ X_i - \bar{X} Xi−Xˉ | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) |
---|---|---|---|---|---|
1 | 2 | 5 | 2 − 6 = − 4 2 - 6 = -4 2−6=−4 | 5 − 11.6 = − 6.6 5 - 11.6 = -6.6 5−11.6=−6.6 | ( − 4 ) ( − 6.6 ) = 26.4 (-4)(-6.6) = 26.4 (−4)(−6.6)=26.4 |
2 | 4 | 9 | 4 − 6 = − 2 4 - 6 = -2 4−6=−2 | 9 − 11.6 = − 2.6 9 - 11.6 = -2.6 9−11.6=−2.6 | ( − 2 ) ( − 2.6 ) = 5.2 (-2)(-2.6) = 5.2 (−2)(−2.6)=5.2 |
3 | 6 | 12 | 6 − 6 = 0 6 - 6 = 0 6−6=0 | 12 − 11.6 = 0.4 12 - 11.6 = 0.4 12−11.6=0.4 | ( 0 ) ( 0.4 ) = 0 (0)(0.4) = 0 (0)(0.4)=0 |
4 | 8 | 15 | 8 − 6 = 2 8 - 6 = 2 8−6=2 | 15 − 11.6 = 3.4 15 - 11.6 = 3.4 15−11.6=3.4 | ( 2 ) ( 3.4 ) = 6.8 (2)(3.4) = 6.8 (2)(3.4)=6.8 |
5 | 10 | 17 | 10 − 6 = 4 10 - 6 = 4 10−6=4 | 17 − 11.6 = 5.4 17 - 11.6 = 5.4 17−11.6=5.4 | ( 4 ) ( 5.4 ) = 21.6 (4)(5.4) = 21.6 (4)(5.4)=21.6 |
步骤3:求偏差乘积的和
将所有样本的 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) 相加:
∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 i=1∑n(Xi−Xˉ)(Yi−Yˉ)=26.4+5.2+0+6.8+21.6=60
步骤4:计算协方差
协方差的公式为:
Cov ( X , Y ) = 1 n ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n1i=1∑n(Xi−Xˉ)(Yi−Yˉ)
将上述计算结果代入:
Cov ( X , Y ) = 1 5 × 60 = 12 \text{Cov}(X, Y) = \frac{1}{5} \times 60 = 12 Cov(X,Y)=51×60=12
因此,变量 X X X 和 Y Y Y 的协方差为 12。
总结
通过以上步骤,我们计算出了 X X X 和 Y Y Y 的协方差为 12,表示 X X X 和 Y Y Y 之间存在正向的线性关系。当 X X X 增大时, Y Y Y 也倾向于增大。
额外说明
-
协方差的符号:
- 正值:表示两个变量倾向于同方向变化。
- 负值:表示两个变量倾向于反方向变化。
- 零或接近零:表示两个变量之间没有线性关系。
-
单位: 协方差的单位是 X X X 和 Y Y Y 单位的乘积,因此不易直接比较大小。
-
标准化协方差(相关系数): 为了消除量纲的影响,可以计算 皮尔逊相关系数,其计算公式为:
r X Y = Cov ( X , Y ) s X s Y r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} rXY=sXsYCov(X,Y)其中 s X s_X sX 和 s Y s_Y sY 分别是 X X X 和 Y Y Y 的标准差。
计算标准差和相关系数
计算 X X X 的标准差 s X s_X sX:
s X = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 s_X = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 } sX=n1i=1∑n(Xi−Xˉ)2
先计算 ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2:
样本编号 | X i − X ˉ X_i - \bar{X} Xi−Xˉ | ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2 |
---|---|---|
1 | -4 | 16 |
2 | -2 | 4 |
3 | 0 | 0 |
4 | 2 | 4 |
5 | 4 | 16 |
求和:
∑ i = 1 n ( X i − X ˉ ) 2 = 16 + 4 + 0 + 4 + 16 = 40 \sum_{i=1}^{n} (X_i - \bar{X})^2 = 16 + 4 + 0 + 4 + 16 = 40 i=1∑n(Xi−Xˉ)2=16+4+0+4+16=40
计算标准差:
s X = 40 5 = 8 ≈ 2.8284 s_X = \sqrt{ \frac{40}{5} } = \sqrt{8} \approx 2.8284 sX=540=8≈2.8284
计算 Y Y Y 的标准差 s Y s_Y sY:
同样地,计算 ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2:
样本编号 | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2 |
---|---|---|
1 | -6.6 | 43.56 |
2 | -2.6 | 6.76 |
3 | 0.4 | 0.16 |
4 | 3.4 | 11.56 |
5 | 5.4 | 29.16 |
求和:
∑ i = 1 n ( Y i − Y ˉ ) 2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 \sum_{i=1}^{n} (Y_i - \bar{Y})^2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 i=1∑n(Yi−Yˉ)2=43.56+6.76+0.16+11.56+29.16=91.2
计算标准差:
s Y = 91.2 5 = 18.24 ≈ 4.2720 s_Y = \sqrt{ \frac{91.2}{5} } = \sqrt{18.24} \approx 4.2720 sY=591.2=18.24≈4.2720
计算相关系数 r X Y r_{XY} rXY:
r X Y = Cov ( X , Y ) s X s Y = 12 2.8284 × 4.2720 = 12 12.092 ≈ 0.9923 r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} = \frac{12}{2.8284 \times 4.2720} = \frac{12}{12.092} \approx 0.9923 rXY=sXsYCov(X,Y)=2.8284×4.272012=12.09212≈0.9923
因此, X X X 和 Y Y Y 的相关系数约为 0.9923,表示它们之间存在非常强的正线性关系。
结论
通过这个例子,我们详细地演示了协方差的计算步骤:
- 计算均值:求 X X X 和 Y Y Y 的均值 X ˉ \bar{X} Xˉ 和 Y ˉ \bar{Y} Yˉ。
- 计算偏差乘积:对每个样本计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
- 求和并平均:将所有偏差乘积相加,除以样本数 n n n,得到协方差。
- (可选)计算相关系数:计算标准差,进一步求得相关系数,以量化变量之间的线性关系强度。
希望这个例子能帮助您理解协方差的计算方法。
相关文章:
举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤 协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。 下面我们将通过一个具体的例…...
2024/9/16论文赏析(均为1区或顶刊
Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation 代码链接:GitHub - xjiangmed/LTUDA 论文链接:Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ …...

IDEA 2024.3 EAP新特征早览!
0 前言 IntelliJ IDEA 2024.3 第一个 EAP 版本已发布,提前体验 下一个重大版本的一部分改进。 持续关注 EAP 更新,未来几周内将推出更多 IntelliJ IDEA 新功能。尝试这些新功能,分享您的反馈,共同完善 IDE。 1 AI 助手 1.1 内…...
如何在安卓設備上更換IP地址?
IP地址是設備在網路中的唯一標識,通過IP地址,網路能夠識別並與設備進行通信。本文將詳細介紹在安卓設備上更換IP地址的幾種方法。 在安卓設備上更換IP地址的方法 1. 使用Wi-Fi網路更換IP地址 最簡單的方法是通過Wi-Fi網路更換IP地址。步驟如下&#x…...

LINUX网络编程:TCP(1)
目录 1.认识Tcp的报头 2.确认应答机制(ACK) 序号与确认序号 捎带应答 3.超时重传机制 4.Tcp连接管理 三次握手 为什是三次握手 四次挥手 理解TIMEWAIT 1.认识Tcp的报头 源端口和目的端口号没什么说的 32位的序号和确认序号,之后会介…...

基于PHP的新闻管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于phpMySQL的新闻管理系统。…...

6.C++程序中的基本数据类型
数据类型是指在C中用于声明不同类型变量或函数的一个系统或抽象或者是一个分类,它决定了变量存储占用的内存空间以及解析存储的位模式。其实数据类型可以理解为固定内存大小的别名,是创建变量的模具,具体使用哪种模具(包括自定义&…...
oracle 11g写一个判断是否是身份证的函数,函数名称为:FUN_IS_IDENNO
下面是一个用于判断是否是身份证号码的Oracle 11g函数(FUN_IS_IDENNO)。身份证号码通常为18位(或者旧的15位),前17位为数字,第18位为数字或字母X,并且需要符合一定的规则,例如出生日…...
如何使用Spring Cloud Gateway搭建网关系统
使用Spring Cloud Gateway搭建网关系统是一个涉及多个步骤的过程,主要包括创建Spring Boot项目、添加 Spring Cloud Gateway依赖、配置路由规则以及运行和测试网关。以下是详细的步骤:一、创建Spring Boot项目 选择工具: 可以使用Spring Ini…...

油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型
油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…...
《拿下奇怪的前端报错》序章:报错输出个数值数组Buffer(475) [Uint8Array],我来教它说人话!
作为前端开发者,你可能会遇到过一些奇奇怪怪的报错(相信我你早晚会遇到),关键是它未给出具体错误的位置,或者是一些很奇怪的信息。 我以前都是还原代码,然后找到错误的位置。或者是瞎弄一通,测试…...

Docker 里面按照ifconfig
1. 进入Docker 容器内部 docker exec -it xxx bash2. 安装 net-tools iputils-ping apt-get update && apt-get install -y net-tools apt-get update && apt-get install -y iputils-ping 3. 执行ifconfig 执行ping...

DOS(Disk Operating System,磁盘操作系统)常用指令
目录 背景: 早期探索: DOS之父: 发展历程: 常用指令: 进入命令: 操作1.进入和回退: 操作2.增、删: 操作3.其它: 总结: 背景: 早期探索: DOS(Disk Operating System,磁盘操作系统)在…...
VSCode集成Python环境搭建配置详细步骤
1. 安装VSCode 在开始我们的Python编程之旅前,首先需要准备好我们的开发工具——Visual Studio Code,简称VSCode。VSCode是一款由微软开发的轻量级但功能强大的源代码编辑器,支持多种编程语言,并且拥有丰富的扩展生态系统。接下来,我们将一步步教你如何下载、安装以及汉化…...

OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…...

Windows【环境 01】服务器系统重装后的服务恢复(ES\Redis\Jafka\Tomcat)环境变量和服务注册
服务器系统重装后的服务恢复 1.原因2.问题处理2.1 JDK2.2 Elasticsearch2.3 Redis2.4 Jafka2.5 Tomcat 3.总结 1.原因 Windows 服务器系统盘损坏,换了硬盘并重做了系统,其他磁盘未损坏但安装的服务无法正常运行了,包括: Elastic…...

发现编程的全新境界——明基RD280U显示器使用体验
前言 在大学的四年里,我几乎每天都泡在实验室,盯着电脑屏幕,一行行地码代码。那时,学校提供的显示器是非常基础的款式,功能简单,几乎没有任何特别之处,甚至配置也比较低。那个时候,…...

使用阿里OCR身份证识别
1、开通服务 免费试用 2、获取accesskay AccessKeyId和AccessKeySecret 要同时复制保存下来 因为后面好像看不AccessKeySecret了 3.Api 参考 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeidcard?spma2c4g.11186623.0.0.7a9f4b1e5C…...
8. 详细描述一条 SQL 语句在 MySQL 中的执行过程。
一条SQL语句在MySQL中的执行过程包括多个步骤,从接收到SQL命令到返回结果,这些步骤涉及SQL解析、优化、执行以及最终的结果返回。以下是详细描述一条SQL语句在MySQL中的执行过程。 1. 客户端发送SQL请求 客户端应用程序:首先,客户…...

C++--类的实例化
一、实例化的概念 用类类型在屋里内存中创建对象的过程,称为类实例化出对象 类是对对象进行一种抽象描述,是一个模型一样的东西,限定了类有哪些成员变量,这些成员变量只是声明,没有分配空间,用类实例化出…...

C++初阶-list的底层
目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...
Web 架构之 CDN 加速原理与落地实践
文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 …...
深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏
一、引言 在深度学习中,我们训练出的神经网络往往非常庞大(比如像 ResNet、YOLOv8、Vision Transformer),虽然精度很高,但“太重”了,运行起来很慢,占用内存大,不适合部署到手机、摄…...
Leetcode33( 搜索旋转排序数组)
题目表述 整数数组 nums 按升序排列,数组中的值 互不相同 。 在传递给函数之前,nums 在预先未知的某个下标 k(0 < k < nums.length)上进行了 旋转,使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...
c# 局部函数 定义、功能与示例
C# 局部函数:定义、功能与示例 1. 定义与功能 局部函数(Local Function)是嵌套在另一个方法内部的私有方法,仅在包含它的方法内可见。 • 作用:封装仅用于当前方法的逻辑,避免污染类作用域,提升…...
Python实现简单音频数据压缩与解压算法
Python实现简单音频数据压缩与解压算法 引言 在音频数据处理中,压缩算法是降低存储成本和传输效率的关键技术。Python作为一门灵活且功能强大的编程语言,提供了丰富的库和工具来实现音频数据的压缩与解压。本文将通过一个简单的音频数据压缩与解压算法…...

ui框架-文件列表展示
ui框架-文件列表展示 介绍 UI框架的文件列表展示组件,可以展示文件夹,支持列表展示和图标展示模式。组件提供了丰富的功能和可配置选项,适用于文件管理、文件上传等场景。 功能特性 支持列表模式和网格模式的切换展示支持文件和文件夹的层…...

解析“道作为序位生成器”的核心原理
解析“道作为序位生成器”的核心原理 以下完整展开道函数的零点调控机制,重点解析"道作为序位生成器"的核心原理与实现框架: 一、道函数的零点调控机制 1. 道作为序位生成器 道在认知坐标系$(x_{\text{物}}, y_{\text{意}}, z_{\text{文}}…...
k8s从入门到放弃之Pod的容器探针检测
k8s从入门到放弃之Pod的容器探针检测 在Kubernetes(简称K8s)中,容器探测是指kubelet对容器执行定期诊断的过程,以确保容器中的应用程序处于预期的状态。这些探测是保障应用健康和高可用性的重要机制。Kubernetes提供了两种种类型…...
[QMT量化交易小白入门]-六十二、ETF轮动中简单的评分算法如何获取历史年化收益32.7%
本专栏主要是介绍QMT的基础用法,常见函数,写策略的方法,也会分享一些量化交易的思路,大概会写100篇左右。 QMT的相关资料较少,在使用过程中不断的摸索,遇到了一些问题,记录下来和大家一起沟通,共同进步。 文章目录 相关阅读1. 策略概述2. 趋势评分模块3 代码解析4 木头…...