举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤
协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。
下面我们将通过一个具体的例子,详细说明如何计算协方差。
示例数据
假设我们有两个变量 X X X 和 Y Y Y,它们的观测值如下:
| 样本编号 | X X X | Y Y Y |
|---|---|---|
| 1 | 2 | 5 |
| 2 | 4 | 9 |
| 3 | 6 | 12 |
| 4 | 8 | 15 |
| 5 | 10 | 17 |
我们将计算变量 X X X 和 Y Y Y 的协方差。
计算步骤
步骤1:计算 X X X 和 Y Y Y 的均值
首先,计算 X X X 和 Y Y Y 的均值(平均值)。
计算 X X X 的均值 X ˉ \bar{X} Xˉ:
X ˉ = 1 n ∑ i = 1 n X i = 2 + 4 + 6 + 8 + 10 5 = 30 5 = 6 \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i = \frac{2 + 4 + 6 + 8 + 10}{5} = \frac{30}{5} = 6 Xˉ=n1i=1∑nXi=52+4+6+8+10=530=6
计算 Y Y Y 的均值 Y ˉ \bar{Y} Yˉ:
Y ˉ = 1 n ∑ i = 1 n Y i = 5 + 9 + 12 + 15 + 17 5 = 58 5 = 11.6 \bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i = \frac{5 + 9 + 12 + 15 + 17}{5} = \frac{58}{5} = 11.6 Yˉ=n1i=1∑nYi=55+9+12+15+17=558=11.6
步骤2:计算每个样本的偏差乘积
对于每个样本,计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
| 样本编号 | X i X_i Xi | Y i Y_i Yi | X i − X ˉ X_i - \bar{X} Xi−Xˉ | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) |
|---|---|---|---|---|---|
| 1 | 2 | 5 | 2 − 6 = − 4 2 - 6 = -4 2−6=−4 | 5 − 11.6 = − 6.6 5 - 11.6 = -6.6 5−11.6=−6.6 | ( − 4 ) ( − 6.6 ) = 26.4 (-4)(-6.6) = 26.4 (−4)(−6.6)=26.4 |
| 2 | 4 | 9 | 4 − 6 = − 2 4 - 6 = -2 4−6=−2 | 9 − 11.6 = − 2.6 9 - 11.6 = -2.6 9−11.6=−2.6 | ( − 2 ) ( − 2.6 ) = 5.2 (-2)(-2.6) = 5.2 (−2)(−2.6)=5.2 |
| 3 | 6 | 12 | 6 − 6 = 0 6 - 6 = 0 6−6=0 | 12 − 11.6 = 0.4 12 - 11.6 = 0.4 12−11.6=0.4 | ( 0 ) ( 0.4 ) = 0 (0)(0.4) = 0 (0)(0.4)=0 |
| 4 | 8 | 15 | 8 − 6 = 2 8 - 6 = 2 8−6=2 | 15 − 11.6 = 3.4 15 - 11.6 = 3.4 15−11.6=3.4 | ( 2 ) ( 3.4 ) = 6.8 (2)(3.4) = 6.8 (2)(3.4)=6.8 |
| 5 | 10 | 17 | 10 − 6 = 4 10 - 6 = 4 10−6=4 | 17 − 11.6 = 5.4 17 - 11.6 = 5.4 17−11.6=5.4 | ( 4 ) ( 5.4 ) = 21.6 (4)(5.4) = 21.6 (4)(5.4)=21.6 |
步骤3:求偏差乘积的和
将所有样本的 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ) 相加:
∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) = 26.4 + 5.2 + 0 + 6.8 + 21.6 = 60 i=1∑n(Xi−Xˉ)(Yi−Yˉ)=26.4+5.2+0+6.8+21.6=60
步骤4:计算协方差
协方差的公式为:
Cov ( X , Y ) = 1 n ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) Cov(X,Y)=n1i=1∑n(Xi−Xˉ)(Yi−Yˉ)
将上述计算结果代入:
Cov ( X , Y ) = 1 5 × 60 = 12 \text{Cov}(X, Y) = \frac{1}{5} \times 60 = 12 Cov(X,Y)=51×60=12
因此,变量 X X X 和 Y Y Y 的协方差为 12。
总结
通过以上步骤,我们计算出了 X X X 和 Y Y Y 的协方差为 12,表示 X X X 和 Y Y Y 之间存在正向的线性关系。当 X X X 增大时, Y Y Y 也倾向于增大。
额外说明
-
协方差的符号:
- 正值:表示两个变量倾向于同方向变化。
- 负值:表示两个变量倾向于反方向变化。
- 零或接近零:表示两个变量之间没有线性关系。
-
单位: 协方差的单位是 X X X 和 Y Y Y 单位的乘积,因此不易直接比较大小。
-
标准化协方差(相关系数): 为了消除量纲的影响,可以计算 皮尔逊相关系数,其计算公式为:
r X Y = Cov ( X , Y ) s X s Y r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} rXY=sXsYCov(X,Y)其中 s X s_X sX 和 s Y s_Y sY 分别是 X X X 和 Y Y Y 的标准差。
计算标准差和相关系数
计算 X X X 的标准差 s X s_X sX:
s X = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 s_X = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 } sX=n1i=1∑n(Xi−Xˉ)2
先计算 ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2:
| 样本编号 | X i − X ˉ X_i - \bar{X} Xi−Xˉ | ( X i − X ˉ ) 2 (X_i - \bar{X})^2 (Xi−Xˉ)2 |
|---|---|---|
| 1 | -4 | 16 |
| 2 | -2 | 4 |
| 3 | 0 | 0 |
| 4 | 2 | 4 |
| 5 | 4 | 16 |
求和:
∑ i = 1 n ( X i − X ˉ ) 2 = 16 + 4 + 0 + 4 + 16 = 40 \sum_{i=1}^{n} (X_i - \bar{X})^2 = 16 + 4 + 0 + 4 + 16 = 40 i=1∑n(Xi−Xˉ)2=16+4+0+4+16=40
计算标准差:
s X = 40 5 = 8 ≈ 2.8284 s_X = \sqrt{ \frac{40}{5} } = \sqrt{8} \approx 2.8284 sX=540=8≈2.8284
计算 Y Y Y 的标准差 s Y s_Y sY:
同样地,计算 ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2:
| 样本编号 | Y i − Y ˉ Y_i - \bar{Y} Yi−Yˉ | ( Y i − Y ˉ ) 2 (Y_i - \bar{Y})^2 (Yi−Yˉ)2 |
|---|---|---|
| 1 | -6.6 | 43.56 |
| 2 | -2.6 | 6.76 |
| 3 | 0.4 | 0.16 |
| 4 | 3.4 | 11.56 |
| 5 | 5.4 | 29.16 |
求和:
∑ i = 1 n ( Y i − Y ˉ ) 2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 \sum_{i=1}^{n} (Y_i - \bar{Y})^2 = 43.56 + 6.76 + 0.16 + 11.56 + 29.16 = 91.2 i=1∑n(Yi−Yˉ)2=43.56+6.76+0.16+11.56+29.16=91.2
计算标准差:
s Y = 91.2 5 = 18.24 ≈ 4.2720 s_Y = \sqrt{ \frac{91.2}{5} } = \sqrt{18.24} \approx 4.2720 sY=591.2=18.24≈4.2720
计算相关系数 r X Y r_{XY} rXY:
r X Y = Cov ( X , Y ) s X s Y = 12 2.8284 × 4.2720 = 12 12.092 ≈ 0.9923 r_{XY} = \frac{\text{Cov}(X, Y)}{s_X s_Y} = \frac{12}{2.8284 \times 4.2720} = \frac{12}{12.092} \approx 0.9923 rXY=sXsYCov(X,Y)=2.8284×4.272012=12.09212≈0.9923
因此, X X X 和 Y Y Y 的相关系数约为 0.9923,表示它们之间存在非常强的正线性关系。
结论
通过这个例子,我们详细地演示了协方差的计算步骤:
- 计算均值:求 X X X 和 Y Y Y 的均值 X ˉ \bar{X} Xˉ 和 Y ˉ \bar{Y} Yˉ。
- 计算偏差乘积:对每个样本计算 ( X i − X ˉ ) ( Y i − Y ˉ ) (X_i - \bar{X})(Y_i - \bar{Y}) (Xi−Xˉ)(Yi−Yˉ)。
- 求和并平均:将所有偏差乘积相加,除以样本数 n n n,得到协方差。
- (可选)计算相关系数:计算标准差,进一步求得相关系数,以量化变量之间的线性关系强度。
希望这个例子能帮助您理解协方差的计算方法。
相关文章:
举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤 协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。 下面我们将通过一个具体的例…...
2024/9/16论文赏析(均为1区或顶刊
Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation 代码链接:GitHub - xjiangmed/LTUDA 论文链接:Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ …...
IDEA 2024.3 EAP新特征早览!
0 前言 IntelliJ IDEA 2024.3 第一个 EAP 版本已发布,提前体验 下一个重大版本的一部分改进。 持续关注 EAP 更新,未来几周内将推出更多 IntelliJ IDEA 新功能。尝试这些新功能,分享您的反馈,共同完善 IDE。 1 AI 助手 1.1 内…...
如何在安卓設備上更換IP地址?
IP地址是設備在網路中的唯一標識,通過IP地址,網路能夠識別並與設備進行通信。本文將詳細介紹在安卓設備上更換IP地址的幾種方法。 在安卓設備上更換IP地址的方法 1. 使用Wi-Fi網路更換IP地址 最簡單的方法是通過Wi-Fi網路更換IP地址。步驟如下&#x…...
LINUX网络编程:TCP(1)
目录 1.认识Tcp的报头 2.确认应答机制(ACK) 序号与确认序号 捎带应答 3.超时重传机制 4.Tcp连接管理 三次握手 为什是三次握手 四次挥手 理解TIMEWAIT 1.认识Tcp的报头 源端口和目的端口号没什么说的 32位的序号和确认序号,之后会介…...
基于PHP的新闻管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于phpMySQL的新闻管理系统。…...
6.C++程序中的基本数据类型
数据类型是指在C中用于声明不同类型变量或函数的一个系统或抽象或者是一个分类,它决定了变量存储占用的内存空间以及解析存储的位模式。其实数据类型可以理解为固定内存大小的别名,是创建变量的模具,具体使用哪种模具(包括自定义&…...
oracle 11g写一个判断是否是身份证的函数,函数名称为:FUN_IS_IDENNO
下面是一个用于判断是否是身份证号码的Oracle 11g函数(FUN_IS_IDENNO)。身份证号码通常为18位(或者旧的15位),前17位为数字,第18位为数字或字母X,并且需要符合一定的规则,例如出生日…...
如何使用Spring Cloud Gateway搭建网关系统
使用Spring Cloud Gateway搭建网关系统是一个涉及多个步骤的过程,主要包括创建Spring Boot项目、添加 Spring Cloud Gateway依赖、配置路由规则以及运行和测试网关。以下是详细的步骤:一、创建Spring Boot项目 选择工具: 可以使用Spring Ini…...
油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型
油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…...
《拿下奇怪的前端报错》序章:报错输出个数值数组Buffer(475) [Uint8Array],我来教它说人话!
作为前端开发者,你可能会遇到过一些奇奇怪怪的报错(相信我你早晚会遇到),关键是它未给出具体错误的位置,或者是一些很奇怪的信息。 我以前都是还原代码,然后找到错误的位置。或者是瞎弄一通,测试…...
Docker 里面按照ifconfig
1. 进入Docker 容器内部 docker exec -it xxx bash2. 安装 net-tools iputils-ping apt-get update && apt-get install -y net-tools apt-get update && apt-get install -y iputils-ping 3. 执行ifconfig 执行ping...
DOS(Disk Operating System,磁盘操作系统)常用指令
目录 背景: 早期探索: DOS之父: 发展历程: 常用指令: 进入命令: 操作1.进入和回退: 操作2.增、删: 操作3.其它: 总结: 背景: 早期探索: DOS(Disk Operating System,磁盘操作系统)在…...
VSCode集成Python环境搭建配置详细步骤
1. 安装VSCode 在开始我们的Python编程之旅前,首先需要准备好我们的开发工具——Visual Studio Code,简称VSCode。VSCode是一款由微软开发的轻量级但功能强大的源代码编辑器,支持多种编程语言,并且拥有丰富的扩展生态系统。接下来,我们将一步步教你如何下载、安装以及汉化…...
OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…...
Windows【环境 01】服务器系统重装后的服务恢复(ES\Redis\Jafka\Tomcat)环境变量和服务注册
服务器系统重装后的服务恢复 1.原因2.问题处理2.1 JDK2.2 Elasticsearch2.3 Redis2.4 Jafka2.5 Tomcat 3.总结 1.原因 Windows 服务器系统盘损坏,换了硬盘并重做了系统,其他磁盘未损坏但安装的服务无法正常运行了,包括: Elastic…...
发现编程的全新境界——明基RD280U显示器使用体验
前言 在大学的四年里,我几乎每天都泡在实验室,盯着电脑屏幕,一行行地码代码。那时,学校提供的显示器是非常基础的款式,功能简单,几乎没有任何特别之处,甚至配置也比较低。那个时候,…...
使用阿里OCR身份证识别
1、开通服务 免费试用 2、获取accesskay AccessKeyId和AccessKeySecret 要同时复制保存下来 因为后面好像看不AccessKeySecret了 3.Api 参考 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeidcard?spma2c4g.11186623.0.0.7a9f4b1e5C…...
8. 详细描述一条 SQL 语句在 MySQL 中的执行过程。
一条SQL语句在MySQL中的执行过程包括多个步骤,从接收到SQL命令到返回结果,这些步骤涉及SQL解析、优化、执行以及最终的结果返回。以下是详细描述一条SQL语句在MySQL中的执行过程。 1. 客户端发送SQL请求 客户端应用程序:首先,客户…...
C++--类的实例化
一、实例化的概念 用类类型在屋里内存中创建对象的过程,称为类实例化出对象 类是对对象进行一种抽象描述,是一个模型一样的东西,限定了类有哪些成员变量,这些成员变量只是声明,没有分配空间,用类实例化出…...
Qwen3.5-9B商业落地实践:电商客服图文理解+多轮需求确认系统
Qwen3.5-9B商业落地实践:电商客服图文理解多轮需求确认系统 1. 项目概述与核心价值 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型,在电商客服场景中展现出强大的商业应用价值。该系统通过多模态理解和长上下文支持能力,能够同时处理文字和…...
中文大模型实战测评:MiniMax、GLM、Kimi谁更适合你的需求?(附详细对比表)
中文大模型实战测评:MiniMax、GLM、Kimi谁更适合你的需求? 当企业技术团队或个人开发者面临中文大模型选型时,往往陷入"参数崇拜"与"场景适配"的矛盾中。本文基于三个月真实项目测试数据,从工程落地视角拆解三…...
提升Python编码效率:ptpython语法高亮与自动补全的终极指南
提升Python编码效率:ptpython语法高亮与自动补全的终极指南 【免费下载链接】ptpython A better Python REPL 项目地址: https://gitcode.com/gh_mirrors/pt/ptpython ptpython是一款功能强大的Python REPL工具,它通过语法高亮、智能自动补全和丰…...
告别云服务器开销:手把手教你用Docker Compose在本地Linux虚拟机部署Dify
告别云服务器开销:手把手教你用Docker Compose在本地Linux虚拟机部署Dify 在云计算成本不断攀升的今天,越来越多的独立开发者和小团队开始寻求更经济高效的解决方案。对于数据敏感型项目或内部测试环境而言,本地化部署不仅能显著降低长期运营…...
像素剧本圣殿企业应用:中小型内容工作室剧本量产工作流搭建
像素剧本圣殿企业应用:中小型内容工作室剧本量产工作流搭建 1. 剧本创作新范式 在内容创作行业,剧本开发一直是耗时费力的核心环节。传统编剧流程中,一个完整剧本从构思到成稿往往需要数周甚至数月时间,这对于资源有限的中小型工…...
Android 11+ 适配实战:破解TextToSpeech ‘speak failed: not bound to TTS engine‘ 的权限与引擎绑定之谜
1. 当语音突然沉默:Android 11的TTS报错之谜 那天我正在调试一个天气预报应用,当代码执行到语音播报"今天晴转多云"时,控制台突然抛出红字警告:speak failed: not bound to TTS engine。这个错误在Android 10及以下版本…...
告别视图切换混乱:用快马平台和cc-switch提升前端开发效率
告别视图切换混乱:用快马平台和cc-switch提升前端开发效率 最近在开发一个需要多工作模式切换的项目时,遇到了视图管理混乱的问题。不同模式下的UI组件互相干扰,状态管理变得异常复杂。经过一番摸索,我发现cc-switch这个方案能很…...
保姆级教程:在RK3588开发板上编译并加载Xilinx XDMA PCIe驱动(含完整Makefile解析)
RK3588与FPGA的PCIe通信实战:XDMA驱动编译与深度优化指南 当RK3588遇上FPGA,PCIe通信便成为两者之间高速数据交互的核心桥梁。作为一款广泛应用于边缘计算和嵌入式AI场景的ARM处理器,RK3588的PCIe 3.0 x4接口能够提供接近4GB/s的理论带宽&am…...
【05-log-+-diff:看懂你改了什么、历史是什么】
第五篇:log diff:看懂你改了什么、历史是什么会提交只是第一步,会"读"历史才是真的用上了 Git。这篇教你把 log 和 diff 玩出花来。git log:查看提交历史 git log默认输出太详细,通常用这些参数来精简&…...
Qwen3.5-2B边缘部署案例:车载终端实时识别路标+语音播报导航提示
Qwen3.5-2B边缘部署案例:车载终端实时识别路标语音播报导航提示 1. 项目背景与需求 在智能驾驶和车载辅助系统领域,实时路标识别与语音导航是提升驾驶安全性的关键技术。传统方案通常需要: 独立的视觉识别模块处理路标额外的语音合成引擎生…...
