当前位置：首页 > news >正文

相关性检验

news 2026/2/9 22:26:35

文章目录

Pearson相关系数
Spearman等级相关系数
Cochran's Q检验
Kappa一致性系数
Kendall相关系数
实例分析
总结

在数据分析的广阔天地中，相关性检验是探索变量间关系的一把钥匙。本文将带领大家了解几种常用的相关性检验方法：Pearson、Spearman、Cochran’s Q、Kappa和Kendall。我们将深入每种方法的计算公式，并以几个实例，展示如何使用这些方法来计算相关性。

Pearson相关系数

Pearson相关系数是衡量两个连续变量线性相关程度的指标。其值介于-1到1之间，公式如下：

$r_{\text{Pearson}} = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum (X_i - \bar{X})^2}\sqrt{\sum (Y_i - \bar{Y})^2}}$

其中， $X_i$ 和 $Y_i$ 是观测值， $\bar{X}$ 和 $\bar{Y}$ 是它们的均值。

Spearman等级相关系数

Spearman等级相关系数适用于非参数数据，衡量两个变量的单调关系。计算公式如下：

$r_{\text{Spearman}} = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)}$

$d_i$ 是排名差， $n$ 是观测值数量。

Cochran’s Q检验

Cochran’s Q检验用于三个或更多个相关比例的差异性检验。其公式为：

$\frac{1}{2} + \frac{1}{2 \times n} \sum (p_i - p_{\text{overall}})^2$

$k$ 是比例的数量， $p_i$ 是第 $i$ 个比例， $p_{\text{overall}}$ 是所有比例的平均值。

Kappa一致性系数

Kappa一致性系数用于衡量两个评估者在分类数据上的一致性。其计算公式如下：

$\kappa = \frac{p_o - p_e}{1 - p_e}$

$p_o$ 是观察到的一致性比例， $p_e$ 是偶然一致性的比例。

Kendall相关系数

Kendran的tau-b相关系数是衡量两个变量相关性的非参数方法。其计算公式如下：

$\tau_b = \frac{2(\text{number of concordant pairs}) - 2(\text{number of discordant pairs})}{n(n-1)}$

实例分析

实例数据

学生	测试1	测试2
A	78	82
B	85	80
C	90	88
D	60	65
E	70	75

Pearson相关系数
$\bar{X} = \frac{78 + 85 + 90 + 60 + 70}{5} = 76$
$\bar{Y} = \frac{82 + 80 + 88 + 65 + 75}{5} = 79$
$r_{\text{Pearson}} = \frac{(78-76)(82-79) + ... + (70-76)(75-79)}{\sqrt{((78-76)^2 + ... + (70-76)^2)((82-79)^2 + ... + (75-79)^2)}}$
$r_{\text{Pearson}} = 0.967$ （四舍五入到小数点后三位）

Spearman等级相关系数
等级分配：

测试1: A(3), B(5), C(5), D(1), E(2)
测试2: A(4), B(3), C(5), D(1), E(3)

计算 $d_i$ 并应用公式，我们得到：
$r_{\text{Spearman}} = 1$ （因为排名完全一致）

Kendall相关系数
计算一致对和不一致对的数量：

一致对：(A,B), (B,C), (C,E) - 3对
不一致对：(A,C), (A,D), (A,E), (B,D), (B,E), (D,E) - 6对
$\tau_b = \frac{2(3) - 2(6)}{5(5-1)} = -\frac{4}{8} = -0.5$ （负相关）

Python代码

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import pearsonr, spearmanr# 定义数据
data = {'测试1': [78, 85, 90, 60, 70],'测试2': [82, 80, 88, 65, 75]
}# 创建DataFrame
df = pd.DataFrame(data)# 计算Pearson和Spearman相关系数
pearson_corr, _ = pearsonr(df['测试1'], df['测试2'])
spearman_corr, _ = spearmanr(df['测试1'], df['测试2'])# 创建相关性矩阵
corr_matrix = {'测试1': [pearson_corr, spearman_corr],'测试2': [spearman_corr, 1]  # 假设测试1和测试2完全相关
}# 创建DataFrame
corr_df = pd.DataFrame(corr_matrix, index=['测试1', '测试2'])# 绘制热力图
sns.heatmap(corr_df, annot=True, cmap='coolwarm', fmt=".2f")
plt.title('相关性热力图')
plt.show()

总结

通过上述分析，我们可以看到不同相关性检验方法如何揭示变量间的关系。每种方法都有其特定的应用场景和优势。选择合适的方法来分析你的数据，可以更准确地理解变量间的相互作用。

相关性检验

文章目录

Pearson相关系数

Spearman等级相关系数

Cochran’s Q检验

Kappa一致性系数

Kendall相关系数

实例分析

总结

相关文章：

相关性检验

【python】Django运行报错分析：ImproperlyConfigured 错误解决办法

AS01/AS11 创建固资和子资产

vue3数字动画插件countup.js

aspeed2600 GPIO分析与适配ipmitool power status, ipmitool power on/off

在C#中配置ini文件以及封装ini类

使用git上传代码到github

滚珠花键：新能源汽车传动系统的核心动力传递者

LeetCode 149, 347, 31

操作系统（信号处理）

[MRCTF2020]Ezpop

24暑假算法刷题 | Day27 | 贪心算法 I | LeetCode 455. 分发饼干，376. 摆动序列，53. 最大子数组和

Golang 的空接口有什么用？

计算机毕业设计选题推荐-课程教学平台-Java/Python项目实战

健身日记之倒立俯卧撑学习——起始日2024.6.4

pikachu文件包含漏洞

09.FreeRTOS时间片调度与任务相关函数

git分支介绍

vm虚拟机下安装CentOS7系统

python-报数（赛氪OJ）

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

【入坑系列】TiDB 强制索引在不同库下不生效问题

《用户共鸣指数（E）驱动品牌大模型种草：如何抢占大模型搜索结果情感高地》

将对透视变换后的图像使用Otsu进行阈值化，来分离黑色和白色像素。这句话中的Otsu是什么意思？

C++中string流知识详解和示例

Axios请求超时重发机制

CMake 从 GitHub 下载第三方库并使用

关于 WASM：1. WASM 基础原理

c#开发AI模型对话

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”