学习笔记|Pearson皮尔逊相关系数|Spearman斯皮尔曼相关系数|和Kendall肯德尔tau-b相关系数|分析流程|-SPSS中双变量相关性分析系数
目录
- 学习目的
- 软件版本
- 原始文档
- 基础概念
- 皮尔逊相关系数
- 基本假设(适用条件):
- 系数的范围及意义
- 实例
- 1. 读数据:
- 2.正态性检验:
- 3.异常值检验(体重):
- 4.分析:
- 斯皮尔曼相关系数
- 基本假设(适用条件):
- 肯德尔tau-b相关系数
- 基本假设(适用条件):
- 相关性系数的比较
- 皮尔森相关与Spearman和Kendall相关
- Spearman相关与Kendall相关
学习目的
SPSS中双变量相关性分析系数
软件版本
IBM SPSS Statistics 26。
原始文档
三个相关系数的注意事项
Pearson/Spearman/Kendallta三大相关系数怎么选?怎么计算?
《小白爱上SPSS》课程第18讲数据
Statistical functions (scipy.stats)包-scipy.stats.pearsonr
Statistical functions (scipy.stats)包-scipy.stats.spearmanr
Statistical functions (scipy.stats)包-scipy.stats.kendalltau
百度百科:spearman相关系数
相关性检验-Kendall’s Tau-b相关系数
Pearson’s Correlation 皮尔逊相关性分析详细操作
基础概念
皮尔逊相关系数
Pearson相关系数是传统的统计分析工具,应用广泛。Pearson相关系数公式:

但其有明显的理论局限,即只能度量线性的相关性,隐含地做了高斯性假设(正态分布、独立性假、方差齐性),使其无法在非线性和非高斯的情况下应用。
基本假设(适用条件):
每个观察值应具有一对值。比较的两个变量必须来源于同一个总体。
每个变量应该是连续的。
每个变量应为正态分布。
应该没有异常值。
系数的范围及意义
皮尔逊相关系数的范围是位于[-1,1]之间。相关系数展示了方向性:
如果相关系数接近1,说明两个变量之间呈较高的正相关性;
如果相关系数接近-1,说明两个变量之间呈较高的负相关性;
如果相关系数接近0,说明两个变量之间彼此独立,没有相关性。
实例
1. 读数据:
GET FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十八讲:线性相关分析.sav'.
2.正态性检验:
EXAMINE VARIABLES=体重 肺活量/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.


经S-W(夏皮洛-威尔克)检验,体重、肺活量数据的p值分别为0.490和0.465,均大于0.05,无统计学意义,支持原假设,可认为两组数据符合正态分布。
3.异常值检验(体重):
USE ALL.
COMPUTE filter_$=(体重 <= (49.308+3*5.3245) & 体重 >= (49.308-3*5.3245)).
VARIABLE LABELS filter_$ '体重 <= (49.308+3*5.3245) & 体重 >= (49.308-3*5.3245) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
无异常值:

异常值检验(肺活量):
USE ALL.
COMPUTE filter_$=(肺活量 <= (2.9342+3*.43383) & 肺活量 >= (2.9342-3*.43383)).
VARIABLE LABELS filter_$ '肺活量 <= (2.9342+3*.43383) & 肺活量 >= (2.9342-3*.43383) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
无异常值:

4.分析:
CORRELATIONS /VARIABLES=体重 肺活量 /PRINT=TWOTAIL NOSIG /*显著性检验:双尾*//STATISTICS DESCRIPTIVES /*选项中选定:平均值、标准偏差*//MISSING=PAIRWISE /*皮尔逊*/.

皮尔逊相关性分析结果显示,P值显著性为0.001。P值小于0.05,说明示例的两个变量相关。相关性系数为0.828,离1比较近,也说明呈较高的正相关性。
斯皮尔曼相关系数
斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。
对于样本容量为n的样本,n个原始数据被转换成等级数据,相关系数ρ为:

斯皮尔曼相关系数表明X(独立变量)和Y(依赖变量)的相关方向。如果当X增加时,Y趋向于增加,斯皮尔曼相关系数则为正。如果当X增加时,Y趋向于减少,斯皮尔曼相关系数则为负。斯皮尔曼相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。当X和Y完全单调相关时,斯皮尔曼相关系数的绝对值为1。完全的单调递增关系意味着任意两对数据Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj总是同号。完全的单调递减关系意味着任意两对数据Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj总是异号。
斯皮尔曼相关系数经常被称作"非参数"的。这里有两层含义。首先,当X和Y的关系是由任意单调函数描述的,则它们是完全皮尔逊相关的。与此相应的,皮尔逊相关系数只能给出由线性方程描述的X和Y的相关性。其次,斯皮尔曼不需要先验知识(也就是说,知道其参数)便可以准确获取XandY的采样概率分布。
基本假设(适用条件):
两对数据的观察是独立的。
应按序数,区间或比率测量两个变量。
假定两个变量之间存在单调关系。
皮尔逊Pearson相关系数使用前提条件中,任何一个条件不满足时可以考虑使用该系数;
Spearman与Pearson相关系数计算很类似,只是Spearman计算需要将两个变量转化为序数。
肯德尔tau-b相关系数
Kendall’s Tau相关系数,是由英国统计学家Maurice Kendall于1938年提出,主要包括Somers’ D、Goodman-kruskal’s gamma(γ)、Kendall’s Tau(a、b、c)等一系列相关系数。其中,最常用的是Kendall’s Tau-b和Kendall’s Tau-c相关系数。Kendall’s Tau相关系数适用于判断两列离散有序型数据之间的相关性,本文主要讲解Kendall’s Tau-b相关系数的计算。

基本假设(适用条件):
假设同spearman。但适应条件和前两者比完全不一样,衡量有序分类型数据的序数相关性。
相关性系数的比较
皮尔森相关与Spearman和Kendall相关
非参数相关(指 spearman和hendall)的表达能力相对较弱,因为它们在计算中使用的信息较少。在Pearson的情况下,相关性使用有关均值和均值偏差的信息,而非参数相关性仅使用序数信息和成对分数。
在非参数相关的情况下,X和Y值可能是连续的或有序的,并且不需要X和Y的近似正态分布。但在皮尔逊相关的情况下,它假定X和Y的分布应该是正态分布,并且也应该是连续的(因此做spearman之前要做一些对数变换之类的尽量接近正态分布)。
相关系数 测量线性(皮尔逊)或单调(Spearman和Kendall)关系。
Spearman相关与Kendall相关
在正常情况下,Kendall相关性比Spearman相关性更强健和有效。这意味着当样本量较小或存在一些异常值时,首选Kendall相关。
在所有情况下,Kendall相关系数的绝对值均小于其他绝对值。 可以看出,肯德尔相关性比其他相关性更为保守。
相关文章:
学习笔记|Pearson皮尔逊相关系数|Spearman斯皮尔曼相关系数|和Kendall肯德尔tau-b相关系数|分析流程|-SPSS中双变量相关性分析系数
目录 学习目的软件版本原始文档基础概念皮尔逊相关系数基本假设(适用条件):系数的范围及意义实例1. 读数据:2.正态性检验:3.异常值检验(体重):4.分析: 斯皮尔曼相关系数基…...
计算机服务器中了locked勒索病毒怎么办,勒索病毒解密,数据恢复
随着网络技术的不断成熟,网络中存在的病毒威胁也不断增多,近期,云天数据恢复中心陆续接到很多企业的求助,企业的计算机服务器数据库遭到了勒索病毒攻击,并且勒索病毒的攻击与加密形式也发生了许多变化。其中攻击次数较…...
本地生活餐饮视频怎么拍摄能有更多流量?如何批量生产呢?
本地生活近几年特别的火,所以到现在各类内容雷同性也比较高,视频缺少新的创意和玩法,像餐饮店的视频,大部分都是拍顾客进门、拍餐饮店座无虚席的实景……作为用户,其实早就已经看腻了。 今天推荐本地生活餐饮店商家拍…...
【笔记】原型和原型链(持续完善)
概念 原型:函数都具有 prototype 属性,称之为原型,也称之为原型对象 1.1 原型可以放一些属性和方法,共享给实例对象使用(也就是原生方法)。 1.2 原型可以做继承原型链:对象都有 __proto__ 属性…...
python向word中添加表格
1、表格插入 方法一:直接创建表添加 #导入库 from docx import Document #创建文档对象 document Document()#创建5行7列表格 table document.add_table(rows5, cols7)#修改第2行第3列单元格的内容为中国 table.cell(1,2).text中国 #修改第3行第4列单元格的内容…...
2023_11_6 每日半小时 SQL 刷题
文章目录 1. 查询所有列题目描述SQL 语句编写 2. 查询多列题目描述SQL 语句编写 3. 查询结果去重题目描述SQL 语句编写 4. 查询结果限制返回行数题目描述SQL 语句编写 5. 将查询后的列重新命名题目描述SQL 语句编写 语法小总结 1. 查询所有列 题目链接:SQL1 查询所…...
Redis系列-Redis性能优化与安全【9】
目录 Redis系列-Redis性能优化与安全【9】Redis性能优化策略Redis安全设置与防护措施Redis监控与诊断工具介绍 七、Redis应用案例与实战八、Redis未来发展与趋势 个人主页: 【⭐️个人主页】 需要您的【💖 点赞关注】支持 💯 Redis系列-Redis性能优化与安…...
centos7下安装主从仲裁三台结构的MongoDB 7.0.4
安装手册英文版在这里 https://www.mongodb.com/docs/v7.0/tutorial/install-mongodb-on-red-hat/ 我的安装过程 1)基础安装 1、创建 /etc/yum.repos.d/mongodb-org-7.0.repo文件 下面的代码复制到这个文件中,保存 [mongodb-org-7.0] nameMongoDB Re…...
2258. 逃离火灾 : 详解如何从「二分」到「分类讨论」(图解过程)
题目描述 这是 LeetCode 上的 「2258. 逃离火灾」 ,难度为 「困难」。 Tag : 「多源 BFS」、「二分」、「预处理」 给你一个下标从 0 开始大小为 m x n 的二维整数数组 grid,它表示一个网格图。 每个格子为下面 个值之一: 0 表示草地。 1 表…...
基于SSM框架的共享单车管理系统小程序系统的设计和实现
基于SSM框架的共享单车管理系统小程序系统的设计和实现 源码传送入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码传送入口 前言 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,…...
COOHOM通过采用亚马逊云科“专库专用”的方式,为云原生的构建提供稳定的数据支撑
全球化浪潮下,面对全球化业务发展带来的新需求与新挑战,越来越多的企业开启了云原生构建旅程,以推动业务系统快速迭代,为国际业务的拓展打下坚实的基础。COOHOM是杭州群核信息技术有限公司旗下的国际化品牌。为全球企业和个人提供…...
Java根据一个List内Object的两个字段去重
背景 在Java开发过程中,我们经常会遇到需要对List进行去重的需求。 其中常见的情况是,将数组去重,或者将对象依据某个字段去重。这两种方式均可用set属性进行处理。 今天讨论,有一个List,且其中的元素是自定义的对象&…...
运维那些事儿|2023年,运维还有出路吗?
作为一名运维,不知道你有没有这样的感受。 觉得自己的工作没什么成长空间。每天装个系统、跑个机房、跑个脚本,忙来忙去也没忙出来什么名堂,含金量低不说,薪资也一直没见涨,所以你开始陷入迷茫,会疑惑&…...
数据结构——二叉树(2)
接上一篇文章http://t.csdnimg.cn/nsKsW,本次我们接着讲解关于二叉树的相关知识。 一、二叉树的相关性质: 1. 若规定根节点的层数为 1 ,则一棵非空二叉树的 第 i 层上最多有 2^(i-1) 个结点. 2. 若规定根节点的层数为 1 ,则 深度…...
aosp定制android系统
目录 AOSP 准备工作(配置) 确定机型和版本 初始化 git安装 curl安装 同步源码 环境变量 创建aosp目录 指定同步版本 解下来安装编译需要的依赖 编译aosp源码 刷入系统 AOSP 全称 Android Open Source Project 是指Android开源项目,它是由Google主导的…...
程序员的护城河:构建数字世界的守护者
目录 前言1 持续学习的愿望和能力2 与他人沟通和合作的能力3 追求技术的深度和广度4 具备分享的精神结语 前言 在数字化时代,程序员是现代社会的护城河。他们的工作不仅是构建应用程序和系统,更是为保障系统安全、数据防护以及网络稳定发挥着至关重要的…...
Sample Average Approximation,SAA
1. sample average approximation,SAA “样本平均近似”(Sample Average Approximation,SAA)方法是数学优化和运筹学领域广泛使用的优化技术。它主要用于处理优化问题的目标函数或约束涉及随机或不确定参数的情况。SAA尤其适用于具有随机或概…...
springbootMysql文华学院青年志愿者服务预约系统97973-计算机毕业设计项目选题推荐(附源码)
摘 要 随着社会的发展,社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 文华学院青年志愿者服务预约系统,主要的模块包括管理员:后台首页、轮播图、通知公告管理、资源管理(新闻资…...
Go 语言向函数传递数组
Go 语言向函数传递数组 在 Go 语言中,数组是值类型,因此将数组传递给函数时,将复制整个数组。如果数组非常大,这可能会导致性能问题。为了避免复制整个数组,可以通过传递切片(Slice)来传递数组…...
高压放大器在铁电测试中的用途有哪些
高压放大器在铁电测试中有多种重要用途。铁电材料是指具有自发极化的晶体材料,具有一系列特殊的电学和物理性质。铁电测试是研究铁电材料性质的关键实验手段之一。下面安泰电子将介绍高压放大器在铁电测试中的几个主要用途。 极化场施加:铁电材料的最显著…...
【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型
摘要 拍照搜题系统采用“三层管道(多模态 OCR → 语义检索 → 答案渲染)、两级检索(倒排 BM25 向量 HNSW)并以大语言模型兜底”的整体框架: 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后,分别用…...
深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...
Linux链表操作全解析
Linux C语言链表深度解析与实战技巧 一、链表基础概念与内核链表优势1.1 为什么使用链表?1.2 Linux 内核链表与用户态链表的区别 二、内核链表结构与宏解析常用宏/函数 三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势5.1 插入效率5.2 安全…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
测试markdown--肇兴
day1: 1、去程:7:04 --11:32高铁 高铁右转上售票大厅2楼,穿过候车厅下一楼,上大巴车 ¥10/人 **2、到达:**12点多到达寨子,买门票,美团/抖音:¥78人 3、中饭&a…...
全志A40i android7.1 调试信息打印串口由uart0改为uart3
一,概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本:2014.07; Kernel版本:Linux-3.10; 二,Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01),并让boo…...
Element Plus 表单(el-form)中关于正整数输入的校验规则
目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入(联动)2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...
C++.OpenGL (20/64)混合(Blending)
混合(Blending) 透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...
MySQL:分区的基本使用
目录 一、什么是分区二、有什么作用三、分类四、创建分区五、删除分区 一、什么是分区 MySQL 分区(Partitioning)是一种将单张表的数据逻辑上拆分成多个物理部分的技术。这些物理部分(分区)可以独立存储、管理和优化,…...
