机器学习系列—深入探索弗里德曼检验:非参数统计分析的利器
🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中一起航行,共同成长,探索技术的无限可能。
🚀 探索专栏:学步_技术的首页 —— 持续学习,不断进步,让学习成为我们共同的习惯,让总结成为我们前进的动力。
🔍 技术导航:
- 人工智能:深入探讨人工智能领域核心技术。
- 自动驾驶:分享自动驾驶领域核心技术和实战经验。
- 环境配置:分享Linux环境下相关技术领域环境配置所遇到的问题解决经验。
- 图像生成:分享图像生成领域核心技术和实战经验。
- 虚拟现实技术:分享虚拟现实技术领域核心技术和实战经验。
🌈 非常期待在这个数字世界里与您相遇,一起学习、探讨、成长。不要忘了订阅本专栏,让我们的技术之旅不再孤单!
💖💖💖 ✨✨ 欢迎关注和订阅,一起开启技术探索之旅! ✨✨
文章目录
- 1. 背景介绍
- 2. 弗里德曼检验原理
- 3. 使用场景
- 4. 样例数据及代码
- 5. 总结
1. 背景介绍
在数据分析领域,我们经常遇到需要比较多个相关样本均值的场景。当数据不符合正态分布或方差齐性时,传统的方差分析(ANOVA)就不再适用。这时,非参数统计方法就显得尤为重要,其中弗里德曼检验(Friedman test)就是一种用于多个相关样本比较的非参数检验方法。
2. 弗里德曼检验原理
弗里德曼检验的基本思想是将原始数据转换为排名(rank),然后利用这些排名来评估不同组之间的差异是否具有统计学意义。这种方法不依赖于数据的具体分布,因此对数据的分布形态要求不严格。
在传统的参数统计方法中,如ANOVA,数据的正态分布假设是一个关键前提。然而,在现实世界中,数据往往不遵循完美的正态分布,这时候就需要非参数方法来避免对数据分布的强假设。弗里德曼检验通过将原始数据转换为排名,有效地去除了数据分布形态的影响,使得检验结果更加可靠。
-
数据排名:首先对每个组内的观测值进行排名。如果多个观测值相同,则分配平均排名。例如,如果两个最大的观测值相等,它们将共享排名第一的位置。
-
计算排名和:接着计算每个组的排名总和。这一步骤体现了各组在整体中的相对表现。
-
构建检验统计量:利用各组的排名和,构建弗里德曼检验的统计量,该统计量反映了组间差异的程度。
-
确定显著性水平:通过比较检验统计量与理论分布(通常是卡方分布)的临界值,确定是否存在统计学上的显著差异。
-
多重比较:如果检验结果表明存在显著差异,可以进一步使用事后多重比较方法来识别哪些具体组别之间存在差异。
这张图描述的是弗里德曼检验(Friedman test)的基本原理和计算步骤。以下是涉及的原理和公式的详细解释:
弗里德曼检验用于比较多个方法或模型在多个数据集或实验条件下的平均性能是否存在显著差异。它是一种基于排名的非参数统计方法。
- 零假设(Null Hypothesis, ( H_0 )):假设用于比较的多个方法或模型的性能相当,即它们之间没有显著差异。
- 假设条件:
- 有 ( N ) 个数据集。
- 有 ( K ) 个模型。
- 这些模型在 ( N ) 个数据集上的测试结果形成一个 ( [N, K] ) 维的结果矩阵。
- 计算步骤:
- Step 1: 计算序值矩阵及Rank值
- 对于每份数据集,根据模型的性能(如准确率)进行升序排序,并为每个模型分配一个序数值(rank)。性能最高的模型获得最高的序数值。
- 如果有模型性能相同,它们的序数值取平均,但要保持序数值的总和不变。
- Step 2: 计算统计量
- 计算每个模型的Rank值,记第 ( i ) 个模型在第 ( j ) 个数据集上的序值为 ( rank_{i,j} )。
- 计算每个模型的Rank总和 ( R_i ),然后使用以下公式计算弗里德曼统计量 ( T^2 ):
T 2 = 12 N × K × ( k + 1 ) ∑ i = 1 k ( R i N − k + 1 2 ) 2 T^2 = \frac{12}{N \times K \times (k + 1)} \sum_{i=1}^{k} \left(\frac{R_i}{N} - \frac{k+1}{2}\right)^2 T2=N×K×(k+1)12∑i=1k(NRi−2k+1)2,
其中,( R_i ) 是模型 ( i ) 的Rank总和,( N ) 是数据集数量,( K ) 是模型数量。
- 改进统计量 ( T_F ):为了更正 ( T^2 ) 统计量的偏差,可以使用以下改进公式:
T F = ( N − 1 ) T 2 N ( k − 1 ) − T 2 T_F = \frac{(N - 1)T^2}{N(k - 1) - T^2} TF=N(k−1)−T2(N−1)T2.
- Step 1: 计算序值矩阵及Rank值
- 显著性检验:
- 计算出的 ( T^2 ) 或 ( T_F ) 统计量与卡方分布进行比较,以确定是否存在统计学上的显著差异。如果统计量超过了卡方分布的临界值,则拒绝零假设,认为至少有两个模型的性能存在显著差异。
- 结果解释:
- 如果 ( p ) 值小于显著性水平(如 0.05),则认为模型间存在显著差异。
- 如果 ( p ) 值大于或等于显著性水平,则没有足够证据拒绝零假设,即认为模型间没有显著差异。
3. 使用场景
弗里德曼检验适用于以下场景:
- 数据不满足正态分布。
- 样本量较小且数据分布不明确。
- 存在重复测量或相关样本。
4. 样例数据及代码
假设我们进行了一个关于不同教学方法对学生学习效果的研究,收集了以下数据:
学生 | 传统教学 | 互动式教学 | 在线教学 |
---|---|---|---|
A | 70 | 80 | 75 |
B | 60 | 70 | 65 |
C | 75 | 85 | 80 |
我们可以使用Python的scipy
库来执行弗里德曼检验:
import scipy.stats as stats# 样例数据
data = [[70, 80, 75], # 学生A的数据[60, 70, 65], # 学生B的数据[75, 85, 80] # 学生C的数据
]# 执行弗里德曼检验
chi2, p_value = stats.friedmanchisquare(*data)print(f"Chi-squared: {chi2}, P-value: {p_value}")
统计结果分析:如果得到的p值小于常用的显著性水平(例如0.05),则我们拒绝原假设,认为至少有两个组之间存在显著差异。反之,如果p值较大,则没有足够的证据拒绝原假设,即认为各组间差异不显著。
5. 总结
弗里德曼检验作为一种强大的非参数统计工具,为我们提供了一种在不满足传统参数检验条件下分析数据的方法。它简单、易于实现,并且可以提供关于数据分布和组间差异的宝贵信息。在实际应用中,我们应该根据数据的特性和研究目的选择合适的统计方法。
🌟 在这篇博文的旅程中,感谢您的陪伴与阅读。如果内容对您有所启发或帮助,请不要吝啬您的点赞 👍🏻,这是对我最大的鼓励和支持。
📚 本人虽致力于提供准确且深入的技术分享,但学识有限,难免会有疏漏之处。如有不足或错误,恳请各位业界同仁在评论区留下宝贵意见,您的批评指正是我不断进步的动力!😄😄😄
💖💖💖 如果您发现这篇博文对您的研究或工作有所裨益,请不吝点赞、收藏,或分享给更多需要的朋友,让知识的力量传播得更远。
🔥🔥🔥 “Stay Hungry, Stay Foolish” —— 求知的道路永无止境,让我们保持渴望与初心,面对挑战,勇往直前。无论前路多么漫长,只要我们坚持不懈,终将抵达目的地。🌙🌙🌙
👋🏻 在此,我也邀请您加入我的技术交流社区,共同探讨、学习和成长。让我们携手并进,共创辉煌!
相关文章:

机器学习系列—深入探索弗里德曼检验:非参数统计分析的利器
🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中…...
【ubutnu18.04】k8s 部署4: worker节点配置1.31.0和containerd 1.7.20
上一篇:【ubutnu24.04】k8s部署3:重新安装1.31.0并init成功 worker 节点之一是ubuntu18.04主要参考 How Install Kubernetes on Ubuntu 24.04 (Step-by-Step Guide) 重点参考 ubuntu24.04 作为master反复配置kubelet root@PerfSvr:/home/zhangbin/perfwork/k8sadmin# sudo kub…...
android kotlin集成WorkManager实现定时获取数据
在Android中使用Kotlin集成WorkManager来实现定时获取数据是一个很常见的需求。WorkManager可以帮助你在设备处于闲置或应用被关闭时执行后台任务,特别适用于需要在特定时间间隔内重复执行的任务。以下是实现步骤: 1. 添加依赖项 首先,在你…...

BvSP_ Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction
BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction 英文题目BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction中文题目BvSP:面向少样本方面情感四元预测的广视角软提示论文地址aclanthology.org/202…...

React+Vis.js(05):vis.js的节点的点击事件
文章目录 需求实现思路抽屉实现完整代码需求 双击节点,弹出右侧的“抽屉”,显示节点的详细信息 实现思路 vis.network提供了一个doubleClick事件,代码如下: network.on(doubleClick, function (properties) {// console.log(nodes);let id = properties...
今日(2024 年 8 月 19 日)科技新闻
科大讯飞推出星火极速超拟人交互:8 月 19 日,科大讯飞宣布星火语音大模型更新,正式推出星火极速超拟人交互,并将其能力落地在讯飞星火 APP “小星畅聊” 功能中。该交互响应速度更快,能感知用户情绪变化并共情回应&…...
Python 虚拟环境
为什么要创建虚拟环境 创建 Python 虚拟环境的主要目的是为了解决依赖管理的问题,特别是在开发多个项目或部署应用程序时,虚拟环境具有以下几个优势: 依赖隔离: 不同的项目可能需要不同版本的 Python 解释器和库。通过创建虚拟环…...

Redis RDB三两事
rdb:将数据库的快照以二进制格式保存在文件中,redis重启后直接加载数据。可以通过save和bgsave命令生成rdb。当然我们可以在生成rdb文件时指定规则,例如 save 60 1000 如果60秒内不少于1000个key发生了改动,则生成一个新的rdb文件…...

分布式高可用架构设计
一、限流 1、单机限流 如图,应用C的资源c/x被上游的应用A和应用C并发访问,应用C的系统能力支持c/x资源最高5000/qps的访问量;为了不让高并发流量或尖峰流量压垮应用C,可以针对应用C的资源c/x做限流;比如设置限流4500…...

GATK SampleList接口介绍
在 GATK 中,SampleList 是一个接口,用于表示一个样本列表。这些样本通常是在基因组分析过程中被处理的不同生物样本。SampleList 接口提供了访问这些样本的一些基本方法,通常用于多样本分析任务,比如变异检测或基因组重测序。 SampleList 接口的方法 SampleList 接口定义…...

00后是真卷不过,工作没两年,跳槽到我们公司起薪20K都快接近我了
在程序员职场上,什么样的人最让人反感呢? 是技术不好的人吗?并不是。技术不好的同事,我们可以帮他。 是技术太强的人吗?也不是。技术很强的同事,可遇不可求,向他学习还来不及呢。 真正让人反感的,是技术平平&…...

树莓派Pico C/C++ 开发环境搭建(一键完成版)
树莓派Pico C/C 开发环境搭建(一键完成版) 因为之前使用过MicroPython开发过树莓派Pico,总觉得用起来怪怪的。正好最近树莓怕发布了新一代的MCU——RP2350,之前的RP2040在各个平台都有所降价,因此,买了几块。同时因为之前是玩stm…...

【计算机组成原理】二、数据的表示和运算:1.数值与编码(十进制二进制转换、BCD码、ASCII码、汉字编码、奇偶校验码、循环冗余检测CRC、海明码)
二、数据的表示和运算 文章目录 二、数据的表示和运算1.数值与编码1.1数据存储和排列❗1.2十进制转换1.2.1整数1.2.2小数 1.3二进制转换1.3.1 B->O1.3.2 B->H 1.4真值&机器数1.5 BCD码1.6 ASCII码1.7汉字与GBK1.8 UTF1.9检错码1.9.1奇偶校验码1.9.2循环冗余检测CRC1.…...
汇编语言中的艺术:数据压缩与解压缩技术
标题:汇编语言中的艺术:数据压缩与解压缩技术 数据压缩是计算机科学中的一项基本技术,它通过减少数据的冗余来降低存储或传输所需的空间。在低级语言如汇编语言中实现数据压缩和解压缩,不仅是一种技术挑战,也是对硬件…...

【Alibaba Cola 状态机】重点解析以及实践案例
【Alibaba Cola 状态机】重点解析以及实践案例 1. 状态模式 状态模式是一种行为型设计模式,允许对象在内部状态改变时改变其行为,简单地讲就是,一个拥有状态的context对象,在不同状态下,其行为会发生改变。看起来是改…...
购买商城源码前需要考虑哪些方面?
前言 购买商城源码前需要考虑的方面包括功能满足、技术兼容性、可扩展性、公司实力、客户评价、安全性与稳定性等。 购买商城源码是一项重要决策,需要综合考虑多个因素。以下是详细的考虑方面: 1.功能满足: 确保所选的源码能够支持企业所…...

MongoDB快速入门CRUD
1. 数据库管理 1.1 切换数据库 切换到名为 myDatabase 的数据库。如果该数据库不存在,MongoDB 会在第一次写入数据时自动创建它。 use myDatabase;1.2 查看当前数据库 显示当前使用的数据库的名称。 db; 1.3 显示所有数据库 列出当前 MongoDB 实例中的所有数…...

【python基础】—利用pandas读取或写入mysql表数据
文章目录 一、read_sql()二、to_sql()三、连接数据库方式—MySQL1、用sqlalchemy包构建数据库链接2、用DBAPI构建数据库链接 四、容易遇到的问题 一、read_sql() 功能 将 SQL 查询/数据库表读入 DataFrame。 语法 读取数据库(通过SQL语句或表名) pand…...
C/C++信号量
文章目录 一、信号量介绍1.1 什么是信号量1.2 信号量的原子性1.3 信号量的使用 二、C语言使用2.1 函数接口2.2 信号量代码 三、C20使用3.1 函数接口 四、C11模拟信号量 一、信号量介绍 1.1 什么是信号量 信号量是一种特殊的变量,是操作系统层面的,可以…...

SSL Pining 问题解决方案
实战案例 为了能够更好的复现 SSL Pining 场景,我们对一个 App(https:app4.scrape.center)进行抓包,这个 App 包含了 SSL Pining 的相关设置,如果我们将手机的代理设置为抓包软件提供的代理服务,那么这个 …...

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

汽车生产虚拟实训中的技能提升与生产优化
在制造业蓬勃发展的大背景下,虚拟教学实训宛如一颗璀璨的新星,正发挥着不可或缺且日益凸显的关键作用,源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例,汽车生产线上各类…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...

云原生玩法三问:构建自定义开发环境
云原生玩法三问:构建自定义开发环境 引言 临时运维一个古董项目,无文档,无环境,无交接人,俗称三无。 运行设备的环境老,本地环境版本高,ssh不过去。正好最近对 腾讯出品的云原生 cnb 感兴趣&…...

视觉slam十四讲实践部分记录——ch2、ch3
ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行 二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件,或者在构建过程中仍然引用了旧的路…...

基于Java+VUE+MariaDB实现(Web)仿小米商城
仿小米商城 环境安装 nodejs maven JDK11 运行 mvn clean install -DskipTestscd adminmvn spring-boot:runcd ../webmvn spring-boot:runcd ../xiaomi-store-admin-vuenpm installnpm run servecd ../xiaomi-store-vuenpm installnpm run serve 注意:运行前…...
WebRTC从入门到实践 - 零基础教程
WebRTC从入门到实践 - 零基础教程 目录 WebRTC简介 基础概念 工作原理 开发环境搭建 基础实践 三个实战案例 常见问题解答 1. WebRTC简介 1.1 什么是WebRTC? WebRTC(Web Real-Time Communication)是一个支持网页浏览器进行实时语音…...

五子棋测试用例
一.项目背景 1.1 项目简介 传统棋类文化的推广 五子棋是一种古老的棋类游戏,有着深厚的文化底蕴。通过将五子棋制作成网页游戏,可以让更多的人了解和接触到这一传统棋类文化。无论是国内还是国外的玩家,都可以通过网页五子棋感受到东方棋类…...
在RK3588上搭建ROS1环境:创建节点与数据可视化实战指南
在RK3588上搭建ROS1环境:创建节点与数据可视化实战指南 背景介绍完整操作步骤1. 创建Docker容器环境2. 验证GUI显示功能3. 安装ROS Noetic4. 配置环境变量5. 创建ROS节点(小球运动模拟)6. 配置RVIZ默认视图7. 创建启动脚本8. 运行可视化系统效果展示与交互技术解析ROS节点通…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...