当前位置: 首页 > news >正文

学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 两独立样本秩和检验
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
      • 1、正态性检验
      • 2、两样本秩和检验
    • 四、结果解读
      • 疑问:曼-惠特尼 U数据分布图如何绘制?
    • 五、规范报告
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十二讲 | 两独立样本秩和检验如何做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

两独立样本秩和检验

前面学习过两独立样本T检验,主要用于数据服从正态分布。
如果遇到数据严重偏态样本数据,可采用两种统计策略:一是将数据转化为正态分布数据;二是采用两独立样本秩和检验,一般用Mann-Whitney U 检验。
秩和检验的原理是将连续型数据排序后分配秩次,再对秩次做假设检验。假设检验的结果表述为“各组数据分布的差异有无统计学意义”。
需指出的是,虽然要重视数据的正态性,但样本量也很重要,如果样本量足够大(比如超过50),只要数据不是那么严重偏态,在近似正态范围内,也可使用t检验,而且更推荐用t检验。

一、实战案例

小白想了解男大侠和女大侠的收入差异。随机抽取了23名男侠和21名女侠,收集了每位大侠的性别和每月平均收入水平。
问,男女大侠之间的收入是否有差异?
读数据:

GETFILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十二讲:两独立样本秩和检验.sav'.

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:比较差异。
比较男侠和女侠收入分布有无统计学差异
Q2:本案例属于什么研究设计?
A:属于随机观察性研究。
事实上,两样本秩和检验也可用于实验性研究。
Q3:有几个变量?
A:有两个变量。
①自变量为性别
②因变量为收入
Q4:变量类型是什么?
A:自变量为分类变量
因变量为连续型变量。
Q5:连续型变量服从正态分布么?
A:需要检验。
Q6:可采用何种统计方法?
A:若服从,采用两独立样本T检验;
若不服从正态,可采用两样本秩和检验。
概括而言,如果数据满足以下条件,则采用两独立样本秩和检验。在这里插入图片描述

三、SPSS操作

1、正态性检验

命令行:

EXAMINE VARIABLES=收入  BY  性别/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

正态性检验结果:
在这里插入图片描述
直方图:
在这里插入图片描述
在这里插入图片描述
经S-W检验结果显示:男侠组收入P=0.332,女侠组收入P=0.002<0.01。同时结合直方图,可认为,男侠组服从正态分布,而女侠组不符合正态分布,建议采用两样本秩和检验。

2、两样本秩和检验

Step1 : 依次点击“分析—非参数检验–旧对话框–2个独立样本”,弹出两个独立样本检验对话框。
在这里插入图片描述
Step2 : 点击“收入”放入“检验变量”,性别放入“分组变量”同时进行定义组。
①检验类型:曼-惠特尼 U(Man-whttey U),是最常见的两样本秩和检验
②检验变量:即放入结局指标,本例为收入
③分组变量:放入性别。这里“定义组”需要进一步明确。
定义组:即指定比较哪两组。
在本例,我们比较男侠和女侠组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。
再次提醒:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。
④选项:对总体数据进行基本的统计描述
在这里插入图片描述
继续,确定,输出结果。
命令行:

NPAR TESTS /M-W= 收入 BY 性别(1 2) /STATISTICS=DESCRIPTIVES QUARTILES /MISSING ANALYSIS.

四、结果解读

根据上述SPSS操作,秩和检验将提供3张表格。
表1:提供对收入的总体描述
在这里插入图片描述
表2:提供分组描述收入平均排名(秩平均值)和总排名(秩总和)在这里插入图片描述
统计描述为各组的“平均秩次”和“秩总和”,然而,“平均秩次”和“秩总和”并不能充分反映各组数据的集中趋势。一般论文不报告秩平均和秩总和。
那报告什么呢?
对于非正态分布数据,中位数是描述其集中趋势的较好指标,四分位数是描述离散趋势的较好指标。
对于正态分布数据,均数是描述其集中趋势的较好指标,标准差是描述离散趋势的较好指标。
表3:秩和检验分析结果在这里插入图片描述
曼-惠特尼U(Mann-Whitney U)和威尔克森W(Wilcoxon)是常用的两独立样本秩和检验方法。
两者的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。
我们主要关注Z值和对应的p值。本案例的Z=-0.787,p=0.431>0.05, 表明两者的数据分布无显著性差异(数据分布图如下所示):

疑问:曼-惠特尼 U数据分布图如何绘制?

请选择“分析”——“非参数检验”——“独立样本”方式,在“设置”中选择“曼-惠特尼U”检验,确定
在这里插入图片描述
在这里插入图片描述
即可输出该图:
在这里插入图片描述

命令行:

*Nonparametric Tests: Independent Samples. 
NPTESTS /INDEPENDENT TEST (收入) GROUP (性别) MANN_WHITNEY /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE/CRITERIA ALPHA=0.05  CILEVEL=95.

五、规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

表 男女大侠收入差异比较在这里插入图片描述
注:数据不服从正态时,不能用平均数和标准差来描述;而应采用中位数和四分位距(第25百分位数和第75百分位数之距离)来描述。
如何获得中位数?详见第二讲|描述性统计,你学会了吗?

2、规范文字

经S-W检验以及直方图结果显示,女侠这一组数据不服从正态分布,故采用两样本Mann-Whitney U检验。
结果显示,男侠组收入的中位数11014.6(10168.9,11860)元,女侠组的中位数11739.5(10878.8,12600.3)元,两组总体收入分布不存在统计差异(Z=0.787,p =0.431)。

六、划重点

1、两独立样本的秩和检验主要是用于次序数据或不满足正态分布的连续型数据,一般用Mann-Whitney U检验。
2、如果数据严重偏态分布或存在若干个极端异常值,至少一组数据正态性检验p值接近0.01或者<0,01,优先考虑秩和检验。
3、秩和检验的描述性统计应采用中位数和四分位距(25%和75%位数),而非平均数和标准差。
小白学完两节秩和检验课程,心里又有几分成就感。
他想到了之前学习的配对样本T检验。如果数据不服从正态分布,那么也不适合T检验见,应该有配对秩和检验吧!
是的,小白思路没错,下一讲:配对样本秩和检验。

相关文章:

学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

目录 学习目的软件版本原始文档两独立样本秩和检验一、实战案例二、统计策略三、SPSS操作1、正态性检验2、两样本秩和检验 四、结果解读疑问&#xff1a;曼-惠特尼 U数据分布图如何绘制&#xff1f; 五、规范报告1、规范表格2、规范文字 六、划重点 学习目的 SPSS第十二讲 | 两…...

【Python微信机器人】第三篇:使用ctypes调用进程函数和读取内存结构体

目录修整 目前的系列目录(后面会根据实际情况变动): 在windows11上编译python将python注入到其他进程并运行注入Python并使用ctypes主动调用进程内的函数和读取内存结构体使用汇编引擎调用进程内的任意函数利用beaengine反汇编引擎的c接口写一个pyd库&#xff0c;用于实现inl…...

easyExcel按模板填充数据,处理模板列表合并问题等,并导出为html,pdf,png等格式文件demo

1.工具类 /*** excle模板填充并转换html* * @param response 返回* @param order 主体内容* @param goods 配件列表* @param pro 项目列表* @throws IOException*/public static void moudleExcleToHtml(HttpServletResponse response, String moudleUrl, Object o…...

怎么开发小程序?微信小程序开发方式

小程序开发之所以受到欢迎&#xff0c;是因为相比于APP&#xff0c;小程序的开发成本更低。不需要下载和安装&#xff0c;用户可以直接在微信内使用&#xff0c;节省了开发和维护的成本。小程序的开发方式有很多种&#xff0c;常见的有&#xff1a;自己源码开发、模板编辑、购买…...

测试从外包到自研再到大厂,这5年鬼知道我是怎么过来的

18岁那年我背井离乡来到从来没有来过的郑州。在一所普通的二本院校里学网络工程。 很明显&#xff0c;在大学以前只会用电脑开关机打LOL的我恍然间只觉得自己来到了人间天堂&#xff0c;没有人管&#xff0c;也没有任何烦恼无忧无虑的过了三年大学生涯。 直到秋招的开始&…...

Stable Diffusion系列(二):ControlNet基础控件介绍

文章目录 线稿提取类Canny&#xff1a;边缘检测SoftEdge&#xff1a;软边缘检测Lineart&#xff1a;精细线稿提取Scribble/Sketch&#xff1a;涂鸦提取MLSD&#xff1a;建筑领域的线条提取 3D提取类Normal map&#xff1a;法线贴图Depth&#xff1a;深度计算Segmentation&#…...

sql server数据库跟踪——SQL Server Profiler解析

工具&#xff1a; SQL Server Profiler这个工具是SQL Server数据库自带的语句执行跟踪工具&#xff0c;常使用于分析软件修改数据库时所执行的语句&#xff0c;适合用来研究软件运行数据库的原理。 打开方式&#xff1a; 本机安装了SQL server的话&#xff0c;都是自带的。直接…...

多机多卡分布式训练

1. 环境搭建 分布式训练框架&#xff1a;acceleratedeepspeedpdsh(可有可无)基础环境&#xff1a;cuda、显卡驱动、pytorch 1.1 安装相关包 cuda安装&#xff1a;参考官网安装步骤 wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-…...

打字练习软件 Type Fu mac中文版技能介绍

Type Fu mac是一款打字练习和提高打字速度的应用程序。它旨在帮助用户通过练习键盘打字&#xff0c;提高打字准确性和速度。无论您是初学者还是想要提高打字技能的专业人士&#xff0c;Type Fu都是一个很好的选择&#xff01; Type Fu mac采用了一种互动&#xff0c;游戏化的方…...

我的云栖大会之旅:见证云计算创新的15年

云栖大会&#xff0c;曾经是一次不可思议的科技之旅&#xff0c;却如今已见证了我对云计算世界的15年关注和发展。第一次踏上云栖大会之旅&#xff0c;我记得是在2009年。那时的云计算还是一个新生事物&#xff0c;而云栖大会正是其中的奠基石。 我清楚地记得那个炎热的夏天&am…...

一个小技巧,显著提升大模型推理能力!加州大学提出MAF多反馈框架

作者 | 谢年年 最近&#xff0c;多篇文章《GPT-4的推理能力非常有限&#xff0c;有两篇论文为证》、《DeepMind&#xff1a;无法自我纠正推理&#xff0c;除非提前得知正确答案》指出大模型在推理任务中似乎没有自我改进的能力。即在无任何外部反馈的情况下无法通过自我纠正的形…...

测开 (Junit 单元测试框架)

目录 了解 Junit 引入相关依赖 1、Junit注解 Test BeforeEach、BeforeAll AfterEach && AfterAll 2、断言 1、Assertions - assertEquals 方法 2、Assertions - assertNotEquals 方法 3、Assertions - assertTrue && assertFalse方法 4、Assertions…...

ncurse编程指南

文章目录 0. 介绍1. Hello, Ncurse2. 初始化函数2.1 raw() 和 cbreak()2.2 echo()和noecho()2.3 keypad()2.4 halfdelay()2.5 初始化样例 3. 命名规范4. 输出函数4.1 addch()类函数4.2 printw()类函数4.3 addstr()类函数4.4 注意4.5 输出函数例子 5. 输入函数5.1 getch()5.2 sc…...

Graph U-Net Code【图分类】

1. main.py # GNet是需要用到的model net GNet(G_data.feat_dim, G_data.num_class, args) # graph, 特征维度&#xff0c;类别数&#xff0c;参数 trainer Trainer(args, net, G_data) #开始训练数据 # 正式开始训练数据 trainer.train()2. network.py class GNet(nn.Modul…...

PTA 秀恩爱分得快(树)

题目 古人云&#xff1a;秀恩爱&#xff0c;分得快。 互联网上每天都有大量人发布大量照片&#xff0c;我们通过分析这些照片&#xff0c;可以分析人与人之间的亲密度。如果一张照片上出现了 K 个人&#xff0c;这些人两两间的亲密度就被定义为 1/K。任意两个人如果同时出现在…...

文心一言4.0对比ChatGPT4.0有什么优势?

目录 总结 文心一言4.0的优势 文心一言4.0的劣势 免费分享使用工具 后话 生成式AI的困境 “不会问”“不会用”“不敢信” 为什么要出收费版本&#xff1f; 目前使用过国内的文心一言3.5和WPS AI&#xff0c;国外的ChatGPT4.0。 文心一言和其他国内产品相比&#xff0…...

美观且可以很方便自定义的MATLAB绘图颜色

函数介绍 主函数是draw_test&#xff0c;用于测试函数。 draw_h是函数&#xff0c;用于给Matlab提供美观且可以很方便自定义的绘图颜色。 draw_h函数介绍 这是一个带输入输出的函数&#xff0c;输入1/2/3&#xff0c;输出下面三种颜色库的配色&#xff0c;每种库均有五种颜色…...

基于jsp,ssm物流快递管理系统

开发工具&#xff1a;eclipse&#xff0c;jdk1.8 服务器&#xff1a;tomcat7.0 数据库&#xff1a;mysql5.7 技术&#xff1a; springspringMVCmybaitsEasyUI 项目包括用户前台和管理后台两部分&#xff0c;功能介绍如下&#xff1a; 一、用户(前台)功能&#xff1a; 用…...

陪诊系统|挂号陪护搭建二开陪诊师入驻就医小程序

我们的陪诊小程序拥有丰富多样的功能&#xff0c;旨在最大程度满足现代人的需求。首先&#xff0c;我们采用了智能排队系统&#xff0c;通过扫描二维码获取排号信息&#xff0c;让您从繁琐的排队过程中解放出来。其次&#xff0c;我们提供了多种支付方式&#xff0c;不仅可以实…...

恒驰服务 | 华为云数据使能专家服务offering之大数据建设

恒驰大数据服务主要针对客户在进行智能数据迁移的过程中&#xff0c;存在业务停机、数据丢失、迁移周期紧张、运维成本高等问题&#xff0c;通过为客户提供迁移调研、方案设计、迁移实施、迁移验收等服务内容&#xff0c;支撑客户实现快速稳定上云&#xff0c;有效降低时间成本…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上&#xff0c;看到基于小智 AI DIY 玩具的演示&#xff0c;感觉有点意思&#xff0c;想着自己也来试试。 如果只是想烧录现成的固件&#xff0c;乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外&#xff0c;还提供了基于网页版的 ESP LA…...

CRMEB 框架中 PHP 上传扩展开发:涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展 扩展入口文件 文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全&#xff08;Thread Safety&#xff09; 线程安全是指在多线程环境下&#xff0c;某个函数、类或代码片段能够被多个线程同时调用时&#xff0c;仍能保证数据的一致性和逻辑的正确性&#xf…...

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】 文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装 四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码 五、报告文件爬取5.1 提…...

站群服务器的应用场景都有哪些?

站群服务器主要是为了多个网站的托管和管理所设计的&#xff0c;可以通过集中管理和高效资源的分配&#xff0c;来支持多个独立的网站同时运行&#xff0c;让每一个网站都可以分配到独立的IP地址&#xff0c;避免出现IP关联的风险&#xff0c;用户还可以通过控制面板进行管理功…...

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析 前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

Neko虚拟浏览器远程协作方案:Docker+内网穿透技术部署实践

前言&#xff1a;本文将向开发者介绍一款创新性协作工具——Neko虚拟浏览器。在数字化协作场景中&#xff0c;跨地域的团队常需面对实时共享屏幕、协同编辑文档等需求。通过本指南&#xff0c;你将掌握在Ubuntu系统中使用容器化技术部署该工具的具体方案&#xff0c;并结合内网…...

OCR MLLM Evaluation

为什么需要评测体系&#xff1f;——背景与矛盾 ​​ 能干的事&#xff1a;​​ 看清楚发票、身份证上的字&#xff08;准确率>90%&#xff09;&#xff0c;速度飞快&#xff08;眨眼间完成&#xff09;。​​干不了的事&#xff1a;​​ 碰到复杂表格&#xff08;合并单元…...

yaml读取写入常见错误 (‘cannot represent an object‘, 117)

错误一&#xff1a;yaml.representer.RepresenterError: (‘cannot represent an object’, 117) 出现这个问题一直没找到原因&#xff0c;后面把yaml.safe_dump直接替换成yaml.dump&#xff0c;确实能保存&#xff0c;但出现乱码&#xff1a; 放弃yaml.dump&#xff0c;又切…...

轻量级Docker管理工具Docker Switchboard

简介 什么是 Docker Switchboard &#xff1f; Docker Switchboard 是一个轻量级的 Web 应用程序&#xff0c;用于管理 Docker 容器。它提供了一个干净、用户友好的界面来启动、停止和监控主机上运行的容器&#xff0c;使其成为本地开发、家庭实验室或小型服务器设置的理想选择…...