当前位置: 首页 > news >正文

学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 两独立样本秩和检验
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
      • 1、正态性检验
      • 2、两样本秩和检验
    • 四、结果解读
      • 疑问:曼-惠特尼 U数据分布图如何绘制?
    • 五、规范报告
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十二讲 | 两独立样本秩和检验如何做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

两独立样本秩和检验

前面学习过两独立样本T检验,主要用于数据服从正态分布。
如果遇到数据严重偏态样本数据,可采用两种统计策略:一是将数据转化为正态分布数据;二是采用两独立样本秩和检验,一般用Mann-Whitney U 检验。
秩和检验的原理是将连续型数据排序后分配秩次,再对秩次做假设检验。假设检验的结果表述为“各组数据分布的差异有无统计学意义”。
需指出的是,虽然要重视数据的正态性,但样本量也很重要,如果样本量足够大(比如超过50),只要数据不是那么严重偏态,在近似正态范围内,也可使用t检验,而且更推荐用t检验。

一、实战案例

小白想了解男大侠和女大侠的收入差异。随机抽取了23名男侠和21名女侠,收集了每位大侠的性别和每月平均收入水平。
问,男女大侠之间的收入是否有差异?
读数据:

GETFILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十二讲:两独立样本秩和检验.sav'.

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:比较差异。
比较男侠和女侠收入分布有无统计学差异
Q2:本案例属于什么研究设计?
A:属于随机观察性研究。
事实上,两样本秩和检验也可用于实验性研究。
Q3:有几个变量?
A:有两个变量。
①自变量为性别
②因变量为收入
Q4:变量类型是什么?
A:自变量为分类变量
因变量为连续型变量。
Q5:连续型变量服从正态分布么?
A:需要检验。
Q6:可采用何种统计方法?
A:若服从,采用两独立样本T检验;
若不服从正态,可采用两样本秩和检验。
概括而言,如果数据满足以下条件,则采用两独立样本秩和检验。在这里插入图片描述

三、SPSS操作

1、正态性检验

命令行:

EXAMINE VARIABLES=收入  BY  性别/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

正态性检验结果:
在这里插入图片描述
直方图:
在这里插入图片描述
在这里插入图片描述
经S-W检验结果显示:男侠组收入P=0.332,女侠组收入P=0.002<0.01。同时结合直方图,可认为,男侠组服从正态分布,而女侠组不符合正态分布,建议采用两样本秩和检验。

2、两样本秩和检验

Step1 : 依次点击“分析—非参数检验–旧对话框–2个独立样本”,弹出两个独立样本检验对话框。
在这里插入图片描述
Step2 : 点击“收入”放入“检验变量”,性别放入“分组变量”同时进行定义组。
①检验类型:曼-惠特尼 U(Man-whttey U),是最常见的两样本秩和检验
②检验变量:即放入结局指标,本例为收入
③分组变量:放入性别。这里“定义组”需要进一步明确。
定义组:即指定比较哪两组。
在本例,我们比较男侠和女侠组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。
再次提醒:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。
④选项:对总体数据进行基本的统计描述
在这里插入图片描述
继续,确定,输出结果。
命令行:

NPAR TESTS /M-W= 收入 BY 性别(1 2) /STATISTICS=DESCRIPTIVES QUARTILES /MISSING ANALYSIS.

四、结果解读

根据上述SPSS操作,秩和检验将提供3张表格。
表1:提供对收入的总体描述
在这里插入图片描述
表2:提供分组描述收入平均排名(秩平均值)和总排名(秩总和)在这里插入图片描述
统计描述为各组的“平均秩次”和“秩总和”,然而,“平均秩次”和“秩总和”并不能充分反映各组数据的集中趋势。一般论文不报告秩平均和秩总和。
那报告什么呢?
对于非正态分布数据,中位数是描述其集中趋势的较好指标,四分位数是描述离散趋势的较好指标。
对于正态分布数据,均数是描述其集中趋势的较好指标,标准差是描述离散趋势的较好指标。
表3:秩和检验分析结果在这里插入图片描述
曼-惠特尼U(Mann-Whitney U)和威尔克森W(Wilcoxon)是常用的两独立样本秩和检验方法。
两者的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。
我们主要关注Z值和对应的p值。本案例的Z=-0.787,p=0.431>0.05, 表明两者的数据分布无显著性差异(数据分布图如下所示):

疑问:曼-惠特尼 U数据分布图如何绘制?

请选择“分析”——“非参数检验”——“独立样本”方式,在“设置”中选择“曼-惠特尼U”检验,确定
在这里插入图片描述
在这里插入图片描述
即可输出该图:
在这里插入图片描述

命令行:

*Nonparametric Tests: Independent Samples. 
NPTESTS /INDEPENDENT TEST (收入) GROUP (性别) MANN_WHITNEY /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE/CRITERIA ALPHA=0.05  CILEVEL=95.

五、规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

表 男女大侠收入差异比较在这里插入图片描述
注:数据不服从正态时,不能用平均数和标准差来描述;而应采用中位数和四分位距(第25百分位数和第75百分位数之距离)来描述。
如何获得中位数?详见第二讲|描述性统计,你学会了吗?

2、规范文字

经S-W检验以及直方图结果显示,女侠这一组数据不服从正态分布,故采用两样本Mann-Whitney U检验。
结果显示,男侠组收入的中位数11014.6(10168.9,11860)元,女侠组的中位数11739.5(10878.8,12600.3)元,两组总体收入分布不存在统计差异(Z=0.787,p =0.431)。

六、划重点

1、两独立样本的秩和检验主要是用于次序数据或不满足正态分布的连续型数据,一般用Mann-Whitney U检验。
2、如果数据严重偏态分布或存在若干个极端异常值,至少一组数据正态性检验p值接近0.01或者<0,01,优先考虑秩和检验。
3、秩和检验的描述性统计应采用中位数和四分位距(25%和75%位数),而非平均数和标准差。
小白学完两节秩和检验课程,心里又有几分成就感。
他想到了之前学习的配对样本T检验。如果数据不服从正态分布,那么也不适合T检验见,应该有配对秩和检验吧!
是的,小白思路没错,下一讲:配对样本秩和检验。

相关文章:

学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

目录 学习目的软件版本原始文档两独立样本秩和检验一、实战案例二、统计策略三、SPSS操作1、正态性检验2、两样本秩和检验 四、结果解读疑问&#xff1a;曼-惠特尼 U数据分布图如何绘制&#xff1f; 五、规范报告1、规范表格2、规范文字 六、划重点 学习目的 SPSS第十二讲 | 两…...

【Python微信机器人】第三篇:使用ctypes调用进程函数和读取内存结构体

目录修整 目前的系列目录(后面会根据实际情况变动): 在windows11上编译python将python注入到其他进程并运行注入Python并使用ctypes主动调用进程内的函数和读取内存结构体使用汇编引擎调用进程内的任意函数利用beaengine反汇编引擎的c接口写一个pyd库&#xff0c;用于实现inl…...

easyExcel按模板填充数据,处理模板列表合并问题等,并导出为html,pdf,png等格式文件demo

1.工具类 /*** excle模板填充并转换html* * @param response 返回* @param order 主体内容* @param goods 配件列表* @param pro 项目列表* @throws IOException*/public static void moudleExcleToHtml(HttpServletResponse response, String moudleUrl, Object o…...

怎么开发小程序?微信小程序开发方式

小程序开发之所以受到欢迎&#xff0c;是因为相比于APP&#xff0c;小程序的开发成本更低。不需要下载和安装&#xff0c;用户可以直接在微信内使用&#xff0c;节省了开发和维护的成本。小程序的开发方式有很多种&#xff0c;常见的有&#xff1a;自己源码开发、模板编辑、购买…...

测试从外包到自研再到大厂,这5年鬼知道我是怎么过来的

18岁那年我背井离乡来到从来没有来过的郑州。在一所普通的二本院校里学网络工程。 很明显&#xff0c;在大学以前只会用电脑开关机打LOL的我恍然间只觉得自己来到了人间天堂&#xff0c;没有人管&#xff0c;也没有任何烦恼无忧无虑的过了三年大学生涯。 直到秋招的开始&…...

Stable Diffusion系列(二):ControlNet基础控件介绍

文章目录 线稿提取类Canny&#xff1a;边缘检测SoftEdge&#xff1a;软边缘检测Lineart&#xff1a;精细线稿提取Scribble/Sketch&#xff1a;涂鸦提取MLSD&#xff1a;建筑领域的线条提取 3D提取类Normal map&#xff1a;法线贴图Depth&#xff1a;深度计算Segmentation&#…...

sql server数据库跟踪——SQL Server Profiler解析

工具&#xff1a; SQL Server Profiler这个工具是SQL Server数据库自带的语句执行跟踪工具&#xff0c;常使用于分析软件修改数据库时所执行的语句&#xff0c;适合用来研究软件运行数据库的原理。 打开方式&#xff1a; 本机安装了SQL server的话&#xff0c;都是自带的。直接…...

多机多卡分布式训练

1. 环境搭建 分布式训练框架&#xff1a;acceleratedeepspeedpdsh(可有可无)基础环境&#xff1a;cuda、显卡驱动、pytorch 1.1 安装相关包 cuda安装&#xff1a;参考官网安装步骤 wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-…...

打字练习软件 Type Fu mac中文版技能介绍

Type Fu mac是一款打字练习和提高打字速度的应用程序。它旨在帮助用户通过练习键盘打字&#xff0c;提高打字准确性和速度。无论您是初学者还是想要提高打字技能的专业人士&#xff0c;Type Fu都是一个很好的选择&#xff01; Type Fu mac采用了一种互动&#xff0c;游戏化的方…...

我的云栖大会之旅:见证云计算创新的15年

云栖大会&#xff0c;曾经是一次不可思议的科技之旅&#xff0c;却如今已见证了我对云计算世界的15年关注和发展。第一次踏上云栖大会之旅&#xff0c;我记得是在2009年。那时的云计算还是一个新生事物&#xff0c;而云栖大会正是其中的奠基石。 我清楚地记得那个炎热的夏天&am…...

一个小技巧,显著提升大模型推理能力!加州大学提出MAF多反馈框架

作者 | 谢年年 最近&#xff0c;多篇文章《GPT-4的推理能力非常有限&#xff0c;有两篇论文为证》、《DeepMind&#xff1a;无法自我纠正推理&#xff0c;除非提前得知正确答案》指出大模型在推理任务中似乎没有自我改进的能力。即在无任何外部反馈的情况下无法通过自我纠正的形…...

测开 (Junit 单元测试框架)

目录 了解 Junit 引入相关依赖 1、Junit注解 Test BeforeEach、BeforeAll AfterEach && AfterAll 2、断言 1、Assertions - assertEquals 方法 2、Assertions - assertNotEquals 方法 3、Assertions - assertTrue && assertFalse方法 4、Assertions…...

ncurse编程指南

文章目录 0. 介绍1. Hello, Ncurse2. 初始化函数2.1 raw() 和 cbreak()2.2 echo()和noecho()2.3 keypad()2.4 halfdelay()2.5 初始化样例 3. 命名规范4. 输出函数4.1 addch()类函数4.2 printw()类函数4.3 addstr()类函数4.4 注意4.5 输出函数例子 5. 输入函数5.1 getch()5.2 sc…...

Graph U-Net Code【图分类】

1. main.py # GNet是需要用到的model net GNet(G_data.feat_dim, G_data.num_class, args) # graph, 特征维度&#xff0c;类别数&#xff0c;参数 trainer Trainer(args, net, G_data) #开始训练数据 # 正式开始训练数据 trainer.train()2. network.py class GNet(nn.Modul…...

PTA 秀恩爱分得快(树)

题目 古人云&#xff1a;秀恩爱&#xff0c;分得快。 互联网上每天都有大量人发布大量照片&#xff0c;我们通过分析这些照片&#xff0c;可以分析人与人之间的亲密度。如果一张照片上出现了 K 个人&#xff0c;这些人两两间的亲密度就被定义为 1/K。任意两个人如果同时出现在…...

文心一言4.0对比ChatGPT4.0有什么优势?

目录 总结 文心一言4.0的优势 文心一言4.0的劣势 免费分享使用工具 后话 生成式AI的困境 “不会问”“不会用”“不敢信” 为什么要出收费版本&#xff1f; 目前使用过国内的文心一言3.5和WPS AI&#xff0c;国外的ChatGPT4.0。 文心一言和其他国内产品相比&#xff0…...

美观且可以很方便自定义的MATLAB绘图颜色

函数介绍 主函数是draw_test&#xff0c;用于测试函数。 draw_h是函数&#xff0c;用于给Matlab提供美观且可以很方便自定义的绘图颜色。 draw_h函数介绍 这是一个带输入输出的函数&#xff0c;输入1/2/3&#xff0c;输出下面三种颜色库的配色&#xff0c;每种库均有五种颜色…...

基于jsp,ssm物流快递管理系统

开发工具&#xff1a;eclipse&#xff0c;jdk1.8 服务器&#xff1a;tomcat7.0 数据库&#xff1a;mysql5.7 技术&#xff1a; springspringMVCmybaitsEasyUI 项目包括用户前台和管理后台两部分&#xff0c;功能介绍如下&#xff1a; 一、用户(前台)功能&#xff1a; 用…...

陪诊系统|挂号陪护搭建二开陪诊师入驻就医小程序

我们的陪诊小程序拥有丰富多样的功能&#xff0c;旨在最大程度满足现代人的需求。首先&#xff0c;我们采用了智能排队系统&#xff0c;通过扫描二维码获取排号信息&#xff0c;让您从繁琐的排队过程中解放出来。其次&#xff0c;我们提供了多种支付方式&#xff0c;不仅可以实…...

恒驰服务 | 华为云数据使能专家服务offering之大数据建设

恒驰大数据服务主要针对客户在进行智能数据迁移的过程中&#xff0c;存在业务停机、数据丢失、迁移周期紧张、运维成本高等问题&#xff0c;通过为客户提供迁移调研、方案设计、迁移实施、迁移验收等服务内容&#xff0c;支撑客户实现快速稳定上云&#xff0c;有效降低时间成本…...

浏览器访问 AWS ECS 上部署的 Docker 容器(监听 80 端口)

✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义&#xff08;Task Definition&…...

椭圆曲线密码学(ECC)

一、ECC算法概述 椭圆曲线密码学&#xff08;Elliptic Curve Cryptography&#xff09;是基于椭圆曲线数学理论的公钥密码系统&#xff0c;由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA&#xff0c;ECC在相同安全强度下密钥更短&#xff08;256位ECC ≈ 3072位RSA…...

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引&#xff0c;可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度&#xff08;创建索引的主要原因&#xff09;。3. 可以加速表和表之间的连接&#xff0c;实现数据的参考完整性。4. 可以在查询过程中&#xff0c;…...

线程同步:确保多线程程序的安全与高效!

全文目录&#xff1a; 开篇语前序前言第一部分&#xff1a;线程同步的概念与问题1.1 线程同步的概念1.2 线程同步的问题1.3 线程同步的解决方案 第二部分&#xff1a;synchronized关键字的使用2.1 使用 synchronized修饰方法2.2 使用 synchronized修饰代码块 第三部分&#xff…...

服务器硬防的应用场景都有哪些?

服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式&#xff0c;避免服务器受到各种恶意攻击和网络威胁&#xff0c;那么&#xff0c;服务器硬防通常都会应用在哪些场景当中呢&#xff1f; 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...

Linux-07 ubuntu 的 chrome 启动不了

文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了&#xff0c;报错如下四、启动不了&#xff0c;解决如下 总结 问题原因 在应用中可以看到chrome&#xff0c;但是打不开(说明&#xff1a;原来的ubuntu系统出问题了&#xff0c;这个是备用的硬盘&a…...

【C语言练习】080. 使用C语言实现简单的数据库操作

080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码:使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出:5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作 在…...

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

安全突围:重塑内生安全体系:齐向东在2025年BCS大会的演讲

文章目录 前言第一部分&#xff1a;体系力量是突围之钥第一重困境是体系思想落地不畅。第二重困境是大小体系融合瓶颈。第三重困境是“小体系”运营梗阻。 第二部分&#xff1a;体系矛盾是突围之障一是数据孤岛的障碍。二是投入不足的障碍。三是新旧兼容难的障碍。 第三部分&am…...

NPOI Excel用OLE对象的形式插入文件附件以及插入图片

static void Main(string[] args) {XlsWithObjData();Console.WriteLine("输出完成"); }static void XlsWithObjData() {// 创建工作簿和单元格,只有HSSFWorkbook,XSSFWorkbook不可以HSSFWorkbook workbook new HSSFWorkbook();HSSFSheet sheet (HSSFSheet)workboo…...