当前位置: 首页 > news >正文

t检验(连续变量)和卡方检验(分类变量)

目录

情形

不同种类的萼片差异

数据类型查看:

差异分析:

不同萼片的种类差异

数据准备

二分类卡方检验

绘图


情形

:当有两列数据进行分析比较时,一列为连续变量,一列数据为分类变量。

rm(list = ls()) 
library(ggplot2)
library(ggpubr)
library(cowplot)
data <- iris##鸢尾花数据集
data1 <- data[,c(1,5)]
data2 <- data1[data1$Species=="setosa"|data1$Species=="versicolor",]
##提取鸢尾花数据集的部分数据进行分析

如下整理鸢尾花部分数据:“Sepal.Length”是连续变量,“Species”只选择了两种数据。

分析两列数据:2种情况

①比较不同种类的萼片长度是否存在差异。

②比较不同萼片长度的种类是否存在差异。

不同种类的萼片差异

数据类型查看:

数据分布检测:第六讲 R-数据正态分布检验 - 知乎 (zhihu.com)

#①比较不同种类的萼片长度是否存在差异。
#分析方法选择
shapiro.test(data2$Sepal.Length)
#W = 0.96964, p-value = 0.02076 不符合正太分布#密度图
ggdensity(data2$Sepal.Length, main = "Density plot of sepal length",xlab = "sepal length")
#正态性测试对样本量敏感。小样本最常通过正态性测试。
#因此,重要的是将外观检查和显着性测试相结合以做出正确的决定
#综合分析也可以采用t检验

数据分布情况

差异分析:
#pdf("plot.pdf",width = 4,height = 4)##保存图片
p <- ggplot(na.omit(data2), aes(x = Species, y = Sepal.Length, fill = Species)) + geom_boxplot(aes(col = Species)) + scale_fill_manual(values = alpha(c("#3C6FAC","grey50"),0.8)) + scale_color_manual(values = c("#3C6FAC","grey50")) + xlab("Species") + ##X轴名称ylab("") + theme_bw() +#主题设置 theme(legend.position = "top",#添加图例#legend.title = "Species",#legend.key.size = unit(0.5, "cm"),#缩小图例大小axis.text.x = element_blank(),axis.text.y = element_blank(),axis.ticks = element_blank(),panel.border = element_blank(),panel.grid = element_blank(),panel.background = element_blank(),axis.title = element_text(size = 10),axis.text = element_text(size = 10)) + stat_compare_means(method = "t.test", #wilcox.test(检验方法选择)label = "p.signif",#展示星标** label.y = max(na.omit(data2$Sepal.Length)) * 0.95, label.x = 1.5, size = 8)
p

不同萼片的种类差异

将萼片长度分为二分类变量(如:长短),然后分析不同萼片组的种类是否存在差异

数据准备
##数据准备
rm(list = ls()) 
library(ggplot2)
library(ggpubr)
library(cowplot)
data <- iris##鸢尾花数据集
data1 <- data[,c(1,5)]
data2 <- data1[data1$Species=="setosa"|data1$Species=="versicolor",]#②不同萼片长度的种类是否存在差异
data3 <- data2[order(data2$Sepal.Length),]
#计算分割点(进行二分类设置)
point <- round(nrow(data3) / 2)##几分之几,自己设置
data3$SepalLength[1:point] <-"Low" 
data3$SepalLength[point:nrow(data3)] <-"High" #详情
table(data3$Species,data3$SepalLength)High Low
setosa        6  44
versicolor   45   5
virginica     0   0

二分类卡方检验

R语言卡方检验最全总结_医学和生信笔记的博客-CSDN博客

R语言—卡方检验 - 知乎 (zhihu.com)

R=C=2时四格表卡方检验

当 n(样本量)≥40 且所有的T(期望频数)≥5时,用χ2检验的基本公式或四格表资料之χ2检验的专用公式;当P ≈ α时,改用四格表资料的 Fisher 确切概率法;
当 n≥40 但有 1≤T<5 时,用四格表资料χ2检验的校正公式,或改用四格表资料的 Fisher 确切概率法。
当 n<40,或 T<1时,用四格表资料的 Fisher 确切概率法。

#生成二维列联表
mytable <- table(data3$Species,data3$SepalLength)
mytable1 <-mytable[c(1,2),]##需要去除列联表中并没有的第三列(否则不能计算)
chisq.test(mytable1,correct = F) # 和SPSS一样
#结果:X-squared = 64, df = 1, p-value = 1.244e-15
#data3$Species,data3$SepalLength顺序不影响结果
绘图

比例计算

##绘制堆砌图并展示结果
#表格汇总结果(为了展示比例)
result <- data3 %>% group_by(Species, SepalLength) %>%summarize(count = n()) %>%mutate(proportion = count / sum(count))
print(result)# 输出结果
result <- as.data.frame(result)
result$proportion <- round(result$proportion*100,1)#保留1位小数
dat01 <- result[c(3,4),]#提取需要展示的数值的行(需要匹配X轴)

完整图

#pdf("plot.pdf",width = 4,height = 4)##保存图片
ggplot(data3,aes(x=SepalLength,#X轴fill=Species))+geom_bar(position = "fill")+scale_y_continuous(expand = expansion(mult=c(0.01,0.1)),##展示百分比labels = scales::percent_format())+scale_fill_manual(values = c("setosa"="#98d09d","versicolor"="#dadada"),##根据需求修改配色limits=c("setosa","versicolor"))+theme_set(theme_bw())+theme(panel.grid = element_blank())+#不展示网格线geom_text(data=dat01,##展示比例aes(x=SepalLength,y=0.05,#设置Y轴展示的位置label=paste0(dat01$proportion)),##展示的是比例inherit.aes = FALSE,vjust=-0.2)+geom_text(aes(x = 1.5, y = 1.1,#调整文本注释位置label = "p-value 1.244e-15"))+#添加P(前面计算)labs(title = "AAABBB",#标题x="SepalLength",y="Species")
dev.off()

更多绘图细节

ggplot2作图最全教程(上) - 知乎 (zhihu.com)

ggplot2作图最全教程(下) - 知乎 (zhihu.com)

相关文章:

t检验(连续变量)和卡方检验(分类变量)

目录 情形 不同种类的萼片差异 数据类型查看&#xff1a; 差异分析&#xff1a; 不同萼片的种类差异 数据准备 二分类卡方检验 绘图 情形 &#xff1a;当有两列数据进行分析比较时&#xff0c;一列为连续变量&#xff0c;一列数据为分类变量。 rm(list ls()) libra…...

PDF转Word,1行Python代码就够了,免费用

大家好&#xff0c;这里是程序员晚枫。 今年十一假期没出去旅游&#xff0c;在家里更新一套原创课程&#xff0c;&#x1f449;给小白的《50讲Python自动化办公》。 所有功能&#xff0c;都只需要1行代码&#xff0c;非常适合非程序员入门Python使用。 目前全网播放量直逼100…...

【开源】基于Vue和SpringBoot的智能教学资源库系统

项目编号&#xff1a; S 050 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S050&#xff0c;文末获取源码。} 项目编号&#xff1a;S050&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 课程档案模块2.3 课…...

『亚马逊云科技产品测评』活动征文|通过Lightsail搭建个人笔记

提示&#xff1a;授权声明&#xff1a;本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 Developer Centre, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道 文章目录 前言实践知识储备Lightsail介绍Leanote介绍实践…...

基于JavaWeb+SSM+Vue家庭记账本微信小程序系统的设计和实现

基于JavaWebSSMVue家庭记账本微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 1.1选题背景 互联网是人类的基本需求&#xff0c;特别是在现代社会&#xff0c;个人…...

十二、h.264解码

前言 测试环境&#xff1a; ffmpeg的4.3.2自行编译版本windows环境qt5.12 完整代码&#xff1a; H264DncodeThread.h #ifndef H264DNCODETHREAD_H #define H264DNCODETHREAD_H#include <QObject> #include <QThread>extern "C" { #include <libavu…...

springboot前后端分离项目配置https接口(ssl证书)

文章目录 说明vue.js前端部署vue.js项目axios请求配置本地创建日志文件创建Dockerfile文件配置ssl证书nginx.confvue项目打包上传创建容器部署 后端springboot项目部署配置ssl证书打包部署 补充&#xff1a;jsk证书和pfx证书补充&#xff1a;两种证书的转化JKS转PFXPFX 转 JKS …...

智能小车速通版——手把手教程

考虑到大部分学校&#xff0c;会发放简易小车来作为智能车初期培训和筛选的工具&#xff0c; 于是&#xff0c;我写一个简单的教程&#xff0c;能够实现简单小车的电磁循迹。 通过这个教程&#xff0c;能够通过简化的步骤搭建寻迹小车&#xff0c;进而了解整个智能车是如何实…...

【C++】vector的介绍与使用

&#x1f9d1;‍&#x1f393;个人主页&#xff1a;简 料 &#x1f3c6;所属专栏&#xff1a;C &#x1f3c6;个人社区&#xff1a;越努力越幸运社区 &#x1f3c6;简 介&#xff1a;简料简料&#xff0c;简单有料~在校大学生一枚&#xff0c;专注C/C/GO的干货分…...

【libGDX】使用Mesh绘制圆形

1 前言 使用Mesh绘制三角形 中介绍了绘制三角形的方法&#xff0c;使用Mesh绘制矩形 中介绍了绘制矩形的方法&#xff0c;本文将介绍绘制圆形的方法。 libGDX 以点、线段、三角形为图元&#xff0c;没有提供绘制圆形的接口。要绘制圆形边框&#xff0c;必须通过割圆法逼近圆形&…...

一个测试驱动的Spring Boot应用程序开发

文章目录 系统任务用户故事搭建开发环境Web应用的框架Spring Boot 自动配置三层架构领域建模域定义与领域驱动设计领域类 业务逻辑功能随机的Challenge验证 表示层RESTSpring Boot和REST API设计API第一个控制器序列化的工作方式使用Spring Boot测试控制器 小结 这里采用面向需…...

简单几步,借助Aapose.Cells将 Excel XLS 转换为PPT

数据呈现是商业和学术工作的一个重要方面。通常&#xff0c;您需要将数据从一种格式转换为另一种格式&#xff0c;以创建信息丰富且具有视觉吸引力的演示文稿。当您需要在幻灯片上呈现工作表数据时&#xff0c;需要从 Excel XLS 转换为 PowerPoint 演示文稿。在这篇博文中&…...

CSS特效016:天窗扬起合上的效果

CSS常用示例100专栏目录 本专栏记录的是经常使用的CSS示例与技巧&#xff0c;主要包含CSS布局&#xff0c;CSS特效&#xff0c;CSS花边信息三部分内容。其中CSS布局主要是列出一些常用的CSS布局信息点&#xff0c;CSS特效主要是一些动画示例&#xff0c;CSS花边是描述了一些CSS…...

基于SSM的济南旅游网站设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;Vue 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#xff1a;是 目录…...

【ArrayList是如何扩容(ArrayList、LinkedList、与Vector的区别)】

ArrayList、LinkedList、与Vector的区别 解读ArrayList 是一个可改变大小的数组LinkedList 是一个双向链表Vector 属强同步类 拓展知识面ArrayList是如何扩容&#xff1f;如何利用List实现LRU&#xff1f; 解读 List主要有ArrayList、LinkedList与Vector几种实现。这三者都实现…...

STM32_3(GPIO)

GPIO简介 GPIO&#xff08;General Purpose Input Output&#xff09;通用输入输出口8种输入输出模式输出模式可控制端口输出高电平&#xff0c;驱动LED、蜂鸣器、模拟通信协议输出时许等输入模式可读取端口的高低电平或电压&#xff0c;用于读取按键输入、外接模块电平信号输…...

【技巧】PDF文件如何编辑?

日常办公中我们经常会用到PDF文件&#xff0c;PDF具备很好的兼容性、稳定性及安全性&#xff0c;但却不容易编辑&#xff0c;那PDF要如何编辑呢&#xff1f; 如果打开PDF文件就只是只读的性质&#xff0c;说明文件是在线打开&#xff0c;或者通过PDF阅读器打开的&#xff0c;这…...

AR道具特效制作工具

AR&#xff08;增强现实&#xff09;技术已经逐渐渗透到各个行业&#xff0c;为企业带来了全新的营销方式和用户体验。在这个背景下&#xff0c;美摄科技凭借其强大的技术实力和创新精神&#xff0c;推出了一款专为企业打造的美摄AR特效制作工具&#xff0c;旨在帮助企业轻松实…...

鸿蒙4.0开发笔记之DevEco Studio页面操作router的pushUrl页面跳转与back返回上一页(五)

一、认识组件 关于HarmonyOS中ArkTS的基础组件请参见文章鸿蒙4.0开发笔记之ArkTs语言基础与基本组件结构&#xff08;四&#xff09; 二、实现页面跳转pushUrl 1、操作说明 实现页面跳转的核心便是router.pushUrl的调用&#xff0c;操作起来也很简单&#xff0c;总共就四步…...

20个CSS函数-释放设计创造力和响应能力

20个CSS函数-释放设计创造力和响应能力 CSS是网页设计的核心&#xff0c;使开发者和设计者能够制作出令人叹为观止和反应迅速的网页布局。CSS函数通过引入动态性和多功能性提升了我们的设计能力。在本文中&#xff0c;我们将开始讲解20个CSS函数。 1.rgba()&#xff1a;定义颜…...

Python MCP服务器开发指南:为LLM构建标准化工具调用接口

1. 项目概述&#xff1a;一个Python MCP服务器的诞生最近在折腾AI应用开发&#xff0c;特别是想让大语言模型&#xff08;LLM&#xff09;能更“接地气”&#xff0c;直接操作我本地或远程的工具和数据。这让我想到了一个概念&#xff1a;模型上下文协议。简单来说&#xff0c;…...

FP4量化训练中的均值偏差问题与Averis算法解析

1. FP4量化训练中的均值偏差问题解析在大型语言模型(LLM)的低比特量化训练中&#xff0c;FP4(W4A4G4)格式因其极低的内存占用和计算需求而备受关注。然而&#xff0c;这种超低精度训练面临一个根本性挑战&#xff1a;激活值的各向异性结构会导致数值不稳定问题。这种现象源于语…...

faster_whisper,视频转文字,并生成字幕文件

faster_whisper&#xff0c;视频转文字&#xff0c;并生成字幕文件&#xff08;附带exe&#xff09; 使用说明&#xff1a; –model&#xff1a;选 tiny/base/small/medium/large&#xff08;越大越准、越耗资源&#xff09;。 模型路径(medium)&#xff1a;C:\Users\XXX.cache…...

实用工具全面指南:FileMeta让你的Windows文件管理效率翻倍

实用工具全面指南&#xff1a;FileMeta让你的Windows文件管理效率翻倍 【免费下载链接】FileMeta Enable Explorer in Vista, Windows 7 and later to see, edit and search on tags and other metadata for any file type 项目地址: https://gitcode.com/gh_mirrors/fi/File…...

快速入门通过一个简单的Python示例了解Taotoken API调用全流程

快速入门通过一个简单的Python示例了解Taotoken API调用全流程 1. 准备工作 在开始调用Taotoken API之前&#xff0c;您需要完成几个简单的准备工作。首先&#xff0c;访问Taotoken平台并注册一个账号。注册过程与其他在线服务类似&#xff0c;只需提供基本的邮箱信息并设置密…...

告别繁琐配置!Win11下用Go一键编译fscan内网扫描器的保姆级教程

Win11极简编译指南&#xff1a;5分钟搞定fscan内网扫描器 每次看到那些需要配置Go环境、解决依赖问题的开源工具就头疼&#xff1f;作为一款高效的内网扫描工具&#xff0c;fscan的实用性毋庸置疑&#xff0c;但官方文档里那些晦涩的编译步骤确实让不少新手望而却步。今天我们就…...

【行业首发】Python标注工具链性能基准测试报告:Label Studio vs CVAT vs 自研框架(附压测数据)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Python 数据标注优化 自动化标注流程设计 在计算机视觉与NLP任务中&#xff0c;高质量标注数据是模型性能的基石。手动标注成本高、一致性差&#xff0c;因此需构建可复用、可验证的Python自动化标注流…...

TegraRcmGUI完整指南:5分钟掌握Switch注入工具,开启你的游戏主机定制之旅

TegraRcmGUI完整指南&#xff1a;5分钟掌握Switch注入工具&#xff0c;开启你的游戏主机定制之旅 【免费下载链接】TegraRcmGUI C GUI for TegraRcmSmash (Fuse Gele exploit for Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/te/TegraRcmGUI TegraRcmGU…...

告别PPT繁琐:用Markdown+Git打造高效演示文稿工作流

1. 项目概述&#xff1a;从“香蕉幻灯片”到高效演示工作流最近在整理技术分享和内部汇报材料时&#xff0c;我又一次被PPT折磨得够呛。倒不是功能不够用&#xff0c;而是从构思、设计到最终排版&#xff0c;整个流程太割裂了。直到我偶然发现了GitHub上一个名为“banana-slide…...

猫抓浏览器扩展实战:3步掌握网页视频音频资源高效下载

猫抓浏览器扩展实战&#xff1a;3步掌握网页视频音频资源高效下载 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常遇到这样的情况&#…...