t检验(连续变量)和卡方检验(分类变量)
目录
情形
不同种类的萼片差异
数据类型查看:
差异分析:
不同萼片的种类差异
数据准备
二分类卡方检验
绘图
情形
:当有两列数据进行分析比较时,一列为连续变量,一列数据为分类变量。
rm(list = ls())
library(ggplot2)
library(ggpubr)
library(cowplot)
data <- iris##鸢尾花数据集
data1 <- data[,c(1,5)]
data2 <- data1[data1$Species=="setosa"|data1$Species=="versicolor",]
##提取鸢尾花数据集的部分数据进行分析
如下整理鸢尾花部分数据:“Sepal.Length”是连续变量,“Species”只选择了两种数据。

分析两列数据:2种情况
①比较不同种类的萼片长度是否存在差异。
②比较不同萼片长度的种类是否存在差异。
不同种类的萼片差异
数据类型查看:
数据分布检测:第六讲 R-数据正态分布检验 - 知乎 (zhihu.com)
#①比较不同种类的萼片长度是否存在差异。
#分析方法选择
shapiro.test(data2$Sepal.Length)
#W = 0.96964, p-value = 0.02076 不符合正太分布#密度图
ggdensity(data2$Sepal.Length, main = "Density plot of sepal length",xlab = "sepal length")
#正态性测试对样本量敏感。小样本最常通过正态性测试。
#因此,重要的是将外观检查和显着性测试相结合以做出正确的决定
#综合分析也可以采用t检验
数据分布情况

差异分析:
#pdf("plot.pdf",width = 4,height = 4)##保存图片
p <- ggplot(na.omit(data2), aes(x = Species, y = Sepal.Length, fill = Species)) + geom_boxplot(aes(col = Species)) + scale_fill_manual(values = alpha(c("#3C6FAC","grey50"),0.8)) + scale_color_manual(values = c("#3C6FAC","grey50")) + xlab("Species") + ##X轴名称ylab("") + theme_bw() +#主题设置 theme(legend.position = "top",#添加图例#legend.title = "Species",#legend.key.size = unit(0.5, "cm"),#缩小图例大小axis.text.x = element_blank(),axis.text.y = element_blank(),axis.ticks = element_blank(),panel.border = element_blank(),panel.grid = element_blank(),panel.background = element_blank(),axis.title = element_text(size = 10),axis.text = element_text(size = 10)) + stat_compare_means(method = "t.test", #wilcox.test(检验方法选择)label = "p.signif",#展示星标** label.y = max(na.omit(data2$Sepal.Length)) * 0.95, label.x = 1.5, size = 8)
p

不同萼片的种类差异
将萼片长度分为二分类变量(如:长短),然后分析不同萼片组的种类是否存在差异
数据准备
##数据准备
rm(list = ls())
library(ggplot2)
library(ggpubr)
library(cowplot)
data <- iris##鸢尾花数据集
data1 <- data[,c(1,5)]
data2 <- data1[data1$Species=="setosa"|data1$Species=="versicolor",]#②不同萼片长度的种类是否存在差异
data3 <- data2[order(data2$Sepal.Length),]
#计算分割点(进行二分类设置)
point <- round(nrow(data3) / 2)##几分之几,自己设置
data3$SepalLength[1:point] <-"Low"
data3$SepalLength[point:nrow(data3)] <-"High" #详情
table(data3$Species,data3$SepalLength)High Low
setosa 6 44
versicolor 45 5
virginica 0 0

二分类卡方检验
R语言卡方检验最全总结_医学和生信笔记的博客-CSDN博客
R语言—卡方检验 - 知乎 (zhihu.com)
R=C=2时四格表卡方检验
当 n(样本量)≥40 且所有的T(期望频数)≥5时,用χ2检验的基本公式或四格表资料之χ2检验的专用公式;当P ≈ α时,改用四格表资料的 Fisher 确切概率法;
当 n≥40 但有 1≤T<5 时,用四格表资料χ2检验的校正公式,或改用四格表资料的 Fisher 确切概率法。
当 n<40,或 T<1时,用四格表资料的 Fisher 确切概率法。
#生成二维列联表
mytable <- table(data3$Species,data3$SepalLength)
mytable1 <-mytable[c(1,2),]##需要去除列联表中并没有的第三列(否则不能计算)
chisq.test(mytable1,correct = F) # 和SPSS一样
#结果:X-squared = 64, df = 1, p-value = 1.244e-15
#data3$Species,data3$SepalLength顺序不影响结果
绘图
比例计算
##绘制堆砌图并展示结果
#表格汇总结果(为了展示比例)
result <- data3 %>% group_by(Species, SepalLength) %>%summarize(count = n()) %>%mutate(proportion = count / sum(count))
print(result)# 输出结果
result <- as.data.frame(result)
result$proportion <- round(result$proportion*100,1)#保留1位小数
dat01 <- result[c(3,4),]#提取需要展示的数值的行(需要匹配X轴)
完整图
#pdf("plot.pdf",width = 4,height = 4)##保存图片
ggplot(data3,aes(x=SepalLength,#X轴fill=Species))+geom_bar(position = "fill")+scale_y_continuous(expand = expansion(mult=c(0.01,0.1)),##展示百分比labels = scales::percent_format())+scale_fill_manual(values = c("setosa"="#98d09d","versicolor"="#dadada"),##根据需求修改配色limits=c("setosa","versicolor"))+theme_set(theme_bw())+theme(panel.grid = element_blank())+#不展示网格线geom_text(data=dat01,##展示比例aes(x=SepalLength,y=0.05,#设置Y轴展示的位置label=paste0(dat01$proportion)),##展示的是比例inherit.aes = FALSE,vjust=-0.2)+geom_text(aes(x = 1.5, y = 1.1,#调整文本注释位置label = "p-value 1.244e-15"))+#添加P(前面计算)labs(title = "AAABBB",#标题x="SepalLength",y="Species")
dev.off()

更多绘图细节
ggplot2作图最全教程(上) - 知乎 (zhihu.com)
ggplot2作图最全教程(下) - 知乎 (zhihu.com)
相关文章:
t检验(连续变量)和卡方检验(分类变量)
目录 情形 不同种类的萼片差异 数据类型查看: 差异分析: 不同萼片的种类差异 数据准备 二分类卡方检验 绘图 情形 :当有两列数据进行分析比较时,一列为连续变量,一列数据为分类变量。 rm(list ls()) libra…...
PDF转Word,1行Python代码就够了,免费用
大家好,这里是程序员晚枫。 今年十一假期没出去旅游,在家里更新一套原创课程,👉给小白的《50讲Python自动化办公》。 所有功能,都只需要1行代码,非常适合非程序员入门Python使用。 目前全网播放量直逼100…...
【开源】基于Vue和SpringBoot的智能教学资源库系统
项目编号: S 050 ,文末获取源码。 \color{red}{项目编号:S050,文末获取源码。} 项目编号:S050,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 课程档案模块2.3 课…...
『亚马逊云科技产品测评』活动征文|通过Lightsail搭建个人笔记
提示:授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道 文章目录 前言实践知识储备Lightsail介绍Leanote介绍实践…...
基于JavaWeb+SSM+Vue家庭记账本微信小程序系统的设计和实现
基于JavaWebSSMVue家庭记账本微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 1.1选题背景 互联网是人类的基本需求,特别是在现代社会,个人…...
十二、h.264解码
前言 测试环境: ffmpeg的4.3.2自行编译版本windows环境qt5.12 完整代码: H264DncodeThread.h #ifndef H264DNCODETHREAD_H #define H264DNCODETHREAD_H#include <QObject> #include <QThread>extern "C" { #include <libavu…...
springboot前后端分离项目配置https接口(ssl证书)
文章目录 说明vue.js前端部署vue.js项目axios请求配置本地创建日志文件创建Dockerfile文件配置ssl证书nginx.confvue项目打包上传创建容器部署 后端springboot项目部署配置ssl证书打包部署 补充:jsk证书和pfx证书补充:两种证书的转化JKS转PFXPFX 转 JKS …...
智能小车速通版——手把手教程
考虑到大部分学校,会发放简易小车来作为智能车初期培训和筛选的工具, 于是,我写一个简单的教程,能够实现简单小车的电磁循迹。 通过这个教程,能够通过简化的步骤搭建寻迹小车,进而了解整个智能车是如何实…...
【C++】vector的介绍与使用
🧑🎓个人主页:简 料 🏆所属专栏:C 🏆个人社区:越努力越幸运社区 🏆简 介:简料简料,简单有料~在校大学生一枚,专注C/C/GO的干货分…...
【libGDX】使用Mesh绘制圆形
1 前言 使用Mesh绘制三角形 中介绍了绘制三角形的方法,使用Mesh绘制矩形 中介绍了绘制矩形的方法,本文将介绍绘制圆形的方法。 libGDX 以点、线段、三角形为图元,没有提供绘制圆形的接口。要绘制圆形边框,必须通过割圆法逼近圆形&…...
一个测试驱动的Spring Boot应用程序开发
文章目录 系统任务用户故事搭建开发环境Web应用的框架Spring Boot 自动配置三层架构领域建模域定义与领域驱动设计领域类 业务逻辑功能随机的Challenge验证 表示层RESTSpring Boot和REST API设计API第一个控制器序列化的工作方式使用Spring Boot测试控制器 小结 这里采用面向需…...
简单几步,借助Aapose.Cells将 Excel XLS 转换为PPT
数据呈现是商业和学术工作的一个重要方面。通常,您需要将数据从一种格式转换为另一种格式,以创建信息丰富且具有视觉吸引力的演示文稿。当您需要在幻灯片上呈现工作表数据时,需要从 Excel XLS 转换为 PowerPoint 演示文稿。在这篇博文中&…...
CSS特效016:天窗扬起合上的效果
CSS常用示例100专栏目录 本专栏记录的是经常使用的CSS示例与技巧,主要包含CSS布局,CSS特效,CSS花边信息三部分内容。其中CSS布局主要是列出一些常用的CSS布局信息点,CSS特效主要是一些动画示例,CSS花边是描述了一些CSS…...
基于SSM的济南旅游网站设计与实现
末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:Vue 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目:是 目录…...
【ArrayList是如何扩容(ArrayList、LinkedList、与Vector的区别)】
ArrayList、LinkedList、与Vector的区别 解读ArrayList 是一个可改变大小的数组LinkedList 是一个双向链表Vector 属强同步类 拓展知识面ArrayList是如何扩容?如何利用List实现LRU? 解读 List主要有ArrayList、LinkedList与Vector几种实现。这三者都实现…...
STM32_3(GPIO)
GPIO简介 GPIO(General Purpose Input Output)通用输入输出口8种输入输出模式输出模式可控制端口输出高电平,驱动LED、蜂鸣器、模拟通信协议输出时许等输入模式可读取端口的高低电平或电压,用于读取按键输入、外接模块电平信号输…...
【技巧】PDF文件如何编辑?
日常办公中我们经常会用到PDF文件,PDF具备很好的兼容性、稳定性及安全性,但却不容易编辑,那PDF要如何编辑呢? 如果打开PDF文件就只是只读的性质,说明文件是在线打开,或者通过PDF阅读器打开的,这…...
AR道具特效制作工具
AR(增强现实)技术已经逐渐渗透到各个行业,为企业带来了全新的营销方式和用户体验。在这个背景下,美摄科技凭借其强大的技术实力和创新精神,推出了一款专为企业打造的美摄AR特效制作工具,旨在帮助企业轻松实…...
鸿蒙4.0开发笔记之DevEco Studio页面操作router的pushUrl页面跳转与back返回上一页(五)
一、认识组件 关于HarmonyOS中ArkTS的基础组件请参见文章鸿蒙4.0开发笔记之ArkTs语言基础与基本组件结构(四) 二、实现页面跳转pushUrl 1、操作说明 实现页面跳转的核心便是router.pushUrl的调用,操作起来也很简单,总共就四步…...
20个CSS函数-释放设计创造力和响应能力
20个CSS函数-释放设计创造力和响应能力 CSS是网页设计的核心,使开发者和设计者能够制作出令人叹为观止和反应迅速的网页布局。CSS函数通过引入动态性和多功能性提升了我们的设计能力。在本文中,我们将开始讲解20个CSS函数。 1.rgba():定义颜…...
Python MCP服务器开发指南:为LLM构建标准化工具调用接口
1. 项目概述:一个Python MCP服务器的诞生最近在折腾AI应用开发,特别是想让大语言模型(LLM)能更“接地气”,直接操作我本地或远程的工具和数据。这让我想到了一个概念:模型上下文协议。简单来说,…...
FP4量化训练中的均值偏差问题与Averis算法解析
1. FP4量化训练中的均值偏差问题解析在大型语言模型(LLM)的低比特量化训练中,FP4(W4A4G4)格式因其极低的内存占用和计算需求而备受关注。然而,这种超低精度训练面临一个根本性挑战:激活值的各向异性结构会导致数值不稳定问题。这种现象源于语…...
faster_whisper,视频转文字,并生成字幕文件
faster_whisper,视频转文字,并生成字幕文件(附带exe) 使用说明: –model:选 tiny/base/small/medium/large(越大越准、越耗资源)。 模型路径(medium):C:\Users\XXX.cache…...
实用工具全面指南:FileMeta让你的Windows文件管理效率翻倍
实用工具全面指南:FileMeta让你的Windows文件管理效率翻倍 【免费下载链接】FileMeta Enable Explorer in Vista, Windows 7 and later to see, edit and search on tags and other metadata for any file type 项目地址: https://gitcode.com/gh_mirrors/fi/File…...
快速入门通过一个简单的Python示例了解Taotoken API调用全流程
快速入门通过一个简单的Python示例了解Taotoken API调用全流程 1. 准备工作 在开始调用Taotoken API之前,您需要完成几个简单的准备工作。首先,访问Taotoken平台并注册一个账号。注册过程与其他在线服务类似,只需提供基本的邮箱信息并设置密…...
告别繁琐配置!Win11下用Go一键编译fscan内网扫描器的保姆级教程
Win11极简编译指南:5分钟搞定fscan内网扫描器 每次看到那些需要配置Go环境、解决依赖问题的开源工具就头疼?作为一款高效的内网扫描工具,fscan的实用性毋庸置疑,但官方文档里那些晦涩的编译步骤确实让不少新手望而却步。今天我们就…...
【行业首发】Python标注工具链性能基准测试报告:Label Studio vs CVAT vs 自研框架(附压测数据)
更多请点击: https://intelliparadigm.com 第一章:Python 数据标注优化 自动化标注流程设计 在计算机视觉与NLP任务中,高质量标注数据是模型性能的基石。手动标注成本高、一致性差,因此需构建可复用、可验证的Python自动化标注流…...
TegraRcmGUI完整指南:5分钟掌握Switch注入工具,开启你的游戏主机定制之旅
TegraRcmGUI完整指南:5分钟掌握Switch注入工具,开启你的游戏主机定制之旅 【免费下载链接】TegraRcmGUI C GUI for TegraRcmSmash (Fuse Gele exploit for Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/te/TegraRcmGUI TegraRcmGU…...
告别PPT繁琐:用Markdown+Git打造高效演示文稿工作流
1. 项目概述:从“香蕉幻灯片”到高效演示工作流最近在整理技术分享和内部汇报材料时,我又一次被PPT折磨得够呛。倒不是功能不够用,而是从构思、设计到最终排版,整个流程太割裂了。直到我偶然发现了GitHub上一个名为“banana-slide…...
猫抓浏览器扩展实战:3步掌握网页视频音频资源高效下载
猫抓浏览器扩展实战:3步掌握网页视频音频资源高效下载 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常遇到这样的情况&#…...
