辨析常见的医学数据分析(相关性分析回归分析)
目录
1 常见的三种分类结果?
2 什么是相关性分析?
相关性分析的结果怎么看?
3 什么是回归分析?
1)前提
2)常见的回归模型
4 对于存在对照组实验的医学病例如何分析?
1)卡方检验
2)Fisher 精确概率法
为了更好理解下述辨析,假设有一份关于膝关节骨性关节炎的数据:(注:这里仅为示意,没有任何医学借鉴含义)
| 患者编号 | 年龄 | 性别 | BMI | 是否为关节炎 | 关节炎严重程度 | 软骨损伤类型 |
| 001 | 60 | 0 | 23.4 | 1-是 | 轻度 | 1-软骨软化 |
| 002 | 56 | 1 | 26.1 | 1-是 | 中度 | 2-软骨裂隙 |
| 003 | 64 | 0 | 25.5 | 1-是 | 轻度 | 3-局灶性缺损 |
| 004 | 63 | 0 | 26.8 | 1-是 | 重度 | 4-弥漫性变薄 |
| *软骨损伤类型的分类方式参考了文献《Deep Learning Approach for Evaluating Knee MR Images: Achieving High Diagnostic Performance for Cartilage Lesion Detection》 | ||||||
1 常见的三种分类结果?
二元分类:e.g. 是/否 为关节炎
多元有序分类:疾病严重程度的分级(分类结果有序且等差,e.g.轻度、中度、重度依次等差递增)
多元无序分类:疾病的种类,e.g.肺癌、乳腺癌、胃癌,这里如软骨损伤的类型。这些分类结果没有等级上的关系,都是并列关系的诊断结果。
2 什么是相关性分析?
两个变量之间是否存在相关性及计算相关程度的大小。
主要分为两类:线性相关 && 秩相关
| 线性相关分析 | 秩相关分析 | |
| 类型 | 参数检验 | 非参数检验 |
| 数据需求 | 双定量变量(连续型数值变量),均满足正态分布 | 定量或等级变量,即至少有一个变量为偏态分布或等级变量 |
| 分析方法 | Pearson相关 | Spearman相关 |
| 相关系数 | Pearson相关系数,r | Spearman相关系数, |
| p值与结论 | p<0.05:两变量总体线性相关 | p<0.05:两变量总体相关 |
| r值与结论 | |r| > 0.8,两变量存在极强的相关; 0.6 < |r| < 0.8,强相关; 0.4 < |r| < 0.6,中等相关; |r| < 0.4,弱相关。 | |
相关性分析的结果怎么看?
①先看显著性p值,(变量间是否存在显著性影响的关系)只有存在显著性相关(即 p < 0.05),再分析r值;(若不存在相关性,考虑筛选别的影响因子纳入表格)
②看相关性系数r值,判断变量间是显著强相关/中等相关/弱相关。
3 什么是回归分析?
如果说,相关性分析是看自变量对因变量是否有影响,那么,回归分析是看自变量如何影响因变量的模型拟合。
相关性分析基于两两变量直接的关系探究;而回归分析一次性纳入了所有可能相关的变量,模拟真实的环境以找到真正有独立影响性的因素,并得到这些因素是如何作用的。
1)前提
建立回归模型的多变量不能存在共线性的关系(如,BMI是由身高与体重的线性计算公式得到的,那么建立模型时就不能同时纳入BMI和体重两个自变量)
2)常见的回归模型
| 二元Logistic回归 | 适用于二元分类(是否发生疾病) |
| 多元有序Logistic回归 | 适用于多元有序分类 |
| 多元无序Logistic回归 | 适用于多元无序分类 |
| Cox回归 | 含有“时间数据”的二元Logistic回归 (疾病发生的速度) |
4 对于存在对照组实验的医学病例如何分析?
1)卡方检验
卡方检验进行分析的目的是比较差异性。
建立了两组假设:①零假设:观察组和对照组的作用结果一致。(如,某新药物【观察组】和常规药物【对照组】的疗效一致。)
②备选假设:观察组和对照组的作用结果显著不一致。(如,想要证实新药物的疗效更好。)
卡方检验的p值<0.05,则拒绝零假设,接受备选假设;反之,接受零假设。
参考:卡方(χ2),四格表应用条件,理论频数_weixin_34307464的博客-CSDN博客,由于基于卡方分布模型,使用卡方检验的前提:①样本总量>40;②四格表的理论频数≠0并且理论频数<5的样本不超过总样本数的20%。
2)Fisher 精确概率法
对于小样本,或四格表的理论频数=0的情况,使用Fisher 精确概率法。
目的: 以超几何分布为理论模型,用来检验一次随机实验的结果是否支持对于某个随机实验的假设,当测试结果出现小概率事件则认定原有假设不被支持。
同样地,Fisher 检验的p值<0.05,则拒绝零假设。
与卡方检验的区别在于:在实际计算当中分为单边检验(即超几何检验)和双边检测。实际应用中,Fisher检验前先有一个预期,如:想要得到新药比常规药的有效概率更大,则选择Fisher检验的“大于”的单侧;若只是想要得到新药与常规药的有效性有差异,则选择Fisher双边检测。
相关文章:
辨析常见的医学数据分析(相关性分析回归分析)
目录 1 常见的三种分类结果? 2 什么是相关性分析? 相关性分析的结果怎么看? 3 什么是回归分析? 1)前提 2)常见的回归模型 4 对于存在对照组实验的医学病例如何分析? 1)卡方检验…...
SpringBoot项目中只执行一次的任务写法
SpringBoot项目中只执行一次的任务写法 有时候我们需要进行初始化工作,就说明只要进行一次的工作,那么,在Springboot项目中如何做到任务只进行一次呢 利用定时任务 在Spring Boot项目中,你可以使用Spring框架提供的Scheduled注解…...
TCK、TMS、TDI、TDO的含义
这四个信号是JTAG(Joint Test Action Group)界面的一部分。JTAG是一种用于测试和验证集成电路和印刷电路板的技术,也用于进行设备编程和调试。这四个信号分别是: TCK (Test Clock): 意义:测试时钟ÿ…...
R语言RSTAN MCMC:NUTS采样算法用LASSO 构建贝叶斯线性回归模型分析职业声望数据...
全文链接:http://tecdat.cn/?p24456 如果你正在进行统计分析:想要加一些先验信息,最终你想要的是预测。所以你决定使用贝叶斯(点击文末“阅读原文”获取完整代码数据)。 相关视频 但是,你没有共轭先验。你…...
【PowerShell】PowerShell的Core版本的额外配置
在PowerShell 7.1 安装完成后,默认情况下打开PowerShell 会直接进入到系统内置的PowerShell,如果希望通过远程连接或者PowerShell Web Access 进入到PowerShell 7环境的界面,就需要进行环境的再配置才能实现PowerShell 7.1 的环境连接。需要为外部的环境提供连接的话需要按照…...
数据结构----链式栈
目录 前言 链式栈 操作方式 1.存储结构 2.初始化 3.创建节点 4.判断是否满栈 5.判断是否空栈 6.入栈 7.出栈 8.获取栈顶元素 9.遍历栈 10.清空栈 完整代码 前言 前面我们学习过了数组栈的相关方法,(链接:线性表-----栈(栈…...
实在智能携手40+央企,探索财务大模型及数智化实践与应用
“这次培训给我一个最大的感触就是,过去以为AI智能化、大模型技术是很高深的事情。但现在,我们通过RPA等数字化工具,自主根据自己的工作岗位,完成业务自动化流程的开发和设计。AI技术没有想象中的那么难入门。” 这是一位参加了“…...
upload-labs文件上传1-5关
第一关 编写一句话木马1.php,编写完成后将后缀名修改为png 将1.png上传,上传时使用bp抓包 抓包后将后缀名修改为png 连接蚁剑 第二关 上传1.php,显示文件类型不正确 使用bp抓包发送重发器,修改文件后缀名后点击发送,…...
git的基本使用
查看当前分支 git branch //查看本地分支 git branch -a // 查看本地和远程的分支切分支 git checkout -b 分支的名字从当前分支切换到其他分支 拉取远程分支到本地 拉取远程develop分支代码到本地develop分支 git checkout -b develop origin/developgit merge B分支合并…...
Mac台式电脑内存清理方法教程
对于一些小白用户,如果觉得以上的清理方法比较复杂却又想要更好的优化Mac电脑内存,专业的系统清理软件是一个不错的选择。比起花几个小时时间浏览文件夹、删除临时文件、缓存和卸载残留。Cleanmymac X,只需单击几下即可完成所有内存清理工作&…...
FL Studio怎么破解?2023年最新FL Studio 21图文安装激活教程?FL 21中文版下载 v21.1.1.3750 汉化 版
fl studio21中文解锁特别破解版是一款功能强大的编曲软件,也就是众所熟知的水果软件。它可以编曲、剪辑、录音、混音,让您的计算机成为全功能录音室。除此之外,这款软件功能非常强大,为用户提供了许多音频处理工具,包含…...
Zookeeper高级_四字命令
之前使用stat命令来验证ZooKeeper服务器是否启动成功,这里的stat命令就是ZooKeeper 中最为典型的命令之一。ZooKeeper中有很多类似的命令,它们的长度通常都是4个英文字母,因此我们称之为“四字命令”。 添加配置 vim zoo.cfg 4lw.commands…...
/usr/bin/ld: cannot find -lmysqlcllient
文章目录 1. question: /usr/bin/ld: cannot find -lmysqlcllient2. solution 1. question: /usr/bin/ld: cannot find -lmysqlcllient 2. solution 在 使用编译命令 -lmysqlclient时,如果提示这个信息。 先确认一下 有没有安装mysql-devel 执行如下命令 yum inst…...
折线图geom_line()参数选项
往期折线图教程 图形复现| 使用R语言绘制折线图折线图指定位置标记折线图形状更改 | 绘制动态折线图跟着NC学作图 | 使用python绘制折线图 前言 我们折线的专栏推出一段时间,但是由于个人的原因,一直未进行更新。那么今天,我们也参考《R语…...
百度SEO优化基本原理(掌握SEO基础,提高网站排名)
随着互联网的迅速发展,越来越多的企业开始意识到网站优化的重要性,其中百度SEO优化是企业不可忽视的一项工作。本文将介绍百度SEO优化的基本概念、步骤、原理、解决方法和提升网站标题优化的方法。蘑菇号-www.mooogu.cn 百度SEO优化是指针对百度搜索引擎…...
2023 ICPC 网络赛 第一场 部分题解 (待完善)
D Transitivity 题解: 根据题意可以推出结论: 如果存在连通块,那么这个连通块要满足条件,必然是满连通块. 一共有两种情况 1. 存在一个连通块不是满连通块 设cnt表示连通块的节点个数, num表示连通块边的个数 一个连通块的贡献 cnt*(cnt-1)/2 - num; 那么最终答案 连…...
Hadoop的HDFS高可用方案
一、Hadoop高可用简介 Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFSNameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂 1、HDFS系统高可用简介…...
【计算机基础】让我们重新认识一下Visual Stduio及其操作,知识点汇总!!
📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…...
使用Node构建私人代理池
在进行大规模数据采集时,经常会遇到网站反爬虫机制导致爬虫被封的问题。为了解决这个困扰,本文将向大家介绍如何利用Node.js构建私人代理池,提供稳定的代理,实现高效、可靠的爬虫操作。跟随本文一起学习,拥有解封爬虫的…...
2023年“羊城杯”网络安全大赛 决赛 AWDP [Break+Fix] Web方向题解wp 全
终于迎来了我的第一百篇文章。 这次决赛赛制是AWDP。BreakFix,其实就是CTFFix,Fix规则有点难崩。Break和Fix题目是一样的。 总结一下:败北,还是太菜了得继续修炼一下。 一、Break ezSSTI 看到是SSTI,焚靖直接一把梭…...
告别重复造轮子:用快马一键生成可扩展的高效ibbot开发框架
最近在开发一个智能对话机器人(ibbot)时,发现每次从零开始搭建框架都要重复处理很多基础工作。经过一番探索,我发现用InsCode(快马)平台可以快速生成可扩展的项目框架,效率提升非常明显。下面分享下我的实践心得&#…...
Windows下Git 2.43.2安装全攻略:从下载到配置的避坑指南
Windows下Git 2.43.2安装全攻略:从下载到配置的避坑指南 对于Windows开发者而言,Git已经成为版本控制的标准工具。但许多新手在初次安装时,面对密密麻麻的选项和术语常常感到困惑。本文将带你一步步完成Git 2.43.2的安装过程,不仅…...
利用Google Earth与KML技术高效提取数字高程等高线
1. 从零开始认识数字高程与KML技术 数字高程模型(DEM)就像给地球表面拍了一张"立体照片",它能精确记录每个位置的海拔高度。我第一次接触DEM数据时,被它的实用性震惊了——从洪水模拟到城市规划,再到手机导…...
半导体工艺模拟进阶:如何用Sentaurus Sprocess实现精确的刻蚀/沉积建模
半导体工艺模拟进阶:Sentaurus Sprocess刻蚀与沉积建模实战解析 在半导体制造工艺开发中,TCAD仿真已成为缩短研发周期、降低试错成本的关键工具。作为Synopsys Sentaurus套件的核心模块,Sprocess凭借其精确的几何处理能力和丰富的工艺模型库&…...
闲鱼AI客服终极指南:7×24小时自动化值守完整教程
闲鱼AI客服终极指南:724小时自动化值守完整教程 【免费下载链接】XianyuAutoAgent 智能闲鱼客服机器人系统:专为闲鱼平台打造的AI值守解决方案,实现闲鱼平台724小时自动化值守,支持多专家协同决策、智能议价和上下文感知对话。 …...
MATLAB科研绘图:如何用title/legend/grid on让你的论文图表通过审稿人‘火眼金睛’?
MATLAB科研绘图:学术图表标注的审稿人级优化指南 科研图表是论文的"门面",审稿人往往在30秒内就能通过图表质量判断研究的严谨性。我曾参与多个顶级期刊的图表评审工作,发现90%的退稿图表问题都出在标注细节上——不是数据不好&…...
[嵌入式系统]的[WiFi网络配置]:从[连接不稳定]到[可靠通信]的实践指南
[嵌入式系统]的[WiFi网络配置]:从[连接不稳定]到[可靠通信]的实践指南 【免费下载链接】arduino-esp32 Arduino core for the ESP32 项目地址: https://gitcode.com/GitHub_Trending/ar/arduino-esp32 1. 问题发现:WiFi连接的隐形障碍 当我们在开…...
解决Lumerical(FDTD)中lumapi模块导入失败的完整指南
1. 为什么会出现lumapi导入失败的问题 第一次遇到import lumapi报错的时候,我也是一头雾水。明明按照官方文档安装了Lumerical软件和lumopt扩展包,怎么Python就找不到这个模块呢?后来经过多次实践和排查,发现这个问题在Windows系统…...
OpenDrop用户画像分析:揭秘不同用户群体的文件传输习惯与使用场景
OpenDrop用户画像分析:揭秘不同用户群体的文件传输习惯与使用场景 【免费下载链接】opendrop An open Apple AirDrop implementation written in Python 项目地址: https://gitcode.com/gh_mirrors/op/opendrop OpenDrop是一个开源Apple AirDrop实现…...
C++游戏开发实战:从零构建局域网联机对战系统(附完整代码解析)
1. 为什么选择C开发局域网联机游戏? 用C做游戏联机功能就像给汽车装涡轮增压——虽然需要点技术含量,但跑起来是真的爽。我十年前第一次用C写联机坦克大战时,看着两台电脑上的坦克同步开火,那种成就感至今难忘。 性能优势是首要原…...
