辨析常见的医学数据分析(相关性分析回归分析)
目录
1 常见的三种分类结果?
2 什么是相关性分析?
相关性分析的结果怎么看?
3 什么是回归分析?
1)前提
2)常见的回归模型
4 对于存在对照组实验的医学病例如何分析?
1)卡方检验
2)Fisher 精确概率法
为了更好理解下述辨析,假设有一份关于膝关节骨性关节炎的数据:(注:这里仅为示意,没有任何医学借鉴含义)
| 患者编号 | 年龄 | 性别 | BMI | 是否为关节炎 | 关节炎严重程度 | 软骨损伤类型 |
| 001 | 60 | 0 | 23.4 | 1-是 | 轻度 | 1-软骨软化 |
| 002 | 56 | 1 | 26.1 | 1-是 | 中度 | 2-软骨裂隙 |
| 003 | 64 | 0 | 25.5 | 1-是 | 轻度 | 3-局灶性缺损 |
| 004 | 63 | 0 | 26.8 | 1-是 | 重度 | 4-弥漫性变薄 |
| *软骨损伤类型的分类方式参考了文献《Deep Learning Approach for Evaluating Knee MR Images: Achieving High Diagnostic Performance for Cartilage Lesion Detection》 | ||||||
1 常见的三种分类结果?
二元分类:e.g. 是/否 为关节炎
多元有序分类:疾病严重程度的分级(分类结果有序且等差,e.g.轻度、中度、重度依次等差递增)
多元无序分类:疾病的种类,e.g.肺癌、乳腺癌、胃癌,这里如软骨损伤的类型。这些分类结果没有等级上的关系,都是并列关系的诊断结果。
2 什么是相关性分析?
两个变量之间是否存在相关性及计算相关程度的大小。
主要分为两类:线性相关 && 秩相关
| 线性相关分析 | 秩相关分析 | |
| 类型 | 参数检验 | 非参数检验 |
| 数据需求 | 双定量变量(连续型数值变量),均满足正态分布 | 定量或等级变量,即至少有一个变量为偏态分布或等级变量 |
| 分析方法 | Pearson相关 | Spearman相关 |
| 相关系数 | Pearson相关系数,r | Spearman相关系数, |
| p值与结论 | p<0.05:两变量总体线性相关 | p<0.05:两变量总体相关 |
| r值与结论 | |r| > 0.8,两变量存在极强的相关; 0.6 < |r| < 0.8,强相关; 0.4 < |r| < 0.6,中等相关; |r| < 0.4,弱相关。 | |
相关性分析的结果怎么看?
①先看显著性p值,(变量间是否存在显著性影响的关系)只有存在显著性相关(即 p < 0.05),再分析r值;(若不存在相关性,考虑筛选别的影响因子纳入表格)
②看相关性系数r值,判断变量间是显著强相关/中等相关/弱相关。
3 什么是回归分析?
如果说,相关性分析是看自变量对因变量是否有影响,那么,回归分析是看自变量如何影响因变量的模型拟合。
相关性分析基于两两变量直接的关系探究;而回归分析一次性纳入了所有可能相关的变量,模拟真实的环境以找到真正有独立影响性的因素,并得到这些因素是如何作用的。
1)前提
建立回归模型的多变量不能存在共线性的关系(如,BMI是由身高与体重的线性计算公式得到的,那么建立模型时就不能同时纳入BMI和体重两个自变量)
2)常见的回归模型
| 二元Logistic回归 | 适用于二元分类(是否发生疾病) |
| 多元有序Logistic回归 | 适用于多元有序分类 |
| 多元无序Logistic回归 | 适用于多元无序分类 |
| Cox回归 | 含有“时间数据”的二元Logistic回归 (疾病发生的速度) |
4 对于存在对照组实验的医学病例如何分析?
1)卡方检验
卡方检验进行分析的目的是比较差异性。
建立了两组假设:①零假设:观察组和对照组的作用结果一致。(如,某新药物【观察组】和常规药物【对照组】的疗效一致。)
②备选假设:观察组和对照组的作用结果显著不一致。(如,想要证实新药物的疗效更好。)
卡方检验的p值<0.05,则拒绝零假设,接受备选假设;反之,接受零假设。
参考:卡方(χ2),四格表应用条件,理论频数_weixin_34307464的博客-CSDN博客,由于基于卡方分布模型,使用卡方检验的前提:①样本总量>40;②四格表的理论频数≠0并且理论频数<5的样本不超过总样本数的20%。
2)Fisher 精确概率法
对于小样本,或四格表的理论频数=0的情况,使用Fisher 精确概率法。
目的: 以超几何分布为理论模型,用来检验一次随机实验的结果是否支持对于某个随机实验的假设,当测试结果出现小概率事件则认定原有假设不被支持。
同样地,Fisher 检验的p值<0.05,则拒绝零假设。
与卡方检验的区别在于:在实际计算当中分为单边检验(即超几何检验)和双边检测。实际应用中,Fisher检验前先有一个预期,如:想要得到新药比常规药的有效概率更大,则选择Fisher检验的“大于”的单侧;若只是想要得到新药与常规药的有效性有差异,则选择Fisher双边检测。
相关文章:
辨析常见的医学数据分析(相关性分析回归分析)
目录 1 常见的三种分类结果? 2 什么是相关性分析? 相关性分析的结果怎么看? 3 什么是回归分析? 1)前提 2)常见的回归模型 4 对于存在对照组实验的医学病例如何分析? 1)卡方检验…...
SpringBoot项目中只执行一次的任务写法
SpringBoot项目中只执行一次的任务写法 有时候我们需要进行初始化工作,就说明只要进行一次的工作,那么,在Springboot项目中如何做到任务只进行一次呢 利用定时任务 在Spring Boot项目中,你可以使用Spring框架提供的Scheduled注解…...
TCK、TMS、TDI、TDO的含义
这四个信号是JTAG(Joint Test Action Group)界面的一部分。JTAG是一种用于测试和验证集成电路和印刷电路板的技术,也用于进行设备编程和调试。这四个信号分别是: TCK (Test Clock): 意义:测试时钟ÿ…...
R语言RSTAN MCMC:NUTS采样算法用LASSO 构建贝叶斯线性回归模型分析职业声望数据...
全文链接:http://tecdat.cn/?p24456 如果你正在进行统计分析:想要加一些先验信息,最终你想要的是预测。所以你决定使用贝叶斯(点击文末“阅读原文”获取完整代码数据)。 相关视频 但是,你没有共轭先验。你…...
【PowerShell】PowerShell的Core版本的额外配置
在PowerShell 7.1 安装完成后,默认情况下打开PowerShell 会直接进入到系统内置的PowerShell,如果希望通过远程连接或者PowerShell Web Access 进入到PowerShell 7环境的界面,就需要进行环境的再配置才能实现PowerShell 7.1 的环境连接。需要为外部的环境提供连接的话需要按照…...
数据结构----链式栈
目录 前言 链式栈 操作方式 1.存储结构 2.初始化 3.创建节点 4.判断是否满栈 5.判断是否空栈 6.入栈 7.出栈 8.获取栈顶元素 9.遍历栈 10.清空栈 完整代码 前言 前面我们学习过了数组栈的相关方法,(链接:线性表-----栈(栈…...
实在智能携手40+央企,探索财务大模型及数智化实践与应用
“这次培训给我一个最大的感触就是,过去以为AI智能化、大模型技术是很高深的事情。但现在,我们通过RPA等数字化工具,自主根据自己的工作岗位,完成业务自动化流程的开发和设计。AI技术没有想象中的那么难入门。” 这是一位参加了“…...
upload-labs文件上传1-5关
第一关 编写一句话木马1.php,编写完成后将后缀名修改为png 将1.png上传,上传时使用bp抓包 抓包后将后缀名修改为png 连接蚁剑 第二关 上传1.php,显示文件类型不正确 使用bp抓包发送重发器,修改文件后缀名后点击发送,…...
git的基本使用
查看当前分支 git branch //查看本地分支 git branch -a // 查看本地和远程的分支切分支 git checkout -b 分支的名字从当前分支切换到其他分支 拉取远程分支到本地 拉取远程develop分支代码到本地develop分支 git checkout -b develop origin/developgit merge B分支合并…...
Mac台式电脑内存清理方法教程
对于一些小白用户,如果觉得以上的清理方法比较复杂却又想要更好的优化Mac电脑内存,专业的系统清理软件是一个不错的选择。比起花几个小时时间浏览文件夹、删除临时文件、缓存和卸载残留。Cleanmymac X,只需单击几下即可完成所有内存清理工作&…...
FL Studio怎么破解?2023年最新FL Studio 21图文安装激活教程?FL 21中文版下载 v21.1.1.3750 汉化 版
fl studio21中文解锁特别破解版是一款功能强大的编曲软件,也就是众所熟知的水果软件。它可以编曲、剪辑、录音、混音,让您的计算机成为全功能录音室。除此之外,这款软件功能非常强大,为用户提供了许多音频处理工具,包含…...
Zookeeper高级_四字命令
之前使用stat命令来验证ZooKeeper服务器是否启动成功,这里的stat命令就是ZooKeeper 中最为典型的命令之一。ZooKeeper中有很多类似的命令,它们的长度通常都是4个英文字母,因此我们称之为“四字命令”。 添加配置 vim zoo.cfg 4lw.commands…...
/usr/bin/ld: cannot find -lmysqlcllient
文章目录 1. question: /usr/bin/ld: cannot find -lmysqlcllient2. solution 1. question: /usr/bin/ld: cannot find -lmysqlcllient 2. solution 在 使用编译命令 -lmysqlclient时,如果提示这个信息。 先确认一下 有没有安装mysql-devel 执行如下命令 yum inst…...
折线图geom_line()参数选项
往期折线图教程 图形复现| 使用R语言绘制折线图折线图指定位置标记折线图形状更改 | 绘制动态折线图跟着NC学作图 | 使用python绘制折线图 前言 我们折线的专栏推出一段时间,但是由于个人的原因,一直未进行更新。那么今天,我们也参考《R语…...
百度SEO优化基本原理(掌握SEO基础,提高网站排名)
随着互联网的迅速发展,越来越多的企业开始意识到网站优化的重要性,其中百度SEO优化是企业不可忽视的一项工作。本文将介绍百度SEO优化的基本概念、步骤、原理、解决方法和提升网站标题优化的方法。蘑菇号-www.mooogu.cn 百度SEO优化是指针对百度搜索引擎…...
2023 ICPC 网络赛 第一场 部分题解 (待完善)
D Transitivity 题解: 根据题意可以推出结论: 如果存在连通块,那么这个连通块要满足条件,必然是满连通块. 一共有两种情况 1. 存在一个连通块不是满连通块 设cnt表示连通块的节点个数, num表示连通块边的个数 一个连通块的贡献 cnt*(cnt-1)/2 - num; 那么最终答案 连…...
Hadoop的HDFS高可用方案
一、Hadoop高可用简介 Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFSNameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂 1、HDFS系统高可用简介…...
【计算机基础】让我们重新认识一下Visual Stduio及其操作,知识点汇总!!
📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…...
使用Node构建私人代理池
在进行大规模数据采集时,经常会遇到网站反爬虫机制导致爬虫被封的问题。为了解决这个困扰,本文将向大家介绍如何利用Node.js构建私人代理池,提供稳定的代理,实现高效、可靠的爬虫操作。跟随本文一起学习,拥有解封爬虫的…...
2023年“羊城杯”网络安全大赛 决赛 AWDP [Break+Fix] Web方向题解wp 全
终于迎来了我的第一百篇文章。 这次决赛赛制是AWDP。BreakFix,其实就是CTFFix,Fix规则有点难崩。Break和Fix题目是一样的。 总结一下:败北,还是太菜了得继续修炼一下。 一、Break ezSSTI 看到是SSTI,焚靖直接一把梭…...
生成xcframework
打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式,可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。 使用 Xcode 命令行工具打包 通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...
解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八
现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet,点击确认后如下提示 最终上报fail 解决方法 内核升级导致,需要在新内核下重新下载编译安装 查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...
Keil 中设置 STM32 Flash 和 RAM 地址详解
文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面(Target 选项卡)1. IROM1(用于配置 Flash)2. IRAM1(用于配置 RAM)二、链接器设置界面(Linker 选项卡)1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数(如果没有勾选上面…...
从零实现STL哈希容器:unordered_map/unordered_set封装详解
本篇文章是对C学习的STL哈希容器自主实现部分的学习分享 希望也能为你带来些帮助~ 那咱们废话不多说,直接开始吧! 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...
select、poll、epoll 与 Reactor 模式
在高并发网络编程领域,高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表,以及基于它们实现的 Reactor 模式,为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。 一、I…...
视频行为标注工具BehaviLabel(源码+使用介绍+Windows.Exe版本)
前言: 最近在做行为检测相关的模型,用的是时空图卷积网络(STGCN),但原有kinetic-400数据集数据质量较低,需要进行细粒度的标注,同时粗略搜了下已有开源工具基本都集中于图像分割这块,…...
使用Spring AI和MCP协议构建图片搜索服务
目录 使用Spring AI和MCP协议构建图片搜索服务 引言 技术栈概览 项目架构设计 架构图 服务端开发 1. 创建Spring Boot项目 2. 实现图片搜索工具 3. 配置传输模式 Stdio模式(本地调用) SSE模式(远程调用) 4. 注册工具提…...
鸿蒙(HarmonyOS5)实现跳一跳小游戏
下面我将介绍如何使用鸿蒙的ArkUI框架,实现一个简单的跳一跳小游戏。 1. 项目结构 src/main/ets/ ├── MainAbility │ ├── pages │ │ ├── Index.ets // 主页面 │ │ └── GamePage.ets // 游戏页面 │ └── model │ …...
微服务通信安全:深入解析mTLS的原理与实践
🔥「炎码工坊」技术弹药已装填! 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 一、引言:微服务时代的通信安全挑战 随着云原生和微服务架构的普及,服务间的通信安全成为系统设计的核心议题。传统的单体架构中&…...
rknn toolkit2搭建和推理
安装Miniconda Miniconda - Anaconda Miniconda 选择一个 新的 版本 ,不用和RKNN的python版本保持一致 使用 ./xxx.sh进行安装 下面配置一下载源 # 清华大学源(最常用) conda config --add channels https://mirrors.tuna.tsinghua.edu.cn…...
