当前位置: 首页 > news >正文

多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

            生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是非常重要和实用的多元数据分析方法和统计工具,其中分类(classification)/分组(grouping)和梯度(gradient)/排序(ordination)分析是多元统计分析的核心内容。分类/分组分析主要包括聚类(如层次聚类和k-means聚类等)和辨别分析(如线性辨别分析和mental检验等);梯度/排序分析分为非约束排序(如PCA和CA等)和约束排序(如RDA和CCA等)两大类(详见课程介绍)。

         但初学者在应用多元统计分析方法时往往非常困惑,这种困惑主要来自几个方面:首先,多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

其次,在多元分析中很多术语都有别称,如非约束排序也叫间接梯度分析;

再次,多元数据类型包括连续型数据、计数数据、分类数据及混合类型数据,不同数据类型如何选择合适的方法?

本文将梳理多元统计中分类/分组和排序/梯度分析各方法不同应用情境,包括生态环境多元数据分析概述、R基础及数据探索、多元数据梯度分析、多元数据分组分析及统计结果作图。课程将通过大量具体案例,利用R语言相关包示范各种方法实现途径,使大家面对多元数据分析时能够驾轻就熟,从容面对。

多元统计方法概念定义

纷繁的多元统计方法应用情景、异同点

多元统计方法数据或变量类型和结构

 R基础及数据探索 (Working with R and Data screening)

R和Rstudio简介及入门和作图基础

R及Rstudio介绍:背景、软件及程序包安装、基本设置等

2) R语言基本操作,包括向量、矩阵、数据框及数据列表等生成和数据提取等

3) R语言数据文件读取、整理(清洗)、结果存储等(含tidverse)

4) R语言基础绘图(含ggplot):基本绘图、排版、发表质量绘图输出存储

 

群落数据准备及探索分析

生物群落数据准备:物种组成、环境变量、物种功能属性、系统发育树等

2) 生物群落数据检查:缺失值和离群值(outliers)等-避免模型错进错出(GIGO)

3) 物种多样性计算:物种多样性(TD)、功能多样性(FD)和系统发育多样性(PD)

4) 物种相似/相异矩阵关联测度介绍

 

多元数据分组分析 (Working with groups)

聚类(Cluster)分析上:非层次聚类(NHC)

1) 聚类及非层次聚类方法概述

2) 非层次聚类:K均值(K-means)聚类方法(kmeans;pam;clara)

3) 实例鸟类生境数据K均值聚类比较分析:聚类数确定、聚类稳定性、聚类结果评估、复合聚类值构建

 聚类(Cluster)分析下:层次聚类(NHC)

1)层次聚类方法简介:多元聚合层次聚类(PAHC) VS 多元分化层次聚类(PDHC)

2)层次聚类方法(hcluster和agnes)分类结果比较分析:碎石图、轮廓宽度、同表型相关图等

3) 案例1鸟类生境数据的层次聚类分析;案例2鱼类生境数据的层次聚类分析

辨别(Discrimination)分析上:分组差异性检验(Group Difference Test)

1) 多元群落数据分组差异分析及检验简介

2)(非参数)多元方差分析(NP-MANOVA/ADONIS/PERMANOVA)、多元置换过程(MRPP)、多元相似分析(ANOSIM)、Mantel检验(MANTEL)在多元数据差异性检验的应用

3)多元差异性检验多组数据比较实现方法:MRPP、Mantel

4)Mental方法在群落生态学‘标准’应用:空间取样距离、环境因子及物种组成关系及其偏Mental分析

5) 案例1乌龟适生生境差异性检验;案例2微生物组成数据差异分析;案例3鱼类群落、空间距离及环境因子相互关析分析

 

 辨别(Discrimination)分析中:线性辨别分析(LDA)

1) 辨别分析(DA)的多面性

2) 线性辨别(LDA)分析基本原理及流程:数据检查、评估假设、样本数量、变量选择、模型确定、结果解读及模型验证

3)其他辨别分析方法介绍(QDA,KNN等)

4) 案例乌龟适生生境辨别及预测

辨别(Discrimination)分析下:分类回归树(CART)及随机森林模型(RFM)

1) 生物群落数据的分类回归树简介

2) 分类回归树分析(CART)实现:分化准则、节点杂度、gini指数、先验概率效应、误分类代价、分类树裁剪、Monte Carlo检验、变量重要性评估、模型预测等

3) 随机森林模型(RFM)实现:算法流程、模型评估、变量重要性评估及模型分类与回归等

4) 案例1基于分类回归树的乌龟群落生境划分及预测

5)案例2基于随机森林模型的根际微生物群落与植物生长关系及变量重要性评估

多元数据梯度分析/(Working with gradients) 

间接梯度分析-非约束排序(Unconstrained ordination)上:PCA

1)生物群落数据的非约束排序简介

2) 主成分分析(PCA)的基本原理:假设条件、数据要求等

3)案例:鱼类生境数据的PCA排序分析实现-数据准备、检查(离群值、多元正态性、线性关系、样本独立性等)、结果验证、排序轴选择(特征根准则、累计解释率、随机断棍准则等)、结果解读、双序图等

间接梯度分析-非约束排序(Unconstrained ordination)下:PCoA、CA、DCA 及NMDS

1) 其他非约束方法介绍及应用情景: CA、DCA 、PCOA及NMDS

2) 案例1鸟类群落组成数据的对应分析(CA)及去趋势对应分析(DCA):数据准备、假设条件、总惯量、特征根、排序轴选择、结果解读、偶见种效应/弓形效应等

3) 案例2 基于距离/相似度指数或矩阵的主坐标排序(PCoA):距离/相似度指数选择、模型假设、负特征根问题、结果解读、排序图等

4) 案例3 NMDS排序方法应用:假设条件、基本分析流程、排序效果评估(应力值)、排序图等

5)案例4 药物对肠道微生物群落影响:PCoA+PERMANOVA

6)案例5 基于随机森林模型的蚂蚁多维属性特征预测:RF+PCA+PCoA+PERMANOVA

直接梯度分析-约束排序(Constrained ordination)上:RDA

生物群落数据的约束排序简介:非对称约束排序 VS 对称约束排序

2)生物群落数据非对称约束排序的基本流程:响应变量/物种选择(矩阵Y)、响应变量数据预处理(转换或标准化)、分析方法选择(RDA/db-RDA/CCA)、解释变量/约束变量选择(矩阵X)及分析和结果解读、评估及展示

3) 案例景观、斑块及立地条件对森林景观中蛾类群落物种组成的影响

直接梯度分析-约束排序(Constrained ordination)中:dbRDA、CCA及对称约束排序方法

案例1:基于距离矩阵的冗余分析(dbRDA):物种组成数据及0,1数据分析

2)案例2:群落物种多度数据的典范对应分析(CCA):单峰型环境梯度分析方法

3)案例3:对称约束排序方法介绍及物种组成、物种属性及环境变量相关关系第四角分析

直接梯度分析-约束排序(Constrained ordination)下:变差分解(Variance Partitioning) 

 群落数据多元统计分析变差分解简介

2) 偏回归分析与变差分解

3) 案例景观、斑块及立地条件及空间因素对森林景观蛾类群落物种组成变异的变差分解

 

 

 统计结果作图ggplot (Plotting the results)

群落数据及统计分析结果作图数据准备:结果提取、整理

PCA、CA、PCoA及NMDS等非约束排序图:排序图和双序图(biplot)

PCoA+PERMANOVA结果图:排序图+分组+PERMANOVA差异显著性+多重比较

RDA、db-RDA及CCA等约束排序图:三序图(triplot)和韦恩图(venn)

 

 

相关文章:

多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是非常重要和…...

有关白盒加密

白盒密码技术白皮书 有关白盒的概念 其实白盒黑盒之类概念其实是软件保护方面的概念,在很多方面都有应用,例如 黑盒: 传统的加密技术是默认假定处于黑盒中的,也就是假定攻击者无法获得密钥。具体而言,认为攻击者并…...

C#学习系列之image控件配合ffmpeg播放视频(bitmap转image)

C#学习系列之image控件配合ffmpeg播放视频(bitmap转image)啰嗦ffmpeg输入格式与输出格式bitmap数据在image控件上显示数据转化总结啰嗦 关于音视频解码问题,采用海思解码库进行解码,存在C#托管调用动态库,会出现卡顿的…...

电容笔和Apple pencil有什么区别?开学季电容笔排行榜

与苹果的 Pencil相比,市面上常见的电容笔在压感上是没有具备重力压感,只具备着一种倾斜压感。对于绘画没有过高要求的话,其实一支普通的平替电容笔,就能为我们解决日常很多问题。它不仅可以用在办公上,也可以用在笔记、…...

【蓝桥杯每日一题】递归算法

🍎 博客主页:🌙披星戴月的贾维斯 🍎 欢迎关注:👍点赞🍃收藏🔥留言 🍇系列专栏:🌙 蓝桥杯 🌙我与杀戮之中绽放,亦如黎明的花…...

java 寻找2020

题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 小蓝有一个数字矩阵,里面只包含数字 0 0 和 2 2。小蓝很喜欢 2020 2020,他想找 到这个数字矩阵中有多少个 2020 2020 。 小蓝只关注三种构成 …...

1.1 小白黑群晖构建,硬件推荐,硬件选购教程

构建一台黑群晖需要购买:CPU主板、散热器、内存条、机箱、电源、硬盘、网卡(可选)。物理机安装若需硬解需选择918/920此类机型系统进行安装。关联教程:黑群晖安装中的报错:https://guoqing.blog.csdn.net/article/deta…...

实验三、数字PID控制器的设计

实验三、数字PID控制器的设计 --- 直流闭环调速实验 一、实验目的 1.理解晶闸管直流单闭环调速系统的数学模型和工作原理;. 2. 掌握PID控制器参数对控制系统性能的影响; 3. 能够运用MATLAB/Simulink软件对控制系统进行正确建模并对模块进行正确的参数设置; 4.…...

python List和常用的方法

List:列表中包含多个数据,数据之间使用逗号分隔,索引从0开始。 空列表: dir:查看列表的所有方法 List常用方法:insert、append,extend、del、remove、pop、clear、count、index 增加insert(索引…...

PMP证书要怎么考,含金量怎么样?

对于新改版的PMP提纲,很多人都不知道如何去备考,这里我就总结一些经验,希望能帮助到大家!! 一,学习内容及考试形式? 学习内容:《PMBOK》项目管理知识体系指南,建议大家…...

MySQL实战解析底层---事务隔离:为什么你改了我还看不见

目录 前言 隔离性与隔离级别 事务隔离的实现 事务的启动方式 前言 和数据库打交道的时候,总是会用到事务最经典的例子就是转账,你要给朋友小王转 100 块钱,而此时你的银行卡只有 100 块钱转账过程具体到程序里会有一系列的操作&#xff0…...

变更数据捕获(CDC)

从广泛意义上说,全球许多企业每天都需要通过频繁的数据批量处理与加载,来定期将数据从一个数据库迁移到另一个数据库(或数据仓库)。这类定期批量加载的工作,往往既耗费时间,又会消耗原始系统的大量处理能力。因此,管理…...

【移动端表格组件】uniapp简单实现H5,小程序,APP多端兼容表格功能,复制即用,简单易懂【详细注释版本】

前言: 由于最近需要做移动端的项目 有个pc端的后台系统里面需要移一部分页面过来 而里面就有很多的表格,我就开始惯例网上先找前人栽的树,我好乘凉 然后找了一圈发现,不管是主流的移动端ui库或者网上自己写的帖子,或者…...

电子技术——CMOS 逻辑门电路

电子技术——CMOS 逻辑门电路 在本节我们介绍如何使用CMOS电路实现组合逻辑函数。在组合电路中,电路是瞬时发生的,也就是电路的输出之和当前的输入有关,并且电路是无记忆的也没有反馈。组合电路被大量的使用在当今的数字逻辑系统中。 晶体管…...

【C++】C++11 新特性

目录 1.列表初始化 1.1. C98中使用{}初始化的问题 1.2. 内置类型的列表初始化 1.3. 自定义类型的列表初始化 2. 变量类型推导 2.1. 为什么需要类型推导 2.2. decltype类型推导 2.2.1 为什么需要decltype 2.2.2. decltype 3. 对默认成员的控制(default、delete) 3.1. …...

JPA 相关注解说明

jpa相关注解 JPA(Java Persistence API)是一种Java规范,定义了一套标准的对象关系映射(ORM)API,用于将Java对象映射到关系型数据库中。JPA旨在统一各种ORM框架之间的差异,提供一种标准化的ORM解…...

SAP 生产订单/流程订单中日期的解释

SAP 生产订单/流程订单中日期的解释 基本开始日期:表示订单的开始日期 基本完成日期:表示订单的完成日期 我们在输入基本开始日期和基本完成日期时需要关注 调度 下面的“类型”,其中有向前、向后、当天日期等: 调度类型 为向前…...

Java设计模式笔记——七大设计原则

系列文章目录 第一章 Java 设计模式之七大设计原则 文章目录系列文章目录前言一、单一职责原则1.案例分析2.改进二、开闭原则1.案例分析2.改进三、里氏替换原则1.案例分析2.改进四、依赖倒转原则五、接口隔离原则1.案例分析2.改进六、合成复用原则1.案例分析2.改进七、迪米特原…...

记录第一次接口上线过程

新入职一家公司后,前三天一直在学习公司内部各种制度文化以及考试。 一直到第三天组长突然叫我过去,给了一个需求的思维导图,按照这个需求写这样一个接口, 其实还不错,不用自己去分析需求,按照这上面直接开…...

时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含验证Loss曲线)

时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含训练和验证Loss曲线) 目录 时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含训练和验证Loss曲线)效果一览基本描…...

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端,它允许HTTP与Elasticsearch 集群通信,而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点 轻量级&#xff…...

【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪 宝可梦GO游戏自组网系统

目录 游戏说明《宝可梦 Mesh GO》 —— 局域宝可梦探索Pokmon GO 类游戏核心理念应用场景Mesh 特性 宝可梦玩法融合设计游戏构想要素1. 地图探索(基于物理空间 广播范围)2. 野生宝可梦生成与广播3. 对战系统4. 道具与通信5. 延伸玩法 安全性设计 技术选…...

鸿蒙DevEco Studio HarmonyOS 5跑酷小游戏实现指南

1. 项目概述 本跑酷小游戏基于鸿蒙HarmonyOS 5开发,使用DevEco Studio作为开发工具,采用Java语言实现,包含角色控制、障碍物生成和分数计算系统。 2. 项目结构 /src/main/java/com/example/runner/├── MainAbilitySlice.java // 主界…...

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) ​梯度归一化(Gradient Normalization)​​ (2) ​判别器梯度间隙正则化(Discriminator Gradient Gap Regularization)​​ (3) ​自注意力机制(Self-Attention)​​ 3. 完整损失函数 二…...

NPOI Excel用OLE对象的形式插入文件附件以及插入图片

static void Main(string[] args) {XlsWithObjData();Console.WriteLine("输出完成"); }static void XlsWithObjData() {// 创建工作簿和单元格,只有HSSFWorkbook,XSSFWorkbook不可以HSSFWorkbook workbook new HSSFWorkbook();HSSFSheet sheet (HSSFSheet)workboo…...

django blank 与 null的区别

1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空 但是,要注意以下几点: Django的表单验证与null无关:null参数控制的是数据库层面字段是否可以为NULL,而blank参数控制的是Django表单验证时字…...

一些实用的chrome扩展0x01

简介 浏览器扩展程序有助于自动化任务、查找隐藏的漏洞、隐藏自身痕迹。以下列出了一些必备扩展程序,无论是测试应用程序、搜寻漏洞还是收集情报,它们都能提升工作流程。 FoxyProxy 代理管理工具,此扩展简化了使用代理(如 Burp…...

JDK 17 序列化是怎么回事

如何序列化?其实很简单,就是根据每个类型,用工厂类调用。逐个完成。 没什么漂亮的代码,只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...

SQL进阶之旅 Day 22:批处理与游标优化

【SQL进阶之旅 Day 22】批处理与游标优化 文章简述(300字左右) 在数据库开发中,面对大量数据的处理任务时,单条SQL语句往往无法满足性能需求。本篇文章聚焦“批处理与游标优化”,深入探讨如何通过批量操作和游标技术提…...

MeanFlow:何凯明新作,单步去噪图像生成新SOTA

1.简介 这篇文章介绍了一种名为MeanFlow的新型生成模型框架,旨在通过单步生成过程高效地将先验分布转换为数据分布。文章的核心创新在于引入了平均速度的概念,这一概念的引入使得模型能够通过单次函数评估完成从先验分布到数据分布的转换,显…...