当前位置: 首页 > article >正文

扩增子分析|基于R语言microeco包进行微生物群落网络分析(network网络、Zi-Pi关键物种和subnet子网络图)

一、引言

       microeco是福建农林大学姚敏杰教授团队开发的扩增子测序集成分析。该包综合了扩增子测序下游分析的多种功能包括群落组成、多样性、网络分析、零模型等等。通过简单的几行代码可实现复杂的分析。因此,microeco包发表以来被学界广泛关注,截止2024年10月13日已经被引644次,是领域内高被引文章。本系列推送将持续推出microeco包分析流程,这一期是微生物网络分析(network

       在微生物群落生态学研究中,微生物群落之间的相互作用是揭示微生物生态系统复杂性的关键。微生物之间的协作、竞争等关系构成了一个复杂的生态网络,通过这些网络,我们能够深入理解微生物如何在生态系统中相互影响、协同工作甚至争夺资源。网络分析的方法多种多样,如下阐述了选择microeco进行网络分析的理由。

1.1 为什么选择 microeco 进行网络分析?

高效、简便的网络构建:仅需几行代码便可完成复杂的网络构建。

支持多种相关性算法:根据研究需求,选择不同的相关性测量方式。

强大的可视化功能:与ggplot2igraph无缝集成,生成美观且信息丰富的网络图。

拓展功能丰富:不仅可以构建网络,还可以进行模块性、中心性等分析,深度挖掘微生物间的相互作用。

       如下所示阐述了microeco包中进行微生物网络构建和分析的流程。比较核心的内容是输入文件的准备,也就是微表(mirotable),microeco包进行多种分析的前提也是准备好基础数据,包括样本信息表:sample_info,特征表otu_table,分类信息表taxonomy_table,系统发育树phylo_tree和环境因子表env_data。当然不同的分析所需要的基础数据也不一样,系统发育树和环境因子表并不是所有分析都需要的。微表准备好了可以通过几行简单的代码进行下游分析。

二、文献美图欣赏

图源:Yuan, M.M., Guo, X., Wu, L. et al.Nat. Clim. Chang. 11, 343–348 (2021).

图片来源:Dai, T., Wen, D., Bates, C.T. et al. Nat Commun 13, 175 (2022).

三、示例数据和R代码

       这套代码基于microeco包自带的数据进行分析,同时我们也提供了读取自己数据的方法,可私信小编获取代码。

🌟数据基本操作之建立微表

#安装microeco包
if(!require("microeco")){install.packages("microeco")}
library(microeco)  
#安装并加载ape包
if(!require("ape")){install.packages("ape")}
library(ape)##################数据基本操作#######################
# 样本信息表;data.frame
data(sample_info_16S)
# 特征表;data.frame
data(otu_table_16S)
# 分类分配表;data.frame
data(taxonomy_table_16S)
# 系统发育树;不是必需的;用于系统发育分析
# Newick格式;使用ape包的read.tree函数读取树文件
data(phylo_tree_16S)
# 加载环境数据表(如果它不在样本表中)
data(env_data_16S)
# 使用magrittr包中的管道操作符
if(!require("magrittr")){install.packages("mgrittr")}
library(magrittr)
# 固定随机数生成,以使结果可重复
set.seed(123)
# 使绘图背景与教程相同
if(!require("ggplot2")){install.packages("ggplot2")}
library(ggplot2)
theme_set(theme_bw())# 统一分类信息,自动统一分类前缀
taxonomy_table_16S %<>% tidy_taxonomy# 在R6类中,'$new' 是用于创建类的新对象的原始方法
# 如果你只提供丰度表,该类可以帮助你创建一个样本信息表
mt <- microtable$new(otu_table = otu_table_16S)
# 通常情况下添加元数据
mt <- microtable$new(otu_table = otu_table_16S, sample_table = sample_info_16S)
mt
# 让我们创建一个包含更多信息的 microtable 对象
mt <- microtable$new(sample_table = sample_info_16S, otu_table = otu_table_16S, tax_table = taxonomy_table_16S, phylo_tree = phylo_tree_16S)

🌟数据清洗

#删除非细菌和古菌的OTU
# 使用 R 的 subset 函数过滤 tax_table 中的分类单元
mt$tax_table %<>% base::subset(Kingdom == "k__Archaea" | Kingdom == "k__Bacteria")
mt
# 使用 grepl 函数的另一种方式
#mt$tax_table %<>% .[grepl("Bacteria|Archaea", .$Kingdom), ]#删除线粒体或叶绿体OTU
# 这将删除 tax_table 中包含这些词的行,忽略分类级别并忽略大小写。
# 因此,如果你想过滤不被认为是污染的某些分类单元,请像之前那样使用 subset 来过滤 tax_table。
mt$filter_pollution(taxa = c("mitochondria", "chloroplast"))#使所有文件中OTU和样本信息一致,使用tidy_dataset修剪函数
mt$tidy_dataset()
mt#使用 sample_sums() 来检查每个样本中的序列号
mt$sample_sums() %>% range#样本稀疏化,每个样本的序列数标准化为相同的数量
mt$rarefy_samples(sample.size = 10000)
mt#save_table可以将微表对象中的所有基础数据保存到本地文件中,包括特征丰度、元数据、分类表、系统发育树和代表序列
mt$save_table(dirpath = "basic_files", sep = ",")

🌟microeco网络分析,构建网络并输出Gephi数据进行网络绘图

##################microeco网络分析###################
#计算相关性矩阵
#使用WGCNA包进行计算,该包提升了计算效率,适合大规模数据
#加载并安装WGCNA包
if(!require("WGCNA")) install.packages("WGCNA", repos = BiocManager::repositories())
#使用WGCNA进行相关性矩阵计算
t1 <- trans_network$new(dataset = mt,                      # 输入数据集 mtcor_method = "spearman",            # 选择 Spearman 相关性计算方法use_WGCNA_pearson_spearman = TRUE,  # 使用 WGCNA 包来计算相关性filter_thres = 0.0001               # 设置过滤阈值为 0.0001
)# 构建相关性网络
#安装并加载igraph包
if(!require("igraph")){install.packages("igraph")}
# 使用 p 值阈值和网络优化进行网络构建
#t1$cal_network(
#  COR_p_thres = 0.01,      # 设定相关性 p 值的阈值,只有 p 值小于 0.01 的相关性才会用于构建网络
#  COR_optimization = TRUE  # 启用网络优化,使用算法构建更稀疏的网络,提高网络可解释性
#)# 使用自定义的相关系数阈值来构建网络(可选)
t1$cal_network(COR_p_thres = 0.01,  # 设定相关性 p 值的阈值,过滤掉不显著的相关性COR_cut = 0.7        # 使用相关系数阈值 0.7,只有相关系数大于 0.7 的变量对会被保留在网络中
)# 对无向网络应用 igraph 的 cluster_fast_greedy 函数进行模块划分
t1$cal_module(method = "cluster_fast_greedy")  # 调用模块划分方法#将网络保存为gexf文件,该文件可直接用于Gephi软件进行可视化
#安装并加载rgexf包,xfun包兼容问题,建议先安装xfun
install.packages("xfun")
if(!require(rgexf)){install.packages('rgexf')}
#保存网络
t1$save_network(filepath = "network.gexf")# 计算网络属性
t1$cal_network_attr()
t1$res_network_attr#函数get_node_table、get_edge_table和get_adjacency_matrix分别用于从网络获取节点属性表、边属性表和邻接矩阵。
# 获得节点属性
t1$get_node_table(node_roles = TRUE)
# 获得边属性表
t1$get_edge_table()
# 获得邻接矩阵 
t1$get_adjacency_matrix()#输出节点和边数据文件,可用于cytoscope软件绘制网络图
write.csv(t1$res_edge_table,"res_edge_table.csv")
write.csv(t1$res_node_table,"res_node_table.csv")

🌟Gephi绘图结果

🌟microeco直接绘图和zi-pi分析,鉴别关键物种

#绘制网络图
t1$plot_network(method = "ggraph", node_color = "module",node_label = NA)#可选其他的绘图方式
#t1$plot_network(method = "networkD3", node_color = "module")
#t1$plot_network(method = "igraph")#模块内连接和模块间连接绘制节点分类
#add_label = TRUE 可以用于直接为点添加文本标签
t1$plot_taxa_roles(use_type = 1)# plot node roles with phylum information
t1$plot_taxa_roles(use_type = 2)

🌟提取网络绘制子网络图

从网络中提取出来的一个部分,用于聚焦特定物种群或相互作用的分析。比如分类层级、功能属性

#提取子网络
#提取特定模块的子网络
#t1$subset_network(node = t1$res_node_table %>% base::subset(module == "M1") %>% rownames, rm_single = TRUE)
#提取特定类型边的子网络(正相关)
#t1$subset_network(edge = "+")#实例
# 提取样本 'S1' 的子网络
sub1 <- t1$subset_network(node = mt$otu_table %>% .[.[, "S1"] != 0, ] %>% rownames, rm_single = TRUE)
# 通过直接赋值创建 t2 对象
t2 <- t1
t2$res_network <- sub1  # 将提取的 'S1' 子网络赋值给 t2 的网络属性# 现在 t2 包含 'S1' 的网络,可以用于进一步分析
t2$cal_module()  # 计算 t2 网络的模块
t2$save_network("S1.gexf")  # 保存 'S1' 的网络为 .gexf 格式文件#绘制子网络图
t1$plot_network(method = "ggraph", node_color = "module",node_label = NA)
#对于微生物网络图的绘制多种方法,可以综合其他方法的选择进行选取

四、参考文献

[1] Chi Liu, Yaoming Cui, Xiangzhen Li, Minjie Yao, microeco: an R package for data mining in microbial community ecology, FEMS Microbiology Ecology, Volume 97, Issue 2, February 2021, fiaa255

[2] Dai, T., Wen, D., Bates, C.T. et al. Nutrient supply controls the linkage between species abundance and ecological interactions in marine bacterial communities. Nat Commun 13, 175 (2022).

[3] Yuan, M.M., Guo, X., Wu, L. et al. Climate warming enhances microbial network complexity and stability. Nat. Clim. Chang. 11, 343–348 (2021).

五、相关信息

!!!本文内容由小编总结互联网和文献内容总结整理,如若侵权,联系立即删除!

 !!!有需要的小伙伴评论区获取今天的测试代码和实例数据。

 📌示例代码中提供了数据和代码,小编已经测试,可直接运行。

以上就是本节所有内容。

如果这篇文章对您有用,请帮忙一键三连(点赞、收藏、评论、分享),让该文章帮助到更多的小伙伴。

 

 

相关文章:

扩增子分析|基于R语言microeco包进行微生物群落网络分析(network网络、Zi-Pi关键物种和subnet子网络图)

一、引言 microeco包是福建农林大学姚敏杰教授团队开发的扩增子测序集成分析。该包综合了扩增子测序下游分析的多种功能包括群落组成、多样性、网络分析、零模型等等。通过简单的几行代码可实现复杂的分析。因此&#xff0c;microeco包发表以来被学界广泛关注&#xff0c;截止2…...

中间件--ClickHouse-4--向量化执行(什么是向量?为什么向量化执行的更快?)

1、向量&#xff08;Vector&#xff09;的概念 &#xff08;1&#xff09;、向量的定义 向量&#xff1a;在计算机科学中&#xff0c;向量是一组同类型数据的有序集合&#xff0c;例如一个包含多个数值的数组。在数据库中&#xff0c;向量通常指批量数据&#xff08;如一列数…...

TDengine 存储引擎剖析:数据文件与索引设计(一)

TDengine 存储引擎简介 在物联网、工业互联网等快速发展的今天&#xff0c;时间序列数据呈爆发式增长。这些数据具有产生频率高、依赖采集时间、测点多信息量大等特点&#xff0c;对数据存储和处理提出了极高要求。TDengine 作为一款高性能、分布式、支持 SQL 的时序数据库&am…...

【kubernetes】pod.spec.containers.ports的介绍

目录 1. 说明2. 基本结构3. 字段说明4. 使用场景5. 示例6. 注意事项 1. 说明 1.在 Kubernetes 中&#xff0c;pod.spec.containers.ports 是 Pod 定义中用于配置容器端口映射的字段&#xff0c;其作用是声明容器需要监听的端口以及如何将这些端口暴露给 Pod 的外部访问。 2. …...

【SpringBoot+Vue自学笔记】001

跟着这位老师学习的&#xff1a;https://www.bilibili.com/video/BV1nV4y1s7ZN?vd_sourceaf46ae3e8740f44ad87ced5536fc1a45 前后端开发技术的全栈课程&#xff1a; Java EE企业级框架&#xff1a;SpringBootMyBatisPlus Web前端核心框架&#xff1a;VueElement UI 公共云…...

第十节:性能优化-如何排查组件不必要的重复渲染?

工具&#xff1a;React DevTools Profiler 方法&#xff1a;memo、shouldComponentUpdate深度对比 React 组件性能优化&#xff1a;排查与解决重复渲染问题指南 一、定位性能问题&#xff1a;React DevTools 高级用法 使用 React Developer Tools Profiler 精准定位问题组件&…...

MATLAB项目实战(一)

题目&#xff1a; 某公司有6个建筑工地要开工&#xff0c;每个工地的位置&#xff08;用平面坐标系a&#xff0c;b表示&#xff0c;距离单位&#xff1a;km&#xff09;及水泥日用量d(t)由下表给出&#xff0e;目前有两个临时料场位于A(5,1)&#xff0c;B(2,7)&#xff0c;日储…...

spring boot 文件下载

1.添加文件下载工具依赖 Commons IO is a library of utilities to assist with developing IO functionality. <dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version> </depe…...

HTTP 2.0 协议特性详解

1. 使用二进制协议&#xff0c;简化传输的复杂性&#xff0c;提高了效率 2. 支持一个 TCP 链接发起多请求&#xff0c;移除 pipeline HTTP/2 移除了 HTTP/1.1中的管道化&#xff08;pipeline&#xff09;机制&#xff0c;转而采用多路复用&#xff08;Multiplexing&#xff0…...

微服务链路追踪:SleuthZipkin

文章目录 Sleuth & Zipkin一、Sleuth\&Zipkin介绍二、搭建环境三、Sleuth入门操作四、Zipkin搭建及操作五、RabbitMQ方式发送信息六、Elasticsearch持久化 SpringBootAdmin一、Actuator介绍二、Actuator快速入门三、SpringBootAdmin介绍四、SpringBootAdmin快速入门4.1…...

HTML语义化与无障碍设计

HTML 语义化与无障碍设计&#xff1a;构建包容且高效的网页体验 引言 在我的前端开发学习旅程中&#xff0c;起初将 HTML 仅视为页面布局的工具&#xff0c;大量使用无语义的 <div> 和 <span>。直到在一篇技术博客当中了解到&#xff0c;作者在一次团队项目中&am…...

java面试篇 4.9(mybatis+微服务+线程安全+线程池)

目录 mybatis&#xff1a; 1、mybatis的执行流程 2、mybatis是否支持延迟加载&#xff1f; 当我们需要去开启全局的懒加载时&#xff1a; 3、mybatis的一级和二级缓存 微服务 1、springcloud五大组件有哪些 2、服务注册和发现是什么意思&#xff1f;springcloud如何实现…...

基于电子等排体的3D分子生成模型 ShEPhERD - 评测

一、背景介绍 ShEPhERD 是一个由 MIT 开发的一个 3D 相互作用感知的 ligand-based的分子生成模型&#xff0c;以 arXiv 预印本的形式发表于 2024 年&#xff0c;被ICLR2025 会议接收。文章链接&#xff1a;https://openreview.net/pdf?idKSLkFYHlYg ShEPhERD 是一种基于去噪扩…...

极狐GitLab 功能标志详解

极狐GitLab 是 GitLab 在中国的发行版&#xff0c;关于中文参考文档和资料有&#xff1a; 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 功能标志 (BASIC ALL) 使用功能标志&#xff0c;您可以将应用程序的新功能小批量部署到生产环境中。您可以为部分用户打开和…...

GR00T N1:面向通用类人机器人的开放基础模型

摘要 通用型机器人需要具备多功能的身体和智能的大脑。近年来&#xff0c;类人机器人的发展在构建人类世界中的通用自主性硬件平台方面展现出巨大潜力。一个经过大量多样化数据源训练的机器人基础模型&#xff0c;对于使机器人能够推理新情况、稳健处理现实世界的多变性以及快…...

QT简单实例

QT简单实例 QT简单实例一&#xff1a;通过拖动创建1.创建工程2.拖动控件实现响应3.文件目录3.1 TestQDialog.pro3.2 main.cpp3.3 dialog.h3.4 dialog.cpp 二&#xff1a;通过动态创建1.创建工程2.文件目录2.1 TestQDialogSelf.pro2.2 main.cpp2.3 dialog.h2.4 dialog.cpp QT简单…...

Linux:初学者的简单指令

文章目录 pwd&#xff08;Print working directory&#xff09;whoamilsmkdir ~~cd ~~touch ~~rm ~~ 充当后端服务,我们用xshell工具来进行操作 其中Linux文件是/目录/目录/目录或文件/来表示的&#xff08;其中目录可以看作是windows操作系统的文件夹&#xff0c;只是Linux中…...

zynq7020 ubuntu_base 跟文件系统

整体流程 制作 ubuntu_base 镜像运行 petalinux 构建的 ramdisk 系统用 ramdisk 系统把 ubuntu_base 镜像烧录到 emmc从 emmc 跟文件系统 启动内核 制作 ubuntu_base 镜像 制作 ubuntu_base 镜像 sudo apt-get install qemu-user-static # 安装 q…...

大数据如何让供应链更丝滑?一场数据驱动的效率革命

大数据如何让供应链更丝滑&#xff1f;一场数据驱动的效率革命 在这个一切讲求“快准狠”的时代&#xff0c;供应链的管理直接决定了企业的竞争力。你能想到吗&#xff1f;一个订单的配送延迟&#xff0c;可能让客户流失&#xff1b;一个采购决策的失误&#xff0c;可能导致库…...

端侧大模型综述On-Device Language Models: A Comprehensive Review

此为机器翻译&#xff0c;仅做个人学习使用 设备端语言模型&#xff1a;全面回顾 DOI&#xff1a;10.48550/arXiv.2409.00088 1 摘要 大型语言模型 &#xff08;LLM&#xff09; 的出现彻底改变了自然语言处理应用程序&#xff0c;由于减少延迟、数据本地化和个性化用户体验…...

量子安全邮件系统 —— 量子随机数生成器集成

目录 量子安全邮件系统 —— 量子随机数生成器集成一、项目背景与简介二、量子随机数生成器的理论基础三、系统架构设计3.1 模块划分3.2 系统架构图(Mermaid示意图)四、关键算法与技术实现4.1 量子数据采集与预处理4.2 随机数生成算法4.3 安全性与随机性检验五、GUI设计与系统…...

python实现音视频下载器

一、环境准备 确保当前系统已安装了wxPython 、 yt-dlp 和FFmpeg。当前主要支持下载youtube音视频 1、安装wxPython pip install wxPython2、安装yt-dp pip install wxPython yt-dlp3、安装FFmpeg 在Windows 10上通过命令行安装FFmpeg&#xff0c;最简便的方式是使用包管理…...

三、小白如何用Pygame制作一款跑酷类游戏(按键图片和距离的计算)

三、小白如何用Pygame制作一款跑酷类游戏&#xff08;实现移动距离的计算&#xff0c;以及按键指引的添加&#xff09; 文章目录 三、小白如何用Pygame制作一款跑酷类游戏&#xff08;实现移动距离的计算&#xff0c;以及按键指引的添加&#xff09;前言一、创建字体文件夹1.可…...

H5:实现安卓和苹果点击下载App自动跳转到对应的应用市场

一、需求场景 手机扫描下载App&#xff0c;需要根据不同手机自动跳转到对应的应用市场&#xff08;商店&#xff09;里&#xff0c;苹果手机直接打开App Store里指定的app页面&#xff0c;安卓手机如果是海外用户则打开GooglePlay 商店里指定的app页面&#xff0c;国内直接下载…...

【Linux】文件传输归档与压缩

目录 配置实验环境 文件传输方法--scp&#xff0c;rsync scp rsync 归档与压缩--tar&#xff0c;gz&#xff0c;bz2&#xff0c;xz&#xff0c;zip 归档---tar 压缩 zip gzip bzip2 xz 归档并压缩 gz bz2 xz 拓展du 配置实验环境 在多个linux系统进行系统传输…...

3D人脸扫描技术如何让真人“进入“虚拟,虚拟数字人反向“激活“现实?

随着虚拟人技术的飞速发展&#xff0c;超写实数字人已经成为数字娱乐、广告营销和虚拟互动领域的核心趋势。无论是企业家、知名主持人还是明星&#xff0c;数字分身正在以高度还原的形象替代真人参与各类活动&#xff0c;甚至成为品牌代言、直播互动的新宠。 3D人脸扫描&#…...

Git标签的认识

Git标签完全指南&#xff1a;从基础到企业级发布策略 前言 在软件发布领域&#xff0c;Git标签是版本管理的基石。根据2023年GitHub年度报告显示&#xff0c;85%的开源项目使用标签进行版本控制。然而&#xff0c;许多开发者仅停留在git tag的基础使用层面&#xff0c;未能充分…...

Docker实战:从零构建高可用的MySQL主从集群与Redis集群

在分布式系统架构中&#xff0c;数据库集群是保障数据高可用和性能的关键组件。本文将通过Docker技术&#xff0c;手把手教你搭建MySQL主从集群和Redis Cluster&#xff0c;并分享独创的优化技巧与运维实战经验。 一、为什么选择Docker部署集群&#xff1f; 传统数据库集群搭…...

【Rust基础】使用Rocket构建基于SSE的流式回复

背景 我们正在使用Rust开发基于RAG的知识库系统&#xff0c;其中对于模型的回复使用了常用的SSE&#xff0c;Web框架使用Rocket&#xff0c;Rocket提供了一个简单的方式支持SSE&#xff0c;但没有会话保持、会话恢复等功能&#xff0c;因此我们自己简单实现这两个功能。 使用R…...

高级java每日一道面试题-2025年4月07日-微服务篇[Nacos篇]-如何监控Nacos的运行状态?

如果有遗漏,评论区告诉我进行补充 面试官: 如何监控Nacos的运行状态&#xff1f; 我回答: 监控Nacos运行状态的综合方案 在Java高级面试中&#xff0c;监控Nacos运行状态是一个重要的技术点&#xff0c;它直接关系到微服务架构的稳定性和性能。以下是一个综合的监控方案&am…...