5+非肿瘤分析,分型+WGCNA+机器学习筛选相关基因
糖尿病肾病(DKD)是糖尿病的长期并发症,引起肾脏微血管病变。它也是终末期肾脏疾病(ESRD)的主要原因之一,其病理生理过程复杂。及时预防和治疗对延缓DKD的发展具有重要意义。本研究旨在利用生物信息学分析找到可能成为DKD治疗靶点的关键诊断标志物。
1. 数据处理
作者从GEO数据库下载了七个数据集,共计214个样本,并使用“sva” R软件包的“ComBat”函数去除来自不同来源的数据的批次效应。PCA图表显示了在去除批次效应之前和之后的数据分布(分别为图1A、B),结果表明批次效应已经得到有效纠正。在合并数据后,可以准确区分DKD和正常样本(图1C)。使用“limma” R软件包进行差异分析, 作者鉴定出共计772个差异表达基因(其中381个上调,391个下调),如火山图所示(图1D)。接下来, 作者对差异基因进行ORA富集分析。从圆形网络图中可以看出,这些基因富集在“炎症反应”、“上皮间质转化”、“凋亡”和“TNFA信号通路通过NFKB”等途径中(图1E)。TreeMap显示,上调基因主要参与免疫激活、T细胞激活和细胞黏附等生物过程,而下调基因主要富集在与代谢调节相关的生物功能中(图1F)。这些发现通过Kyoto Encyclopedia of Genes and Genomes (KEGG)通路富集分析得到了相应的验证(图1G)。
图1 糖尿病肾病(DKD)的差异表达基因(DEG)鉴定和富集分析
2. DKD的不同亚组的鉴定
首先, 作者将氧化应激和炎症反应相关基因(OS Infla)与先前获得的差异表达基因(DEGs)进行交叉,并获得了84个差异表达的氧化应激和炎症反应相关基因(DEOIGs)(图2A)。接下来, 作者使用R软件包“ConsensusClusterPlus”根据这84个DEOIGs将DKD患者分为不同的亚组。当一致性矩阵k值为2时,DKD样本之间的交叉最小,符合选择标准(图2B-E)。因此,113个DKD样本被分为两个明显的聚类,即DKD亚型1和2(分别为C1和C2)。热图显示大多数DEOIGs在C1亚型中上调,在C2亚型和正常样本中下调(图2F)。GSEA富集分析表明,C1亚型富集了细胞外基质受体相互作用,而C2亚型富集了代谢途径(图2G)。 作者量化了不同免疫细胞亚群的ssGSEA富集分数,以用于研究DKD亚型与免疫细胞之间的关系。结果表明,C1亚型在更多与免疫相关的细胞中富集,如调节性T细胞、巨噬细胞、活化的B细胞和浆细胞样树突状细胞。然后, 作者通过查阅文献并使用ssGSEA分析量化结果,找到了近年来与DKD密切相关的通路。山地图显示了两个亚型和正常样本的通路ssGSEA得分,揭示了Wnt、Notch和凋亡通路在C1亚型中较高,而过氧化物酶活化受体(PPAR)、过氧化物酶体、哺乳动物雷帕霉素靶蛋白(mTOR)、自噬、AMPK和其他通路在C1亚型中较低(图2H)。
图2 DKD亚型的鉴定
3. 构建WGCNA并识别关键模块
作者使用了来自七个不同数据集的113个DKD样本,使用中位数绝对偏差对前5000个基因进行了WGCNA分析的筛选。随后, 作者根据尺度自由拟合指数和不同软阈值幂的平均连接度,基于尺度自由R2进行了评估。 作者的研究选择了软阈值幂β = 6和尺度自由R2 = 0.8744133来构建一个标准的尺度自由网络,使用Pick Soft Threshold函数(图3A)。最终, 作者确定了六个模块(图3B)。 作者使用相关热图来探索每个模块与糖尿病肾病的相关性,发现MEblue模块与C1和C2亚型的相关性最高(图3C)。基因重要性评分被用来分析基因与DKD亚型之间的关联,结果显示MEblue模块具有最高的基因重要性评分(图3D)。相关散点图进一步证明了MEblue模块中的基因不仅与MEblue模块强相关,而且与糖尿病肾病亚型显著相关(图3E)。因此, 作者提取了MEblue模块中的基因进行后续分析。
图3 加权基因共表达网络分析(WGCNA)
4. 糖尿病肾病的诊断标志物鉴定
作者通过对糖尿病肾病的两个亚型进行差异分析,获得了473个差异基因(|log2FC| > 1,padj < 0.05)。Venn图显示,在与MEblue模块中的1458个基因相交后,发现了347个相交基因。使用STRING在线网络工具构建了上述347个基因的PPI网络图,并在Cytoscape软件中进行了分析。使用Upset图选择满足CytoHubba插件的12种算法的相交基因,最终获得了279个基因(附图4)。基于这279个基因, 作者进一步使用不同的生物信息学方法筛选出诊断标志物。使用LASSO回归算法,挑选出了12个潜在生物标志物(图4A、B)。随机森林(RF)算法确定了15个候选基因(图4C、D)。SVM-RFE算法显示,当特征基因数为64时,准确率最高达到0.956(图4E)。最终, 作者获得了四个基因作为DKD的诊断标志物(图4F)。
图4 诊断标记物的鉴定
5. 四个诊断标志物的诊断价值和验证
箱线图显示了在七个合并的GEO数据集中四个标志基因的表达情况(图5A)。可以看出,DKD样本中四个基因的表达高于正常样本。Nephroseq v5在线数据库中的样本也验证了它们的高表达(图5B),表明它们在DKD的发生和发展过程中可能起到重要作用。在合并的GEO数据集中,当将所有四个基因作为一个变量进行拟合时,ROC曲线下面积(AUC)为0.808,比单独使用它们作为诊断变量时获得了更好的结果(图5C)。 作者还评估了这四个基因在来自GSE142025数据集的独立患者队列中的诊断效能。每个基因的ROC曲线下面积(AUC)值都大于0.8,表明这四个基因可以诊断DKD(图5D)。相关分析显示,四个基因的表达与肌酐呈正相关(图5E),与肾小球滤过率呈负相关(图5F)。
图5 诊断效能和诊断标志物的外部验证
6. 基于特征基因的DKD诊断模型的Nomogram构建
基于四个诊断标志物的表达, 作者基于逻辑回归构建了一个诊断模型,并绘制了一个图表(图6A)。在这个图表中,参与构建诊断模型的每个基因对应一个分数,它们的分数相加得到一个总分,该总分对应不同的DKD诊断效果。校准曲线显示该图表能可靠地诊断DKD(图6B)。ROC曲线表明该模型的AUC值为0.801(图6C)。DCA结果通过四个单独的基因或它们的组合来评估DKD患者的结果,显示了净效益(NB)。结果表明,组合的图表模型能显著增加净效益(图6D)。
图6 DKD诊断模型的构建
7. 诊断标志物的功能富集分析
为了探索与诊断标志物相关的生物过程, 作者分析了这四个诊断标志物与免疫细胞的相关性。结果表明,它们与大多数免疫细胞浸润呈正相关(图7A),如活化的CD4 T细胞、活化的树突状细胞、调节性T细胞、巨噬细胞等。接下来, 作者根据基因表达将DKD样本分为高表达组和低表达组。对高表达组和低表达组中的差异表达基因进行GSEA分析,以探索可能涉及的信号通路,结果发现这四个基因的通路富集是一致的。因此,它们在TNFA SIGNALING VIA NFKB、KRAS SIGNALING UP、INTERFERON GAMMA RESPONSE、INFLAMMATORY RESPONSE、EPITHELIAL MESENCHYMAL TRANSITION等方面均显著富集(图7B)。功能富集分析显示,这四个基因的高表达组均富集在ADAPTIVE IMMUNE RESPONSE、T CELL ACTIVATION、IMMUNE RESPONSE REGULATING CELL SURFACE RECEPTOR SIGNALING PATHWAY等方面。低表达组在生物过程中富集了一些如SMALL MOLECULE CATABOLIC PROCESS、FATTY ACID CATABOLIC PROCESS、INNER MITOCHONDRIAL MEMBRANE PROTEIN COMPLEX等的过程(图7C)。
图7 诊断标志物的生物学功能富集
8. 动物模型中的验证
为了进一步验证这四个标志物在早期DKD诊断中的诊断价值, 作者利用12周龄的db/db小鼠作为自发性DKD模型。 作者发现,与正常对照组小鼠相比,DKD组小鼠的体重、血糖、HbA1c、血清肌酐、血尿素氮和尿白蛋白/肌酐水平显著增加(图8A)。病理染色还显示DKD组小鼠的肾组织中有系膜细胞增生、系膜基质扩张以及肾小球和肾小管基底膜不规则增厚(图8B),表明自发性DKD模型已成功建立。接下来, 作者检测了四个生物标志物(包括TNC、PXDN、TIMP1和TPM1)的mRNA表达水平。结果显示,TNC、TPM1和PXDN在小鼠模型中显著升高。不幸的是,TIMP1呈上升趋势,两组之间没有差异(图8C)。 作者还检测了小鼠血液和尿液中的四个生物标志物中的三种分泌蛋白。结果显示,TNC和PXDN在血液和尿液中持续升高,而TIMP1在尿液中显著升高,但在血液中没有显著差异(图8D)。相关分析显示,无论是血液样本还是尿液样本,这些标志物与尿白蛋白/肌酐比值明显呈正相关。至于血糖和HbAc1,这些标志物与它们之间没有显著相关性。免疫组化结果显示,TNC、TPM1、TIMP1和PXDN的表达水平在DKD小鼠模型中升高(图8E)。为了进一步验证上述变化与DKD而不是糖尿病有关, 作者的研究还添加了两组6周龄的db/db小鼠和正常小鼠。 作者发现,与正常对照小鼠相比,DM小鼠的体重、血糖和HbA1c显著增加,但两组小鼠的血清肌酐、血尿素氮和尿白蛋白/肌酐水平之间没有差异。同时,在肾脏病理染色中没有发现显著差异。qRT-PCR的结果显示,TPM1和TIMP1的mRNA表达水平在两组之间没有统计学差异。TNC和PXDN的表达在DM组中增加。此外,检测了DM组小鼠的血液和尿液样本中三种分泌蛋白的表达水平,并发现只有血液样本中的TNC在DM小鼠中显著增加。对于尿液样本,DM小鼠中的TNC和TIMP1的升高存在显著差异。
图8 动物实验中诊断标志物的验证
总结
总之, 作者通过全面系统的生物信息学分析和实验验证,确定了TNC、PXDN、TIMP1和TPM1作为DKD的潜在诊断标志物,并建立了一个包含这四个诊断标志物的图表,并初步探讨了它们在DKD的发生和发展中可能的生物学功能。这些发现将为DKD的早期诊断和治疗提供新的思路。
相关文章:
5+非肿瘤分析,分型+WGCNA+机器学习筛选相关基因
今天给同学们分享一篇非肿瘤分型机器学习WGCNA实验的生信文章“Identification of diagnostic markers related to oxidative stress and inflammatory response in diabetic kidney disease by machine learning algorithms: Evidence from human transcriptomic data and mou…...
算法课作业2 OJ for Divide and Conquer
https://vjudge.net/contest/581947 A - Ultra-QuickSort 题意 每次给n个无序的数,互不重复,问最少需要多少次必要的交换操作使n个数有序。 思路 看一眼想到逆序数,然后验证了逆序数的个数符合样例,但想了一个3 2 1的话实际上…...
申请全国400电话的步骤及注意事项
导语:随着企业的发展,越来越多的公司开始意识到全国400电话的重要性。本文将介绍申请全国400电话的步骤及注意事项,帮助企业顺利办理相关手续。 一、了解全国400电话的概念和优势 全国400电话是一种统一的客服热线号码,以“400”…...
C++ 的设计模式之 工厂方法加单例
在下面的示例中,我将演示如何创建一个工厂类,该工厂类能够生成四个不同类型的单例对象,每个单例对象都通过单独的工厂方法进行创建。 #include <iostream> #include <mutex>// Singleton base class class Singleton { protecte…...
Deploy、Service与Ingress
Deployment 自愈 介绍:控制Pod,使Pod拥有多副本,自愈,扩缩容等能力 # 清除所有Pod,比较下面两个命令有何不同效果? kubectl run mynginx --imagenginxkubectl create deployment mytomcat --imagetomcat:8.5.68 # 自…...
定制化推送+精细化运营,Mobpush助力《迷你世界》用户留存率提升23%
随着智能设备的市场下沉,手游市场迎来了爆发式增长,《迷你世界》作为一款于2015年推出的手游,一经问世就饱受欢迎。上线短短三年,迷你世界在应用商店下载量已经高达2亿次,周下载量两千万,稳居第一名&#x…...
深度学习零基础教程
代码运行软件安装: anaconda:一个管理环境的软件–>https://blog.csdn.net/scorn_/article/details/106591160(可选装) pycharm:一个深度学习运行环境–>https://blog.csdn.net/scorn_/article/details/106591160…...
简单测试一下 展锐的 UDX710 性能
最近在接触 联通5G CPE VN007 ,发现使用的是 展锐的Unisoc UDX710 CPU,正好简单的测试一下这颗CPU CPU信息 UDX710 是一颗 双核 ARM Cortex-A55 处理器,主频高达 1.35GHz processor : 0 BogoMIPS : 52.00 Features : fp…...
一百九十、Hive——Hive刷新分区MSCK REPAIR TABLE
一、目的 在用Flume采集Kafka中的数据直接写入Hive的ODS层静态分区表后,需要刷新表,才能导入分区和数据。原因很简单,就是Hive表缺乏分区的元数据 二、实施步骤 (一)问题——在Flume采集Kafka中的数据写入HDFS后&am…...
智慧公厕:探索未来城市环境卫生设施建设新标杆
智慧公厕是当代城市建设的一项重要举措,它集先进技术、人性化设计和智能管理于一体,为人们提供更为舒适、便捷和卫生的厕所环境。现代智慧公厕的功能异常丰富,从厕位监测到多媒体信息交互,从自动化清洁到环境调控,每一…...
高压放大器在无线电能中应用有哪些
高压放大器是一种用于放大电信号的放大器,可以将输入的低电压信号放大到更高的输出电压水平。在无线电通信和其他相关领域中,高压放大器具有广泛的应用。本文将详细介绍高压放大器在无线电能中的应用。 无线电发射:高压放大器在无线电发射中起…...
若依集成MybatisPlus
目录 一、依赖变更 1. MybatisPlus依赖 2. pagehelper依赖修改 二、相关配置 1. yml配置 1.1 注释掉原Mybatis配置 1.2 加入MybatisPlus的配置 1.3 注释掉原MybatisConfig.class 三、其他配置及功能实现 1. 自动补全create_time等信息 2. 实现MP分页 3. 实现Mybati…...
List小练习,实现添加图书,并且有序遍历
SuppressWarnings({"all"})public static void main(String[] args) {List list new LinkedList(); // List list new Vector(); // List list new ArrayList();list.add(new Book1("红楼小梦",35.5,"曹雪芹"));list.add(new B…...
代码随想录二刷 Day42
62.不同路径 简单题目自己就可以写出来,注意下创建二维vector的方法就可以, dp table如下 class Solution { public:int uniquePaths(int m, int n) {vector<vector<int>> dp(m,vector<int>(n,0));for (int i 0; i < n; i ) {dp[…...
【Android】Drawable 和src 的区别和理解
详细讲解 在 Android 中,ImageView 的 src 属性和 background 属性用于设置不同类型的图像内容。下面是它们的详细解释: src 属性:该属性用于设置 ImageView 中显示的图像内容。它可以接受一个图像资源的引用,可以是一个图片文件…...
Linux网络-UDP/TCP协议详解
Linux网络-UDP/TCP协议详解 2023/10/17 14:32:49 Linux网络-UDP/TCP协议详解 零、前言一、UDP协议二、TCP协议 1、应答机制2、序号机制3、超时重传机制4、连接管理机制 三次握手四次挥手5、理解CLOSE_WAIT状态6、理解TIME_WAIT状态7、流量控制8、滑动窗口 丢包问题9、拥塞控制…...
C语言从入门到高级
C语言是“编程语言之首”(很多人学习的第一门编程语言),学好一门编程语言需要明确其学习路径,下面分享下我的学习路径,希望对您有所帮助。 一、C语言入门 (1)C语言概述 (2&#x…...
【MultiOTP】在Linux上使用MultiOTP进行SSH登录
在前面的文章中【FreeRADIUS】使用FreeRADIUS进行SSH身份验证已经了解过如何通过Radius去来实现SSH和SUDO的登录,在接下来的文章中只是将密码从【LDAP PASSWORD Googlt OTP】改成了【MultiOTP】生成的passcode,不在需要密码,只需要OTP去登录…...
性能超越 Clickhouse | 物联网场景中的毫秒级查询案例
1 物联网应用场景简介 物联网(Internet of Things,简称 IoT)是指通过各种信息传感、通信和 IT 技术来实时连接、采集、监管海量的传感设备,从而实现对现实世界的精确感知和快速响应,继而实现自动化、智能化管理。在查…...
05、SpringBoot 集成 RocketMQ
目录 SpringBoot集成RocketMQ消息发送三种方式1、同步消息producer-springboot创建项目添加依赖配置文件同步消息发送代码启动类Test类 comsumer-springboot创建项目添加依赖配置文件同步消息消费代码 2、异步消息生产者消费者 3、一次性消息生产者消费者 消息消费两种方式1、集…...
Vim 调用外部命令学习笔记
Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...
【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...
渲染学进阶内容——模型
最近在写模组的时候发现渲染器里面离不开模型的定义,在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容,其实不管是方块还是方块实体,都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器,用于动态创…...
Java - Mysql数据类型对应
Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...
【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)
可以使用Sqliteviz这个网站免费编写sql语句,它能够让用户直接在浏览器内练习SQL的语法,不需要安装任何软件。 链接如下: sqliteviz 注意: 在转写SQL语法时,关键字之间有一个特定的顺序,这个顺序会影响到…...
Ascend NPU上适配Step-Audio模型
1 概述 1.1 简述 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统,支持多语言对话(如 中文,英文,日语),语音情感(如 开心,悲伤)&#x…...
JAVA后端开发——多租户
数据隔离是多租户系统中的核心概念,确保一个租户(在这个系统中可能是一个公司或一个独立的客户)的数据对其他租户是不可见的。在 RuoYi 框架(您当前项目所使用的基础框架)中,这通常是通过在数据表中增加一个…...
Selenium常用函数介绍
目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...
多模态图像修复系统:基于深度学习的图片修复实现
多模态图像修复系统:基于深度学习的图片修复实现 1. 系统概述 本系统使用多模态大模型(Stable Diffusion Inpainting)实现图像修复功能,结合文本描述和图片输入,对指定区域进行内容修复。系统包含完整的数据处理、模型训练、推理部署流程。 import torch import numpy …...
