当前位置: 首页 > news >正文

8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达


今天给同学们分享一篇双疾病+WGCNA+多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表在Front lmmunol 期刊上,影响因子为8.786。

4b55022941dfa5a912cb27a0d875f8c5.jpeg


多囊卵巢综合征(PCOS)是一种复杂的内分泌代谢紊乱疾病,影响着5-10%的生育年龄妇女。PCOS患者的子宫内膜存在改变的免疫细胞,导致慢性低度炎症,这是反复植入失败(RIF)的原因之一。

4041b6ec59b99026a3686e11b47d0e1e.jpeg

图1 整个设计的流程图


1. GEO信息

根据作者的纳入标准,共选择了四个数据集进行发现性分析:GSE10946、GSE34526、GSE103465和GSE111974。其中,GSE10946和GSE34526被用作PCOS的发现队列,而GSE103465和GSE111974被视为RIF的发现队列。此外,GSE80432和GSE26787分别是PCOS和RIF的验证队列。在本研究中,作者简称这两个疾病组为PCOS和RIF。


2. 差异基因的鉴定

在进行生物信息分析之前,作者测试了收集的数据集的批次效应,并发现两种疾病的批次效应明显(图2A,E)。使用“sva”软件包,作者去除了PCOS(图2B)和RIF组(图2F)的批次效应,以获得可靠的分析结果。然后使用LIMMA软件包对两组之间的差异表达基因(DEGs)进行表征。对于PCOS,获得了201个差异基因(P<0.05,|log2 FC|>0.585),其中101个上调基因和100个下调基因。对于RIF,有253个差异基因(adj. P<0.05,|log2 FC|>1),其中167个上调基因和86个下调基因。火山图显示了PCOS(图2C)和RIF(图2G)组的所有差异基因。总体而言,通过热图(图2D,H)可视化了这两组中包含的差异基因。与PCOS和RIF相关的差异基因可能在它们的发生和发展中起到一定作用。

81632b7a05413151dc32b24ae130f039.jpeg

图2 去除批次效应并在PCOS和RIF中识别差异表达基因


3.&nbsp;通过WGCNA筛选关键模块

为了调查疾病和关键基因是否相关,作者除了分析两组之间的差异表达外,还进行了WGCNA。使用软阈值方法,本研究构建了一个共表达网络。这个参数β对于共表达网络保持无标度拓扑结构至关重要。基于基因表达数据的生物网络很可能是无标度的。因此,在PCOS组中,拟合指数大于0.85被认为是无标度拓扑结构,β被设定为9(图3A)。通过使用邻接函数,生成了邻接矩阵。如图3B所示,使用TOM差异度量构建了层次聚类。作者总共确定了20个共表达模块。P<0.05的模块被视为关键模块。如图3C所示,antiquewhite4模块具有最强的正相关性,其中包含180个基因。同样,WGCNA也应用于RIF组,β=10是软功率的最佳值(图3D)。作者总共确定了19个模块,其中深灰色、深绿色和皇家蓝显示出强烈的正相关性,而绿黄色、鲑鱼色、深青色和浅黄色模块显示出强烈的负相关性(图3E,F)。在RIF组的这7个关键模块中的基因中,作者进一步选择了334个具有|MM| > 0.8和|GS| > 0.5的基因。这些来自两组关键模块的基因可能被用作候选的细胞特异性标记物。

456c80d424504beca23e1ce873f265fc.jpeg

图3 加权基因共表达网络分析(WGCNA)在多囊卵巢综合征(PCOS)和反复植入失败(RIF)中的应用


4.&nbsp;共同基因的分析和功能富集

为了探索多囊卵巢综合征(PCOS)和反复流产(RIF)的共同发病机制,作者分别取上述差异表达基因(DEGs)和WGCNA筛选的基因的交集。图4A显示了PCOS和RIF的DEGs之间的重叠,共有11个基因(CHST11,FAM150B,GLIPR1,SLC16A6,MAMLD1,SLC46A2,ENPP3,HAPLN1,PLCXD3,FAM110C,GAS1)。WGCNA分析的基因中只有一个与之重叠(CCND2,图4B)。作者推测这12个基因可能与PCOS和RIF的发病机制有关,并且存在共同关系(图4C)。通过对这些基因进行功能注释和富集分析(图4D,E),作者试图研究PCOS和RIF之间的潜在生物学变化。毫不奇怪,共享基因的GO分析显示它们在早期胚胎器官形态发生相关通路中过度表达。值得注意的是,在所有富集的GO术语中,作者注意到有几个显著富集的生物过程通路,例如调节T细胞凋亡过程、肥大细胞激活和白细胞稳态,这表明免疫细胞的激活和凋亡可能对PCOS和RIF的共同发病机制有着重要贡献。此外,KEGG富集结果与GO分析一致。另外,作者还注意到几个与卵泡发育相关的通路富集,例如p53信号通路、FOXO信号通路、Hippo信号通路和PI3K-Akt信号通路。

dc82301d3b745cd6ff6417c63b45918b.jpeg

图4 PCOS和RIF之间的共享基因标识和功能富集


5.&nbsp;基于机器学习算法,识别潜在的诊断基因

为了进一步选择具有显著特征值以区分疾病组和对照组的最佳诊断基因靶点,作者基于上述12个共享基因应用了三种不同的算法(LASSO、SVM-RFE和随机森林)。在PCOS组中,根据LASSO系数曲线和最佳调参选择图,将λ设定为0.06851194(PCOS)(图5A)。随后,找到了8个具有非零系数的基因。然后,作者将上述12个基因输入RF分类器,并在重要性尺度上显示了前10个基因。作者选择了0.9作为重要性筛选阈值,并确定了一组包含9个基因的集合(图5B)。此外,SVM算法确定了5个具有最低5点交叉验证误差和最佳5点交叉验证准确性的基因(图5C)。通过将这三种算法重叠,作者确定了5个共享生物标志物(CHST11、GLIPR1、SLC16A6、MAMLD1、HAPLN1、GAS1)用于PCOS组(图5D,I)。

b89f24231f0013a39cfe6971b9a2eff3.jpeg

图5 使用三种机器学习算法筛选候选的PCOS和RIF诊断基因


同样地,当使用LASSO算法将λ设置为0.03001025时,作者得到了7个特征基因,用于RIF组(图5E)。图5F显示了重要性排名前10的基因,作者选择了9个基因(重要性>0.9)作为RM结果。接下来,使用SVM-REF算法确定了10个中心基因子集(图5G)。然后,通过三种算法获得的7个共同基因标志物重叠(图5H,I)。


6. 诊断中心生物标志物的诊断价值和验证

为了更准确地了解多囊卵巢综合征(PCOS)和反复植入失败(RIF)之间的关系,作者对PCOS和RIF群体的机器学习结果进行了交集分析,并得到了2个共享的诊断基因,GLIPR1和MAMLD1(图6A)。通过分析这两个基因的表达模式,评估了共享诊断基因的预测和鉴别能力。此外,还进行了受试者工作特征曲线(ROC曲线)的分析。

387e10431b8abb38636dd9c269048233.jpeg

图6 选择和验证两个共享的诊断基因


首先,作者分析了两个发现队列中PCOS和RIF的表达水平。图6B显示GLIRP1在RIF组中较低(P<0.01),在PCOS组中较高(P<0.01)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.0001)中均表达较低(图6F)。


接下来,为了测试这两个目标基因在两种疾病诊断中的特异性和敏感性,作者进行了ROC分析。在多囊卵巢综合征生物标志物方面,这两个基因的结果是有利的:GLIPR1(AUC=0.812)和MAMLD1(AUC=0.774)。RIF组也经过了相同的ROC分析。每个生物标志物的预测性能都很强:GLIPR1(AUC=0.723)和MAMLD1(AUC=0.879)(图6C,G)。


此外,作者通过进行外部验证,确认了GLIPR1和MAMLD1作为多囊卵巢综合征(PCOS)和反复流产(RIF)的核心诊断基因的可靠性。在两个验证组中,这两个关键基因的表达水平与发现组相匹配。GLIPR1在RIF组中降低(P<0.05),在PCOS组中增加(P<0.05)(图6D)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.05)中均减少(图6H)。图6E显示,GLIPR1在PCOS验证队列中具有出色的诊断准确性(AUC=1.000),在RIF验证队列中也具有良好的诊断准确性(AUC=0.920)。同样,MAMLD1也能正确诊断PCOS(AUC=1.000)和RIF(AUC=0.840)(图6I)。因此,结果证实了它们作为PCOS和RIF的关键鉴别分子的能力。


7.&nbsp;诊断基因的单基因GSEA

随后,作者分别在PCOS和RIF数据集中使用单基因GSEA分析了这两个生物标志物,并使用“GSEA”软件包可视化了前5个上调和下调的通路。图7显示,在这两个疾病组中,这两个基因都参与了代谢通路,如甘氨酸、丝氨酸、苏氨酸代谢、α-亚麻酸代谢和丙酸代谢。此外,这两个基因还富集在与炎症相关的通路中,将PCOS和RIF联系在一起。

a49508b7e6a78a04a17a34ab97dcd4b8.jpeg

图7 &nbsp;GSEA分析


8.&nbsp;共享诊断基因的免疫浸润分析

考虑到多囊卵巢综合征(PCOS)和反复植入失败(RIF)都具有高免疫反应的特点。作者使用CIBERSORT分析了不同组别中免疫细胞的丰度。在每个组别中,22种免疫细胞的比例以条形图的形式展示。总体而言,条形图清楚地显示了PCOS(图8A)和RIF(图8E)之间T细胞、巨噬细胞和NK细胞群体百分比之间的显著差异。与对照样本相比,PCOS样本中的活化树突状细胞增加了(图8B)。而在RIF样本中,休息的NK细胞、巨噬细胞M0增加,γδT细胞和活化树突状细胞减少(图8F)。

e524ea4e6a101d656cde72139005e2a6.jpeg

图8 PCOS和RIF免疫细胞组成


此外,还研究了生物标志物与免疫细胞含量之间的关系。在多囊卵巢综合征样本中,CD8 T细胞与GLIPR1呈显著正相关(图8C)。相反,巨噬细胞M0呈负相关。MAMLD1与B细胞记忆呈显著正相关,与巨噬细胞M2、树突状细胞静止和单核细胞呈负相关(图8D)。在反复流产样本中,GLIPR1与静止NK细胞呈显著负相关(图8G)。而中性粒细胞和静止NK细胞与MAMLD1呈负相关(图8H)。免疫功能似乎对多囊卵巢综合征和反复流产的发展至关重要。


9.&nbsp;在人体组织中通过RT-PCR验证GLIPRand MAMLD的有效性

对正常女性和多囊卵巢综合征(PCOS)患者的卵泡液颗粒细胞以及健康和反复流产(RIF)女性的子宫内膜组织进行了RT-PCR检测。这证实了两个诊断生物标志物GLIPR1和MAMLD1的基因表达水平。与数据分析一致,作者的结果显示,PCOS患者的颗粒细胞中GLIPR1的表达上调,而MAMLD1的表达下调(图9A),而RIF患者的子宫内膜组织中GLIPR1和MAMLD1的表达均减少(图9B)。

9f2237b53bb0f0fcd9e2d4cdc8c6ac91.jpeg

&nbsp;图9&nbsp;


总结

总之,诊断生物标志物GLIPR1和MAMLD1被确定为关键生物标志物,负责调节由TCA循环代谢物失衡引起的免疫细胞激活。作者的分析加强了PCOS患者反复流产的共病发病理论基础。



相关文章:

8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达

今天给同学们分享一篇双疾病WGCNA多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”&#xff0c;这篇文章于2023年5月16日发表…...

springboot如何获取前端请求头的值并加入ThreadLocal

依赖&#xff1a; <dependency><groupId>org.aspectj</groupId><artifactId>aspectjweaver</artifactId><version>1.9.7</version> </dependency>示例&#xff1a; public class ThreadLocalUtil {private static ThreadLoc…...

程序员想要网上接单却看花了眼?那这几个平台你可得收藏好了!

现在经济压力这么大&#xff0c;但是生活成本还在上升&#xff0c;相信大家都知道“四脚吞金兽”的威力了吧&#xff01;话虽如此&#xff0c;但是生活总得继续&#xff0c;为了家庭的和谐幸福&#xff0c;为了孩子的未来&#xff0c;不少人选择多干几份工作&#xff0c;赚点外…...

前端食堂技术周刊第 102 期:Next.js 14、Yarn 4.0、State of HTML、SEO 从 0 到 1

美味值&#xff1a;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f; 口味&#xff1a;肥牛宽粉 食堂技术周刊仓库地址&#xff1a;https://github.com/Geekhyt/weekly 大家好&#xff0c;我是童欧巴。欢迎来到前端食堂技术周刊&#xff0c;我们先来看下…...

GPT与人类共生:解析AI助手的兴起

随着GPT模型的崭新应用&#xff0c;如百度的​1​和CSDN的​2​&#xff0c;以及AI助手的普及&#xff0c;人们开始讨论AI对就业市场和互联网公司的潜在影响。本文将探讨GPT和AI助手的共生关系&#xff0c;以及我们如何使用它们&#xff0c;以及使用的平台和动机。 GPT和AI助手…...

HTML脚本、字符实体、URL

HTML脚本&#xff1a; JavaScript 使 HTML 页面具有更强的动态和交互性。 <script> 标签用于定义客户端脚本&#xff0c;比如 JavaScript。<script> 元素既可包含脚本语句&#xff0c;也可通过 src 属性指向外部脚本文件。 JavaScript 最常用于图片操作、表单验…...

UOS安装Jenkins

一&#xff0c;环境准备 1.安装jdk 直接使用命令行&#xff08;sudo apt install -y openjdk-11-jdk&#xff09;安装jdk11 2.安装maven 参考此篇文章即可 UOS安装并配置Maven工具_uos 安装maven_蓝天下的一员的博客-CSDN博客 不过要注意这篇文章有个小错误&#xff0c;我…...

纯CSS实现卡片上绘制透明圆孔

<template><div class"dot-card-wrapper"><div class"top-wrapper"><slot name"top"></slot></div><!-->核心是下面这部分</--><div class"dot-row"><div class"left-…...

用前端框架Bootstrap的AdminLTE模板和Django实现后台首页的页面

承接博文 用前端框架Bootstrap和Django实现用户注册页面 继续开发实现 后台首页的页面。 01-下载 AdminLTE-3.1.0-rc 并解压缩 以下需要的四个文件夹及里面的文件百度网盘下载链接&#xff1a; https://pan.baidu.com/s/1QYpjOfSBJPmjmVuFZdSgFQ?pwdo9ta 下载 AdminLTE-3.1…...

Linux驱动 编译乱序和执行乱序

编译乱序 现代的高性能编译器在目标码优化上都具备对指令进行乱序优化的能力。编译器可以对访存的指令进行乱序&#xff0c;减少逻辑上不必要的访存&#xff0c;以及尽量提高Cache命中率和CPU的Load/Store单元的工作效率。 因此在打开编译器优化以后&#xff0c;看到生成的汇编…...

京东大数据平台(京东数据分析):9月京东牛奶乳品排行榜

鲸参谋监测的京东平台9月份牛奶乳品市场销售数据已出炉&#xff01; 9月份&#xff0c;牛奶乳品市场销售呈大幅上涨。鲸参谋数据显示&#xff0c;今年9月&#xff0c;京东平台牛奶乳品市场的销量为2000万&#xff0c;环比增长约65%&#xff0c;同比增长约3%&#xff1b;销售额为…...

Hadoop RPC简介

数新网络-让每个人享受数据的价值https://www.datacyber.com/ 前 言 RPC&#xff08;Remote Procedure Call&#xff09;远程过程调用协议&#xff0c;一种通过网络从远程计算机上请求服务&#xff0c;而不需要了解底层网络技术的协议。RPC它假定某些协议的存在&#xff0c;例…...

你没有见过的 git log 风格

背景 git大家都不陌生&#xff0c;git log 也是大家经常用的指令&#xff0c;今天分享三种 git log的美化格式&#xff0c;大家看看哪种更易读。 git log -15 --graph --decorate --oneline 带有 pretty 格式的git log 风格 log --color --graph --prettyformat:‘%Cred%h%C…...

轻松搭建个人邮件服务器:实现远程发送邮件的hMailServer配置

文章目录 前言1. 安装hMailServer2. 设置hMailServer3. 客户端安装添加账号4. 测试发送邮件5. 安装cpolar6. 创建公网地址7. 测试远程发送邮件8. 固定连接公网地址9. 测试固定远程地址发送邮件 前言 hMailServer 是一个邮件服务器,通过它我们可以搭建自己的邮件服务,通过cpola…...

刷题笔记day08-字符串01

344. 反转字符串 思路1&#xff1a;使用双指针的方法&#xff0c;前后交换 func reverseString(s []byte) {// 思路1&#xff1a;使用双指针进行交换// 思路2&#xff1a;使用库函数进行交换for i, j : 0, len(s) - 1; i < j; {s[i], s[j] s[j], s[i]ij--} }思路2&…...

Pure-Pursuit 跟踪双移线 Gazebo 仿真

Pure-Pursuit 跟踪双移线 Gazebo 仿真 主要参考学习下面的博客和开源项目 自动驾驶规划控制&#xff08;&#xff21;*、pure pursuit、LQR算法&#xff0c;使用c在ubuntu和ros环境下实现&#xff09; https://github.com/NeXTzhao/planning Pure-Pursuit 的理论基础见今年六月…...

Selenium学习(Java + Edge)

Selenium /səˈliːniəm/ 1. 简介 ​ Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中&#xff0c;就像真正的用户在操作一样。支持的浏览器包括IE、Mozilla Firefox、Safari、Google Chrome、Opera、Edge等。 ​ 适用于自动化测试&#x…...

项目管理-组织战略类型和层次讲解

组织战略类型和层次 对于不同的组织战略可能会采用不同的项目管理形式&#xff0c;组织作为项目管理的载体&#xff0c;其战略决策对项目管理体系的架构&#xff0c;对组织与项目之间责权利的划分具有深远的影响&#xff0c;组织的战略文化也会影响到项目的组织文化氛围。因此…...

面试算法50:向下的路径节点值之和

题目 给定一棵二叉树和一个值sum&#xff0c;求二叉树中节点值之和等于sum的路径的数目。路径的定义为二叉树中顺着指向子节点的指针向下移动所经过的节点&#xff0c;但不一定从根节点开始&#xff0c;也不一定到叶节点结束。例如&#xff0c;在如图8.5所示中的二叉树中有两条…...

dbeaver查看表,解决证书报错current license is non-compliant for [jdbc]

http://localhost:9200/_license { “license” : { “status” : “active”, “uid” : “b91ae0e0-b04d-4e20-8730-cf0bca7b2035”, “type” : “basic”, “issue_date” : “2023-02-22T14:33:27.648Z”, “issue_date_in_millis” : 1677076407648, “max_nodes” : 10…...

装饰模式(Decorator Pattern)重构java邮件发奖系统实战

前言 现在我们有个如下的需求&#xff0c;设计一个邮件发奖的小系统&#xff0c; 需求 1.数据验证 → 2. 敏感信息加密 → 3. 日志记录 → 4. 实际发送邮件 装饰器模式&#xff08;Decorator Pattern&#xff09;允许向一个现有的对象添加新的功能&#xff0c;同时又不改变其…...

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装&#xff08;Encapsulation&#xff09; 定义&#xff1a;将数据&#xff08;属性&#xff09;和操作数据的方法绑定在一起&#xff0c;通过访问控制符&#xff08;private、protected、public&#xff09;隐藏内部实现细节。示例&#xff1a; public …...

学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1

每日一言 生活的美好&#xff0c;总是藏在那些你咬牙坚持的日子里。 硬件&#xff1a;OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写&#xff0c;"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类&#xff1a;块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

LLM基础1_语言模型如何处理文本

基于GitHub项目&#xff1a;https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken&#xff1a;OpenAI开发的专业"分词器" torch&#xff1a;Facebook开发的强力计算引擎&#xff0c;相当于超级计算器 理解词嵌入&#xff1a;给词语画"…...

Device Mapper 机制

Device Mapper 机制详解 Device Mapper&#xff08;简称 DM&#xff09;是 Linux 内核中的一套通用块设备映射框架&#xff0c;为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程&#xff0c;并配以详细的…...

SiFli 52把Imagie图片,Font字体资源放在指定位置,编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍&#xff1a; img 属性指定分区存放的 image 名称&#xff0c;指定的 image 名称必须是当前工程生成的 binary 。 如果 binary 有多个文件&#xff0c;则以 proj_name:binary_name 格式指定文件名&#xff0c; proj_name 为工程 名&…...

LOOI机器人的技术实现解析:从手势识别到边缘检测

LOOI机器人作为一款创新的AI硬件产品&#xff0c;通过将智能手机转变为具有情感交互能力的桌面机器人&#xff0c;展示了前沿AI技术与传统硬件设计的完美结合。作为AI与玩具领域的专家&#xff0c;我将全面解析LOOI的技术实现架构&#xff0c;特别是其手势识别、物体识别和环境…...

在树莓派上添加音频输入设备的几种方法

在树莓派上添加音频输入设备可以通过以下步骤完成&#xff0c;具体方法取决于设备类型&#xff08;如USB麦克风、3.5mm接口麦克风或HDMI音频输入&#xff09;。以下是详细指南&#xff1a; 1. 连接音频输入设备 USB麦克风/声卡&#xff1a;直接插入树莓派的USB接口。3.5mm麦克…...

Leetcode33( 搜索旋转排序数组)

题目表述 整数数组 nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转&#xff0c;使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...