8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达
今天给同学们分享一篇双疾病+WGCNA+多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表在Front lmmunol 期刊上,影响因子为8.786。

多囊卵巢综合征(PCOS)是一种复杂的内分泌代谢紊乱疾病,影响着5-10%的生育年龄妇女。PCOS患者的子宫内膜存在改变的免疫细胞,导致慢性低度炎症,这是反复植入失败(RIF)的原因之一。

图1 整个设计的流程图
1. GEO信息
根据作者的纳入标准,共选择了四个数据集进行发现性分析:GSE10946、GSE34526、GSE103465和GSE111974。其中,GSE10946和GSE34526被用作PCOS的发现队列,而GSE103465和GSE111974被视为RIF的发现队列。此外,GSE80432和GSE26787分别是PCOS和RIF的验证队列。在本研究中,作者简称这两个疾病组为PCOS和RIF。
2. 差异基因的鉴定
在进行生物信息分析之前,作者测试了收集的数据集的批次效应,并发现两种疾病的批次效应明显(图2A,E)。使用“sva”软件包,作者去除了PCOS(图2B)和RIF组(图2F)的批次效应,以获得可靠的分析结果。然后使用LIMMA软件包对两组之间的差异表达基因(DEGs)进行表征。对于PCOS,获得了201个差异基因(P<0.05,|log2 FC|>0.585),其中101个上调基因和100个下调基因。对于RIF,有253个差异基因(adj. P<0.05,|log2 FC|>1),其中167个上调基因和86个下调基因。火山图显示了PCOS(图2C)和RIF(图2G)组的所有差异基因。总体而言,通过热图(图2D,H)可视化了这两组中包含的差异基因。与PCOS和RIF相关的差异基因可能在它们的发生和发展中起到一定作用。

图2 去除批次效应并在PCOS和RIF中识别差异表达基因
3. 通过WGCNA筛选关键模块
为了调查疾病和关键基因是否相关,作者除了分析两组之间的差异表达外,还进行了WGCNA。使用软阈值方法,本研究构建了一个共表达网络。这个参数β对于共表达网络保持无标度拓扑结构至关重要。基于基因表达数据的生物网络很可能是无标度的。因此,在PCOS组中,拟合指数大于0.85被认为是无标度拓扑结构,β被设定为9(图3A)。通过使用邻接函数,生成了邻接矩阵。如图3B所示,使用TOM差异度量构建了层次聚类。作者总共确定了20个共表达模块。P<0.05的模块被视为关键模块。如图3C所示,antiquewhite4模块具有最强的正相关性,其中包含180个基因。同样,WGCNA也应用于RIF组,β=10是软功率的最佳值(图3D)。作者总共确定了19个模块,其中深灰色、深绿色和皇家蓝显示出强烈的正相关性,而绿黄色、鲑鱼色、深青色和浅黄色模块显示出强烈的负相关性(图3E,F)。在RIF组的这7个关键模块中的基因中,作者进一步选择了334个具有|MM| > 0.8和|GS| > 0.5的基因。这些来自两组关键模块的基因可能被用作候选的细胞特异性标记物。

图3 加权基因共表达网络分析(WGCNA)在多囊卵巢综合征(PCOS)和反复植入失败(RIF)中的应用
4. 共同基因的分析和功能富集
为了探索多囊卵巢综合征(PCOS)和反复流产(RIF)的共同发病机制,作者分别取上述差异表达基因(DEGs)和WGCNA筛选的基因的交集。图4A显示了PCOS和RIF的DEGs之间的重叠,共有11个基因(CHST11,FAM150B,GLIPR1,SLC16A6,MAMLD1,SLC46A2,ENPP3,HAPLN1,PLCXD3,FAM110C,GAS1)。WGCNA分析的基因中只有一个与之重叠(CCND2,图4B)。作者推测这12个基因可能与PCOS和RIF的发病机制有关,并且存在共同关系(图4C)。通过对这些基因进行功能注释和富集分析(图4D,E),作者试图研究PCOS和RIF之间的潜在生物学变化。毫不奇怪,共享基因的GO分析显示它们在早期胚胎器官形态发生相关通路中过度表达。值得注意的是,在所有富集的GO术语中,作者注意到有几个显著富集的生物过程通路,例如调节T细胞凋亡过程、肥大细胞激活和白细胞稳态,这表明免疫细胞的激活和凋亡可能对PCOS和RIF的共同发病机制有着重要贡献。此外,KEGG富集结果与GO分析一致。另外,作者还注意到几个与卵泡发育相关的通路富集,例如p53信号通路、FOXO信号通路、Hippo信号通路和PI3K-Akt信号通路。

图4 PCOS和RIF之间的共享基因标识和功能富集
5. 基于机器学习算法,识别潜在的诊断基因
为了进一步选择具有显著特征值以区分疾病组和对照组的最佳诊断基因靶点,作者基于上述12个共享基因应用了三种不同的算法(LASSO、SVM-RFE和随机森林)。在PCOS组中,根据LASSO系数曲线和最佳调参选择图,将λ设定为0.06851194(PCOS)(图5A)。随后,找到了8个具有非零系数的基因。然后,作者将上述12个基因输入RF分类器,并在重要性尺度上显示了前10个基因。作者选择了0.9作为重要性筛选阈值,并确定了一组包含9个基因的集合(图5B)。此外,SVM算法确定了5个具有最低5点交叉验证误差和最佳5点交叉验证准确性的基因(图5C)。通过将这三种算法重叠,作者确定了5个共享生物标志物(CHST11、GLIPR1、SLC16A6、MAMLD1、HAPLN1、GAS1)用于PCOS组(图5D,I)。

图5 使用三种机器学习算法筛选候选的PCOS和RIF诊断基因
同样地,当使用LASSO算法将λ设置为0.03001025时,作者得到了7个特征基因,用于RIF组(图5E)。图5F显示了重要性排名前10的基因,作者选择了9个基因(重要性>0.9)作为RM结果。接下来,使用SVM-REF算法确定了10个中心基因子集(图5G)。然后,通过三种算法获得的7个共同基因标志物重叠(图5H,I)。
6. 诊断中心生物标志物的诊断价值和验证
为了更准确地了解多囊卵巢综合征(PCOS)和反复植入失败(RIF)之间的关系,作者对PCOS和RIF群体的机器学习结果进行了交集分析,并得到了2个共享的诊断基因,GLIPR1和MAMLD1(图6A)。通过分析这两个基因的表达模式,评估了共享诊断基因的预测和鉴别能力。此外,还进行了受试者工作特征曲线(ROC曲线)的分析。

图6 选择和验证两个共享的诊断基因
首先,作者分析了两个发现队列中PCOS和RIF的表达水平。图6B显示GLIRP1在RIF组中较低(P<0.01),在PCOS组中较高(P<0.01)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.0001)中均表达较低(图6F)。
接下来,为了测试这两个目标基因在两种疾病诊断中的特异性和敏感性,作者进行了ROC分析。在多囊卵巢综合征生物标志物方面,这两个基因的结果是有利的:GLIPR1(AUC=0.812)和MAMLD1(AUC=0.774)。RIF组也经过了相同的ROC分析。每个生物标志物的预测性能都很强:GLIPR1(AUC=0.723)和MAMLD1(AUC=0.879)(图6C,G)。
此外,作者通过进行外部验证,确认了GLIPR1和MAMLD1作为多囊卵巢综合征(PCOS)和反复流产(RIF)的核心诊断基因的可靠性。在两个验证组中,这两个关键基因的表达水平与发现组相匹配。GLIPR1在RIF组中降低(P<0.05),在PCOS组中增加(P<0.05)(图6D)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.05)中均减少(图6H)。图6E显示,GLIPR1在PCOS验证队列中具有出色的诊断准确性(AUC=1.000),在RIF验证队列中也具有良好的诊断准确性(AUC=0.920)。同样,MAMLD1也能正确诊断PCOS(AUC=1.000)和RIF(AUC=0.840)(图6I)。因此,结果证实了它们作为PCOS和RIF的关键鉴别分子的能力。
7. 诊断基因的单基因GSEA
随后,作者分别在PCOS和RIF数据集中使用单基因GSEA分析了这两个生物标志物,并使用“GSEA”软件包可视化了前5个上调和下调的通路。图7显示,在这两个疾病组中,这两个基因都参与了代谢通路,如甘氨酸、丝氨酸、苏氨酸代谢、α-亚麻酸代谢和丙酸代谢。此外,这两个基因还富集在与炎症相关的通路中,将PCOS和RIF联系在一起。

图7 GSEA分析
8. 共享诊断基因的免疫浸润分析
考虑到多囊卵巢综合征(PCOS)和反复植入失败(RIF)都具有高免疫反应的特点。作者使用CIBERSORT分析了不同组别中免疫细胞的丰度。在每个组别中,22种免疫细胞的比例以条形图的形式展示。总体而言,条形图清楚地显示了PCOS(图8A)和RIF(图8E)之间T细胞、巨噬细胞和NK细胞群体百分比之间的显著差异。与对照样本相比,PCOS样本中的活化树突状细胞增加了(图8B)。而在RIF样本中,休息的NK细胞、巨噬细胞M0增加,γδT细胞和活化树突状细胞减少(图8F)。

图8 PCOS和RIF免疫细胞组成
此外,还研究了生物标志物与免疫细胞含量之间的关系。在多囊卵巢综合征样本中,CD8 T细胞与GLIPR1呈显著正相关(图8C)。相反,巨噬细胞M0呈负相关。MAMLD1与B细胞记忆呈显著正相关,与巨噬细胞M2、树突状细胞静止和单核细胞呈负相关(图8D)。在反复流产样本中,GLIPR1与静止NK细胞呈显著负相关(图8G)。而中性粒细胞和静止NK细胞与MAMLD1呈负相关(图8H)。免疫功能似乎对多囊卵巢综合征和反复流产的发展至关重要。
9. 在人体组织中通过RT-PCR验证GLIPRand MAMLD的有效性
对正常女性和多囊卵巢综合征(PCOS)患者的卵泡液颗粒细胞以及健康和反复流产(RIF)女性的子宫内膜组织进行了RT-PCR检测。这证实了两个诊断生物标志物GLIPR1和MAMLD1的基因表达水平。与数据分析一致,作者的结果显示,PCOS患者的颗粒细胞中GLIPR1的表达上调,而MAMLD1的表达下调(图9A),而RIF患者的子宫内膜组织中GLIPR1和MAMLD1的表达均减少(图9B)。

图9
总结
总之,诊断生物标志物GLIPR1和MAMLD1被确定为关键生物标志物,负责调节由TCA循环代谢物失衡引起的免疫细胞激活。作者的分析加强了PCOS患者反复流产的共病发病理论基础。
相关文章:

8+双疾病+WGCNA+多机器学习筛选疾病的共同靶点并验证表达
今天给同学们分享一篇双疾病WGCNA多机器学习的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表…...
springboot如何获取前端请求头的值并加入ThreadLocal
依赖: <dependency><groupId>org.aspectj</groupId><artifactId>aspectjweaver</artifactId><version>1.9.7</version> </dependency>示例: public class ThreadLocalUtil {private static ThreadLoc…...

程序员想要网上接单却看花了眼?那这几个平台你可得收藏好了!
现在经济压力这么大,但是生活成本还在上升,相信大家都知道“四脚吞金兽”的威力了吧!话虽如此,但是生活总得继续,为了家庭的和谐幸福,为了孩子的未来,不少人选择多干几份工作,赚点外…...
前端食堂技术周刊第 102 期:Next.js 14、Yarn 4.0、State of HTML、SEO 从 0 到 1
美味值:🌟🌟🌟🌟🌟 口味:肥牛宽粉 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 大家好,我是童欧巴。欢迎来到前端食堂技术周刊,我们先来看下…...

GPT与人类共生:解析AI助手的兴起
随着GPT模型的崭新应用,如百度的1和CSDN的2,以及AI助手的普及,人们开始讨论AI对就业市场和互联网公司的潜在影响。本文将探讨GPT和AI助手的共生关系,以及我们如何使用它们,以及使用的平台和动机。 GPT和AI助手…...

HTML脚本、字符实体、URL
HTML脚本: JavaScript 使 HTML 页面具有更强的动态和交互性。 <script> 标签用于定义客户端脚本,比如 JavaScript。<script> 元素既可包含脚本语句,也可通过 src 属性指向外部脚本文件。 JavaScript 最常用于图片操作、表单验…...
UOS安装Jenkins
一,环境准备 1.安装jdk 直接使用命令行(sudo apt install -y openjdk-11-jdk)安装jdk11 2.安装maven 参考此篇文章即可 UOS安装并配置Maven工具_uos 安装maven_蓝天下的一员的博客-CSDN博客 不过要注意这篇文章有个小错误,我…...
纯CSS实现卡片上绘制透明圆孔
<template><div class"dot-card-wrapper"><div class"top-wrapper"><slot name"top"></slot></div><!-->核心是下面这部分</--><div class"dot-row"><div class"left-…...

用前端框架Bootstrap的AdminLTE模板和Django实现后台首页的页面
承接博文 用前端框架Bootstrap和Django实现用户注册页面 继续开发实现 后台首页的页面。 01-下载 AdminLTE-3.1.0-rc 并解压缩 以下需要的四个文件夹及里面的文件百度网盘下载链接: https://pan.baidu.com/s/1QYpjOfSBJPmjmVuFZdSgFQ?pwdo9ta 下载 AdminLTE-3.1…...

Linux驱动 编译乱序和执行乱序
编译乱序 现代的高性能编译器在目标码优化上都具备对指令进行乱序优化的能力。编译器可以对访存的指令进行乱序,减少逻辑上不必要的访存,以及尽量提高Cache命中率和CPU的Load/Store单元的工作效率。 因此在打开编译器优化以后,看到生成的汇编…...

京东大数据平台(京东数据分析):9月京东牛奶乳品排行榜
鲸参谋监测的京东平台9月份牛奶乳品市场销售数据已出炉! 9月份,牛奶乳品市场销售呈大幅上涨。鲸参谋数据显示,今年9月,京东平台牛奶乳品市场的销量为2000万,环比增长约65%,同比增长约3%;销售额为…...

Hadoop RPC简介
数新网络-让每个人享受数据的价值https://www.datacyber.com/ 前 言 RPC(Remote Procedure Call)远程过程调用协议,一种通过网络从远程计算机上请求服务,而不需要了解底层网络技术的协议。RPC它假定某些协议的存在,例…...

你没有见过的 git log 风格
背景 git大家都不陌生,git log 也是大家经常用的指令,今天分享三种 git log的美化格式,大家看看哪种更易读。 git log -15 --graph --decorate --oneline 带有 pretty 格式的git log 风格 log --color --graph --prettyformat:‘%Cred%h%C…...

轻松搭建个人邮件服务器:实现远程发送邮件的hMailServer配置
文章目录 前言1. 安装hMailServer2. 设置hMailServer3. 客户端安装添加账号4. 测试发送邮件5. 安装cpolar6. 创建公网地址7. 测试远程发送邮件8. 固定连接公网地址9. 测试固定远程地址发送邮件 前言 hMailServer 是一个邮件服务器,通过它我们可以搭建自己的邮件服务,通过cpola…...
刷题笔记day08-字符串01
344. 反转字符串 思路1:使用双指针的方法,前后交换 func reverseString(s []byte) {// 思路1:使用双指针进行交换// 思路2:使用库函数进行交换for i, j : 0, len(s) - 1; i < j; {s[i], s[j] s[j], s[i]ij--} }思路2&…...

Pure-Pursuit 跟踪双移线 Gazebo 仿真
Pure-Pursuit 跟踪双移线 Gazebo 仿真 主要参考学习下面的博客和开源项目 自动驾驶规划控制(A*、pure pursuit、LQR算法,使用c在ubuntu和ros环境下实现) https://github.com/NeXTzhao/planning Pure-Pursuit 的理论基础见今年六月…...

Selenium学习(Java + Edge)
Selenium /səˈliːniəm/ 1. 简介 Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE、Mozilla Firefox、Safari、Google Chrome、Opera、Edge等。 适用于自动化测试&#x…...

项目管理-组织战略类型和层次讲解
组织战略类型和层次 对于不同的组织战略可能会采用不同的项目管理形式,组织作为项目管理的载体,其战略决策对项目管理体系的架构,对组织与项目之间责权利的划分具有深远的影响,组织的战略文化也会影响到项目的组织文化氛围。因此…...

面试算法50:向下的路径节点值之和
题目 给定一棵二叉树和一个值sum,求二叉树中节点值之和等于sum的路径的数目。路径的定义为二叉树中顺着指向子节点的指针向下移动所经过的节点,但不一定从根节点开始,也不一定到叶节点结束。例如,在如图8.5所示中的二叉树中有两条…...

dbeaver查看表,解决证书报错current license is non-compliant for [jdbc]
http://localhost:9200/_license { “license” : { “status” : “active”, “uid” : “b91ae0e0-b04d-4e20-8730-cf0bca7b2035”, “type” : “basic”, “issue_date” : “2023-02-22T14:33:27.648Z”, “issue_date_in_millis” : 1677076407648, “max_nodes” : 10…...
在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能
下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

python/java环境配置
环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...

CentOS下的分布式内存计算Spark环境部署
一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...

页面渲染流程与性能优化
页面渲染流程与性能优化详解(完整版) 一、现代浏览器渲染流程(详细说明) 1. 构建DOM树 浏览器接收到HTML文档后,会逐步解析并构建DOM(Document Object Model)树。具体过程如下: (…...

基于Docker Compose部署Java微服务项目
一. 创建根项目 根项目(父项目)主要用于依赖管理 一些需要注意的点: 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件,否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

ardupilot 开发环境eclipse 中import 缺少C++
目录 文章目录 目录摘要1.修复过程摘要 本节主要解决ardupilot 开发环境eclipse 中import 缺少C++,无法导入ardupilot代码,会引起查看不方便的问题。如下图所示 1.修复过程 0.安装ubuntu 软件中自带的eclipse 1.打开eclipse—Help—install new software 2.在 Work with中…...
工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配
AI3D视觉的工业赋能者 迁移科技成立于2017年,作为行业领先的3D工业相机及视觉系统供应商,累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成,通过稳定、易用、高回报的AI3D视觉系统,为汽车、新能源、金属制造等行…...

Linux --进程控制
本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...

OPENCV形态学基础之二腐蚀
一.腐蚀的原理 (图1) 数学表达式:dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一,腐蚀跟膨胀属于反向操作,膨胀是把图像图像变大,而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...

【从零学习JVM|第三篇】类的生命周期(高频面试题)
前言: 在Java编程中,类的生命周期是指类从被加载到内存中开始,到被卸载出内存为止的整个过程。了解类的生命周期对于理解Java程序的运行机制以及性能优化非常重要。本文会深入探寻类的生命周期,让读者对此有深刻印象。 目录 …...