8+纯生信,多组机器学习+分型探讨黑色素瘤发文思路。

越来越多的证据突出了免疫原性细胞死亡(ICD)在许多肿瘤中的关键功能。然而,利用ICD治疗黑色素瘤的可能性和机制仍未得到很好的研究。
1. 数据处理
图1显示了一个流程图,总结了研究过程。分析包括来自TCGA数据库的472个黑色素瘤样本和来自GEO数据库的额外214个黑色素瘤样本(GSE65904)。在对TCGA和GEO数据集中的所有基因进行交集操作后,共找到了20,188个共同基因。值得注意的是,由于其生存数据不完整,37个TCGA黑色素瘤样本和4个GEO黑色素瘤样本被省略。总共,分别合并了435个TCGA黑色素瘤样本和210个GEO黑色素瘤样本的mRNA表达数据和生存数据。对于接下来的研究,包括了34个与ICD相关的基因。

图1 本研究的工作流程
2. 癌症类型间与ICD相关的基因的mRNA表达及其预后意义
首先,图2A显示了与ICD相关基因的mRNA表达水平。在热图中,IFNG在CESC、KIRC和GBM中显示出明显升高的表达。IFNB1在BRCA和BLCA中显示出显著升高的表达,而IL6在BRCA和BLCA中显示出明显下降的表达。为了更生动地展示mRNA表达水平的差异的重要性,构建了一个显示-lg(pValue)的热图。相应肿瘤中mRNA表达变化越剧烈,颜色越红(图2B)。mRNA表达与生存期(OS)之间的单变量Cox回归分析结果区分了高风险的ICD相关基因(HR>1,p<0.05)和保护性的ICD相关基因(HR<1,p<0.05)。值得注意的是,CD4、FOXP3、CD8A、CXCR3、IFNG、PRF1、MYD88、ATG5、CD8B、IL1R1、TLR4、PIK3CA、TNF、CASP8和EIF2AK3在SKCM中显示出保护功能(图2C)。

图2 ICD相关基因在泛癌中的概述
3. 不同类型的癌症中,CNV、SNV、ICD相关基因的甲基化以及受ICD相关基因影响的免疫相关通路
CNV、SNV和甲基化在各种癌症中存在。泛癌CNV的总结表明CNV在各种癌症中高频率发生(>5%)(图2D)。与ICD相关基因的SNV状态在UCEC中明显且引人注目。而PIK3CA在BRCA、COAD和UCEC中显示出更高的SNV。PIK3CA在UCEC中的突变频率接近50%(图2E)。确切地说,PIK3CA的SNV类型主要是错义突变(图2F)。值得注意的是,PIK3CA的甲基化在大多数癌症中没有意义(图2G)。事实上,ICD相关基因可能与许多免疫相关途径相关,如图2H所示。
4. NMF聚类识别出两种黑色素瘤亚型
根据与ICD相关的基因表达矩阵,进行了NMF聚类,并选择了最佳聚类数为2(图3A)。聚类1和聚类2之间的临床特征组成差异表明,这两个亚型在许多方面(如生存状态、癌症状态和肿瘤分期)在统计学上存在差异(图3B)。至于两个聚类中不同的生存状态,聚类2中的样本具有更好的DSS、OS和PFI(图3C-E)。

图3 通过NMF聚类获得的不同簇亚型之间的临床特征、生存状况和肿瘤免疫微环境的比较
肿瘤免疫微环境也存在统计学上的差异。与免疫成分相关的较高的免疫评分存在于C2中。C2中的肿瘤纯度较C1差(图3F)。值得注意的是,不同亚型中的肿瘤浸润免疫细胞显示不同的百分比。C2中存在更多的抗肿瘤免疫细胞,如CD8 T细胞、活化的CD4 T记忆细胞、活化的NK细胞和M1巨噬细胞。至于促癌免疫细胞,C2中的M2巨噬细胞被下调(图3G)。两个亚型中的免疫检查点基因(ICGs)也存在差异。几乎所有的ICGs在C2中的表达都更高。值得注意的是,包括PD-1(PDCD1)、PD-L1(CD274)和CTLA4在内的常见免疫治疗靶点在C2中高度表达(图3H)。
5. ICD-DEGs的调查和ICDRS的构建
鉴于两个聚类亚型在统计上具有不同的生存状态和肿瘤免疫微环境,可以将这两个聚类区分开来。然后,确定了聚类1和聚类2之间的534个ICD-DEGs(附图1)。单变量Cox回归分析的结果显示,这534个ICD-DEGs中的237个可能用作预后预测因子。随后,通过LASSO回归分析消除了这237个ICD-DEGs之间的共线性,并避免了预后标志物的过度拟合。选择了3个ICD-DEGs进行进一步的多变量Cox回归分析。最后,使用多变量Cox比例风险回归分析结合3个ICD-DEGs(即GBP2、THBS4和APOBEC3G)开发了一个ICDRS。在R中应用“predict”函数计算了所有四个队列中黑色素瘤患者的风险评分,并使用训练集中的中位数风险评分1.0342095作为分割值将样本分为高风险和低风险亚群。
然后进行了主成分分析(PCA)和t-SNE分析,以确定黑色素瘤样本在低风险和高风险亚群中的整体分布情况。两个亚群中的患者可以有效区分(图4A、B)。生存分析显示,两个亚群中的样本对应不同的生存状态:高风险亚群的总生存率较低(p < 0.05)(图4C)。然后,通过热图展示了这三个ICD-DEGs在高风险亚群和低风险亚群中的表达水平:与低风险亚群相比,高风险亚群中GBP2和APOBEC3G的表达水平较低,而THBS4的表达水平较高(图4D)。此外,低风险和高风险亚群的肿瘤免疫微环境也存在统计学差异:高风险患者的免疫评分较低,但肿瘤纯度较高,与低风险患者相比(图4E、F);此外,免疫评分与风险评分呈高度负相关(R=-0.52,P=2.8e-16),而肿瘤纯度与风险评分呈中度正相关(R=0.39,P=2.5e-09)(图4G、H)。此外,ROC曲线下的曲线面积(AUC)值分别为0.922、0.763和0.696,对应0.5年、1年和2年的生存率(图4I)。

图4 在列车队列中建立ICDRS
6. ICDRS在黑色素瘤中的内部和外部验证
首先,根据训练集的中位风险评分,将三个测试队列中的患者分别分组为低风险和高风险亚群。对于内部验证(测试1和测试2队列)和外部验证(测试3队列),通过T-SNE和PCA可以轻松区分两个亚群中的患者(图5A、B,图6A、B,7A、B)。同样,在三个测试队列中,高风险亚群的患者的生存率较差(所有p值<0.05)(图5C、6C和7C)。此外,从三个测试队列获得的热图显示高风险亚群中GBP2和APOBEC3G的表达减弱,而THBS4的表达增强(图5D、6D和7D)。同样,这三个队列中的肿瘤免疫微环境与训练集的结果相同(图5E、F,6E、F和7E、F)。此外,免疫评分在测试1队列(R=-0.4,p=1.2e-09)、测试2队列(R=-0.43,p<2.2e-16)和测试3队列(R=-0.6,p<2.2e-16)(图5G、6G和7G),而TumorPurity也显示出与测试1队列(R=0.25,p=0.00026)、测试2队列(R=0.29,p=5.2e-10)和测试3队列(R=0.39,p=5.2e-09)的风险评分存在显著正相关关系(图5H、6H和7H)。至于风险评分的诊断价值,ROC曲线的AUC值分别为0.768、0.767和0.673(测试1队列)、0.852、0.762和0.684(测试2队列)以及0.729、0.706和0.730(测试3队列),对应0.5年、1年和2年的生存率(图5I、6I和7I)。值得注意的是,内部验证(测试1和测试2队列)和外部验证(测试3队列)的所有结果与训练队列的结果一致。

图5 ICDRS在test1队列中的内部验证

图6 ICDRS在test2队列中的内部验证

图7 ICDRS在test2队列中的内部验证
此外,同时考虑基于ICDRS的生存概率差异、AUC值和C指数,与其他三个标志相比,ICDRS在预后价值和诊断准确性方面表现出优势(图8)。根据AUC值,ICDRS在所有四个队列中表现出令人满意且稳定的性能。值得注意的是,由其他三个标志区分的不同风险亚群的生存概率差异有时显示出无统计学意义。而ICDRS的C指数高于其他三个标志,并分别为0.66、0.62、0.64和0.67在四个不同队列中。

图8 ICDRS的比较分析
7. 基于ICDRS的四个队列中的免疫相关差异
鉴于低风险和高风险亚群中肿瘤免疫微环境的差异,本研究在所有四个队列中对免疫相关差异进行了更深入的探索。
首先,四个队列中低风险和高风险亚群中肿瘤浸润免疫细胞的共识差异表明,高风险亚群存在M1巨噬细胞和活化的CD4+ T记忆细胞浸润丰度较低,但M2巨噬细胞和静息的CD4+ T记忆细胞浸润较多(图9A-D)。随后,皮尔逊相关分析显示,在训练队列中,M1巨噬细胞的比例与风险评分呈显著负相关(R=-0.3,p=0.0037),在测试1队列中(R=-0.22,p=0.021),在测试2队列中(R=-0.23,p=0.0016),在测试3队列中(R=-0.31,p=0.00041)(图9E);M2巨噬细胞的百分比与风险评分呈显著正相关,在训练队列中(R=0.37,p=0.00026),在测试1队列中(R=0.35,p=0.00016),在测试2队列中(R=0.35,p=5.9e-07),在测试3队列中(R=0.56,p=2.2e-11)(图9F);活化的CD4+ T记忆细胞的比例与风险评分呈显著负相关,在训练队列中(R=-0.38,p=0.00018),在测试1队列中(R=-0.3,p=0.0014),在测试2队列中(R=-0.29,p=4.4e-05),在测试3队列中(R=-0.36,p=4.6e-05)(图9G);休息的CD4+ T记忆细胞百分比与训练队列中的风险评分呈显著正相关(R=0.3,p=0.0029),测试1队列(R=0.26,p=0.0048),测试2队列(R=0.24,p=0.00082)和测试3队列(R=0.25,p=0.0049)(图9H)。

图9
此外,四个队列中低风险和高风险亚型中ICGs表达的差异显示,共有52个ICGs在高风险亚群中表达下降(图10A-D)。其中30个ICGs(HLA-A,BTLA,CD80,HLA-C,CD27,CD40,CD86,BTN3A1,HLA-DMB,CD96,HAVCR2,HLA-B,HLA-DMA,ICOS,HLA-DOB,LGALS9,PDCD1,HLA-DPB1,HLA-F,HLA-DOA,HLA-DRA,HLA-E,HLA-DQA1,IDO1,KIR2DL4,LAG3,PDCD1LG2,HLA-DPA1,HLA-DQB1和TIGIT)在四个队列中同时与风险评分呈中度负相关关系(所有R<-0.3,所有p<0.05)(图10E-H)。

图10
接下来,与ICD相关的基因在低风险和高风险亚群中也存在差异。总共有17个与ICD相关的基因(ATG5,CASP1,CASP8,CD4,CD8A,CD8B,CXCR3,ENTPD1,IFNG,IFNGR1,IL1B,LY96,MYD88,NLRP3,PRF1,TLR4,TNF)在所有四个队列的高风险亚群中表达下降(图11A)。此外,低风险和高风险亚群中每个免疫相关通路的激活也不同。高风险亚型的免疫相关通路激活程度下降。在四个队列中,有21个通路在两个亚群中同时显示出统计学差异(图11B)。值得注意的是,6个与ICD相关的基因(CD8A,PRF1,IFNG,CXCR3,TNF,CD8B)在四个队列中与风险评分呈中度负相关(所有R<-0.3,所有p<0.05)(图11C-F)。在四个队列中,有20个中的21个统计学上不同的免疫相关通路(例如MHC I和II类介导的抗原呈递和处理、Toll样和NOD样受体信号通路、T细胞和B细胞受体信号通路、NK细胞介导的细胞毒性、IL-1、IL-2和IL-10相关的信号通路、PD-1和CTLA-4相关的通路)与风险评分呈中度负相关(所有R<-0.3,所有p<0.05)(图11G-J)。

图11
8. 基于ICDRS的黑色素瘤免疫治疗反应预测和潜在药物治疗
最近的研究表明,基于免疫原性的IPS对免疫疗法的反应预测有所帮助。分析了在不同ICDRS亚群中使用抗PD-1抗体和抗CTLA-4抗体的反应概率。结果显示,高风险亚群的IPS较低,可能有较差的免疫疗法反应(图12A-C)。在高风险中,通过筛选标准为FDR < 0.05和log2 FC > 1在所有四个队列中,探索了上调的目标DEGs。根据四个队列中各自的潜在药物预测,以下31种药物作用于上调的目标DEGs:阿西替尼、布利万、西地那非、蟾蜍毒苷、达沙替尼、多维替尼、ENMD-2076、GTP-14564、HG-6-64-01、伊马替尼、利尼非尼、马西替尼、米多吡嗪、莫替西布、尼洛替尼、奥利司他、缩宫素、帕唑帕尼、苯基丁酸、PD-173074、奎扎替尼、RHC-80267、RO-08-2750、罗非昔布、塞马昔尼、索拉非尼、斯特罗凡丁、SU-11652、舒尼替尼和替伏替尼。其作用机制如图12D-G所示。

图12
总结
作者成功地将TCGA-黑色素瘤样本根据ICD相关基因的表达分为两个亚型,并基于两个亚型之间的差异表达基因(DEGs)开发了一个包含3个基因(即GBP2、THBS4和APOBEC3G)的预后ICDRS。ICDRS在训练队列、内部验证队列(测试1和测试2队列)以及外部验证队列(测试3队列)中展现出良好的诊断价值,并与不同的肿瘤免疫微环境相关。因此,基于三个ICD依赖的DEGs表达的ICDRS可能被应用于确定黑色素瘤的预后、M1/M2巨噬细胞的浸润、ICGs和ICD相关基因的表达水平,以及免疫相关通路的功能。这将有助于为个体化的黑色素瘤治疗进行患者分类。
相关文章:

8+纯生信,多组机器学习+分型探讨黑色素瘤发文思路。
今天给同学们分享一篇泛癌多组机器学习分型的生信文章“Comprehensive characterisation of immunogenic cell death in melanoma revealing the association with prognosis and tumor immune microenvironment”,这篇文章于2022年9月23日发表在Front Immunol 期刊…...
GPU高性能面试-写一个ReduceKernel
要求写一个reduceKernel 要求给出Kerne的完整调用: 1. 进行一维reduce 可以写一个最基础的,仅仅实现基础功能就行 使用share mem进行功能优化 使用shuffles指令完成block reduce操作 2.实现二维reduce...

深入探索STARK的安全性和可靠性——STARKs全面安全分析
1. 引言 non-interactive STARKs,起源于Interactive Oracle Proofs (IOPs),然后通过random oracle模式转换为非交互式。StarkWare团队 ethSTARK Documentation – Version 1.2(2023年7月)论文做了更新,给出了完整具体…...
WPF 控件分辨率自适应问题
WPF 控件分辨率自适应时,我首先想到的是使用ViewBox控件来做分辨率自适应。 ViewBox这个控件通常和其他控件结合起来使用,是WPF中非常有用的控件。定义一个内容容器。ViewBox组件的作用是拉伸或延展位于其中的组件,以填满可用空间࿰…...

CANoe创建仿真工程
CANoe创建仿真工程 写在前面仿真工程的创建创建工程添加CAN数据库添加系统变量创建面板创建网络节点为节点添加代码工程运行测试总结 写在前面 Canoe的安装不是特别方便,我是参加了松勤的培训课程,不仅需要安装软件还需要安装驱动,刚刚学习的…...
Scanner 输入回车跳不出循环的解决方法
题目要求: 输入一行内容包含字符串和数字,将字符串与数字分别提取。 解决方法: 可以使用两个Scanner对象,一个用来键入数据,另外一个用来对数据进行操作,以此来解决输入“回车”跳不出while循环的问题。 i…...
docker 启动 mysql 通过防火墙设置端口无法访问解决方案
1、问题描述:通过 docker compose 启动mysql服务,然而在防火墙添加了3306端口后却无法访问,但是关闭防火墙后又可以访问mysql数据库。 解决方案: 重启 docker 后解决:systemctl restart docker 如果没有解决问题则执…...

智能制造优化,RFID生产线管理系统解决方案
一、背景介绍 随着全球经济的发展,传统制造业面临着越来越高的成本和低利润的挑战,为了提升企业的整体利润率,优化管理流程成为必要的手段之一,在传统的制造企业中,生产线通常采用单件流生产模式,但这种模…...

【Mybatis】基于Mybatis插件+注解,实现敏感数据自动加解密
一、介绍 业务场景中经常会遇到诸如用户手机号,身份证号,银行卡号,邮箱,地址,密码等等信息,属于敏感信息,需要保存在数据库中。而很多公司会会要求对数据库中的此类数据进行加密存储。 敏感数据…...

【特纳斯电子】基于物联网的指纹密码锁系统设计-实物设计
资料下载链接:基于物联网的指纹密码锁系统设计-实物设计 - 电子校园网 编号: T3732205M-SW 设计简介: 本设计是基于单片机的指纹密码锁,主要实现以下功能: 1、可通过密码解锁 2、可通过云平台解锁 3、可通过指纹解…...

【牛客面试必刷TOP101】Day9.BM37 二叉搜索树的最近公共祖先和BM42 用两个栈实现队列
作者简介:大家好,我是未央; 博客首页:未央.303 系列专栏:牛客面试必刷TOP101 每日一句:人的一生,可以有所作为的时机只有一次,那就是现在!!!&…...
10.12 校招 实习 内推 面经
绿*泡*泡: neituijunsir 交流裙 ,内推/实习/校招汇总表格 1、校招 | 2024届秋招,美团哪些校招岗位最缺人?(内推) 校招 | 2024届秋招,美团哪些校招岗位最缺人?(内推&…...
redis 生成流水工具类
使用redis存储流水号,代码如下: import cn.hutool.core.date.DateUtil; import org.springframework.data.redis.core.RedisTemplate; import org.springframework.stereotype.Component;Component public class RedisSerialUtil {private RedisTemplate…...

BGP服务器租用腾讯云和阿里云价格对比
BGP云服务器像阿里云和腾讯云均是BGP多线网络,速度更快延迟更低,阿里云BGP服务器2核2G3M带宽优惠价格108元一年起,腾讯云BGP服务器2核2G3M带宽95元一年起,阿腾云atengyun.com分享更多云服务器配置如2核4G、4核8G、8核16G等配置价格…...

PyTorch 深度学习之多分类问题Softmax Classifier(八)
1. Revision: Diabetes dataset 2. Design 10 outputs using Sigmoid? 2.1 Output a Distribution of prediction with Softmax 2.2 Softmax Layer Example, 2.3 Loss Function-Cross Entropy Cross Entropy in Numpy Cross Entropy in PyTorch 注意交叉熵损失,最…...

抖音直播招聘小程序可以增加职位展示,提升转化率,增加曝光度
抖音直播招聘报白是指进入抖音的白名单,允许在直播间或小视频中发布招聘或找工作等关键词。否则会断播、不推流、限流。抖音已成为短视频流量最大的平台,但招聘企业数量较少。抖音招聘的优势在于职位以视频、直播方式展示,留存联系方式更加精…...

论文阅读之《Learn to see in the dark》
Learning to See in the Dark-CVPR2018 Chen ChenUIUC(伊利诺伊大学厄巴纳-香槟分校) Qifeng Chen, Jia Xu, Vladlen Koltun Intel Labs(英特尔研究院) 文章链接:https://arxiv.org/pdf/1805.01934.pdfhttps://arxiv.org/pdf/1805.01934.p…...
Docker 生成自定义镜像并使用Docker Compose部署
Docker 生成自定义镜像并使用Docker Compose部署 Docker Compose 是一个用于定义和运行多个 Docker 容器的工具,可以轻松管理复杂的应用程序。本文将介绍如何在 Docker Compose 中使用自定义 Docker 镜像,并提供了生成自定义 Docker 镜像的步骤。 步骤…...
设计模式~调停者(中介者)模式(Mediator)-21
调停者(中介者)模式(Mediator) (1)优点 (2)缺点 (3)使用场景 (4)注意事项: (5)应用实例: 代码 调停者&a…...

计算机毕业设计选什么题目好?springboot 医院门诊在线预约挂号系统
✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…...
KubeSphere 容器平台高可用:环境搭建与可视化操作指南
Linux_k8s篇 欢迎来到Linux的世界,看笔记好好学多敲多打,每个人都是大神! 题目:KubeSphere 容器平台高可用:环境搭建与可视化操作指南 版本号: 1.0,0 作者: 老王要学习 日期: 2025.06.05 适用环境: Ubuntu22 文档说…...
R语言AI模型部署方案:精准离线运行详解
R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...
PHP和Node.js哪个更爽?
先说结论,rust完胜。 php:laravel,swoole,webman,最开始在苏宁的时候写了几年php,当时觉得php真的是世界上最好的语言,因为当初活在舒适圈里,不愿意跳出来,就好比当初活在…...
MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例
一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...
深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...
React Native在HarmonyOS 5.0阅读类应用开发中的实践
一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强,React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 (1)使用React Native…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放
简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...

相机从app启动流程
一、流程框架图 二、具体流程分析 1、得到cameralist和对应的静态信息 目录如下: 重点代码分析: 启动相机前,先要通过getCameraIdList获取camera的个数以及id,然后可以通过getCameraCharacteristics获取对应id camera的capabilities(静态信息)进行一些openCamera前的…...
大模型多显卡多服务器并行计算方法与实践指南
一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...