当前位置: 首页 > article >正文

别再只用GO/KEGG了!用R语言做GSEA分析,一眼看懂通路是激活还是抑制

别再只用GO/KEGG了用R语言做GSEA分析一眼看懂通路是激活还是抑制当你拿到差异表达分析结果兴冲冲地跑完GO/KEGG富集分析后是否经常遇到这样的困惑同一个通路里有的基因上调有的基因下调这条通路到底是激活了还是抑制了传统富集分析就像给你一张模糊的照片而GSEA则像打开了高清模式让你一眼看清通路的真实状态。1. 为什么GSEA是解读通路功能的利器在生物信息学分析中我们常常陷入一个尴尬的境地差异基因分析给出了几百个显著基因GO/KEGG告诉我们这些基因集中在哪些通路但这些通路到底是开还是关传统方法却给不出明确答案。这就是GSEA(Gene Set Enrichment Analysis)大显身手的时候了。GSEA的核心优势在于它能捕捉基因表达变化的整体趋势。想象一下如果一个通路中的大部分基因都集中在表达量排序的顶端上调或底端下调即使单个基因的变化不显著这个通路整体上也很可能有功能变化。这正是传统富集分析无法告诉你的关键信息。GSEA与GO/KEGG的关键区别特征GO/KEGGGSEA分析角度离散的基因列表连续的基因排序结果解读哪些通路被富集通路是被激活还是抑制敏感性需要预设显著性阈值能发现微弱但一致的表达变化可视化条形图/气泡图富集分数曲线图提示GSEA特别适合分析那些变化幅度不大但协调一致的基因集这在免疫反应、代谢调控等过程中很常见。2. 准备GSEA分析所需的数据和环境2.1 安装必要的R包在R中运行GSEA分析我们需要几个核心包的支持# 安装必要包 if (!require(BiocManager)) install.packages(BiocManager) BiocManager::install(c(clusterProfiler, GSEABase, fgsea)) install.packages(c(ggplot2, ggsci, dplyr))这些包各司其职clusterProfilerGSEA分析的主力包GSEABase处理基因集数据fgsea快速GSEA实现ggplot2/ggsci可视化dplyr数据整理2.2 准备输入数据GSEA需要两类关键输入排序的基因列表通常根据log2FC或差异显著性排序基因集可以是标准数据库(如MSigDB)或自定义基因集准备差异表达数据的典型代码# 读取差异分析结果 diff_data - read.csv(diff_genes.csv, row.names1) # 按log2FC排序 gene_list - diff_data$log2FoldChange names(gene_list) - rownames(diff_data) gene_list - sort(gene_list, decreasingTRUE)获取基因集的几种方式从MSigDB下载GMT文件使用clusterProfiler内置的KEGG/GO基因集自定义感兴趣的基因集3. 使用clusterProfiler进行GSEA分析3.1 基本分析流程clusterProfiler是进行GSEA最全面的R包之一。下面是一个完整的分析示例library(clusterProfiler) library(ggplot2) # 使用KEGG基因集为例 gsea_result - gseKEGG( geneList gene_list, organism hsa, # 人类使用hsa keyType kegg, exponent 1, minGSSize 10, maxGSSize 500, pvalueCutoff 0.05, pAdjustMethod BH, verbose FALSE ) # 查看显著结果 head(as.data.frame(gsea_result))关键参数说明exponent加权分数计算方式通常用1min/maxGSSize基因集大小过滤pAdjustMethod多重检验校正方法3.2 解读GSEA结果GSEA结果中最关键的指标是NES(Normalized Enrichment Score)NES 0基因集在排序列表顶部富集通路激活NES 0基因集在排序列表底部富集通路抑制p.adjust校正后的显著性水平一个典型的结果表格如下IDDescriptionNESpvaluep.adjusthsa04612抗原处理与呈递2.120.0010.008hsa04060细胞因子互作-1.980.0020.0124. 高级分析与可视化技巧4.1 多数据库联合分析GSEA的强大之处在于可以同时分析多个基因集数据库# 自定义基因集数据库 gene_sets - list( My_Pathway1 c(GeneA, GeneB, GeneC), My_Pathway2 c(GeneD, GeneE, GeneF) ) # 转换为GSEA需要的格式 term2gene - stack(gene_sets)[,2:1] colnames(term2gene) - c(term, gene) # 运行GSEA custom_gsea - GSEA(gene_list, TERM2GENEterm2gene)4.2 专业级可视化clusterProfiler提供了丰富的可视化函数单个通路可视化gseaplot2(gsea_result, geneSetID hsa04612, title 抗原处理与呈递通路, color red, pvalue_table TRUE)多个通路组合图top_pathways - head(gsea_result$ID, 3) gseaplot2(gsea_result, geneSetID top_pathways, subplots 1:3, color c(#E64B35, #4DBBD5, #00A087))进阶美化技巧library(ggplot2) # 获取绘图数据 plot_data - mutate_terms(gsea_result, foldChangegene_list) # 自定义ggplot ggplot(plot_data, aes(xNES, y-log10(p.adjust), colorDescription)) geom_point(size3) scale_color_brewer(paletteSet1) theme_minimal() labs(xNES, y-log10(adj.p), titleGSEA结果气泡图)5. 实战案例免疫治疗响应标志物发现最近一位同事在分析PD-1治疗前后的转录组数据时GO/KEGG只找到了免疫应答等宽泛的通路而GSEA则明确指出了干扰素γ响应(NES2.3, p.adj0.003)和T细胞活化(NES1.9, p.adj0.012)等通路被显著激活同时WNT信号通路(NES-2.1, p.adj0.004)被抑制。这些发现与临床响应率高度一致后来成为了他们预测治疗响应的关键标志物。在具体操作中我发现以下几点特别重要基因排序时使用signed -log10(pvalue)*log2FC比单纯用log2FC更稳健对于免疫相关研究MSigDB中的C7免疫基因集特别有用当分析小鼠数据时记得使用org.Mm.eg.db而不是人类数据库

相关文章:

别再只用GO/KEGG了!用R语言做GSEA分析,一眼看懂通路是激活还是抑制

别再只用GO/KEGG了!用R语言做GSEA分析,一眼看懂通路是激活还是抑制 当你拿到差异表达分析结果,兴冲冲地跑完GO/KEGG富集分析后,是否经常遇到这样的困惑:同一个通路里,有的基因上调,有的基因下调…...

TouchGal完整指南:如何搭建一站式Galgame文化社区平台

TouchGal完整指南:如何搭建一站式Galgame文化社区平台 【免费下载链接】kun-touchgal-next TouchGAL是立足于分享快乐的一站式Galgame文化社区, 为Gal爱好者提供一片净土! 项目地址: https://gitcode.com/gh_mirrors/ku/kun-touchgal-next TouchGal是一个基于…...

别再和posedge搞混了!手把手教你用SVA的$rose/$fell写对时序断言(附SystemVerilog代码)

深入解析SVA中的$rose与$fell:时序断言的核心差异与实战技巧 刚接触SystemVerilog断言(SVA)的工程师们,经常会把$rose/$fell与Verilog中的posedge/negedge混为一谈。这种误解可能导致测试平台中的断言行为与预期完全不符——你的断…...

Windows Internals 10.5.3:ETW 架构详解,从事件产生到性能分析的完整链路

🔥个人主页:杨利杰YJlio❄️个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》 《Python》 《Kali Linux》 《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更…...

BiliRoamingX终极指南:解锁B站完整观影体验的完整教程

BiliRoamingX终极指南:解锁B站完整观影体验的完整教程 【免费下载链接】BiliRoamingX-integrations BiliRoamingX integrations and patches powered by ReVanced. 项目地址: https://gitcode.com/gh_mirrors/bi/BiliRoamingX-integrations 你是否厌倦了B站A…...

RKNN混合量化避坑指南:从手动调参到自动配置,让你的ResNet18在RK3588上精度提升5%

RKNN混合量化实战:从手动调优到智能配置的精度跃迁之路 在边缘计算设备上部署深度学习模型时,量化技术已经成为平衡性能与精度的关键手段。RK3588作为Rockchip旗舰级AI芯片,其NPU算力可达6TOPS,但真正发挥硬件潜力需要精细的量化策…...

3步实现影院级沉浸体验,让你的网易云音乐播放界面焕然一新

3步实现影院级沉浸体验,让你的网易云音乐播放界面焕然一新 【免费下载链接】refined-now-playing-netease 🎵 网易云音乐沉浸式播放界面、歌词动画 - BetterNCM 插件 项目地址: https://gitcode.com/gh_mirrors/re/refined-now-playing-netease 你…...

揭秘微信单向好友检测:WechatRealFriends技术深度解析与实战指南

揭秘微信单向好友检测:WechatRealFriends技术深度解析与实战指南 【免费下载链接】WechatRealFriends 微信好友关系一键检测,基于微信ipad协议,看看有没有朋友偷偷删掉或者拉黑你 项目地址: https://gitcode.com/gh_mirrors/we/WechatRealF…...

云成本优化:每年为公司省下百万的架构设计技巧

在软件测试工作中,我们常常将目光聚焦于功能验证、性能瓶颈排查与安全漏洞挖掘,却容易忽视云资源成本这一隐性但影响深远的环节。随着企业上云规模不断扩大,云账单的悄然增长逐渐成为运营负担。作为软件测试从业者,我们凭借对系统…...

SAP ABAP开发避坑指南:COMMIT WORK和COMMIT WORK AND WAIT到底怎么选?

SAP ABAP开发实战:COMMIT WORK与COMMIT WORK AND WAIT的智能决策框架 在SAP ABAP开发中,数据提交操作的选择往往决定了系统的稳定性和业务数据的可靠性。许多开发者在面对COMMIT WORK和COMMIT WORK AND WAIT时,常常陷入两难:是追求…...

低代码/无代码革命:软件测试从业者的机遇与挑战

在数字化浪潮的席卷下,低代码/无代码(Low-Code/No-Code,LC/NC)平台如雨后春笋般涌现,正以颠覆性的力量重塑软件开发的格局。Forrester Research的数据显示,到2025年,低代码/无代码平台将占据全球…...

抖音下载终极指南:3分钟搞定无水印批量下载,快速保存你喜欢的视频

抖音下载终极指南:3分钟搞定无水印批量下载,快速保存你喜欢的视频 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and …...

别再只会看波形了!用Tektronix TBS1102B示波器精准测量直流电压的保姆级教程

别再只会看波形了!用Tektronix TBS1102B示波器精准测量直流电压的保姆级教程 示波器在电子工程师手中就像外科医生的手术刀——但很多人只把它当作"波形显示器",却忽略了它作为精密电压表的潜力。Tektronix TBS1102B这款入门级示波器&#xff…...

3种无EXE方案彻底移除Windows Defender:纯脚本实现深度指南

3种无EXE方案彻底移除Windows Defender:纯脚本实现深度指南 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.com/gh_mirror…...

开源MIT协议90度半边脸识别性别android方案

方案 1:侧脸性别 √ 可以做到 | 年龄 做不到模型:YOLOv8 人体属性识别(商用免费 MIT)不靠脸看身形、体态、肩膀、骨盆、走路姿态90 侧脸、背影、全身 都能识别:✅ 男 / 女❌ 无法识别精确年龄(只能分成人 …...

2026年床垫弹簧机生产厂家排名,靠谱选择看这几点

说到选床垫弹簧机生产厂家,很多人上来就问“排名”。但说句实在话,单纯看排名很容易踩坑。国内做这行的企业不少,但能做到技术过硬、服务到位、还能陪你走长远的,其实就那么几家。2026年,与其迷信榜单,不如…...

2小时视频5分钟学完?2026年值得一试的AI视频总结工具

长视频→图文讲义,不是转写,是真正帮你学完 先算一笔账 你B站收藏夹里有多少干货视频? 我数了一下,237个视频,平均时长28分钟。算下来就是110小时的内容量——不吃不睡看5天才能看完。 为什么收藏了再也没看过呢&am…...

ARM SIMD指令集:UQSUB与USHL详解与优化实践

1. ARM SIMD指令集概述在ARM架构中,SIMD(Single Instruction Multiple Data)技术通过单条指令同时处理多个数据元素,显著提升了多媒体处理、科学计算等场景的性能。作为ARMv8/v9架构的重要组成部分,NEON技术提供了丰富…...

2025届必备的六大AI学术方案解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 凭借自然语言处理以及机器学习模型,人工智能技术给学术论文写作提供了高效辅助工…...

Adobe-GenP:智能破解工具如何3分钟内解锁Adobe全家桶?

Adobe-GenP:智能破解工具如何3分钟内解锁Adobe全家桶? 【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP 在创意设计领域,Adobe Cre…...

终极平滑滚动解决方案:如何用Mos让你的macOS鼠标滚轮体验飞升

终极平滑滚动解决方案:如何用Mos让你的macOS鼠标滚轮体验飞升 【免费下载链接】Mos 一个用于在 macOS 上平滑你的鼠标滚动效果或单独设置滚动方向的小工具, 让你的滚轮爽如触控板 | A lightweight tool used to smooth scrolling and set scroll direction independ…...

告别数据孤岛:在WinForm项目里用C#调用MATLAB函数,实现矩阵计算与结果自动存TXT

告别数据孤岛:在WinForm项目里用C#调用MATLAB函数,实现矩阵计算与结果自动存TXT 当桌面应用开发遇上复杂数学计算,很多开发者都会面临一个经典困境:C#擅长构建用户界面和业务逻辑,但处理矩阵运算、信号处理等专业计算时…...

2026届必备的AI学术助手实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 具有全面性且深入性的DeepSeek系列论文,展示了大规模语言模型于技术层面的创新成…...

手把手教你用Pinecone和Hugging Face数据集,5步搞定一个多模态混合搜索Demo

5步实战:基于Pinecone与Hugging Face打造时尚商品多模态搜索系统 当你在电商平台搜索"复古风蓝色牛仔裤"时,是否遇到过返回结果与预期不符的情况?传统关键词搜索的局限性正在被新一代多模态混合搜索技术打破。本文将带你用Pinecone…...

R 4.5情感分析项目交付倒计时:客户验收必查的6类偏见指标+3份可签字审计报告模板

更多请点击: https://intelliparadigm.com 第一章:R 4.5情感分析项目交付倒计时总览 距离 R 4.5 情感分析项目正式交付仅剩 14 天,当前整体进度达 82%,核心模型训练与评估已闭环,正进入最终集成测试与文档固化阶段。本…...

为什么 2026 年被称为 AI Agent Harness Engineering 元年

为什么全行业都在说2026年是AI Agent Harness Engineering元年?从概念、痛点到落地的完整解析 引言 如果你关注AI领域的最新动态,大概率在2025年底已经听到过无数次「2026年是AI Agent Harness Engineering元年」的判断。从OpenAI的年度开发者大会到国内大厂的AI战略发布会…...

OpenAI隐私过滤器

多年来,这个笑话一直在自我书写。OpenAI。 这家公司的名字里包含"Open",就像"超大虾"里包含"超大"一样。好吧,看来压力足够让OpenAI开始认真出货了。 2026年4月22日,OpenAI在Apache 2.0下发布了一…...

从128ms到9.3ms响应,从$427/月到$158/月——PHP 9.0异步AI网关真实成本拆解(含AWS Lambda冷启动规避方案)

更多请点击: https://intelliparadigm.com 第一章:PHP 9.0异步AI网关演进全景图 PHP 9.0 正式将协程原生化、事件驱动内核与 AI 接口抽象层深度集成,标志着 PHP 从传统 Web 脚本语言跃迁为高并发 AI 服务编排中枢。其核心突破在于引入 async…...

ARM SVE2向量存储指令ST1Q与ST1W详解

1. ARM SVE2向量存储指令概述在现代处理器架构中,SIMD(单指令多数据)技术是提升计算性能的关键手段。作为ARMv9架构的重要组成部分,SVE2(Scalable Vector Extension 2)引入了更强大的向量处理能力&#xff…...

观察不同时段通过Taotoken调用大模型的延迟波动情况

观察不同时段通过Taotoken调用大模型的延迟波动情况 1. 测试环境与数据收集方法 我们基于实际业务场景,对Taotoken平台进行了为期两周的持续监测。测试环境采用Python编写的自动化脚本,每小时向平台发送固定内容的请求,记录每次调用的响应时…...