当前位置: 首页 > article >正文

Nat Methods | 哈工大王亚东/程亮团队开发通用反卷积深度学习框架,实现转录组、蛋白质组、代谢组细胞数据精准解析

细胞丰度是指组织内各类细胞类型的比例分布其动态变化在器官发育、基因调控和疾病治疗等生物学过程中至关重要。尽管单细胞技术能直接解析细胞异质性但其成本较高、样本处理受限难以大规模应用于临床队列研究且大量珍贵的组织样本无法进行单细胞解离。因此如何将丰富的组织水平多组学数据推广至细胞层面成为探索细胞异质性的核心。反卷积算法能通过单细胞参考数据推断组织水平的细胞组成成为解析复杂生物系统细胞异质性的一种经济高效替代方案。但现有算法大多针对单一组学开发泛化性较差代谢组学甚至缺乏专有方法。目前开发通用反卷积框架面临组学数据特征差异、细胞类型不匹配、批次效应等技术挑战现有方法无法同时解决这些问题。针对上述挑战哈尔滨工业大学王亚东、程亮团队开发了一种基于深度学习的通用反卷积框架DECODE可适用于转录组、蛋白质组和代谢组数据并能在细胞水平无缝整合多样的多组学组织数据集。DECODE填补了代谢组学反卷积领域的空白在跨供体、跨疾病状态、跨平台等多种场景组学数据测试中其性能显著优于现有方法。此外该框架在实际应用场景中表现稳健在单细胞参考数据不完整时仍具高鲁棒性为大规模多组学研究向细胞水平解析提供了强大工具助力精准医学研究发展。相关内容以“DECODE: deep learning-based common deconvolution framework for various omics data”为题发表在Nature Methods。DECODE整合了对抗训练和对比学习技术通过四个阶段来实现跨多组学数据的精准反卷积。第一阶段基于单细胞数据生成带已知细胞比例的伪组织样本作为训练集第二阶段采用对抗训练策略通过编码器、判别器和反卷积模块的协同优化在保留生物学信号的前提下消除训练数据与目标数据间的批次效应第三阶段引入噪声添加与对比学习机制通过维度扩展模块、去噪模块处理分离噪声特征与纯化特征增强模型处理数据噪声和跨组学异质性的鲁棒性第四阶段提供两种推理路径针对单细胞参考与目标组织细胞类型是否匹配分别采用标准和相对反卷积路径输出每个样本的细胞丰度向量。图1.DECODE框架研究团队基于15个数据集设置了7种复杂实验场景涵盖跨供体、跨疾病、跨健康状态、跨数据集、空间转录组、多细胞类型解析及真实组织数据将DECODE与TAPE、MuSiC等11种主流反卷积方法进行对比以一致性相关系数CCC、均方根误差和皮尔逊相关系数为指标全面评估其反卷积性能。结果显示DECODE在多数核心场景中CCC值均居首位且具有高鲁棒性显著超越现有方法。在空间转录组分析中DECODE预测结果与真实细胞类型分布高度吻合在真实组织数据中仅Monaco数据集的均方根误差略高于部分方法其余关键指标其均超越所有对比方法。计算效率评估显示DECODE的峰值内存占用和运行时间处于合理水平具备良好的实际应用可行性。总之与主流方法的对比证实DECODE是目前适用于转录组和蛋白质组数据的最有效的反卷积方法。图2.DECODE在转录组学和蛋白质组学数据的反卷积性能组织水平代谢组数据在临床中应用广泛但由于特征数量少、细胞类型间代谢组图谱相似度高等其反卷积难度远高于转录组和蛋白质组。为此研究团队选取小鼠肝脏、小鼠骨髓和人类结直肠癌的单细胞代谢组数据集评估了DECODE性能。结果显示DECODE仅在小鼠肝脏数据集的CCC指标上略逊于MuSiC在其余数据集和指标上均显著优于所有对比方法其细胞比例预测值与真实值高度吻合能有效捕捉细胞间微弱的差异信号。DECODE首次实现代谢组数据的有效反卷积填补了该领域的技术空白。图3.DECODE在代谢组学数据的解卷积性能细胞状态如分化、活化、凋亡等可为细胞功能提供重要信息准确量化细胞状态丰度对理解器官发育、细胞分裂等生物过程至关重要。研究团队构建了单核细胞伪时间轨迹、细胞周期G1/S/G2期及黑色素瘤细胞药物相应0/1/3/5天等3个数据集对DECODE进行全面评估。结果显示在所有数据集上DECODE均取得最优性能能够有效反演拟时间轨迹、细胞周期及环境刺激引发的细胞状态动态变化。上述结果表明DECODE是一种适用于多组学数据、可解析多种细胞状态的反卷积方法。图4.DECODE在不同组学数据、细胞状态下的反卷积性能现实研究中单细胞参考数据常因样本制备、细胞解离等因素存在细胞类型缺失问题。研究团队在转录组、蛋白质组和代谢组数据中模拟了未知细胞类型引入、特征表达波动、系统性偏差及特征丢失等多重扰动场景系统评估了DECODE性能。结果显示该框架在多数指标与场景下均优于现有方法且是唯一在代谢组数据中保持可用性能的工具。在稳定性方面转录组、蛋白质组中DECOD与部分方法在某些稳定性指标上表现相当但始终维持最高反卷积精度。为验证DECODE在跨组学、多队列研究中的一致性研究团队利用外周血单核细胞PBMCCITE-seq数据集构建转录组和蛋白质组伪队列。结果显示DECODE显著优于其他方法跨组学性能高度一致可提供稳定、精准的细胞丰度估计。接下来研究团队将DECODE应用于人类乳腺癌和小鼠肝脏等真实多组学队列。在乳腺癌队列DECODE揭示了不同转移状态下细胞组成的变化与脑转移性乳腺癌组织和转移病灶相比非转移乳腺癌组织中T细胞、血管周样细胞丰度显著较高B细胞丰度显著较低。在小鼠肝脏队列中DECODE揭示不同饮食干预和疾病状态下的细胞组成变化与健康饮食相比非酒精性脂肪性肝炎NASH和西方饮食酒精WDA组中Kupffer细胞显著增加NASH组肝细胞显著减少。图5.DECODE在真实多组学队列中的应用综上所述DECODE是首个能够统一处理转录组、蛋白质组和代谢组数据的通用解卷积框架尤其填补了代谢组学领域的空白。通过将组织水平的分子信息与单细胞分辨率的细胞图谱相结合DECODE能够以经济、高效的方式系统性地揭示疾病进展、治疗响应等过程中的细胞动态为生物标志物发现、疾病机制研究及精准医学应用开辟了新的路径。参考文献Zhao, T., Liu, R., Sun, Y.et al.DECODE: deep learning-based common deconvolution framework for various omics data.Nat Methods(2026). https://doi.org/10.1038/s41592-026-03007-y·END·阅读推荐01科学狂人克莱格·文特尔创立AI基因组学公司DGI02樊荣团队基于成像和测序的空间多组学方法实现同一组织切片的单细胞空间转录组与蛋白质分析03迄今最大规模甲状腺疾病多祖先GWAS荟萃分析结果发布04谢澎涛等团队开发包含10亿参数的单细胞转录组学基础模型05Science最新研究揭示人类寿命的遗传贡献高达55%最全1000植物核基因组数据库IMP (点击图片直达)高颜值免费 SCI 在线绘图(点击图片直达)往期精品(点击图片直达文字对应教程)LinuxPythonR绘图NGS基础GEO高级生信自学生信书籍系列教程心得体会转录组经典宏基因组蛋白质组单细胞系列测序发展史免费在线画图色彩搭配图形排版图形解读ChIP-seqTCGAGSEAWGCNA海哥组学傻瓜系列文章写作CytoscapeExcelPPT机器学习公众号投稿联系陈同 chentong_biology163.com快点亮在看”吧

相关文章:

Nat Methods | 哈工大王亚东/程亮团队开发通用反卷积深度学习框架,实现转录组、蛋白质组、代谢组细胞数据精准解析

细胞丰度是指组织内各类细胞类型的比例分布,其动态变化在器官发育、基因调控和疾病治疗等生物学过程中至关重要。尽管单细胞技术能直接解析细胞异质性,但其成本较高、样本处理受限,难以大规模应用于临床队列研究,且大量珍贵的组织…...

基于贾子理论与哲学智慧的华夏四大元典体系化深度研究报告

基于贾子理论与哲学智慧的华夏四大元典体系化深度研究报告本报告严格锚定贾子理论公理化体系,以「不迷信权威、不迷信注疏、只忠诚于原文事实与底层逻辑」为第一认识论准则,完整覆盖此前全部对话内容 —— 从《黄帝阴符经》版本正本清源、《论语》核心元…...

IO 资源与文件描述符的绑定关系

一、核心概念铺垫:IO 资源与文件描述符的绑定关系 首先要明确:PHP 中所有 IO 资源(文件、网络连接、管道、Socket、curl 句柄等),最终都会映射到操作系统的文件描述符(FD) —— 这是用户态 PHP …...

SpringBoot+Vue +校园求职招聘系统管理平台源码【适合毕设/课设/学习】Java+MySQL

摘要 随着高校毕业生人数的逐年增加,校园求职市场竞争日益激烈,传统的线下招聘方式效率低下,信息传递不及时,难以满足学生和企业的双向需求。同时,企业在校园招聘过程中面临简历筛选繁琐、面试安排复杂等问题&#xff…...

cursor 如何退出账号

打开 cursor settings tab,左侧选中 「General」,划到底部,有一个「Log Out」,点击即可退出...

资本狂热背后:OpenClaw引爆的AI智能体狂潮,是真风口还是泡沫?78962

SQLAlchemy是Python中最流行的ORM(对象关系映射)框架之一,它提供了高效且灵活的数据库操作方式。本文将介绍如何使用SQLAlchemy ORM进行数据库操作。 目录 安装SQLAlchemy 核心概念 连接数据库 定义数据模型 创建数据库表 基本CRUD操作…...

【C语言】register 关键字详解

1. 概述register 关键字用于声明希望频繁使用的变量,并提示编译器尽可能将这些变量存储在寄存器中,以提高访问速度。尽管编译器可能会忽略这个提示,但它仍然是一个有效的优化手段,特别是在性能关键的代码中。1.1 主要目的使用 reg…...

保姆级教程:Windows 一键安装 OpenClaw + 接入 DataEyes API(新手零失败)

一、准备工作:安装 Node.js OpenClaw 依赖 Node.js 环境,必须先安装。 打开 Node.js 官网下载:https://nodejs.org/zh-cn/download 下载对应 Windows 版本,双击安装,全程下一步即可。 安装完成后,打开 P…...

架构自定义UDP协议视频传输调试

一、整体系统架构图┌─────────────────────────────────────────────────────────────────┐ │ 视频流应用程序 │ │ test_…...

基于协同过滤算法的音乐网站的设计与实现

目录 可选框架 可选语言 内容 可选框架 J2EE、MVC、vue3、spring、springmvc、mybatis、SSH、SpringBoot、SSM、django 可选语言 java、web、PHP、asp.net、javaweb、C#、python、 HTML5、jsp、ajax、vue3 内容 在互联网普及化的大背景下,音乐资源的过多带来…...

基于python的家庭消费数据分析系统的设计与实现

目录 可选框架 可选语言 内容 可选框架 J2EE、MVC、vue3、spring、springmvc、mybatis、SSH、SpringBoot、SSM、django 可选语言 java、web、PHP、asp.net、javaweb、C#、python、 HTML5、jsp、ajax、vue3 内容 由于大数据技术的快速发展,家庭消费数据分析的…...

C++虚函数:多态实现的关键基石

C 虚函数与纯虚函数:多态的核心实现基石在面向对象编程中,多态(Polymorphism)是一种核心特性,它允许不同类的对象对同一消息(如函数调用)做出不同响应。这种机制提高了代码的灵活性和可扩展性&a…...

仁王3的宏 和 浪人崛起 战神3模拟器设置 the dark rites of akham

the dark rites of akham: 卡关点: 地下室的box里面有刀. 警局垃圾箱里面有面包. 警局的玩硬币之后拿到硬币,之后去精神医院门口报纸机器拿报纸. 罐头打开之后放雨伞上. 互动大地图:https://www.gamersky.com/tools/map/rw3/ 用来找武士益发, 忍者益发. 仁王3里面99武器适合狂按…...

智慧课堂-YOLOv8课堂行为检测系统|学生+教师双模型|图片/视频/摄像头/双摄像头|历史记录+报告|Web可视化YOLOv8 课堂老师及学生行为检测系统 —— 学生+教师双模型智能分析平台

智慧课堂-YOLOv8课堂行为检测系统|学生教师双模型|图片/视频/摄像头/双摄像头|历史记录报告|Web可视化 包括 全部源码 完整标注的数据集 训练好的模型及训练结果 项目运行教程(README.md) 仅供参考系统…...

像素即坐标 · 视频即传感器 · 空间即智能——镜像视界 Pixel-to-Space 空间智能技术白皮书

像素即坐标 视频即传感器 空间即智能——镜像视界 Pixel-to-Space 空间智能技术白皮书发布单位:镜像视界(浙江)科技有限公司 发布时间:2026一、白皮书摘要随着人工智能、大模型技术和空间计算技术的快速发展,传统视频…...

Q61P三菱标准电源模块

Q61P 是三菱电机(Mitsubishi Electric)MELSEC-Q 系列 PLC 的标准电源模块,专为 Q 系列 CPU、I/O 及功能模块提供稳定的 DC 5V/6A 电源。一、产品特性类型:Q 系列 PLC 主基板电源模块(开关电源型)输入&#…...

QJ71GP21S-SX三菱网络模块

QJ71GP21S-SX 是三菱电机 MELSEC-Q 系列的 CC-Link IE 控制器网络模块(光纤型、双回路、带外部供电),专为中大型分布式控制系统提供 1Gbps 超高速、大容量、高可靠的 PLC 间互联与数据共享能力。一、产品特性1Gbps 超高速光纤通信&#xff1a…...

深入解析:高阶 iOS 工程师的技术栈、架构设计与民航行业应用实践

引言 在移动互联网高速发展的时代,iOS 应用作为连接用户与服务的重要桥梁,其质量、性能和用户体验至关重要。优秀的 iOS 工程师不仅需要扎实的语言基础和框架知识,还需具备良好的架构设计能力、复杂问题排查技巧,以及对特定行业业务逻辑的深刻理解。本文旨在深度剖析一份典…...

《OpenClaw 从入门到精通指南》正式发布,开源免费!

大家好,我是苍何。今天,我们打磨了很久的《OpenClaw 从入门到精通指南》终于正式和大家见面了。他是完全免费的,开源的。从 OpenClaw 还没大火的时候,我们就开始写这份文档,那个时候在 X 上先推了第一个版本&#xff0…...

基于多模态攻击链的网络钓鱼防御机制与韧性构建研究

摘要 网络钓鱼(Phishing)作为网络安全领域最为持久且演变迅速的威胁向量,已从早期的粗放式邮件欺诈演变为利用人工智能、自动化服务及社会工程学心理操纵的精密攻击体系。本文基于Consumer Affairs发布的最新深度报道,系统剖析了现…...

北京有没有可以做SMT贴片和整机组装的公司

随着电子信息产业的快速发展,电子制造服务(EMS)已成为产业链中至关重要的一环。北京作为中国的科技创新中心,汇聚了一批技术实力雄厚、制造能力卓越的电子制造企业,尤其在需要高精度、高可靠性的SMT(表面贴…...

基于Python的新能源汽车价格走势分析与可视化研究

摘 要随着全球能源危机和环境污染问题的日益严峻,新能源汽车作为传统燃油汽车的替代品,已成为汽车产业发展的重要方向。近年来,我国新能源汽车市场呈现爆发式增长态势,产销量连续多年位居全球第一。在市场竞争日益激烈的背景下&a…...

Linux 文件系统目录架构全解析

Linux 文件系统采用树形分层结构,以根目录 / 为起点,所有文件和目录都依附于这一核心节点。这种设计遵循 FHS(文件系统层次结构标准),让系统资源管理更清晰、协作更高效。下面我们逐一解析核心目录的作用&#xff1a…...

RVFLNN随机向量函数链神经网络:单变量时间序列预测的快速高精度模型

RVFLNN(Random vector functional link neural network )随机向量函数链神经网络 单变量时间序列预测 自带单变量数据 python 代码,模型部分是手撸的,当然不是我 数据格式为csv,可以替换成自己的 这个模型也不是最近的…...

MemEvolve·记忆与学习融合系统:给OpenClaw装上会“进化”的大脑,让AI在每一次对话中变得更懂你

大家好,我是芯作者,给大家分享下给OpenClaw装上会“进化”的大脑 当AI记住你所有的偏好,却永远学不会从错误中成长——这不是记忆,这是“死记硬背”。真正的智能,是在记住的同时,还能从每一次纠正中进化。 两大遗憾,一个解决方案 如果你已经用上了OpenClaw,你一定经历…...

ClawShield·智能体免疫系统:给OpenClaw装上“安全护栏”,让AI在动手前先问“我可以吗?”

hello大家好,我是芯作者,给大家分享下openclaw的安全护栏! 你以为装的只是一个查天气的Skill,实际上它正在悄悄把你的SSH密钥发给黑客。当AI开始真正动手干活,谁来保证它不“闯祸”? 当“小龙虾”开始咬人 2026年2月,VirusTotal接连发布两份重磅报告,揭露了OpenClaw生…...

杰理之开关IIS解码后,不停的打印“W“【篇】

显示buf满...

基于大数据的就业推荐系统设计与实现

目录 可选框架 可选语言 内容 可选框架 J2EE、MVC、vue3、spring、springmvc、mybatis、SSH、SpringBoot、SSM、django 可选语言 java、web、PHP、asp.net、javaweb、C#、python、 HTML5、jsp、ajax、vue3 内容 当今时代,随着信息技术的发展,世界…...

【揭秘】3大关键指标,你的耐燃烧试验机真的达标了吗?

在电子、汽车、航空航天等高端制造领域,产品的阻燃性能是关乎安全与合规的生命线。然而,许多企业实验室在进行耐燃烧测试时,常常陷入一个怪圈:测试周期冗长,数据重复性差,设备维护繁琐。这不仅拖慢了研发进…...

桶排序原理与Python实现详解

桶排序算法全面解析:原理、Python实现与动图演示 1. 算法概述 桶排序(Bucket Sort)是一种分布式排序算法,它将待排序的元素分布到有限数量的桶中,然后对每个桶中的元素进行排序,最后按照桶的顺序依次取出…...