当前位置: 首页 > article >正文

Adv Sci(IF=14.1)上海同济大学上海交通大学医学院等团队:HiST:通过多尺度融合深度学习利用组织学图像重建肿瘤空间转录组

01文献学习今天分享的文献是由上海同济大学、上海交通大学医学院等团队于2026年3月在《Advanced Science》中科院1区top。IF14.1上发表的研究”HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Learning“即HiST通过多尺度融合深度学习利用组织学图像重建肿瘤空间转录组该研究提出一个名为HiST的多尺度融合深度学习框架旨在利用常规HE染色组织学图像重建肿瘤的空间转录组spatial transcriptomics, ST。HiST通过提取组织图像中的形态学特征预测肿瘤区域和空间基因表达谱GEPs并在多个癌种中实现了高精度预测。该模型在肿瘤区域识别、空间基因表达重建、患者预后分层、免疫治疗反应预测等方面均表现出优越性能显著优于现有方法。创新点①提出多尺度融合卷积框架HiST通过改进U-Net与ConvMixer模块高效捕捉全局空间上下文与局部形态特征。②预测精度显著超越现有模型平均Pearson相关系数达0.74较第二名提升约两倍实现高保真空间转录组重建。③首次实现从组织学图像预测免疫治疗疗效并整合预后分析与肿瘤异质性评估拓展了HE图像的分子信息挖掘能力。临床价值①规避空间转录组高昂成本仅用常规HE染色图像即可推断高精度基因表达谱降低临床应用门槛。②支持患者预后分层与免疫治疗反应预测为个性化治疗决策提供可解释的分子依据。③从组织图像中识别肿瘤异质性与关键通路辅助病理诊断与精准肿瘤学分析提升诊疗一体化能力。图 1HiST框架示意图a预处理模块Preprocess ModuleHE组织学全切片→按空间转录组斑点位置切分为5120个图像块→经预训练Swin TransformerCTranspath提取特征→重构为768×80×64空间特征图b预测模块Prediction Module基于改进U-Net架构编码器5层卷积下采样解码器对称上采样加入多尺度注意力门跳跃连接与ConvMixer模块双输出肿瘤区域识别二分类掩码空间基因表达谱逐基因空间表达矩阵c应用模块Application Module基于ConvNeXt-V2输入HiST预测的空间转录组特征临床数据输出患者预后风险分层免疫检查点阻断ICB治疗响应预测02研究背景和目的研究背景随着肿瘤精准医疗的发展传统病理诊断仅依赖苏木精-伊红HE染色图像虽能揭示组织结构与细胞形态却难以全面反映肿瘤微环境中复杂的分子调控异质性且诊断结果易受病理医师经验与主观性影响。空间转录组学ST技术通过将基因表达与组织空间坐标相结合为解析肿瘤异质性、免疫微环境及疾病机制提供了关键分子视角但其高昂成本与长周期限制了其作为临床常规工具的应用。近年来人工智能AI方法尝试从HE图像中直接预测空间基因表达谱GEPs以替代昂贵的ST检测。然而现有模型如ST‑Net、HisToGene、Hist2ST及IGI‑DL等存在明显局限一方面基于Vision TransformerViT或图神经网络GNN的架构参数量大、易过拟合尤其在小规模ST数据集上表现不佳另一方面它们对全局空间上下文与局部形态特征的融合不足导致基因表达预测精度较低平均皮尔逊相关系数仅约0.34。此外现有方法普遍未充分验证预测结果在下游临床任务如预后分层、免疫治疗响应评估中的可靠性限制了其临床转化潜力。研究目的针对上述挑战本研究旨在开发一个名为HiSTHistological Images reconstructs Tumor Spatial Transcriptomics的新型深度学习框架其核心目标是从HE染色组织学图像中高精度重建肿瘤空间转录组谱并系统验证其在肿瘤区域识别、异质性分析及临床预后预测中的实用性。HiST通过多尺度融合卷积架构创新性地整合了三个模块预处理模块利用Swin Transformer提取图像斑块特征并重构空间特征图以保留全局空间关系与局部形态信息预测模块基于改进的U‑Net与ConvMixer实现肿瘤斑点分割和空间基因表达回归应用模块采用ConvNeXt‑V2将预测的GEPs用于患者生存分析和免疫治疗响应预测。研究在五种癌症类型乳腺癌、结直肠癌、肝癌、肾癌、卵巢癌的102张ST切片上开展通过留一法交叉验证与多个公开模型对比旨在证明HiST在基因表达预测精度预期平均皮尔逊相关系数超0.70、计算效率及临床任务表现预后C-index达0.78免疫响应预测准确率近0.80上均显著优于现有方法从而为将常规病理图像转化为可解释的分子图谱、推动空间信息辅助的精准肿瘤诊疗提供技术支撑。03数据和方法研究数据训练与验证数据102张ST切片涵盖5种癌种乳腺癌BRCA42例结直肠癌CRC25例肝细胞癌HCC13例肾透明细胞癌KIRC14例卵巢癌OV8例外部验证TCGA数据库中的HE图像与RNA-seq数据免疫治疗数据131例HCC患者29例响应者102例非响应者的HE图像与临床数据。技术方法HiST框架结构预处理模块提取HE图像中的补丁使用Swin Transformer提取特征构建空间特征图预测模块基于改进的U-Net结构引入多尺度注意力门控和ConvMixer模块用于肿瘤区域分割和空间基因表达回归应用模块基于ConvNeXt-V2结构用于预后预测和免疫治疗反应预测。模型训练策略小数据集留一法交叉验证LOOCV大数据集5折交叉验证使用MSE损失基因表达和二元交叉熵损失肿瘤区域。评估指标Pearson相关系数、Spearman相关系数AUC、IOU、Dice、F1、精度、召回率等C-index用于生存分析。04实验结果肿瘤区域识别AUC最高达0.96BRCA各癌种平均准确率 0.80预测结果与病理学家注释高度一致。空间基因表达预测平均Pearson相关系数为0.74优于现有模型如EGNv2仅为0.28在ACTB、FTL、UBC等关键基因上预测精度高达0.96以上在HER2和cSCC等非Visium平台上也表现优异。肿瘤异质性分析HiST预测的GEPs可区分不同肿瘤亚克隆与真实ST的CNV模式高度一致。预后预测HiST预测的GEPs在TCGA五个癌种中均能显著分层高风险与低风险患者C-index最高达0.78BRCA优于Swin Transformer和ResNet50。免疫治疗反应预测预测免疫治疗响应者的准确率为0.79F1为0.81识别的差异基因与真实ST数据高度一致重叠率44%-46%。图 2多癌种肿瘤区域预测结果图 3空间转录组基因表达谱重构性能图 4五癌种预后预测性能图 5肝癌免疫治疗疗效预测05研究结论该研究提出的HiST框架通过多尺度融合深度学习成功从HE染色组织学图像中高精度重建肿瘤空间转录组。其核心结论包括①在肿瘤区域识别上HiST在多种癌症类型中表现优异如乳腺癌AUC达0.96与病理学家注释高度一致②在空间基因表达预测方面HiST的平均皮尔逊相关系数达0.74较现有模型提升约两倍且计算效率更高③预测的空间转录组谱能有效揭示肿瘤异质性如区分不同CNV亚克隆并在预后分层如乳腺癌C-index达0.78和免疫治疗响应预测准确率0.79中展现出显著临床应用价值④HiST在多种独立数据集和平台上的泛化能力强其预测表达与真实RNA-seq高度一致为缺乏空间转录组数据的临床场景提供了低成本、可解释的分子替代方案。总体而言HiST实现了从形态学到空间分子信息的跨尺度建模为精准肿瘤学的临床转化提供了新工具。参考文献Li W, Zhang D, Peng E, Shen S, Alinejad-Rokny H, Liu Y, Zheng J, Jiang C, Ye Y. HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Learning. Adv Sci (Weinh). 2026 Mar;13(13):e14351. doi: 10.1002/advs.202514351.

相关文章:

Adv Sci(IF=14.1)上海同济大学上海交通大学医学院等团队:HiST:通过多尺度融合深度学习利用组织学图像重建肿瘤空间转录组

01文献学习今天分享的文献是由上海同济大学、上海交通大学医学院等团队于2026年3月在《Advanced Science》(中科院1区top。IF14.1)上发表的研究”HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Lear…...

C语言main函数怎么写?6种写法教你正确使用入口函数

名为main的函数,是C程序的入口之处的函数,也就是程序的执行,是从main函数起始的,对于其他函数的调用,也是直接或者间接地,在main函数当中被调用的。那么main函数又究竟是被谁所调用的呢?答案是操…...

实在 Agent 和通用大模型有什么不一样?深度拆解 AI Agent 的感知、决策与执行逻辑

获取系统时间这一任务,虽然看似简单,却深刻揭示了 AI Agent 与通用大模型在本质、能力、架构和应用场景上的根本性差异。通用大模型(LLM),如 GPT、Claude 或通义千问等,其核心是基于海量文本数据训练出的概…...

ESP32低功耗项目实战:用Light Sleep和Deep Sleep保持LED亮度的完整代码与避坑指南

ESP32低功耗项目实战:用Light Sleep和Deep Sleep保持LED亮度的完整代码与避坑指南 在物联网设备开发中,电池续航往往是决定产品成败的关键因素。想象一下,你设计的智能门锁因为频繁更换电池而被用户抱怨,或者环境监测传感器因为电…...

Agent 在人力资源场景能做什么?——深度拆解AI Agent重塑HR全流程的技术路径与实操价值

在2026年的今天,AI Agent(智能体)已不再仅仅是企业数字化转型的“锦上添花”,而是演变为人力资源(HR)领域的底层驱动力。从最初的单点辅助工具到如今具备自主规划、工具调用及闭环执行能力的数字员工&#…...

LeetCode 283. Move Zeroes 题解

LeetCode 283. Move Zeroes 题解 题目描述 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1,0,3,12] 输…...

LeetCode 238. Product of Array Except Self 题解

LeetCode 238. Product of Array Except Self 题解 题目描述 给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整…...

在 Windows 11 家庭版安装 Docker Desktop解决虚拟化问题

目录 前言 环境说明 架构原理 第一步:启用 Windows 虚拟化功能 第二步:修复 Hypervisor 启动配置 第三步:安装 WSL 2 与 Ubuntu 第四步:启动 Docker Desktop 第五步:验证安装 常见问题 总结 前言 Docker 是目…...

【磁盘】gdisk 实战:分区创建与删除的完整流程解析

1. 认识gdisk:你的磁盘分区利器 第一次接触磁盘分区工具时,我完全被各种专业术语搞晕了。直到遇到gdisk,才发现原来分区可以这么简单。gdisk是Linux环境下专门用于GPT分区表的交互式工具,相比传统的fdisk,它支持更大容…...

Linux新手必看:Deepin、Mint、Fedora等主流发行版安装镜像获取全攻略

Linux新手必看:Deepin、Mint、Fedora等主流发行版安装镜像获取全攻略 当你第一次踏入Linux世界的大门,面对众多发行版的选择,获取正确的安装镜像往往是第一步。就像选择一把合适的钥匙,镜像的质量和来源直接关系到系统安装的成败。…...

免费音频转录神器oTranscribe:记者学者的终极效率工具

免费音频转录神器oTranscribe:记者学者的终极效率工具 【免费下载链接】oTranscribe A free & open tool for transcribing audio interviews 项目地址: https://gitcode.com/gh_mirrors/ot/oTranscribe 你是否曾经花费数小时反复播放音频文件&#xff0…...

从零到一:STM32F407 HAL库定时器中断精准点亮LED(CubeMX实战)

1. 开发环境搭建与硬件准备 第一次接触STM32开发的朋友可能会被各种专业术语吓到,但其实只要跟着步骤来,配置开发环境就像搭积木一样简单。我手头用的是正点原子探索者V3开发板,主控芯片是STM32F407ZGT6,这块板子对新手特别友好&a…...

给嵌入式新手的ST7789驱动避坑指南:从SPI模式到RGB565显示的完整配置流程

给嵌入式新手的ST7789驱动避坑指南:从SPI模式到RGB565显示的完整配置流程 第一次接触ST7789液晶驱动芯片时,面对厚厚的数据手册和复杂的时序图,很多嵌入式新手都会感到无从下手。本文将带你一步步拆解ST7789的驱动过程,从SPI模式配…...

智能家庭网络系统新选择:iStoreOS打造高效家庭网络与存储中心

智能家庭网络系统新选择:iStoreOS打造高效家庭网络与存储中心 【免费下载链接】istoreos 提供一个人人会用的的路由、NAS系统 (目前活跃的分支是 istoreos-22.03) 项目地址: https://gitcode.com/gh_mirrors/is/istoreos 家庭网络卡顿…...

从‘量子电子商务’到三方协议:手把手拆解量子数字签名(QDS)的核心流程与实验挑战

量子数字签名:从理论到实验的技术深潜与挑战解析 量子数字签名(QDS)作为后量子密码学的重要分支,正在从实验室走向实际应用。不同于传统数字签名依赖数学难题的复杂性,QDS基于量子力学的基本原理,为信息安全…...

AutoGen实战解析:如何用多智能体对话构建下一代LLM应用

1. 什么是AutoGen?为什么它值得关注? 如果你最近在关注大语言模型(LLM)的应用开发,可能已经听说过AutoGen这个名字。简单来说,AutoGen是微软开源的一个人工智能框架,它让开发者能够通过多个可以…...

提示内容用户体验优化框架:提示工程架构师的实战指南

提示内容用户体验优化框架:提示工程架构师的实战指南 一、引言:为什么“提示内容”是AI产品的“用户体验咽喉”? 1. 一个真实的痛点:用户与AI的“对话困境” 上周,我在某知名AI写作平台上看到一条用户评论:…...

从零搭建RAG知识库系统:手把手带你玩转检索增强生成,解决大模型三大痛点!

在探索AI落地应用的过程中,RAG知识库系统是一项无法回避的关键技术。近期我开始系统学习这一领域,并决定以笔记形式持续记录和分享学习心得,一方面督促自己深入理解,另一方面也希望能与大家共同探讨、相互启发。 本文整理自我对RA…...

FlexASIO音频优化实战指南:从延迟卡顿到高保真体验的转型方案

FlexASIO音频优化实战指南:从延迟卡顿到高保真体验的转型方案 【免费下载链接】FlexASIO A flexible universal ASIO driver that uses the PortAudio sound I/O library. Supports WASAPI (shared and exclusive), KS, DirectSound and MME. 项目地址: https://g…...

别再死磕Open SQL了!用ABAP CDS View在SAP S/4HANA里榨干数据库性能

别再死磕Open SQL了!用ABAP CDS View在SAP S/4HANA里榨干数据库性能 每次看到那些运行了20分钟还没出结果的报表程序,我就忍不住想问问开发者:2023年了,为什么还在用Open SQL写这种性能灾难?上周我接手了一个供应商账龄…...

GMSL GUI实战:利用EOM眼图与Link Margin优化高速链路设计

1. GMSL高速链路设计的核心挑战 在车载摄像头、工业视觉等需要长距离传输高清视频的场景中,GMSL(千兆多媒体串行链路)技术凭借其高带宽和抗干扰能力成为首选方案。但当我第一次尝试设计6Gbps的GMSL3链路时,信号完整性问题就像个隐…...

Powershell创建ISO文件全攻略:从基础命令到高级参数详解

PowerShell创建ISO文件全攻略:从基础命令到高级参数详解 在数据迁移、软件分发或系统部署场景中,ISO映像文件因其通用性和完整性验证机制成为首选载体。传统方式依赖第三方工具的时代已经过去,Windows PowerShell作为系统级脚本环境&#xff…...

告别编译烦恼:在Ubuntu 22.04上快速验证OpenCV 3.4.15安装的几种方法

告别编译烦恼:在Ubuntu 22.04上快速验证OpenCV 3.4.15安装的几种方法 刚完成OpenCV编译安装的开发者常会遇到这样的困惑:终端显示"100% Built target"后,如何确认这个耗费数小时编译的计算机视觉库真的能正常工作?本文将…...

uniapp安卓应用实现开机自启动的完整配置指南

1. 为什么需要开机自启动功能? 很多智能设备(如工业平板、广告机、自助终端)都需要在通电后立即运行指定应用。比如商场的导购系统、工厂的生产看板、医院的叫号终端,都需要保证设备重启后业务系统能自动恢复。传统方案需要人工点…...

threestudio-3dgs实战:5分钟生成可编辑的3D汉堡模型(避坑指南)

threestudio-3dgs实战:5分钟生成可编辑的3D汉堡模型(避坑指南) 当我在深夜调试完最后一个参数,看到屏幕上那个纹理清晰、结构完整的3D汉堡模型时,突然意识到——3D高斯泼溅技术正在彻底改变数字内容创作的方式。不同于…...

教育工作者必备:用清音刻墨Qwen3为教学视频自动生成时间轴字幕

教育工作者必备:用清音刻墨Qwen3为教学视频自动生成时间轴字幕 1. 引言:教学视频的字幕痛点 作为一名教育工作者,您是否经常遇到这样的困扰?录制完教学视频后,手动添加字幕耗费大量时间,而且很难做到音画…...

VSCode集成clang-tidy实现多语言命名规范自动化检查

1. 为什么需要自动化命名规范检查 在团队协作开发中,代码命名规范就像交通规则一样重要。想象一下,如果每个司机都按照自己的习惯开车,那道路会乱成什么样子?代码也是如此。我曾经接手过一个遗留项目,发现同一个变量在…...

深入解析EasyExcel自定义列样式:基于AbstractVerticalCellStyleStrategy的灵活实现

1. 为什么需要自定义列样式? 在实际开发中,我们经常遇到这样的需求:导出的Excel表格需要根据不同列的内容类型设置不同的样式。比如文字列需要居中显示,数字列需要右对齐,金额列可能需要特殊格式和颜色标注。这种需求在…...

如何用Python处理杭州交通数据集?从roadnet.json到flow.json的完整解析指南

杭州交通数据实战:用Python解析roadnet.json与flow.json的进阶技巧 第一次接触杭州交通数据集时,我被roadnet.json里密密麻麻的交叉点坐标和flow.json中流动的车辆轨迹震撼到了——这哪是数据文件,分明是一座数字孪生城市的血管与血液。作为算…...

面试官最爱问的归并排序:从递归到非递归,带你彻底搞懂边界条件与内存管理(避坑指南)

归并排序实战:从递归陷阱到非递归优化的工程级实现 在技术面试中,归并排序就像一位老练的考官,总能用各种边界条件挑战候选人的代码功底。我曾见过不少开发者能流畅写出递归版本,却在非递归实现中陷入无限循环;也有候选…...