JCO|病理AI是精准医疗的未来吗?|个人观点·24-09-13
小罗碎碎念
今日顶刊:JCO
这篇文章于24-09-11发表于J Clin Oncol,目前IF=42.1,但是注意,这篇文章是一篇观点类文章,而不是我们常规意义上的那种科研型文章。
我在原作者的基础上补充了很多精美插图,并且根据自己的理解和知识积累做了知识扩充。最重要的,再次结合了基金申请的内容去分析问题,直接从实际出发,哈哈。

| 角色 | 姓名 | 单位(英文) | 单位(中文) |
|---|---|---|---|
| 第一作者 | Vincent M. Wagner | The University of Iowa, Department of Obstetrics and Gynecology, Division of Gynecologic Oncology | 爱荷华大学妇产科学系妇科肿瘤科 |
作者:Vincent M. Wagner

回答问题
我首先回答一下文章标题提出的问题——病理AI是否为精准医学的未来?——答案是肯定的。
要想充分挖掘这个问题背后蕴藏的信息,我们首先需要了解一下病理AI具体的研究内容。

第一步,如果患者确诊癌症了,那么从肿瘤组织中取样,用于进行形态学(morphological)和分子学(molecular)的研究;第二步,是临床负责的制片(即我们说的HE切片),然后用数字扫面仪生成WSI,此时我们就可以从图像中提取重要特征了;第三步,是将我们提取的特征放入深度学习模型中,来进行诊断或者预后的预测。
目前发展趋势
我们判断目前发展趋势的最好的途径,就是看当前领域的发文数量以及基金委的资助趋势。
我们先看下面这张图,左边是基础的研究,对应的研究结果是——诊断、分级和亚型分类——这些都是早期的研究喜欢做;右侧这张图则是目前的热点下游任务——突变、响应和预后——其实从名字就可以看出来,多模态一定是未来的必经之路。

聊完了论文,再开看看基金委的资助动态(八字方针)——频繁布局,试点推行。关于基金的申请我写过三篇推文,分别是:
- 北京市自然基金分析:2024年度北京市自然科学基金发布,【医学AI项目】如何申请?
- 国自然基金分析:从国自然立项情况浅谈一下医学AI的未来发展趋势|个人观点·24-08-28
- 国自然重大专项分析:医学AI再度得到国自然重大专项青睐,10个立项机会,4000万经费虚位以待|个人观点·24-09-12

对医学AI感兴趣的,并且目前有申请基金需求的老师,可以看看上面的三篇推文能否给您提供一些帮助。
病理AI在精准医学中的应用现状
自21世纪初伊马替尼用于治疗慢性髓性白血病以来,精准肿瘤学的研究重点一直是通过生物标志物发现肿瘤中的分子靶标,并通过特定的治疗干预进行靶向治疗[1]。
近年来,人工智能(AI)在肿瘤学研究和开发中的指数级增长,预示着精准肿瘤学的下一个发展浪潮[2,3]。深度学习(DL),作为AI的一个子集,可以利用癌症行为、基因组学和组织病理学之间的关系,通过人工神经网络中的数学方程提取数据(如数字组织病理切片)中的抽象和复杂特征与模式[4]。

深度学习的多层神经网络能够从相对简单的输入中开发复杂的数据表示,结合大数据集和强大的计算能力,赋予了DL其强大的能力[4]。
乳腺癌是最早使用DL在组织病理学上评估的癌症类型之一,这归功于其已建立的生物标志物驱动治疗[5]。同源重组缺陷(HRD)是乳腺癌和卵巢癌最重要的预测生物标志物之一,HRD使得患者对聚腺苷酸二磷酸核糖聚合酶抑制剂和铂类化疗敏感[6]。HRD主要归因于同源重组通路的异常,尤其是BRCA1和BRCA2基因的突变[6]。目前,HRD通常通过依赖于复杂分子测试的专有伴随诊断试剂盒来确定[6]。
Bergstrom等人开发的DeepHRD算法代表了一种创新的方法,通过AI直接从数字组织病理切片中检测HRD,避免了广泛且昂贵的分子测试[7]。

作者使用弱监督卷积神经网络(CNN)和多实例学习(MIL)构建了一个模型,使用苏木精-伊红染色的全切片图像(WSIs)预测HRD和预后[8,9]。CNN通过检测空间特征和模式设计用于视觉/图像应用[8]。
模型将WSIs分割成更小的瓦片进行处理,MIL是一种弱监督DL方法,其中瓦片标签基于WSI标签假设,无需在瓦片级别进行更精确的注释[9]。
作者设计了一个多分辨率工作流程,首先在低倍(5x)放大下评估WSI,然后自动选择一个感兴趣区域在高倍(20x)放大下评估,这模仿了训练有素的病理学家对组织学切片的评估过程。模型使用闪冻(FF)样本和福尔马林固定的石蜡包埋(FFPE)切片进行训练。
尽管之前已有研究使用DL检测HRD[10],但DeepHRD通过建立跨多个独立队列验证的更具泛化性的模型而脱颖而出。
DeepHRD通过评估临床结果进一步展示了其临床实用性。作者使用独立测试组(验证队列中的患者未在训练队列中使用)、平衡训练数据和神经网络内节点的随机丢弃等技术来最小化过拟合。通过比较接收者操作特征曲线下的面积(AUC)适当地评估了模型性能。
DeepHRD能够在FF和FFPE独立队列中实现对HRD的中等准确预测(AUC为0.76-0.81)。他们进一步分析了模型预测预后的能力,发现与传统分子测试相比,DeepHR达能够更精确地预测无进展生存期和治疗反应。重要的是,DeepHRD能够识别出一小部分表现出HRD表型但未被传统分子测试识别的患者。
为了解释DeepHRD算法的内部机制,作者识别并注释了预测HRD的WSI的空间区域,发现这些区域富含坏死、巨噬细胞密度和高密度炎症组织。
综上所述,DeepHRD作为一种创新的DL算法,在精准肿瘤学领域展示了其巨大的潜力,特别是在HRD的检测和预后预测方面。尽管目前仍面临数据集大小、多样性和监管批准等挑战,但其在多个独立队列中的验证结果证明了其临床实用性和泛化能力。
为了成功地将AI整合到临床肿瘤学中,必须解决和克服许多挑战[11]。

A) 人工智能(AI)在病理学中的关键用例
- 强监督AI:主要用于诊断目的,或者为预后或治疗反应的下游模型生成输入数据。
- 弱监督AI:可以直接产生诊断、预后或预测模型。
B) 组织病理学中AI的挑战
- 如数据的质量和数量、算法的解释性、以及临床实践中的集成问题。
C) AI时代的组织病理学工作流程
- 病理切片的数字化、图像分析、诊断辅助、以及报告生成等步骤。
D) 组织病理学发展简明时间线
- 这部分概述了组织病理学领域的重要发展里程碑,从传统的显微镜观察到现代的AI辅助诊断技术的演变。
为了确保DL模型的泛化性和可重复性,初始训练需要足够数量的高质量、平衡数据。
韩国最近发表的一项研究使用了与Bergstrom等人类似的技术,采用基于多实例学习(MIL)的DL算法和来自癌症基因组图谱(TCGA)的卵巢癌队列,他们能够训练和验证一个模型来预测卵巢癌进展,但与DeepHRD不同,他们的模型与BRCA突变或HRD状态无关[12]。
为了开发不仅准确而且广泛可泛化和可重复的模型,研究人员需要超越单一机构数据和TCGA(已广泛用于模型训练)[2,3]。
大多数已发表的DL研究要么从头开始开发模型,要么从预训练的非医学图像(例如,RESNET 18)开始,然后在数百或数千患者队列上进行微调[2,3]。
相比之下,最先进的DL模型通常使用数百万图像进行训练。
由于患者隐私和数据共享的问题,获得高质量医学数据的大型队列可能很困难[13,14]。
新颖的去中心化AI训练技术,如联邦学习和群体学习,可以帮助克服这些挑战[13,14]。最近开发了在数十万个注释的高质量全切片图像上预训练的组织病理学基础模型,也可以解决这些问题[15,16]。
使用基础模型可以更快地开发准确的癌症或特定任务模型,需要更少的数据和计算资源。
在训练新模型后,需要在未用于训练过程的独立数据上进行验证。
这种验证最好包括跨越现实世界变化的多个大队列[4]。DeepHRD的作者正确指出,他们研究的一个优势是包括了多个独立队列进行验证。然而,这些队列中的每一个都是对相对较少患者的回顾性评估。
再次,获得足够大且多样的验证队列是具有挑战性的。国家和国际合作的临床试验数据可以成为验证队列的丰富来源,并已在前列腺癌中成功实施[17]。
AI算法的最终验证步骤是专门设计的临床试验,以评估模型的准确性和实用性[18]。与传统分子生物标志物类似,这是临床采用前的关键步骤。
新颖AI算法的监管批准可能复杂且具有挑战性。
这是一个快速发展的过程,通常需要行业合作或私人公司的开发才能成功实施[11]。任何新技术都需要临床医生和实践者的接受和采用。
AI代表了癌症护理的范式转变方法,将这些模型纳入常规使用需要时间。成功地将AI整合到临床实践中需要研究人员、临床医生、数据科学家和监管机构之间的跨学科合作。
总之,AI和DL在肿瘤学研究和实践中具有巨大的革命性潜力。像DeepHRD这样的工具的开发展示了这种方法的潜在益处,通过提供精准肿瘤学的下一波浪潮。
相关文章:
JCO|病理AI是精准医疗的未来吗?|个人观点·24-09-13
小罗碎碎念 今日顶刊:JCO 这篇文章于24-09-11发表于J Clin Oncol,目前IF42.1,但是注意,这篇文章是一篇观点类文章,而不是我们常规意义上的那种科研型文章。 我在原作者的基础上补充了很多精美插图,并且根据…...
idea一键自动化部署项目
文章目录 前言一、 IDEA插件安装1. 首先下载 Alibaba Cloud Toolkit 插件2. 插件下载完成后重启IDEA 二、SpringBoot项目准备1. pom.xml 文件2. controller3. 启动类 三、SpringBoot项目jar包部署1. Alibaba Cloud Toolkit 插件服务器配置2. 主机 IP、用户名、密码 点击测试链接…...
Mybatis-plus复习篇
文章目录 1.MyBatis-plus基础1.1.mybatis-plus简介1.2.基本使用1.3.注解映射主键生成策略 1.4.命名转换问题1.5.关闭命名转换功能 2.BaseMapper核心接口 1.MyBatis-plus基础 1.1.mybatis-plus简介 MyBatis-Plus(简称 MP)是一个 MyBatis的增强工具&…...
Leetcode 109.有序链表转换二叉搜索树(Medium)
给定一个单链表的头节点 head ,其中的元素 按升序排序 ,将其转换为 平衡 二叉搜索树。 示例 1: 输入: head [-10,-3,0,5,9] 输出: [0,-3,9,-10,null,5] 解释: 一个可能的答案是[0,-3,9,-10,null,5],它表示所示的高度…...
[数据集][目标检测]河道垃圾检测数据集VOC+YOLO格式2274张8类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2274 标注数量(xml文件个数):2274 标注数量(txt文件个数):2274 标注…...
python vtk 绘制圆柱体和包围盒
基本的代码如下, import vtkcylinder vtk.vtkCylinderSource() cylinder.SetRadius(3.0) cylinder.SetHeight(10.0) cylinder.SetResolution(50)boundsFilter vtk.vtkOutlineFilter() boundsFilter.SetInputConnection(cylinder.GetOutputPort())mapper vtk.vtk…...
Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络)
Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络) 文章目录 Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络)前言一、Ubuntu依赖安装二、创建操作目录, 下载build_chain.sh脚本2.1 先…...
【Canvas与表盘】绘制黄蓝两色简约表盘
【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>黄蓝卡通手表</title><style type"text/css">…...
大数据-128 - Flink 并行度设置 细节详解 全局、作业、算子、Slot
点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…...
图新地球-将地图上大量的地标点批量输出坐标到csv文件【kml转excel】
0.序 有很多用户需要在卫星影像、或者无人机航测影像、倾斜模型上去标记一些地物的位置(如电线杆塔、重点单位、下水盖等) 标记的位置最终又需要提交坐标文本文件给上级单位或者其他部门使用,甚至需要转为平面直角坐标。 本文的重点是通过of…...
Git提交有乱码
服务器提交记录如图 可知application.properties中文注释拉黄线 ,提示Unsupported characters for the charset ISO-8859-1 打开settings - Editor - File Encodings 因为我们项目的其他文件都是UTF-8,所以,我们将默认值都改成UTF-8 然后…...
leetcode hot100_part4_子串
2024/4/20—4/21 560.和为K的子数组 前缀和哈希表,做二叉树的时候也有这个套路。注意细节,遍历到当前前缀和的时候是先找结果个数还是先加入哈希?应该先找结果个数,不然的话,当前位置也算上了(因为是前缀和…...
Spring Cloud之三 网关 Gateway
1:Intellij 新建项目 spring-cloud-gateway 2:pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLoca…...
Linux 进程1
进程 在linux系统中,触发任何一个事件时系统会将其定义为一个进程(一个程序开始执行),系统会给这个进程分配一个进程ID统称为PID。 程序:通常是二进制文件,放置于存储媒介如硬盘中。 进程:当存…...
LeetCode: 2552. 统计上升四元组 动态规划 时间复杂度O(n*n)
2552. 统计上升四元组 today 2552. 统计上升四元组 题目描述 给你一个长度为n下标从 0 开始的整数数组 nums ,它包含1到n的所有数字,请你返回上升四元组的数目。 如果一个四元组 (i, j, k, l) 满足以下条件,我们称它是上升的:…...
Unity 编辑器设置中文
在 Unity 编辑器中,你可以按照以下步骤将语言设置为中文: 步骤: 1. 打开 Unity 编辑器。 2. 在顶部菜单栏,依次点击 Edit > Preferences(在 macOS 上是 Unity > Preferences)。 3. 在弹出的 Preferen…...
springboot-创建连接池
操作数据库 代码开发步骤: pom.xml文件配置依赖properties文件配置连接数据库信息(连接池用的是HikariDataSource)数据库连接池开发 configurationproperties和value注解从properties文件中取值bean方法开发 service层代码操作数据库 步骤&am…...
matlab绘制不同区域不同色彩的图,并显示数据(代码)
绘图结果如下: 代码如下: A为绘图的数据,每个数据对应着上图中的一个区域,数据大小决定区域的颜色 % 假设有一系列的数据点 Arand(5,6); %A为绘图的数据,数据大小决定颜色 wei_shu%.3f; %代表数据保留三位小…...
Docker Desktop 的安装与汉化指南
前言 Docker Desktop 是一款非常流行的开发工具,它使得开发者能够在自己的计算机上轻松地构建、运行和调试 Docker 容器。然而,默认情况下,Docker Desktop 的界面是英文的,对于中文用户来说,有时候会觉得不够友好。幸…...
前端form表单+ifarme方式实现大文件下载
// main.jsimport Vue from vue; import App from ./App.vue; import { downloadTokenFile } from /path/to/your/function; // 替换为您的函数路径// 将 downloadTokenFile 添加到 Vue 原型上 Vue.prototype.$downloadTokenFile downloadTokenFile;new Vue({el: #app,render:…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
uni-app学习笔记二十二---使用vite.config.js全局导入常用依赖
在前面的练习中,每个页面需要使用ref,onShow等生命周期钩子函数时都需要像下面这样导入 import {onMounted, ref} from "vue" 如果不想每个页面都导入,需要使用node.js命令npm安装unplugin-auto-import npm install unplugin-au…...
Linux简单的操作
ls ls 查看当前目录 ll 查看详细内容 ls -a 查看所有的内容 ls --help 查看方法文档 pwd pwd 查看当前路径 cd cd 转路径 cd .. 转上一级路径 cd 名 转换路径 …...
深入理解JavaScript设计模式之单例模式
目录 什么是单例模式为什么需要单例模式常见应用场景包括 单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量 惰性单例通用的惰性单例 结语 什么是单例模式 单例模式(Singleton Pattern&#…...
【项目实战】通过多模态+LangGraph实现PPT生成助手
PPT自动生成系统 基于LangGraph的PPT自动生成系统,可以将Markdown文档自动转换为PPT演示文稿。 功能特点 Markdown解析:自动解析Markdown文档结构PPT模板分析:分析PPT模板的布局和风格智能布局决策:匹配内容与合适的PPT布局自动…...
如何为服务器生成TLS证书
TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...
Mysql中select查询语句的执行过程
目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析(Parser) 2.4、执行sql 1. 预处理(Preprocessor) 2. 查询优化器(Optimizer) 3. 执行器…...
Mysql8 忘记密码重置,以及问题解决
1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...
基于IDIG-GAN的小样本电机轴承故障诊断
目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化(Gradient Normalization) (2) 判别器梯度间隙正则化(Discriminator Gradient Gap Regularization) (3) 自注意力机制(Self-Attention) 3. 完整损失函数 二…...
算术操作符与类型转换:从基础到精通
目录 前言:从基础到实践——探索运算符与类型转换的奥秘 算术操作符超级详解 算术操作符:、-、*、/、% 赋值操作符:和复合赋值 单⽬操作符:、--、、- 前言:从基础到实践——探索运算符与类型转换的奥秘 在先前的文…...
