JCO|病理AI是精准医疗的未来吗?|个人观点·24-09-13
小罗碎碎念
今日顶刊:JCO
这篇文章于24-09-11发表于J Clin Oncol,目前IF=42.1,但是注意,这篇文章是一篇观点类文章,而不是我们常规意义上的那种科研型文章。
我在原作者的基础上补充了很多精美插图,并且根据自己的理解和知识积累做了知识扩充。最重要的,再次结合了基金申请的内容去分析问题,直接从实际出发,哈哈。
角色 | 姓名 | 单位(英文) | 单位(中文) |
---|---|---|---|
第一作者 | Vincent M. Wagner | The University of Iowa, Department of Obstetrics and Gynecology, Division of Gynecologic Oncology | 爱荷华大学妇产科学系妇科肿瘤科 |
作者:Vincent M. Wagner
回答问题
我首先回答一下文章标题提出的问题——病理AI是否为精准医学的未来?——答案是肯定的。
要想充分挖掘这个问题背后蕴藏的信息,我们首先需要了解一下病理AI具体的研究内容。
第一步,如果患者确诊癌症了,那么从肿瘤组织中取样,用于进行形态学(morphological)和分子学(molecular)的研究;第二步,是临床负责的制片(即我们说的HE切片),然后用数字扫面仪生成WSI,此时我们就可以从图像中提取重要特征了;第三步,是将我们提取的特征放入深度学习模型中,来进行诊断或者预后的预测。
目前发展趋势
我们判断目前发展趋势的最好的途径,就是看当前领域的发文数量以及基金委的资助趋势。
我们先看下面这张图,左边是基础的研究,对应的研究结果是——诊断、分级和亚型分类——这些都是早期的研究喜欢做;右侧这张图则是目前的热点下游任务——突变、响应和预后——其实从名字就可以看出来,多模态一定是未来的必经之路。
聊完了论文,再开看看基金委的资助动态(八字方针)——频繁布局,试点推行。关于基金的申请我写过三篇推文,分别是:
- 北京市自然基金分析:2024年度北京市自然科学基金发布,【医学AI项目】如何申请?
- 国自然基金分析:从国自然立项情况浅谈一下医学AI的未来发展趋势|个人观点·24-08-28
- 国自然重大专项分析:医学AI再度得到国自然重大专项青睐,10个立项机会,4000万经费虚位以待|个人观点·24-09-12
对医学AI感兴趣的,并且目前有申请基金需求的老师,可以看看上面的三篇推文能否给您提供一些帮助。
病理AI在精准医学中的应用现状
自21世纪初伊马替尼用于治疗慢性髓性白血病以来,精准肿瘤学的研究重点一直是通过生物标志物发现肿瘤中的分子靶标,并通过特定的治疗干预进行靶向治疗[1]。
近年来,人工智能(AI)在肿瘤学研究和开发中的指数级增长,预示着精准肿瘤学的下一个发展浪潮[2,3]。深度学习(DL),作为AI的一个子集,可以利用癌症行为、基因组学和组织病理学之间的关系,通过人工神经网络中的数学方程提取数据(如数字组织病理切片)中的抽象和复杂特征与模式[4]。
深度学习的多层神经网络能够从相对简单的输入中开发复杂的数据表示,结合大数据集和强大的计算能力,赋予了DL其强大的能力[4]。
乳腺癌是最早使用DL在组织病理学上评估的癌症类型之一,这归功于其已建立的生物标志物驱动治疗[5]。同源重组缺陷(HRD)是乳腺癌和卵巢癌最重要的预测生物标志物之一,HRD使得患者对聚腺苷酸二磷酸核糖聚合酶抑制剂和铂类化疗敏感[6]。HRD主要归因于同源重组通路的异常,尤其是BRCA1和BRCA2基因的突变[6]。目前,HRD通常通过依赖于复杂分子测试的专有伴随诊断试剂盒来确定[6]。
Bergstrom等人开发的DeepHRD算法代表了一种创新的方法,通过AI直接从数字组织病理切片中检测HRD,避免了广泛且昂贵的分子测试[7]。
作者使用弱监督卷积神经网络(CNN)和多实例学习(MIL)构建了一个模型,使用苏木精-伊红染色的全切片图像(WSIs)预测HRD和预后[8,9]。CNN通过检测空间特征和模式设计用于视觉/图像应用[8]。
模型将WSIs分割成更小的瓦片进行处理,MIL是一种弱监督DL方法,其中瓦片标签基于WSI标签假设,无需在瓦片级别进行更精确的注释[9]。
作者设计了一个多分辨率工作流程,首先在低倍(5x)放大下评估WSI,然后自动选择一个感兴趣区域在高倍(20x)放大下评估,这模仿了训练有素的病理学家对组织学切片的评估过程。模型使用闪冻(FF)样本和福尔马林固定的石蜡包埋(FFPE)切片进行训练。
尽管之前已有研究使用DL检测HRD[10],但DeepHRD通过建立跨多个独立队列验证的更具泛化性的模型而脱颖而出。
DeepHRD通过评估临床结果进一步展示了其临床实用性。作者使用独立测试组(验证队列中的患者未在训练队列中使用)、平衡训练数据和神经网络内节点的随机丢弃等技术来最小化过拟合。通过比较接收者操作特征曲线下的面积(AUC)适当地评估了模型性能。
DeepHRD能够在FF和FFPE独立队列中实现对HRD的中等准确预测(AUC为0.76-0.81)。他们进一步分析了模型预测预后的能力,发现与传统分子测试相比,DeepHR达能够更精确地预测无进展生存期和治疗反应。重要的是,DeepHRD能够识别出一小部分表现出HRD表型但未被传统分子测试识别的患者。
为了解释DeepHRD算法的内部机制,作者识别并注释了预测HRD的WSI的空间区域,发现这些区域富含坏死、巨噬细胞密度和高密度炎症组织。
综上所述,DeepHRD作为一种创新的DL算法,在精准肿瘤学领域展示了其巨大的潜力,特别是在HRD的检测和预后预测方面。尽管目前仍面临数据集大小、多样性和监管批准等挑战,但其在多个独立队列中的验证结果证明了其临床实用性和泛化能力。
为了成功地将AI整合到临床肿瘤学中,必须解决和克服许多挑战[11]。
A) 人工智能(AI)在病理学中的关键用例
- 强监督AI:主要用于诊断目的,或者为预后或治疗反应的下游模型生成输入数据。
- 弱监督AI:可以直接产生诊断、预后或预测模型。
B) 组织病理学中AI的挑战
- 如数据的质量和数量、算法的解释性、以及临床实践中的集成问题。
C) AI时代的组织病理学工作流程
- 病理切片的数字化、图像分析、诊断辅助、以及报告生成等步骤。
D) 组织病理学发展简明时间线
- 这部分概述了组织病理学领域的重要发展里程碑,从传统的显微镜观察到现代的AI辅助诊断技术的演变。
为了确保DL模型的泛化性和可重复性,初始训练需要足够数量的高质量、平衡数据。
韩国最近发表的一项研究使用了与Bergstrom等人类似的技术,采用基于多实例学习(MIL)的DL算法和来自癌症基因组图谱(TCGA)的卵巢癌队列,他们能够训练和验证一个模型来预测卵巢癌进展,但与DeepHRD不同,他们的模型与BRCA突变或HRD状态无关[12]。
为了开发不仅准确而且广泛可泛化和可重复的模型,研究人员需要超越单一机构数据和TCGA(已广泛用于模型训练)[2,3]。
大多数已发表的DL研究要么从头开始开发模型,要么从预训练的非医学图像(例如,RESNET 18)开始,然后在数百或数千患者队列上进行微调[2,3]。
相比之下,最先进的DL模型通常使用数百万图像进行训练。
由于患者隐私和数据共享的问题,获得高质量医学数据的大型队列可能很困难[13,14]。
新颖的去中心化AI训练技术,如联邦学习和群体学习,可以帮助克服这些挑战[13,14]。最近开发了在数十万个注释的高质量全切片图像上预训练的组织病理学基础模型,也可以解决这些问题[15,16]。
使用基础模型可以更快地开发准确的癌症或特定任务模型,需要更少的数据和计算资源。
在训练新模型后,需要在未用于训练过程的独立数据上进行验证。
这种验证最好包括跨越现实世界变化的多个大队列[4]。DeepHRD的作者正确指出,他们研究的一个优势是包括了多个独立队列进行验证。然而,这些队列中的每一个都是对相对较少患者的回顾性评估。
再次,获得足够大且多样的验证队列是具有挑战性的。国家和国际合作的临床试验数据可以成为验证队列的丰富来源,并已在前列腺癌中成功实施[17]。
AI算法的最终验证步骤是专门设计的临床试验,以评估模型的准确性和实用性[18]。与传统分子生物标志物类似,这是临床采用前的关键步骤。
新颖AI算法的监管批准可能复杂且具有挑战性。
这是一个快速发展的过程,通常需要行业合作或私人公司的开发才能成功实施[11]。任何新技术都需要临床医生和实践者的接受和采用。
AI代表了癌症护理的范式转变方法,将这些模型纳入常规使用需要时间。成功地将AI整合到临床实践中需要研究人员、临床医生、数据科学家和监管机构之间的跨学科合作。
总之,AI和DL在肿瘤学研究和实践中具有巨大的革命性潜力。像DeepHRD这样的工具的开发展示了这种方法的潜在益处,通过提供精准肿瘤学的下一波浪潮。
相关文章:

JCO|病理AI是精准医疗的未来吗?|个人观点·24-09-13
小罗碎碎念 今日顶刊:JCO 这篇文章于24-09-11发表于J Clin Oncol,目前IF42.1,但是注意,这篇文章是一篇观点类文章,而不是我们常规意义上的那种科研型文章。 我在原作者的基础上补充了很多精美插图,并且根据…...

idea一键自动化部署项目
文章目录 前言一、 IDEA插件安装1. 首先下载 Alibaba Cloud Toolkit 插件2. 插件下载完成后重启IDEA 二、SpringBoot项目准备1. pom.xml 文件2. controller3. 启动类 三、SpringBoot项目jar包部署1. Alibaba Cloud Toolkit 插件服务器配置2. 主机 IP、用户名、密码 点击测试链接…...

Mybatis-plus复习篇
文章目录 1.MyBatis-plus基础1.1.mybatis-plus简介1.2.基本使用1.3.注解映射主键生成策略 1.4.命名转换问题1.5.关闭命名转换功能 2.BaseMapper核心接口 1.MyBatis-plus基础 1.1.mybatis-plus简介 MyBatis-Plus(简称 MP)是一个 MyBatis的增强工具&…...

Leetcode 109.有序链表转换二叉搜索树(Medium)
给定一个单链表的头节点 head ,其中的元素 按升序排序 ,将其转换为 平衡 二叉搜索树。 示例 1: 输入: head [-10,-3,0,5,9] 输出: [0,-3,9,-10,null,5] 解释: 一个可能的答案是[0,-3,9,-10,null,5],它表示所示的高度…...

[数据集][目标检测]河道垃圾检测数据集VOC+YOLO格式2274张8类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2274 标注数量(xml文件个数):2274 标注数量(txt文件个数):2274 标注…...

python vtk 绘制圆柱体和包围盒
基本的代码如下, import vtkcylinder vtk.vtkCylinderSource() cylinder.SetRadius(3.0) cylinder.SetHeight(10.0) cylinder.SetResolution(50)boundsFilter vtk.vtkOutlineFilter() boundsFilter.SetInputConnection(cylinder.GetOutputPort())mapper vtk.vtk…...

Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络)
Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络) 文章目录 Fisco Bcos 2.11.0通过网络和本地二进制文件搭建单机节点联盟链网络(搭建你的第一个区块链网络)前言一、Ubuntu依赖安装二、创建操作目录, 下载build_chain.sh脚本2.1 先…...

【Canvas与表盘】绘制黄蓝两色简约表盘
【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>黄蓝卡通手表</title><style type"text/css">…...

大数据-128 - Flink 并行度设置 细节详解 全局、作业、算子、Slot
点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…...

图新地球-将地图上大量的地标点批量输出坐标到csv文件【kml转excel】
0.序 有很多用户需要在卫星影像、或者无人机航测影像、倾斜模型上去标记一些地物的位置(如电线杆塔、重点单位、下水盖等) 标记的位置最终又需要提交坐标文本文件给上级单位或者其他部门使用,甚至需要转为平面直角坐标。 本文的重点是通过of…...

Git提交有乱码
服务器提交记录如图 可知application.properties中文注释拉黄线 ,提示Unsupported characters for the charset ISO-8859-1 打开settings - Editor - File Encodings 因为我们项目的其他文件都是UTF-8,所以,我们将默认值都改成UTF-8 然后…...

leetcode hot100_part4_子串
2024/4/20—4/21 560.和为K的子数组 前缀和哈希表,做二叉树的时候也有这个套路。注意细节,遍历到当前前缀和的时候是先找结果个数还是先加入哈希?应该先找结果个数,不然的话,当前位置也算上了(因为是前缀和…...

Spring Cloud之三 网关 Gateway
1:Intellij 新建项目 spring-cloud-gateway 2:pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLoca…...

Linux 进程1
进程 在linux系统中,触发任何一个事件时系统会将其定义为一个进程(一个程序开始执行),系统会给这个进程分配一个进程ID统称为PID。 程序:通常是二进制文件,放置于存储媒介如硬盘中。 进程:当存…...

LeetCode: 2552. 统计上升四元组 动态规划 时间复杂度O(n*n)
2552. 统计上升四元组 today 2552. 统计上升四元组 题目描述 给你一个长度为n下标从 0 开始的整数数组 nums ,它包含1到n的所有数字,请你返回上升四元组的数目。 如果一个四元组 (i, j, k, l) 满足以下条件,我们称它是上升的:…...

Unity 编辑器设置中文
在 Unity 编辑器中,你可以按照以下步骤将语言设置为中文: 步骤: 1. 打开 Unity 编辑器。 2. 在顶部菜单栏,依次点击 Edit > Preferences(在 macOS 上是 Unity > Preferences)。 3. 在弹出的 Preferen…...

springboot-创建连接池
操作数据库 代码开发步骤: pom.xml文件配置依赖properties文件配置连接数据库信息(连接池用的是HikariDataSource)数据库连接池开发 configurationproperties和value注解从properties文件中取值bean方法开发 service层代码操作数据库 步骤&am…...

matlab绘制不同区域不同色彩的图,并显示数据(代码)
绘图结果如下: 代码如下: A为绘图的数据,每个数据对应着上图中的一个区域,数据大小决定区域的颜色 % 假设有一系列的数据点 Arand(5,6); %A为绘图的数据,数据大小决定颜色 wei_shu%.3f; %代表数据保留三位小…...

Docker Desktop 的安装与汉化指南
前言 Docker Desktop 是一款非常流行的开发工具,它使得开发者能够在自己的计算机上轻松地构建、运行和调试 Docker 容器。然而,默认情况下,Docker Desktop 的界面是英文的,对于中文用户来说,有时候会觉得不够友好。幸…...

前端form表单+ifarme方式实现大文件下载
// main.jsimport Vue from vue; import App from ./App.vue; import { downloadTokenFile } from /path/to/your/function; // 替换为您的函数路径// 将 downloadTokenFile 添加到 Vue 原型上 Vue.prototype.$downloadTokenFile downloadTokenFile;new Vue({el: #app,render:…...

Leetcode面试经典150题-141.环形链表
题目比较简单,重点是理解思想 解法都在代码里,不懂就留言或者私信 /*** Definition for singly-linked list.* class ListNode {* int val;* ListNode next;* ListNode(int x) {* val x;* next null;* }* }*/ public…...

sh文件执行提示语法错误: 未预期的文件结尾
在执行sh文件时总是提示:语法错误: 未预期的文件结尾,尝试删除最后的空格也不对 最后发现在notepad中转换的问题 需要把windows换成unix就行了...

基于SpringBoot的甜品店管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于JavaSpringBootVueMySQL的蛋糕甜品店管理系…...

动态规划-不同的子序列
题目描述 给你两个字符串 s 和 t ,统计并返回在 s 的 子序列 中 t 出现的个数,结果需要对 109 7 取模。 示例: 输入:s "babgbag", t "bag" 输出:5 解释: 如下所示, 有 5 种可以从…...

如何通过OceanBase的多级弹性扩缩容能力应对业务洪峰
每周四晚上的10点,都有近百万的年轻用户进入泡泡玛特的抽盒机小程序,共同参与到抢抽盲盒新品的活动中。瞬间的并发流量激增对抽盒机小程序的系统构成了巨大的挑战,同时也对其数据库的扩容能力也提出了更高的要求。 但泡泡玛特的工程师们一点…...

D - 1D Country(AtCoder Beginner Contest 371)
题目链接: D - 1D Country (atcoder.jp) 题目描述: 数据范围: 输入输出: 题目分析: 典型的l, r 区间问题,即是前缀和问题,但是注意到数据范围, 数据范围1e-9 到 1e9 数据范围,要是从最小到最大直接for循环去模拟的话,时间复杂度…...

怎么很多张图片拼接成一张?试试这几种图片拼接方法!
怎么很多张图片拼接成一张?在繁忙的现代生活中,我们不断地捕捉和累积着各式各样的图像,它们如同记忆的珍珠,串联起生活的每一个瞬间,然而,随图片数量的激增,管理它们成为了一项挑战,…...

Python实现优化的分水岭算法
目录 优化分水岭算法的博客1. 分水岭算法优化概述2. 优化分水岭算法的步骤3. Python实现优化后的分水岭算法4. 实例:优化分水岭算法在图像分割中的应用5. 总结 优化分水岭算法的博客 分水岭算法是一种强大的图像分割方法,特别适用于分离不同的对象和区域…...

智慧交通基于yolov8的行人车辆检测计数系统python源码+onnx模型+精美GUI界面
【算法介绍】 智慧交通中,基于YOLOv8的行人车辆检测计数系统是一项高效、准确的技术解决方案。该系统利用YOLOv8这一先进的目标检测算法,结合深度学习技术,能够实时检测并准确计数道路上的行人和车辆。YOLOv8在保证检测速度的同时࿰…...

Linux开发工具的使用
文章目录 vim的使用基本模式介绍光标当前行操作(命令行模式)光标快速定位(命令行模式):插入模式的三种方式(命令行模式):vim基本操作(命令行模式)底行模式的操…...