当前位置: 首页 > news >正文

CancerGPT :基于大语言模型的罕见癌症药物对协同作用少样本预测研究

今天我们一起来剖析一篇发表于《npj Digital Medicine》的论文——《CancerGPT for few shot drug pair synergy prediction using large pretrained language models》。该研究聚焦于一个极具挑战性的前沿领域:如何利用大语言模型(LLMs)在数据极为稀缺的罕见癌症组织中,实现对药物对协同作用的精准预测。(欢迎关注“赛文AI药学”,获取更多AI与药学的内容)

一、 引言:罕见癌症药物对协同作用预测的挑战与机遇

罕见癌症因其发病率低,患者群体小,导致药物研发长期面临实验数据匮乏的严峻挑战。传统的药物对协同作用预测方法,通常依赖于大量的实验数据进行模型训练,在罕见癌症领域难以有效应用。现有研究主要集中于常见癌症类型,或需要高维度的基因组和化学特征数据,这些数据在罕见癌症组织中获取困难且成本高昂。因此,开发针对罕见癌症的低数据依赖型药物对协同作用预测方法,具有重要的临床意义和科学价值。近年来,大语言模型(Large Language Models, LLMs)在自然语言处理领域展现出强大的少样本学习能力,为解决这一难题提供了新的思路。

二、 方法:基于 LLMs 的 CancerGPT 预测模型构建

本研究提出了一种新颖的基于 LLMs 的少样本药物对协同作用预测模型——CancerGPT。该模型的核心创新在于将药物对协同作用预测问题转化为自然语言处理任务,利用 LLMs 从海量生物医学文献中学习到的先验知识,弥补结构化数据的不足。CancerGPT 的构建流程主要包括以下几个关键步骤:

  1. 表格数据自然语言化: 将药物对、细胞系、组织类型及药物敏感性等表格数据转换为规范化的自然语言文本描述。

  2. 任务导向型提示工程: 设计针对药物对协同作用预测任务的特定提示语(Prompt),引导 LLMs 输出二元分类结果(即协同或非协同)。

  3. 模型预训练与微调: 选取 GPT-2、GPT-3 及 SciFive 等多个 LLMs 作为基础模型,并利用常见癌症药物对协同作用数据集对 GPT-2 进行预训练,得到 CancerGPT 模型。

  4. 少样本微调策略: 针对七种罕见癌症组织类型,分别采用少量样本(k-shot,k 值范围为 0-128)对预训练模型进行微调,以评估模型在数据稀缺条件下的预测性能。

三、 实验:模型性能评估与对比分析

在七种罕见癌症组织数据集上,对 CancerGPT 模型及其他基线模型(包括 XGBoost、TabTransformer 及 Collaborative Filtering)进行了系统性的性能评估。实验结果重点关注以下几个方面:

  1. 数据分布依赖性分析: 实验结果表明,当存在与目标组织分布一致的充足外部数据时,传统数据驱动模型表现更佳;而在外部数据缺乏或分布不一致时,CancerGPT 表现出显著优势。

  2. 不同 LLMs 模型性能比较: 经过针对性微调的 CancerGPT 模型准确率最高;GPT-3 模型展现出较大的性能提升潜力;针对生物医学文献预训练的 SciFive 模型并未在所有数据集上超越 GPT-2。这表明针对特定下游任务进行微调对于提升 LLMs 性能至关重要。

  3. 模型参数规模与性能关系: 参数量较小的 CancerGPT (124M) 性能优于参数量更大的 GPT-3 (175B),表明在特定任务中,模型性能并非单纯依赖于参数规模,精细化的微调策略可能更为关键。

  4. 微调策略对比: 全模型参数微调通常优于仅微调最后一层参数,但性能提升幅度有限。这表明 LLMs 的最后一层已经编码了丰富的先验知识,仅通过微调最后一层也能获得较好的性能。

四、 讨论:研究结果的意义与启示

本研究提出的 CancerGPT 模型,为罕见癌症药物对协同作用预测提供了一种有效的解决方案。更重要的是,本研究为深入理解 LLMs 在生物医学领域的应用提供了重要的 insights:

  1. 归纳推理与演绎推理的结合: 本研究成功地将基于数据的归纳推理(少样本微调)与基于知识的演绎推理(LLMs 预训练知识)相结合,为解决数据稀缺问题提供了新的范式。

  2. LLMs 作为通用学习器的潜力: 实验结果表明,经过适当微调的 LLMs 能够展现出强大的迁移学习能力,有望成为生物医学领域通用的智能学习模型。

  3. 轻量级迁移学习的可行性: 仅对 LLMs 的最后一层进行微调即可取得与全模型微调相当的性能,这为高效利用预训练 LLMs 解决下游任务提供了新的途径。

五、 未来的研究方向与挑战

尽管本研究取得了积极的成果,但仍存在一些局限性和未来值得探索的方向:

  1. 模型泛化能力验证: 需要在更多类型的生物医学预测任务上,进一步验证 LLMs 的泛化能力。

  2. 多模态数据融合: 如何将 LLMs 提取的文本信息与基因组、化学特征等结构化数据进行有效融合,是一个重要的研究方向。

  3. 模型可解释性提升: 虽然本研究尝试对 LLMs 的推理进行解释,但如何提高 LLMs 的可解释性,避免“黑箱”问题,仍然是一个重要的挑战。

本研究提出的 CancerGPT 模型,为解决罕见癌症药物对协同作用预测难题提供了新的思路和有效工具,并为 LLMs 在生物医学领域的应用提供了重要的理论和实践依据。未来,随着 LLMs 技术的不断发展,其在生物医学领域的应用前景将更加广阔。

往期内容荐读:

数智药学的崛起:人工智能赋能药学新未来

数智药师:AI时代药学服务的引领者

智能决策助力药物安全:大模型在临床处方审核中的突破

数字人技术在药学服务中的应用

药师必备:掌握AI,引领药学服务新时代

LEADER - 大模型蒸馏的药物推荐模型

李新刚:《医院药学的创新引擎:ChatGPT的应用与思考》

ChatGPT 在临床药学中的有效性以及人工智能在药物治疗管理中的作用

评估大语言模型在药物基因组学问答任务中的表现:PGxQA

DDI-GPT:使用知识图谱增强的大模型对药物相互作用进行可解释的预测

生成式AI:药学科普的新引擎

诺奖得主David Baker最新Science论文:药学+AI领域迎来新机遇!

AI与药学:ChatGPT与临床培训——药学博士(Pharm-D)学生的看法、担忧和实践

人工智能大模型在用药处方审核的应用潜力:一项跨 12 个临床专科的前瞻性研究

生成式人工智能在中医药学教育中的应用与挑战

PharmacyGPT: AI赋能精准ICU药物治疗

数智药学:信息药师向AI药师的进化

AI用于研究药物扩大适应症:大模型架起药物分子结构与适应症的桥梁

AI与药学:DrugGPT助力减少英国每年2.37亿次用药错误

AI时代下的家庭药师

AI与药学:用药咨询场景的检索增强AI大模型

​AI与药学:生成式人工智能如何帮助构建患者药品说明书?

欢迎关注“赛文AI药学”!

赛文AI药学,致力于探索人工智能在药学场景中的创新与应用。

相关文章:

CancerGPT :基于大语言模型的罕见癌症药物对协同作用少样本预测研究

今天我们一起来剖析一篇发表于《npj Digital Medicine》的论文——《CancerGPT for few shot drug pair synergy prediction using large pretrained language models》。该研究聚焦于一个极具挑战性的前沿领域:如何利用大语言模型(LLMs)在数…...

《汽车维护与修理》是什么级别的期刊?是正规期刊吗?能评职称吗?

​问题解答: 问:《汽车维护与修理》是不是核心期刊? 答:不是,是知网收录的正规学术期刊。 问:《汽车维护与修理》级别? 答:国家级。主管单位:中国汽车维修行业协会 …...

tomcat状态一直是Exited (1)

docker run -di -p 80:8080 --nametomcat001 你的仓库地址/tomcat:9执行此命令后tomcat一直是Exited(1)状态 解决办法: 用以下命令创建运行 docker run -it --name tomcat001 -p 80:8080 -d 你的仓库地址/tomcat:9 /bin/bash最终结果 tomcat成功启动...

消息中间件的基础概念入门

目录 一、什么是消息中间件 1.1、简介 1.2、消息中间件的主要作用 解耦合 异步通信 负载均衡 可靠性与持久性 消息路由与调度 削峰 事务支持 监控与审计 跨平台和跨语言支持 二、常用消息中间件对比 2.1、 RabbitMQ 2.1.1、特点 2.1.2、适用场景 2.2、Apache K…...

基于Web的宠物医院看诊系统设计与实现(源码+定制+开发)在线预约平台、宠物病历管理、医生诊疗记录、宠物健康数据分析 宠物就诊预约、病历管理与健康分析

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…...

Excel数据叠加生成新DataFrame:操作指南与案例

目录 一、准备工作 二、读取Excel文件 三、数据叠加 四、处理重复数据(可选) 五、保存新DataFrame到Excel文件 六、案例演示 七、注意事项 八、总结 在日常数据处理工作中,我们经常需要将不同Excel文档中的数据整合到一个新的DataFrame中,以便进行进一步的分析和处…...

Web 开发入门之旅:从静态页面到全栈应用的第一步

Web 开发入门之旅:从静态页面到全栈应用的第一步 在当今互联网飞速发展的时代,掌握 Web 开发技能已成为众多技术爱好者和职场人士的必修课。然而,对于初学者而言,面对繁杂的技术栈和庞大的学习资源,往往感到无从下手。…...

WebSocket实现分布式的不同方案对比

引言 随着实时通信需求的日益增长,WebSocket作为一种基于TCP的全双工通信协议,在实时聊天、在线游戏、数据推送等场景中得到了广泛应用。然而,在分布式环境下,如何实现WebSocket的连接管理和消息推送成为了一个挑战。本文将对比几…...

基于注意力机制的端到端合成语音检测

End-to-end Synthetic Speech Detection Based on Attention Mechanism 摘要: 五种轻量级注意力模块改为适用于语音序列的 通道注意力机制和 一维空间注意力机制 ASVspoof2019测试集的 等错误率和 最小串联检测代价函数都有所降低 池化层之前嵌入CBAM、ECA的模型测试…...

MySQL NaviCat 安装及配置教程(Windows)【安装】

文章目录 一、 MySQL 下载 1. 官网下载2. 其它渠道 二、 MySQL 安装三、 MySQL 验证及配置四、 NaviCat 下载 1. 官网下载2. 其它渠道 五、 NaviCat 安装六、 NaviCat 逆向工程 软件 / 环境安装及配置目录 一、 MySQL 下载 1. 官网下载 安装地址:https://www.m…...

微信小程序:播放音频

在小程序开发中,音频播放是一个重要的功能。本文将详细介绍小程序音频播放的相关知识点,帮助开发者更好地掌握小程序音频播放的实现方法。 一、小程序音频播放的基本流程 在小程序中,音频播放的基本流程如下: 获取音频数据&#…...

Ubuntu安装K8S

第一步: 安装docker Install Docker #注意docker是早期的名称已经过时了,因此请使用如下命令,一步到位安装docker-ce。 第二步:设置K8S源: (大陆使用aliyun源,大陆外使用google源)…...

独立同分布时,联合概率密度函数等于边缘概率密度函数乘积

在概率论中,独立同分布(i.i.d.)指的是多个随机变量既独立又服从相同的概率分布。对于一组随机变量 (X_1, X_2, \dots, X_n),若它们是独立同分布的,那么它们的联合概率密度函数 (p(x_1, x_2, \dots, x_n)) 就可以表示为…...

半导体数据分析: 玩转WM-811K Wafermap 数据集(三) AI 机器学习

前面我们已经通过两篇文章,一起熟悉了WM-811K Wafermap 数据集,并对其中的一些数据进行了调用,生成了一些统计信息和图片。今天我们接着继续往前走。 半导体数据分析: 玩转WM-811K Wafermap 数据集(二) AI…...

【.net core】【sqlsugar】时间查询示例

1、时间包含查询示例 //model.TimeInterval为时间区间参数,参数格式为2024-01-01~2025-01-01 //query为当前查询的语句内容 //为当前查询语句增加创建时间模糊搜索查询条件 query query.Where(a > ((DateTime)a.F_CreatorTime).ToString("yyyy-MM-dd HH:m…...

Kotlin 协程基础十 —— 协作、互斥锁与共享变量

Kotlin 协程基础系列: Kotlin 协程基础一 —— 总体知识概述 Kotlin 协程基础二 —— 结构化并发(一) Kotlin 协程基础三 —— 结构化并发(二) Kotlin 协程基础四 —— CoroutineScope 与 CoroutineContext Kotlin 协程…...

Java中网络编程的学习

目录 网络编程概述 网络模型 网络通信三要素: IP 端口号 通信协议 IP地址(Internet Protocol Address) 端口号 网络通信协议 TCP 三次握手 四次挥手 UDP TCP编程 客户端Socket的工作过程包含以下四个基本的步骤: 服务器程序…...

[计算机网络]一. 计算机网络概论第一部分

作者申明&#xff1a;作者所有文章借助了各个渠道的图片视频以及资料&#xff0c;在此致谢。作者所有文章不用于盈利&#xff0c;只是用于个人学习。 1.0推荐动画 【网络】半小时看懂<计算机网络>_哔哩哔哩_bilibili 1.1计算机网络在信息时代的作用 在当今信息时代&…...

【0393】Postgres内核 checkpointer process ③ 构建 WAL records 工作缓存区

1. 初始化 ThisTimeLineID、RedoRecPtr 函数 InitXLOGAccess() 内部会初始化 ThisTimeLineID、wal_segment_size、doPageWrites 和 RedoRecPtr 等全局变量。 下面是这四个变量初始化前的值: (gdb) p ThisTimeLineID $125 = 0 (gdb) p wal_segment_size $126 = 16777216 (gdb…...

正则表达式基础知识及grep、sed、awk常用命令

文章目录 前言一、正则表达式元字符和特性1. 字符匹配2. 量词3. 字符类4. 边界匹配5. 分词和捕获6. 特殊字符7. 位置锚定 二、grep常用参数1. -n额外输出行号2. -v 排除匹配的行3. -E 支持扩展正则匹配4. -e进行多规则匹配搜索5. -R 递归匹配目录中的文件内容6. -r递归地搜索目…...

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

测试微信模版消息推送

进入“开发接口管理”--“公众平台测试账号”&#xff0c;无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。 获取access_token: 自定义模版消息&#xff1a; 关注测试号&#xff1a;扫二维码关注测试号。 发送模版消息&#xff1a; import requests da…...

Xshell远程连接Kali(默认 | 私钥)Note版

前言:xshell远程连接&#xff0c;私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...

边缘计算医疗风险自查APP开发方案

核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...

FFmpeg 低延迟同屏方案

引言 在实时互动需求激增的当下&#xff0c;无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作&#xff0c;还是游戏直播的画面实时传输&#xff0c;低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架&#xff0c;凭借其灵活的编解码、数据…...

基于数字孪生的水厂可视化平台建设:架构与实践

分享大纲&#xff1a; 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年&#xff0c;数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段&#xff0c;基于数字孪生的水厂可视化平台的…...

【AI学习】三、AI算法中的向量

在人工智能&#xff08;AI&#xff09;算法中&#xff0c;向量&#xff08;Vector&#xff09;是一种将现实世界中的数据&#xff08;如图像、文本、音频等&#xff09;转化为计算机可处理的数值型特征表示的工具。它是连接人类认知&#xff08;如语义、视觉特征&#xff09;与…...

从零实现STL哈希容器:unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享 希望也能为你带来些帮助~ 那咱们废话不多说&#xff0c;直接开始吧&#xff01; 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

代理篇12|深入理解 Vite中的Proxy接口代理配置

在前端开发中,常常会遇到 跨域请求接口 的情况。为了解决这个问题,Vite 和 Webpack 都提供了 proxy 代理功能,用于将本地开发请求转发到后端服务器。 什么是代理(proxy)? 代理是在开发过程中,前端项目通过开发服务器,将指定的请求“转发”到真实的后端服务器,从而绕…...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...