当前位置：首页 > news >正文

Nat Mach Intell | AI分子对接算法评测

news 2025/7/8 22:19:36

《Nature Machine Intelligence》发表重磅评测，系统评估AI与物理方法在虚拟筛选（VS）中的表现，突破药物发现效率瓶颈。

核心评测体系：三大数据集

研究团队构建了三个新型测试集：

TrueDecoy：含147个靶点，活性分子与真实实验验证的低活性分子（活性-非活性比例1:40），模拟高挑战性筛选场景（图a,c）。
RandomDecoy：活性分子取自TrueDecoy，非活性分子随机选自商业库（比例1:100或1:300），贴近真实药物筛选（图b,d）。
MassiveDecoy：扩展至700万分子库，验证算法在大规模VS中的实用性。

AI与物理方法的对决

1. 对接准确性

AI工具：CarsiDock(成功率86.4%)和KarmaDock(76.2%)在RMSD <2Å时超越所有传统方法。
物理方法：LeDock在RMSD <1Å时准确率最高，显示局部构象优化优势。

2. 结构合理性

物理方法稳胜：Glide等生成复合物的分子间有效性(Intermolecular validity)达90%以上。
AI的短板：CarsiDock在分子间碰撞检查中合格率仅50%，FlexPose甚至低于20%。研究者指出，AI方法多关注配体构象，忽视蛋白-配体空间冲突。

3. 虚拟筛选表现

TrueDecoy测试：物理方法Glide联合RTMScore在区分微弱活性分子时最佳（EF_1%=5.69）。

RandomDecoy测试：CarsiDock全面胜出（EF_1%=43.5），显示AI在真实化学库筛选中的潜力。

技术瓶颈深度解析

1. 数据依赖性

去除PDBbind重复数据后，AI工具成功率下降30%，而物理方法稳定，提示现有AI模型泛化能力不足。

2. 后处理策略的局限性

RDKit几何优化（FF）仅提升配体内部合理性（Intramolecular validity），但恶化分子间相互作用。

构象对齐（Align）反而导致RMSD升高，削弱筛选性能。

3. 效率与精度的平衡

KarmaDock单次对接仅需0.017秒（GPU加速），适合千万级库初筛；CarsiDock精度高但耗时较长（1.7秒/分子），需级联策略提速。

未来方向与实战策略

1. 层次化筛选方案

两步走策略：先用KarmaDock初筛百万库，再以CarsiDock优化前10万分子。在八类靶点测试中，该策略显著提升活性分子召回率。

2. AI算法革新

将分子间几何约束（如氢键网络、疏水接触）融入神经网络架构；
开发统一评分框架，整合物理参数与深度学习特征。

3. 数据建设标准化

制定更严格的复合物合理性评价指标；
构建靶点依赖性更弱的广谱训练集。

主编视点

"AI对接工具的崛起并非替代传统方法，而是扩展药物发现的策略维度。此项研究揭示：

在初筛阶段，AI凭借速度优势可快速缩小化学空间；
在先导化合物优化时，物理方法对结合模式合理性的把控不可替代。

未来，嵌入物理规则的混合模型或成突破关键——既要让AI'理解'能量最小化原理，也要保留其探索未知空间的能力。"

参考资料

Gu, S., Shen, C., Zhang, X. et al. Benchmarking AI-powered docking methods from the perspective of virtual screening. Nat Mach Intell (2025).

代码链接：https://github.com/shukai1997/VSDS-VD

Nat Mach Intell | AI分子对接算法评测

《Nature Machine Intelligence》发表重磅评测，系统评估AI与物理方法在虚拟筛选（VS）中的表现，突破药物发现效率瓶颈。核心评测体系：三大数据集研究团队构建了三个新型测试集： TrueDecoy：含14…...

编程日记 2025/3/6 23:11:05

【自学笔记】Hadoop基础知识点总览-持续更新

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 Hadoop基础知识点总览1. Hadoop简介2. Hadoop生态系统3. HDFS（Hadoop Distributed File System）HDFS基本命令 4. MapReduceWordCount示例&am…...

编程日记 2025/3/6 22:58:50

【Linux】使用问题汇总

#1 ssh连接的时候报Key exchange failed 原因：服务端版本高，抛弃了一些不安全的交换密钥算法，且客户端版本比较旧，不支持安全性较高的密钥交换算法。解决方案： 如果是内网应用，安全要求不这么高&#xf…...

编程日记 2025/3/6 22:52:43

(二十二)趣学设计模式之备忘录模式！

目录一、啥是备忘录模式？二、为什么要用备忘录模式？三、备忘录模式的实现方式四、备忘录模式的优缺点五、备忘录模式的应用场景六、总结 🌟我的其他文章也讲解的比较有趣😁，如果喜欢博主的讲解方式，…...

编程日记 2025/3/6 22:49:39

交叉编译openssl及curl

操作环境：Ubuntu20.04 IDE工具：Clion2020.2 curl下载地址：https://curl.se/download/ openssl下载地址：https://openssl-library.org/source/old/index.html 直接交叉编译curl会报错找不到openssl，所以需要先交叉编…...

编程日记 2025/3/6 22:47:36

【每日八股】计算机网络篇（三）：IP

目录 DNS 查询服务器的基本流程DNS 采用 TCP 还是 UDP，为什么？默认使用 UDP 的原因需要使用 TCP 的场景？总结 DNS 劫持是什么？解决办法？浏览器输入一个 URL 到显示器显示的过程？URL 解析TCP 连接HTTP 请求页…...

编程日记 2025/3/6 22:46:35

Gartner：数据安全平台DSP提升数据流转及使用安全

2025 年 1 月 7 日，Gartner 发布“China Context：Market Guide for Data Security Platforms”（《数据安全平台市场指南——中国篇》，以下简称指南），报告主要聚焦中国数据安全平台（Data Securit…...

编程日记 2025/3/6 22:45:34

从vue源码解析Vue.set()和this.$set()

前言最近死磕了一段时间vue源码，想想觉得还是要输出点东西，我们先来从Vue提供的Vue.set()和this.$set()这两个api看看它内部是怎么实现的。 Vue.set()和this.$set()应用的场景平时做项目的时候难免不会对数组或者对象进行这样的骚操作操作&#xff…...

编程日记 2025/3/6 22:44:33

深入浅出：UniApp 从入门到精通全指南

https://juejin.cn/post/7440119937644101684 uni-app官网 uniapp安卓离线打包流程_uniapp离线打包-CSDN博客本文是关于 UniApp 从入门到精通的全指南，涵盖基础入门（环境搭建、创建项目、项目结构、编写运行）、核心概念与进阶知识&#x…...

编程日记 2025/3/6 22:34:22

DeepSeek未来发展趋势：开创智能时代的新风口

DeepSeek未来发展趋势：开创智能时代的新风口随着人工智能（AI）、深度学习（DL）和大数据的飞速发展，众多创新型技术已经逐渐走向成熟，而DeepSeek作为这一领域的新兴力量，正逐步吸引越…...

编程日记 2025/3/6 22:33:21

阻塞队列的实现（线程案例）

一.什么是阻塞队列？ 1.如果对于一个满的队列，还要把元素入队列，此时这个队列就会阻塞等待，一直阻塞到这个队列不满为止，从而把这个元素入队列！ 2.如果对于一个空的队列，还要从队列拿出元素&…...

编程日记 2025/3/6 22:32:19

http status是什么？常见的http状态码指的是什么意思？

HTTP 状态码 HTTP 状态码（HTTP Status Code）是服务器在响应客户端请求时返回的一个三位数字代码，用于表示请求的处理结果。HTTP 状态码是 HTTP 协议的一部分，帮助客户端（如浏览器或应用程序）了解请求是否成…...

编程日记 2025/3/6 22:31:18

react组件分离,降低耦合

分离前分离后...

编程日记 2025/3/6 22:19:03

【AI】AI白日梦+ChatGPT 三分钟生成爆款短视频

引言随着人工智能（AI）技术的快速发展，AI在各个领域都展现出了强大的应用潜力。其中，自然语言处理技术的进步使得智能对话系统得以实现，而ChatGPT作为其中的代表之一，具有自动生成文本的能力，为…...

编程日记 2025/3/6 22:17:59

MYSQL的安装教程

mysql安装分为：普通安装和压缩包安装压缩包安装很多会存在安装失败的情况，所以我这里就用了普通安装一、官网下载安装包 www.mysql.com 点击DOWNLOADS： 进入社区版本下载： 点击最下面一行进行下载： 选择第二个离…...

编程日记 2025/3/6 22:09:49

深入解析 C# 中的泛型：概念、用法与最佳实践

C# 中的泛型（Generics） 是一种强大的编程特性，允许开发者在不预先指定具体数据类型的情况下编写代码。通过泛型，C# 能够让我们编写更灵活、可重用、类型安全且性能优良的代码。泛型广泛应用于类、方法、接口、委托、集合等多个方…...

编程日记 2025/3/6 22:07:47

NUMA架构介绍

NUMA 架构详解 NUMA（Non-Uniform Memory Access，非统一内存访问） 是一种多处理器系统的内存设计架构，旨在解决多处理器系统中内存访问延迟不一致的问题。与传统的 UMA（Uniform Memory Access，统一内存访问…...

编程日记 2025/3/6 22:04:44

数据安全VS创作自由：ChatGPT与国产AI工具隐私管理对比——论文党程序员必看的避坑指南

文章目录数据安全VS创作自由：ChatGPT与国产AI工具隐私管理对比——论文党程序员必看的避坑指南ChatGPTKimi腾讯元宝DeepSeek 数据安全VS创作自由：ChatGPT与国产AI工具隐私管理对比——论文党程序员必看的避坑指南产品隐私设置操作路径隐私协议ChatGPT…...

编程日记 2025/3/6 22:01:38

python爬虫：python中使用多进程、多线程和协程对比和采集实践

更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录 1. 多进程爬虫1.1 python多进程样例1.2 实现多进程爬虫2. 多线程爬虫2.1 python多线程样例2.2 实现多线程爬虫3. 协程爬虫3.1 python协程样例3.2 实现协程爬虫在网络爬虫中，为了提高抓取效率，常常需要使用多进程、多线…...

编程日记 2025/3/6 21:59:35

《OpenCV》—— dlib库

文章目录 dlib库是什么？OpenCV库与dlib库对比dlib库安装dlib——人脸应用实例——人脸检测dlib——人脸应用实例——人脸关键点定位dlib——人脸应用实例——人脸轮廓绘制 dlib库是什么？ OpenCV库与dlib库对比 dlib库安装 dlib——人脸应用实例——人脸检…...

编程日记 2025/3/6 21:51:25

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/7/6 20:09:15

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2025/7/4 19:19:18

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2025/7/8 19:00:25

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2025/7/7 16:21:08

从深圳崛起的“机器之眼”：赴港乐动机器人的万亿赛道赶考路

进入2025年以来，尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断，但全球市场热度依然高涨，入局者持续增加。以国内市场为例，天眼查专业版数据显示，截至5月底，我国现存在业、存续状态的机器人相关企…...

编程新知 2025/7/6 22:58:21

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日，国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。据「TMT星球」了解，“超级…...

编程新知 2025/7/7 6:52:27

（二）原型模式

原型的功能是将一个已经存在的对象作为源目标，其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。一、源型模式的定义原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现，忽略对象创建过程中的其它细节。 📌 核心特点：避免重复初…...

编程新知 2025/7/8 5:42:23

服务器--宝塔命令

一、宝塔面板安装命令 ⚠️ 必须使用 root 用户或 sudo 权限执行！ sudo su - 1. CentOS 系统： yum install -y wget && wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh2. Ubuntu / Debian 系统…...

编程新知 2025/6/21 14:58:57

站群服务器的应用场景都有哪些？

站群服务器主要是为了多个网站的托管和管理所设计的，可以通过集中管理和高效资源的分配，来支持多个独立的网站同时运行，让每一个网站都可以分配到独立的IP地址，避免出现IP关联的风险，用户还可以通过控制面板进行管理功…...

编程新知 2025/6/17 5:04:55

LRU 缓存机制详解与实现（Java版） + 力扣解决

📌 LRU 缓存机制详解与实现（Java版） 一、📖 问题背景在日常开发中，我们经常会使用缓存（Cache） 来提升性能。但由于内存有限，缓存不可能无限增长，于是需要策略决定&am…...

编程新知 2025/7/8 17:57:05