当前位置: 首页 > news >正文

AI蛋白质设计与人工智能药物设计

AI蛋白质设计与人工智能药物设计

AI蛋白质设计

一、蛋白质相关的深度学习简介

1.基础概念

1.1.机器学习简介:从手写数字识别到大语言模型

1.2.蛋白质结构预测与设计回顾

1.3.Linux简介

1.4.代码环境:VS code和Jupyter notebook*

1.5.Python关键概念介绍*

2.常用的分析/可视化蛋白质及相关分子的方法

2.1.常用数据库与同源序列搜索和MSA构建

2.2.使用pymol和Mol可视化蛋白质结构

2.3.使用biopython与biotite分析生物序列与结构数据*

2.4.使用fpocket与point-site分析蛋白质结构口袋*

3.深度学习蛋白质设计与传统蛋白质设计之间的差异

3.1.深度学习的本质

3.2.传统方法:全原子能量函数Rosetta与统计势

3.3.深度学习:几何深度学习

3.4.深度学习与传统的物理方法的互补性

3.5.深度学习蛋白质设计的优越性

4.蛋白质语言模型

4.1.语言模型:从RNN到Transformers

4.2.理解蛋白质语言

4.3.生成式蛋白质语言模型

4.4.结构模型与语言模型的比较分析

5.基于深度学习的蛋白质功能与性质预测

5.1.蛋白质功能分类预测*

5.2.信号肽、跨膜区、亚细胞定位预测

5.3.蛋白质同源结构搜索

5.4.酶活性位点预测

二、深度学习与蛋白质结构预测

1.传统蛋白质(复合物)结构预测

1.1.使用modeller、swiss-model进行同源建模

1.2.基于分子动力学的从头建模

1.3.分子对接加入非蛋白质部分,AutoDock Vina实际操作*

2.现代深度学习用于蛋白质结构预测

2.1.RaptorX:从计算机视觉到蛋白质结构

2.2.AlphaFold2

2.3.AlphaFold3:生成式结构预测

2.4.ESMFold:语言模型与结构预测的融合

3.AlphaFold2 原理回顾

3.1.从共进化到结构

3.2.注意力机制

3.3.EvoFormer

3.4.Structural Module

4.AlphaFold3 介绍

4.1.扩散模型

4.2.训练数据

4.3.AlphaFold3 的成绩与不足

5.AlphaFold2/3 实际操作与结果分析

5.1.AlphaFold2实操*

5.2.AlphaFold2分析*

5.3.AlphaFold server使用*

5.4.本地版的AlphaFold3*

5.5.AlphaFold3分析*

6.ESMFold

6.1.从语言模型到结构预测

6.2.什么时候使用ESMFold,什么时候使用AlphaFold

6.3.ESMFold使用*

三、固定主链蛋白质序列设计

1.传统的蛋白质序列设计

1.1.基于全原子力场*

1.2.基于统计势

2.融入结构知识的语言模型设计蛋白质序列

2.1.ESM-IF原理介绍

2.2.ESM-IF的应用*

3.基于CNN的序列设计

3.1.CNN原理简介

3.2.DenseCPD设计方法

3.3.有侧链构象的设计方法

4.基于GNN设计序列

4.1.ProteinMPNN 的成功经验分析

4.2.ProteinMPNN 的广泛应用

4.3.ProteinMPNN 实际操作*

5.其他的序列设计模型

5.1.ABACUS-R 简介与实际操作*

5.2.CarbonDesign 从结构预测来到序列设计去*

5.3.CARBonAra 环境感知的序列设计*

6.固定主链序列设计在功能蛋白设计中的应用

6.1.新骨架蛋白质表达量优化(Science文章复现)*

6.2.抗体亲和力优化(Science文章复现)*

6.3.结合进化信息的酶性质全方位优化(JACS文章复现)*

四、深度学习蛋白质结构设计

1.传统思路回顾

1.1.结构域拼接

1.2.SCUBA:无侧链的蛋白质力场

2.基于蛋白质表面几何深度学习的binder设计

2.1.masif原理简介

2.2.masif用于识别蛋白表面的PPI热点

2.3.masif设计binder

3.基于扩散模型的蛋白质骨架设计模型

3.1.FrameDiff:基于IPA的主链生成*

3.2.Chroma:等变图神经网络结构设计

3.3.RFDiffusion:基于RosettaFold

3.4.RFDiffusion-All-Atom:基于RosettaFold-All-Atom

4.序列-结构共设计

4.1.trDesign

4.2.AlphaFold Hallucination

4.3.Rfjoint

4.4.Protein Generator

5.结合蛋白从头设计Nature Communication文章流程*

5.1.功能表位的选取

5.2.带限制条件的骨架生成

5.3.迭代优化

6.荧光素酶结构从头设计

6.1.Theozyme理论解释

6.2.骨架生成策略

6.3.活性位点设计与活性进化

五、面向功能的蛋白质序列设计

1.语言的深度学习建模方法

1.1.Transformer

1.2.BERT: Bidirectional Encoder Representations from Transformers

1.3.GPT: Generative Pre-trained Transformers

2.蛋白质语言模型的代表:ESM

2.1.模型框架

2.2.ESM系列工作:ESM-1/2,MSA Transformer,ESM3

2.3.ESM模型实际操作*

3.基于蛋白质语言模型的功能蛋白设计

3.1.预训练+微调的范式

3.2.条件式生成模型:Progen与ZymCTRL

3.3.Progen案例分析

3.4.上手微调ZymCTRL*

4.非自回归的序列生成模型

4.1.ProteinGAN:生成序列

4.2.DeepEvo:生成耐热酶

4.3.Prot-VAE

4.4.P450Diffusion:基于扩散模型设计功能P450*

5.功能蛋白生成后的评估指标

5.1.天然序列相似性评估*

5.2.多样性评估*

5.3.结构合理性评估*

六、基于深度学习的蛋白质挖掘与改造应用

1.酶学性质预测

1.1.DLKcat与GotEnzyme数据库介绍

1.2.UniKP:利用预训练模型挖掘、改造Kcat*

1.3.CLEAN:基于对比学习的EC号预测挖掘稀有脱卤酶*

2.蛋白质热稳定性改造

2.1.MutCompute介绍

2.2.利用MutCompute改造PETase(Nature)*

2.3.ThermoMPNN介绍与使用*

2.4.Pythia介绍与使用*

3.机器学习辅助定向进化/蛋白质工程

3.1.零样本突变效应预测原理

3.2.零样本改造基因编辑酶*

3.3.Low-N策略用于蛋白质工程

3.4.预训练模型的Evo-tuning*

3.5.ECNet介绍

3.6.蛋白质相互作用中的突变效应预测

4.针对自己的实验数据,训练自己的神经网络*

4.1.神经网络训练框架

4.2.数据收集、整理

4.3.特征提取方式

4.4.预训练模型的选取

4.5.模型训练、测试

4.6.新突变的预测

5.深度学习辅助的新酶挖掘*

5.1.基因编辑脱氨酶挖掘(Cell工作复现)

5.2.耐热塑料水解酶挖掘(Nature Communications

5.3.使用FoldSeek进行基于结构的挖掘

AIDD人工智能药物发现与设计

一、搭建和爬取数据库

  1. AIDD概述及药物综合数据库介绍
  2. 人工智能辅助药物设计AIDD概述
  3. 安装环境
    • (1) anaconda
    • (2) vscode
    • (3) pycharm
    • (4) 虚拟环境
  4. 第三方库基本使用方法
    • (1) numpy
    • (2) pandas
    • (3) matplotlib
    • (4) requests
  5. 多种药物综合数据库的获取方式
    • (1) KEGG(requests爬虫)
    • (2) Chebi(libChEBIpy)
    • (3) PubChem(pubchempy / requests)
    • (4) ChEMBL(chembl_webresource_client)
    • (5) BiGG(curl)
    • (6) PDB(pypdb)

二、 ML-based AIDD

  1. 机器学习
    • (1) 机器学习种类:
      • ① 监督学习
      • ② 无监督学习
      • ③ 强化学习
    • (2) 典型机器学习方法
      • ① 决策树
      • ② 支持向量机
      • ③ 朴素贝叶斯
      • ④ 神经网络
      • ⑤ 卷积神经网络
    • (3) 模型的评估与验证
    • (4) 分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算
    • (5) 回归评估:平均绝对误差、均方差、R2分数、可释方差分数
    • (6) 交叉验证
  2. sklearn工具包基本使用
  3. rdkit工具包的基本使用
  4. 化合物编码方式和化合物相似性理论知识
  5. 项目实战1:基于ADME和Ro5的分子筛选
  6. 项目实战2:基于化合物相似性的配体筛选
  7. 项目实战3:基于化合物相似性的分子聚类
  8. 项目实战4: 基于机器学习的生物活性预测
  9. 项目实战5:基于机器学习的分子毒性预测

三、GNN-based AIDD

  1. 图神经网络
    • (1) 框架介绍: PyG,DGL,TorchDrug
    • (2) 图神经网络消息传递机制
    • (3) 图神经网络数据集设计
    • (4) 图神经网络节点预测、图预测任务和边预测任务实战
  2. 论文精讲:DeepTox: Toxicity Prediction using Deep Learning
  3. 项目实战1:基于图神经网络的分子毒性预测
    • (1) SMILES分子数据集构建PyG图数据集
    • (2) 基于GNN进行分子毒性预测
  4. 项目实战2:基于图神经网络的蛋白质-配体相互作用预测
    • (1) 蛋白质分子图形化,构建PyG图数据集
    • (2) 基于GIN进行网络搭建及相互作用预测

四、NLP-based AIDD

  1. 自然语言处理
    • (1) Encoder-Decoder模型
    • (2) 循环神经网络 RNN
    • (3) Seq2seq
    • (4) Attention
    • (5) Transformer
  2. 项目实战1:基于自然语言的分子毒性预测
    • (1) SMILES分子数据集词向量表示方法
    • (2) 基于NLP模型进行分子毒性预测
  3. 项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)

五、分子生成与药物设计

  1. 蛋白质数据库介绍与相关数据爬取
    • (1) PDB数据库
    • (2) UniProt数据库
  2. 蛋白质相关药物设计项目实战
    • 项目实战 (1):基于RDKit的生化反应与蛋白质基本处理
    • 项目实战 (2):基于序列的蛋白质属性预测
    • 项目实战 (3):基于结构的蛋白质属性预测
    • 项目实战 (4):基于NGLView可视化的蛋白质-配体相互作用
    • 项目实战 (5):基于机器学习的蛋白质-配体相互作用亲和力预测
    • 项目实战 (6):基于蛋白质三维结构使用原子卷积网络的进行蛋白质-配体相互作用预测

相关文章:

AI蛋白质设计与人工智能药物设计

AI蛋白质设计与人工智能药物设计 AI蛋白质设计 一、蛋白质相关的深度学习简介 1.基础概念 1.1.机器学习简介:从手写数字识别到大语言模型 1.2.蛋白质结构预测与设计回顾 1.3.Linux简介 1.4.代码环境:VS code和Jupyter notebook* 1.5.Python关键概…...

IOS ARKit进行图像识别

先讲一下基础控涧,资源的话可以留言,抽空我把它传到GitHub上,这里没写收积分,竟然充值才能下载,我下载也要充值,牛! ARSCNView 可以理解画布或者场景 1 配置 ARWorldTrackingConfiguration AR追…...

初级数据结构——二叉搜索树

目录 前言一、定义二、基本操作三、时间复杂度分析四、变体五、动态图解六、代码模版七、经典例题[1.——700. 二叉搜索树中的搜索](https://leetcode.cn/problems/search-in-a-binary-search-tree/)代码题解 [2.——938. 二叉搜索树的范围和](https://leetcode.cn/problems/ra…...

C++设计模式之组合模式中如何实现同一层部件的有序性

在组合模式中,为了实现同一层上部件的有序性,可以采取以下几种设计方法: 1. 使用有序集合 使用有序集合(如 std::list、std::vector 或其他有序容器)来存储和管理子部件。这种方法可以确保子部件按照特定顺序排列&am…...

duxapp RN 端使用AppUpgrade 进行版本更新

版本更新包含了组件和工具的组合 注册 下面这是 duxcms 入口文件检查更新的注册方法,注册的同时会检查更新 import {request,updateApp,userConfig } from ./utils// 检查app更新 setTimeout(async () > {if (process.env.TARO_ENV rn) {// eslint-disable-n…...

【计网】自定义序列化反序列化(三) —— 实现网络版计算器【下】

🌎实现网络版计算器【下】 本次序列化与反序列化所用到的代码,Tcp服务自定义序列化反序列化实现网络版计算器。 文章目录: 实实现网络版计算器【下】 客户端实现     基于守护进程的改写 🚀客户端实现 在这之前&#xff0c…...

神经网络中的优化方法(一)

目录 摘要Abstract1. 与纯优化的区别1.1 经验风险最小化1.2 代理损失函数1.3 批量算法和小批量算法 2. 神经网络中优化的挑战2.1 病态2.2 局部极小值2.3 高原、鞍点和其他平坦区域2.4 悬崖和梯度爆炸2.5 长期依赖2.6 非精确梯度2.7 局部和全局结构间的弱对应 3. 基本算法3.1 随…...

Linux 计算机网络基础概念

目录 0.前言 1.计算机网络背景 1.1 独立模式 1.2 网络互联 1.3 局域网(Local Area Network,LAN) 1.4 广域网(Wide Area Network,WAN) 2.协议 2.1什么是协议 2.2协议分层和软件分层 2.3 OSI七层网络模型 2.3…...

qt QGraphicsEllipseItem详解

1、概述 QGraphicsEllipseItem是Qt框架中QGraphicsItem的一个子类,它提供了一个可以添加到QGraphicsScene中的椭圆项。QGraphicsEllipseItem表示一个带有填充和轮廓的椭圆,也可以用于表示椭圆段(通过startAngle()和spanAngle()方法&#xff…...

Python websocket

router.websocket(/chat/{flow_id}) 接口代码,并了解其工作流程、涉及的组件以及如何基于此实现你的新 WebSocket 接口。以下内容将分为几个部分进行讲解: 接口整体概述代码逐行解析关键组件和依赖关系如何基于此实现新功能示例:创建一个新的…...

【MySQL-5】MySQL的内置函数

目录 1. 整体学习的思维导图 2. 日期函数 ​编辑 2.1 current_date() 2.2 current_time() 2.3 current_timestamp() 2.4 date(datetime) 2.5 now() 2.6 date_add() 2.7 date_sub() 2.8 datediff() 2.9 案例 2.9.1 创建一个出生日期登记簿 2.9.2 创建一个留言版 3…...

深度学习笔记之BERT(三)RoBERTa

深度学习笔记之RoBERTa 引言回顾:BERT的预训练策略RoBERTa训练过程分析静态掩码与动态掩码的比较模型输入模式与下一句预测使用大批量进行训练使用Byte-pair Encoding作为子词词元化算法更大的数据集和更多的训练步骤 RoBERTa配置 引言 本节将介绍一种基于 BERT \t…...

C++知识点总结(59):背包型动态规划

背包型动态规划 一、背包 dp1. 01 背包(限量)2. 完全背包(不限量)3. 口诀 二、例题1. 和是质数的子集数2. 黄金的太阳3. 负数子集和4. NASA的⻝物计划 一、背包 dp 1. 01 背包(限量) 假如有这几个物品&am…...

C++:反向迭代器的实现

反向迭代器的实现与 stack 、queue 相似&#xff0c;是通过适配器模式实现的。通过传入不同类型的迭代器来实现其反向迭代器。 正向迭代器中&#xff0c;begin() 指向第一个位置&#xff0c;end() 指向最后一个位置的下一个位置。 代码实现&#xff1a; template<class I…...

webGL入门教程_04vec3、vec4 和齐次坐标总结

vec3、vec4 和齐次坐标总结 1. vec3 和 vec4 1.1 什么是 vec3 和 vec4&#xff1f; vec3&#xff1a; GLSL 中的三维向量类型&#xff0c;包含 3 个浮点数&#xff1a;(x, y, z)。常用于表示三维坐标、RGB 颜色、法线、方向等。 vec4&#xff1a; GLSL 中的四维向量类型&…...

uniapp中父组件数组更新后与页面渲染数组不一致实战记录

简单描述一下业务场景方便理解: 商品设置功能,支持添加多组商品(点击添加按钮进行增加).可以对任意商品进行删除(点击减少按钮对选中的商品设置进行删除). 问题: 正常添加操作后,对已添加的任意商品删除后,控制台打印数组正常.但是与页面显示不一致.已上图为例,选中尾…...

优化 Conda 下载速度:详细的代理配置和网络管理策略

优化 Conda 下载速度&#xff1a;详细的代理配置和网络管理策略 为了彻底解决使用 Conda 下载 PyTorch 时遇到的速度问题&#xff0c;并确保下载过程稳定可靠&#xff0c;这需要一个详细、综合的技术方案。让我们更深入地分析问题原因&#xff0c;然后详尽地解释采取的解决策略…...

服务器遭受DDoS攻击后如何恢复运行?

当服务器遭受 DDoS&#xff08;分布式拒绝服务&#xff09;攻击 后&#xff0c;恢复运行需要快速采取应急措施来缓解攻击影响&#xff0c;并在恢复后加强防护以减少未来攻击的风险。以下是详细的分步指南&#xff1a; 一、应急处理步骤 1. 确认服务器是否正在遭受 DDoS 攻击 …...

MFC音视频播放器-支持电子放大等功能

前言 本播放器在VS2019下开发&#xff0c;使用ffmpegD3D实现视频播放渲染功能。同时本播放器支持录像功能、截图功能、音视频播放功能、码流信息显示、电子放大功能等。D3D的渲染同时支持surface和texture两种方式&#xff0c;电子放大功能是在D3D Texture方式下进行实现。以下…...

c语言编程1.17蓝桥杯历届试题-回文数字

题目描述 观察数字&#xff1a;12321&#xff0c;123321 都有一个共同的特征&#xff0c;无论从左到右读还是从右向左读&#xff0c;都是相同的。这样的数字叫做&#xff1a;回文数字。 本题要求你找到一些5位或6位的十进制数字。满足如下要求&#xff1a; 该数字的各个数位之…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练

前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1)&#xff1a;从基础到实战的深度解析-CSDN博客&#xff0c;但实际面试中&#xff0c;企业更关注候选人对复杂场景的应对能力&#xff08;如多设备并发扫描、低功耗与高发现率的平衡&#xff09;和前沿技术的…...

定时器任务——若依源码分析

分析util包下面的工具类schedule utils&#xff1a; ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类&#xff0c;封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz&#xff0c;先构建任务的 JobD…...

376. Wiggle Subsequence

376. Wiggle Subsequence 代码 class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();int res 1;int prediff 0;int curdiff 0;for(int i 0;i < n-1;i){curdiff nums[i1] - nums[i];if( (prediff > 0 && curdif…...

第25节 Node.js 断言测试

Node.js的assert模块主要用于编写程序的单元测试时使用&#xff0c;通过断言可以提早发现和排查出错误。 稳定性: 5 - 锁定 这个模块可用于应用的单元测试&#xff0c;通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...

Ascend NPU上适配Step-Audio模型

1 概述 1.1 简述 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统&#xff0c;支持多语言对话&#xff08;如 中文&#xff0c;英文&#xff0c;日语&#xff09;&#xff0c;语音情感&#xff08;如 开心&#xff0c;悲伤&#xff09;&#x…...

根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:

根据万维钢精英日课6的内容&#xff0c;使用AI&#xff08;2025&#xff09;可以参考以下方法&#xff1a; 四个洞见 模型已经比人聪明&#xff1a;以ChatGPT o3为代表的AI非常强大&#xff0c;能运用高级理论解释道理、引用最新学术论文&#xff0c;生成对顶尖科学家都有用的…...

【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分

一、项目背景回顾 前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。 本弹重点聚焦于服务端的模块划分与架构设计&#xff0c;提升代码结构的可维护性与扩展性。 二、服务端模块设计目标 高内聚低耦合&#xff1a;各模块职责清晰&#xff0c;便于独立开发…...

ios苹果系统,js 滑动屏幕、锚定无效

现象&#xff1a;window.addEventListener监听touch无效&#xff0c;划不动屏幕&#xff0c;但是代码逻辑都有执行到。 scrollIntoView也无效。 原因&#xff1a;这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作&#xff0c;从而会影响…...

云原生玩法三问:构建自定义开发环境

云原生玩法三问&#xff1a;构建自定义开发环境 引言 临时运维一个古董项目&#xff0c;无文档&#xff0c;无环境&#xff0c;无交接人&#xff0c;俗称三无。 运行设备的环境老&#xff0c;本地环境版本高&#xff0c;ssh不过去。正好最近对 腾讯出品的云原生 cnb 感兴趣&…...

消防一体化安全管控平台:构建消防“一张图”和APP统一管理

在城市的某个角落&#xff0c;一场突如其来的火灾打破了平静。熊熊烈火迅速蔓延&#xff0c;滚滚浓烟弥漫开来&#xff0c;周围群众的生命财产安全受到严重威胁。就在这千钧一发之际&#xff0c;消防救援队伍迅速行动&#xff0c;而豪越科技消防一体化安全管控平台构建的消防“…...