Nature | Baker团队用AI设计出史上最高互作强度的蛋白质
蛋白质是生命的基础,是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。蛋白质设计是指对新蛋白质分子进行人为的合理设计,旨在设计新的活性,行为或目的,并增进对蛋白质功能的基本了解。可以从头开始设计蛋白质(从头设计),也可以通过对已知蛋白质结构及其序列进行计算得出的变体进行设计(称为蛋白质重新设计)。合理的蛋白质设计方法可以预测蛋白质序列,并将其折叠成特定的结构。然后可以通过诸如肽合成,定点诱变或人工基因合成等方法对这些预测序列进行实验验证。
蛋白质设计的一个主要目标就是设计能够产生新的功能的非天然的蛋白质。因为细胞体内的蛋白质大多都是通过和其他蛋白质产生相互作用来执行其功能的,所以衡量蛋白质设计的一个成功标准就是检查其设计的新的蛋白质与其他蛋白质的亲和力的强度。这里,一个重要的门槛就是天然蛋白质的亲和力的强度。目前,大多数计算机设计的蛋白质都是模拟天然蛋白的相互作用,但是很难达到和超越天然蛋白质的互作强度。
最近,华盛顿大学医学院和霍华德休斯医学研究所的David Baker教授团队利用人工智能(AI)驱动的生物技术来应对这些挑战。他们使用人工智能软件创建了蛋白质分子,这些蛋白质分子以极高的亲和力和特异性与各种具有挑战性的生物标志物(包括人类激素)结合。值得注意的是,该实验室在计算机生成的生物分子与其目标之间实现了有史以来最高的相互作用强度。
该研究以 “De novo design of high-affinity binders of bioactive helical peptides”为题,于 2023 年 12 月 18 日发布在著名国际杂志《Nature》上。
肽结合蛋白质设计的新挑战
设计的蛋白质可以在大肠杆菌中轻松高产、低成本地生产,并且具有非常高的稳定性,然而,以高亲和力和特异性结合螺旋肽的蛋白的设计仍然是一个突出的挑战。肽结合蛋白的设计具有挑战性,原因有两个。
第一,设计用于结合折叠蛋白的蛋白质,例如皮摩尔亲和力超稳定的 50-65 残基微型结合剂,具有适合结合刚性凹目标的形状,但不适合支撑延伸的肽。螺旋肽可以很容易地结合形成卷曲的线圈组件,并且这一原理已被用来设计钙调蛋白肽的结合剂,但由于大量暴露的疏水表面,卷曲螺旋亚基通常在没有结合伴侣的情况下自缔合,从而大大降低了有效的靶标结合亲和力。
第二,肽具有较少的相互作用残基,并且在分离时通常部分或完全非结构化。因此,将肽构建成特定构象可能会产生熵成本,这会损害有利的缔合自由能。在设计与延伸的 β 链结构和聚脯氨酸 II 构象结合的肽方面已经取得了进展,使用蛋白质侧链与肽主链相互作用;然而,由于 α 螺旋肽内部有大量主链-主链氢键,这种相互作用不能在 α 螺旋肽上发生。
图一:在凹槽支架中结合螺旋肽。 (a) 螺旋肽靶标:甲状旁腺激素 (PTH)、胰高血糖素 (GCG)、神经肽 Y (NPY)、促胰液素 (SCT) 以及 Bid 和 Bim 的凋亡相关 BH3 结构域。 (b) 螺旋结合问题的“开槽”结构解决方案。 (c) 改变超螺旋和螺旋距离以适应不同目标的凹槽支架采样的参数方法。
RFdiffusion:新的解决方案
Baker 实验室成员 Susana Vazquez-Torres、Preetham Venkatesh 和 Phil Leung 领导的团队,正着手创建能够与胰高血糖素、神经肽 Y、甲状旁腺激素和其他螺旋肽靶标结合的蛋白质。该团队提出了一种使用 RFdiffusion(一种用于创建新蛋白质形状的生成模型)与序列设计工具 ProteinMPNN 结合的新方法。
图二: 结合螺旋肽的设计新策略。 (a) 修复活页夹优化:使用 RFjoint 修复重新设计参数化生成的活页夹设计以扩展绑定界面。 左:方法示意图。 中:原始参数支架(灰色)、具有扩展接口的修复设计(粉色)和 PTH 目标(紫色)。 右:TAMRA 标记靶标的荧光偏振测量表明与 PTH 的结合为 6.1 nM,与脱靶 PTH 相关肽 (PTHrp) 的结合仅较弱。 (b) 穿线靶序列和重新设计:将肽穿线到伪重复蛋白支架上。 左:示意图。 右:基于重复蛋白支架(灰色)和SCT靶标(橙色)的SCT设计模型。 TAMRA 标记靶标的荧光偏振测量表明与 SCT 的结合为 3.95 nM,与 GCG 的结合为 12 nM。 (c) 具有深层网络幻觉的 Binder 设计。 左上:示意图。 右图是使用 AlphaFold 对结合物序列进行蒙特卡罗优化超过 5000 个步骤而得到的设计结合物,仅提供目标序列(而非结构)。 幻觉活页夹(灰色); 目标 Bid 肽(蓝色)。 等温滴定量热法测量(最右侧)表明与 Bid 的结合为 25 nM。 下:从随机序列(左)到最终序列(右)的幻觉轨迹; 蛋白质围绕肽折叠,螺旋含量从第 0 步到第 1000 步增加。
研究人员通过扩展 RFdiffusion 从而使绑定器设计能够适应更灵活的目标,并通过连续的噪声和去噪(部分扩散)来细化输入结构模型,皮摩尔亲和力结合剂可以通过其他方法生成的细化设计来生成螺旋肽靶标,或者完全从随机噪声分布开始。
目前为止,这些是针对任何蛋白质或小分子靶标的最高亲和力设计的结合蛋白,通过计算直接生成,无需任何实验优化。RFdiffusion 设计能够通过质谱法富集并随后检测甲状旁腺激素和胰高血糖素,并构建基于生物发光的蛋白质生物传感器。设计构象可变靶点的结合剂以及通过部分扩散优化天然和设计蛋白质的能力应该具有广泛的用途。
「我们正在见证蛋白质设计的激动人心的时代,先进的人工智能工具正在加速蛋白质活性的改善。这一突破将重新定义生物技术的前景。」 Vazquez-Torres 指出。
论文第一作者Susana Vazquez-Torres博士
该团队与哥本哈根大学的 Joseph Rogers 实验室和华盛顿大学医学院的 Andrew Hoofnagle 实验室合作,进行了实验室测试以验证他们的生物设计方法。质谱法用于检测与人血清中低浓度肽结合的设计蛋白质,从而证明了灵敏且准确的疾病诊断的潜力。此外,尽管高温等恶劣条件,这些蛋白质仍保留了其靶标结合能力,这是实际应用的一个关键属性。
许多肽类激素(peptide hormone),例如甲状旁腺激素(PTH)、神经肽Y(NPY)、胰高血糖素(GCG)、胰高血糖素样肽-1(GLP-1)、分泌素(SCT)等,在与受体结合时会采用α螺旋结构,在人类生物学中发挥着关键作用,是临床护理和生物医学研究中已确认的生物标志物。对它们进行灵敏性和特异性的定量检测对于疾病的诊断和药物开发具有重要意义,想要实现这一点,目前还依赖于需要大量资源生成的抗体,但这难以产生高亲和力,并且通常具有较差的稳定性和可重复性。
为了进一步展示该方法的潜力,研究人员将高亲和力甲状旁腺激素结合剂集成到生物传感器系统中,并在含有目标激素的样品中实现了生物发光信号增加 21 倍。这种与诊断设备的集成展示了人工智能生成蛋白质的直接实际应用。
图三:设计的粘合剂在传感和检测中的应用。 (a) 用于 PTH 检测的蛋白质生物传感器。 左图:移植 PTH lucCage 生物传感器的示意图,描绘了笼子和闩锁(左,米色)、钥匙(右,米色)、半荧光素酶(白色为非活性,蓝色为活性)、PTH 结合物(红色)和 PTH 肽 目标(紫色)。 右:以相同配色方案显示的设计模型。 (b) PTH 滴定导致荧光素酶发光线性增加。 (c) 在 PTH 极限浓度下对 PTH 生物传感器的评估表明检测限为 10 nM(参见方法)。 (d-f) 设计的 PTH 粘合剂能够从复杂的混合物中稳健地回收 PTH。 (d) 富集实验示意图。 (e) SVSEIQLMHNLGK(PTH 的 N 末端胰蛋白酶肽)的 LC-MS/MS 色谱图; LC-MS/MS 检测检测到的不同肽片段具有不同的颜色。 (f) 每种样品类型三次重复测量的平均色谱峰面积。 误差线代表标准偏差。
总结
这项研究报告了人工智能(AI)驱动的蛋白质从头设计的最新进展,从头设计和生成具有皮摩尔亲和力的螺旋肽靶标的结合蛋白,实现了直接通过计算生成、无需任何实验优化的最高亲和力。
在这项最新研究中,研究团队提出了一种使用RFdiffusion的新方法,将其与团队之前开发的蛋白质序列设计工具ProteinMPNN相结合,从而实现比以往任何时候都更高效地创建功能性蛋白质。
通过以新的方式组合这些工具,研究团队利用有限的靶标信息(例如肽的氨基酸序列)生成了其结合蛋白。这种“按需构建”(build to fit)的方法的广泛影响表明,生物技术进入了一个新时代,人工智能生成的蛋白质可以检测与人类健康和环境相关的复杂分子。
论文通讯作者 David Baker 教授表示,生成具有如此高亲和力和特异性的新型蛋白质的能力,从新的疾病治疗到先进的诊断,打开了一个新世界。
参考文献
(1)https://www.nature.com/articles/s41586-023-06953-1
(2)https://phys.org/news/2023-12-ai-generates-proteins-exceptional-strengths.html
相关文章:

Nature | Baker团队用AI设计出史上最高互作强度的蛋白质
蛋白质是生命的基础,是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。蛋白质设计是指对新蛋白质分子进行人为的合理设计,旨在设计新的活性,行为或目的,并增进对蛋白质功能的基本了解。可以从头开始设计蛋白质…...

C# 初识System.IO.Pipelines
写在前面 在进一步了解Socket粘包分包的过程中,了解到了.NET 中的 System.IO.Pipelines,可以更优雅高效的解决这个问题;先跟随官方的示例做个初步的认识。 System.IO.Pipelines 是一个库,旨在使在 .NET 中执行高性能 I/O 更加容…...

嵌入式——RTC内置实时时钟
学习目标 理解原理图RTC设计部分掌握初始化RTC掌握设置时间掌握读取时间学习内容 RTC原理图 RTC结构框图 RTC时钟 开发流程 加载依赖。gd32f4xx_rtc.c,gd32f4xx_pmu.c初始化RTC。时钟配置。获取时钟。RTC初始化 // 电池管理加载 rcu_periph_clock_enable(RCU_PMU); pmu_back…...

nodejs微信小程序+python+PHP的热带野生动物园景点预约订票系统的设计与实现-计算机毕业设计推荐
目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…...

ASP.NET MVC的5种AuthorizationFilter
一、IAuthorizationFilter 所有的AuthorizationFilter实现了接口IAuthorizationFilter。如下面的代码片断所示,IAuthorizationFilter定义了一个OnAuthorization方法用于实现授权的操作。作为该方法的参数filterContext是一个表示授权上下文的AuthorizationContext对…...
C语言初学8:函数和作用域
一、函数 函数声明告诉编译器函数的名称、返回值类型和参数。在一个源文件中定义函数且在另一个文件中调用函数时,函数声明是必需的。函数定义提供了函数的实际主体。...

2024年科技盛宴“上海智博会·上海软博会”招商工作接近尾声
2024年上海智博会和上海软博会即将于3月份在上海跨国采购会展中心盛大召开。作为全球科技和软件行业的盛会,这两大展会汇集了业界顶尖的企业、创新技术和前瞻思想,吸引了来自世界各地的专业人士和参展商。 今年的展会将一如既往地为大家呈现最前沿的科技…...

深圳锐科达SIP矿用电话模块SV-2801VP
深圳锐科达SIP矿用电话模块SV-2801VP 一、简介 SV-2800VP系列模块是我司设计研发的一款用于井下的矿用IP音频传输模块,可用此模块打造一套低延迟、高效率、高灵活和多扩展的IP矿用广播对讲系统,亦可对传统煤矿电话系统加装此模块,进行智能化…...
【Qt-数据库】
Qt编程指南 ■ SQLite■ CSV■ JSON ■ SQLite Qt 提供了很多操作数据库的类, SQLite 是非常小的,是轻量级的,完全配置时小于 400KiB,省略可选功能配置时小于 250KiB。 SQLite 是一个进程内的库,实现了自给自足的、无…...
windows文件名命名规范(文件名规范、命名规则、避免特殊字符、注意文件名长度限制260个字符)
文章目录 Windows文件名命名规范1. 基本规则1.1 避免使用特殊字符1.2 限制文件名长度1.3 避免使用预留名称 2. 最佳实践2.1 使用描述性名称2.2 使用连字符或下划线代替空格2.3 使用日期和版本号 3. 实用技巧3.1 批量重命名文件3.2 使用PowerShell进行高级文件操作 Windows文件名…...
如何修改MySQL的默认端口
MySQL是世界上最流行的开源关系型数据库管理系统之一。在某些情况下,由于安全性、网络策略或端口冲突的原因,数据库管理员可能需要更改MySQL服务的默认监听端口。本文将指导您如何在不同的操作系统上更改MySQL的默认端口。 理解MySQL配置文件 MySQL的配…...

Android笔记(二十一):Room组件实现Android应用的持久化处理
一、Room组件概述 Room是Android JetPack架构组件之一,是一个持久处理的库。Room提供了在SQLite数据库上提供抽象层,使之实现数据访问。 (1)实体类(Entity):映射并封装了数据库对应的数据表中…...
uniapp中各种状态的按钮
当涉及状态按钮时,UniApp提供了丰富的选择。UniApp中的状态按钮可以是开关按钮、单选按钮、多选按钮等。开发者可以根据具体需求选择使用合适的状态按钮组件。对于状态按钮,UniApp提供了丰富的API和事件,可以轻松实现状态切换、状态监听等功能…...

模式识别与机器学习-判别式分类器
模式识别与机器学习-判别式分类器 生成式模型和判别式模型的区别线性判别函数多分类情况多分类情况1多分类情况2多分类情况3 例题 广义线性判别函数实例 分段线性判别函数Fisher线性判别感知机算法例:感知机多类别分类 谨以此博客作为学习期间的记录 生成式模型和判…...
c++11 标准模板(STL)(std::pair)(七)访问 pair 的一个元素
定义于头文件 <utility> std::pair 是一个结构体模板,其可于一个单元存储两个相异对象。 pair 是 std::tuple 的拥有两个元素的特殊情况。 访问 pair 的一个元素 std::get(std::pair) template< size_t I, class T1, class T2 > typename std::tuple…...

IP 地址归属地查询
IP 地址归属地查询 1. IP 地址归属地查询2. IP 地址归属地查询References 1. IP 地址归属地查询 https://tool.lu/ip/index.html 2. IP 地址归属地查询 https://www.ip.cn/ip/.html References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/...

实战经验分享:在Java中灵活应用Excel注释和批注
本文由葡萄城技术团队原创并首发。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 前言 注释及批注是 Excel 中比较常用的功能,注释往往针对单元格,起到解释说明的作用&a…...
AUTOSAR从入门到精通-车载以太网(三)
目录 前言 原理 车载以太网总体架构 物理层 数据链路层 以太网帧格式<...

【自然语言处理】用Python从文本中删除个人信息-第二部分
自我介绍 做一个简单介绍,酒架年近48 ,有20多年IT工作经历,目前在一家500强做企业架构.因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【…...
设计模式之-中介者模式,快速掌握中介者模式,通俗易懂的讲解中介者模式以及它的使用场景
系列文章目录 设计模式之-6大设计原则简单易懂的理解以及它们的适用场景和代码示列 设计模式之-单列设计模式,5种单例设计模式使用场景以及它们的优缺点 设计模式之-3种常见的工厂模式简单工厂模式、工厂方法模式和抽象工厂模式,每一种模式的概念、使用…...

UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...
生成xcframework
打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式,可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。 使用 Xcode 命令行工具打包 通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

UE5 学习系列(三)创建和移动物体
这篇博客是该系列的第三篇,是在之前两篇博客的基础上展开,主要介绍如何在操作界面中创建和拖动物体,这篇博客跟随的视频链接如下: B 站视频:s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...

学校招生小程序源码介绍
基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码,专为学校招生场景量身打造,功能实用且操作便捷。 从技术架构来看,ThinkPHP提供稳定可靠的后台服务,FastAdmin加速开发流程,UniApp则保障小程序在多端有良好的兼…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...

Ascend NPU上适配Step-Audio模型
1 概述 1.1 简述 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统,支持多语言对话(如 中文,英文,日语),语音情感(如 开心,悲伤)&#x…...
CMake控制VS2022项目文件分组
我们可以通过 CMake 控制源文件的组织结构,使它们在 VS 解决方案资源管理器中以“组”(Filter)的形式进行分类展示。 🎯 目标 通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总(共4种) 方法描述是否推荐…...
docker 部署发现spring.profiles.active 问题
报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...