当前位置: 首页 > article >正文

机器学习助力无序蛋白建模

Garegin Papoian 对一类难以捉摸的蛋白质的建模探索借助某机构研究奖的支持Papoian 团队正在破解固有无序蛋白的动力学奥秘。分子如何聚集并开始表现得像一个生命系统这是驱动 Garegin Papoian 研究的问题。在马里兰大学他担任 Monroe Martin 教授一直专注于蛋白质和 DNA 等生物分子的计算建模。在其 Papoian 实验室一个位于该校的理论物理化学研究组团队还在致力于开发整个细胞的基础分子模型——这一概念仍处于起步阶段。Papoian 的科学之路很早就确定了。他在亚美尼亚当时为苏联的一部分长大进入一所物理和数学专业学校在那里接触了科学奥林匹克竞赛。高中时期他分别在化学、物理、数学和生物奥林匹克竞赛中获得亚美尼亚共和国第一名。“科学奥林匹克竞赛是我被科学吸引的重要原因尤其是化学和物理”他说。由于在竞赛中的成功他被邀请到莫斯科一所专为奥林匹克竞赛获胜者设立的高等化学学院学习。“我当时16岁”他说“但学校认为我们已经掌握了所有大学水平的化学知识。所以他们会立即开始非常高水平的培训。”该计划包括在美国堪萨斯大学的实习。从那里他最终进入康奈尔大学攻读研究生在诺贝尔奖得主 Roald Hoffmann 指导下攻读量子化学博士学位。在博士后期间他转向经典物理学特别强调生物物理学。“我有兴趣引入物理化学的概念从分子角度理解生物现象”他说“我的长期职业目标是发展针对蛋白质和细胞的概念。”预测蛋白质的形状蛋白质是对所有生物都至关重要的一个大分子。形成蛋白质的氨基酸序列决定了其三维结构。每个蛋白质都有独特的形状决定了其功能。能够从氨基酸序列预测蛋白质结构一直是一个长期存在的科学挑战也是 Papoian 小组的研究兴趣之一他因此在2018年获得了某机构的机器学习研究奖。[动画展示连接组蛋白 H1 的结构包括其无序尾部]此动画展示了 Papoian 团队预测的名为连接组蛋白 H1 的蛋白质结构包括其无序尾部。“我们发现这些无序尾部与 DNA 的相互作用有助于在结构上定位 H1 相对于核小体的位置。从更宏观的角度看H1-核小体相互作用调节表观遗传过程例如决定哪些特定基因应该开启或关闭”Papoian 说。蛋白质结构预测的应用之一是药物设计。“设计药物时需要知道靶点的样子”Papoian 说。例如如果知道靶蛋白有某个口袋就可以开发一个能完美契合该口袋的分子。虽然识别与疾病相关的基因变得更容易但基因序列并不能告诉你它表达的蛋白质是什么样子而确定蛋白质形状的实验方法既漫长又昂贵。固有无序蛋白……更像疯狂的意大利面条。无论从实验还是计算角度都很难处理它们。—— Garegin Papoian即使 DeepMind 证明了 AlphaFold 能够以前所未有的准确度预测蛋白质结构挑战仍然存在。事实证明人类蛋白质中有很大一部分并非完全以规整的三维结构存在。这些被称为固有无序蛋白。“它们更加动态大多永远不会落在一个单一结构上”Papoian 说“它们更像疯狂的意大利面条。无论从实验还是计算角度都很难处理它们因为它们如此难以捉摸。”他指出大约三分之一的人类蛋白质都是这样包括许多重要的致病蛋白。Papoian 获得的某机构机器学习研究奖使其团队得以推进一个更适合模拟这些蛋白质的系统的开发。攻克无序蛋白过去几年Papoian 实验室一直在使用一个名为 AWSEM-MD读作“awesome”的蛋白质建模框架。AWSEM 代表联想记忆、水介导、结构和能量模型——分子动力学。该框架是与 Papoian 的前博士后导师 Peter Wolynes现就职于莱斯大学共同开发的双方多年来持续合作。利用该机器学习研究奖Papoian 及其同事开发了 AWSEM-IDP这是 AWSEM 的一个专门设计用于模拟固有无序蛋白的分支。该系统使用一个通过实验获得的蛋白质片段结构数据库例如通过核磁共振光谱学——一种确定蛋白质结构和动力学的技术。“这些片段作为结构记忆引导 IDP 进行由实验信息指导的结构转变”Papoian 解释道“这允许模拟更真实的 IDP 动力学。”片段数据库也可能包含来自全原子模拟的结构——一种蛋白质每个原子都存在的模拟类型。“我们通常不倾向于进行全原子模拟的原因是非常昂贵无法进行非常大的模拟。但可以对短片段进行全原子模拟为我们提供良好的片段记忆再次提高 AWSEM 模拟中 IDP 结构探索的准确性”他说。一个 IDP 会倾向于多种结构而不仅仅是一种。“这就是与常规蛋白质的关键区别IDP 本质上是多面的。但它们仍然会偏好某些结构而非其他结构。而 AWSEM-IDP 模型允许你正确描述这些偏好”Papoian 解释道。该模型在2018年发表于《物理化学杂志 B》的一篇文章中进行了描述。在另一项今年早些时候发表、由该机器学习奖支持的工作中Papoian 及其同事应用 AWSEM-IDP 研究了一种称为连接组蛋白 H1 的蛋白质该蛋白在调节许多重要生物过程中起着关键作用。这种蛋白质有两个固有无序区域其结构中未良好折叠的部分像两条尾巴。由于它们是无序的理解它们的功能和相互作用方式要困难得多。像连接组蛋白 H1 这样的蛋白质调节组蛋白复合物组蛋白复合物像线轴一样DNA 缠绕在其上形成称为核小体的结构。“在这篇论文中我们使用 AWSEM-IDP 对带有连接组蛋白 H1 的核小体进行建模特别是带有这些无序尾部的核小体。这使我们能够理解连接组蛋白和核小体如何结合并相互作用以及这些无序尾部的作用”Papoian 说。理解蛋白质与核小体的相互作用可能为表观遗传学提供重要见解这也是 Papoiano 实验室的兴趣之一。未来的挑战因为理解 IDP 是一个非常困难的过程Papoian 说 AWSEM-IDP 是一个持续改进的项目。“我们目前的方法在某些蛋白质类别中效果更好在其他类别中则不然。所以接下来我们将探索当前 AWSEM-IDP 面临的挑战并尝试提出新的进展来克服它们。”除了 IDPPapoian 实验室还将继续寻求使用深度学习来预测结构良好的蛋白质结构。尽管与 AlphaFold 存在一些概念上的重叠但 Papoian 相信 AWSEM-MD 是一个强大的工具在分子动力学方面比其他方法更有优势。蛋白质不是冻结的物体。其中一些结构良好但许多根本没有结构它们动态变化不停地移动和变形。—— Garegin Papoian“蛋白质不是冻结的物体”他说“其中一些结构良好但许多根本没有结构它们动态变化不停地移动和变形。因此要理解这些蛋白质的功能必须模拟它们的动力学而这正是 AWSEM-MD 最擅长的。”Papoian 认为未来几十年一个令人兴奋的探索领域将是结合机器学习和物理学来研究蛋白质结构预测、蛋白质动力学、多蛋白复合物和表观遗传学。“我们的模型中还有很多东西有待理解。我认为单靠物理学或机器学习可能都无法解决它们。但一个能够将它们有效结合起来的程序将非常强大”他说。模拟整个细胞Papoian 和他的同事们正在追求的另一个雄心勃勃的项目是开发整个细胞的计算模型。“我们仍然没有像拥有汽车或波音飞机蓝图那样的细胞蓝图。”为此他的小组从头开始开发自己的软件。Garegin Papoian细胞如何移动化学遇上力学“我们基本上在做所需的科学、物理学和生物物理学来模拟我们的细胞。我们基于物理和化学定律从头推导所需的算法然后将其编程到计算机中并在超级计算机上运行模拟”他解释道。他补充说这必须在单分子分辨率下完成意味着必须追踪细胞内的每一个分子。为了实现这一目标Papoian 实验室开发了一个名为 MEDYAN 的模型。“我们已经可以模拟一定数量的蛋白质、细胞膜可以模拟丰富的化学反应。我们已经开发了所需的一些基础化学和物理组件”他说。下一步是扩展它。“我们通常用几种蛋白质进行模拟。未来可能需要数百或数千种不同类型的蛋白质这会带来更大的复杂性。”他说当这种情况发生时将给生物医学带来巨大革命。“那么人们在实验室中费力花费多年做的许多事情就可以在某机构的服务器上运行。你可以在计算机上进行实验和寻找治疗方法这将更便宜、更快速。”FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关文章:

机器学习助力无序蛋白建模

Garegin Papoian 对一类难以捉摸的蛋白质的建模探索 借助某机构研究奖的支持,Papoian 团队正在破解固有无序蛋白的动力学奥秘。 分子如何聚集并开始表现得像一个生命系统?这是驱动 Garegin Papoian 研究的问题。在马里兰大学,他担任 Monroe…...

别再只学协议了!从AVB到TSN:梳理车载以太网确定性演进的完整脉络与核心挑战

从AVB到TSN:车载以太网确定性技术的演进逻辑与工程实践 当一辆自动驾驶汽车在高速公路上以120km/h行驶时,制动指令的10毫秒延迟意味着车辆会多行进33厘米——这个距离可能决定一次避障的成败。正是这种严苛的实时性要求,推动着车载网络从&quo…...

PCIE 3.0信号完整性仿真实战:从S参数提取到合规性验证

1. PCIe 3.0信号完整性仿真的核心挑战 当你第一次接触PCIe 3.0设计时,最让人头疼的莫过于那些看似简单的差分对信号在实际布线后变得"面目全非"。我清楚地记得第一次用示波器测量8Gbps信号时的震惊——眼图几乎完全闭合,就像眯成一条缝的眼睛。…...

用strace追踪一个「僵尸进程」是如何产生的

在Linux系统中,僵尸进程是每个开发者都可能遇到的棘手问题。它们虽然不占用系统资源,但数量过多会导致进程表耗尽,影响系统稳定性。如何快速定位僵尸进程的成因?strace作为强大的系统调用追踪工具,能像X光机一样透视进…...

终极指南:3小时完成100个NCBI基因组数据批量下载的完整解决方案

终极指南:3小时完成100个NCBI基因组数据批量下载的完整解决方案 【免费下载链接】ncbi-genome-download Scripts to download genomes from the NCBI FTP servers 项目地址: https://gitcode.com/gh_mirrors/nc/ncbi-genome-download 作为生物信息学研究人员…...

Keil5库文件打包避坑指南:为什么你的Lib文件宏定义无法修改?

Keil5库文件打包避坑指南:为什么你的Lib文件宏定义无法修改? 当你花费数小时将精心编写的代码打包成Keil5库文件(.lib),却发现头文件中的宏定义修改完全无效时,那种挫败感每个嵌入式开发者都深有体会。这看…...

猫抓浏览器扩展完整教程:网页媒体资源嗅探与下载终极指南

猫抓浏览器扩展完整教程:网页媒体资源嗅探与下载终极指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在当今数字化内容消费时代&am…...

2026奇点智能技术大会核心洞察(AGI驱动的产品设计黄金三角模型首次公开)

第一章:2026奇点智能技术大会:AGI与产品设计 2026奇点智能技术大会(https://ml-summit.org) AGI驱动的产品范式迁移 传统产品设计依赖用户调研、A/B测试与迭代优化,而AGI系统正推动设计流程向“意图-生成-验证-演进”闭环跃迁。在大会现场演…...

AppImageLauncher深度解析:Linux桌面应用智能集成解决方案

AppImageLauncher深度解析:Linux桌面应用智能集成解决方案 【免费下载链接】AppImageLauncher Helper application for Linux distributions serving as a kind of "entry point" for running and integrating AppImages 项目地址: https://gitcode.com…...

从逆向工程到质量控制:手把手教你用GOM Inspect Pro 2018处理ATOS扫描数据

从逆向工程到质量控制:GOM Inspect Pro 2018实战指南 在工业4.0时代,产品研发与质量控制的边界正在被数字技术重新定义。想象一下这样的场景:一款新型涡轮叶片的设计原型刚刚完成光学扫描,数以百万计的点云数据亟待转化为可量化的…...

从Scratch一级到四级:手把手带你拆解官方考纲,规划孩子的图形化编程进阶之路

从Scratch一级到四级:构建孩子的图形化编程能力成长地图 当孩子第一次拖动彩色积木块让小猫在屏幕上移动时,他们眼中闪烁的光芒往往预示着一段奇妙旅程的开始。作为教育工作者或家长,我们面临的挑战是如何将这种初始的好奇心转化为系统的编程…...

告别ArcGIS!用Python+ANUSPLIN搞定全国气象数据插值(附完整脚本)

用PythonANUSPLIN实现气象数据高效插值的工程实践 气象数据插值一直是地理信息科学和气象学研究中的关键环节。传统工作流程往往依赖ArcGIS等商业软件进行数据预处理,不仅操作繁琐,还难以实现批量化处理。本文将介绍如何通过Python脚本与ANUSPLIN结合&am…...

别再只用加减法了!Java 8 ChronoUnit 枚举类帮你搞定日期时间计算的 5 个实战场景

别再只用加减法了!Java 8 ChronoUnit 枚举类帮你搞定日期时间计算的 5 个实战场景 在Java开发中,处理日期和时间计算是每个开发者都会遇到的常见任务。从简单的天数加减到复杂的业务场景如工作日计算、季度末日期确定等,传统的日期处理方法往…...

不止于通信:用HC32的UART和Timer1玩转自定义数据帧与轻量级协议解析

超越基础通信:HC32自定义数据帧与轻量级协议实战指南 在嵌入式开发领域,UART通信就像空气一样无处不在却又容易被忽视。大多数教程止步于"如何收发字节",但真正的工程挑战始于如何让这些字节变得有意义。想象一下智能家居场景&…...

专业干货:低查重AI教材写作工具,为你高效编写优质教材

撰写教材的过程,总能让我踩中各种“慢节奏”的坑。尽管资料和大纲都准备得差不多了,但在具体内容的撰写上就常常遇到瓶颈——常常在一句话上绞尽脑汁,反复修改还是觉得不够完美;而章节之间的衔接也是卡得厉害,想来想去…...

DouyinLiveWebFetcher:抖音直播弹幕数据采集技术解析与架构设计

DouyinLiveWebFetcher:抖音直播弹幕数据采集技术解析与架构设计 【免费下载链接】DouyinLiveWebFetcher 抖音直播间网页版的弹幕数据抓取(2025最新版本) 项目地址: https://gitcode.com/gh_mirrors/do/DouyinLiveWebFetcher 抖音直播网…...

免费入门指南:Unity URP卡通渲染着色器快速上手方案

免费入门指南:Unity URP卡通渲染着色器快速上手方案 【免费下载链接】UnityURPToonLitShaderExample A very simple toon lit shader example, for you to learn writing custom lit shader in Unity URP 项目地址: https://gitcode.com/gh_mirrors/un/UnityURPTo…...

低查重AI教材写作指南:AI教材生成工具实测,快速产出优质教材!

编写教材困境与 AI 工具的出现 编写教材的进度,总是能恰好踩到“慢节奏”的各种陷阱。尽管框架和资料早已准备齐全,却依旧在内容撰写的环节停滞不前。每一句话反复推敲半个小时,始终觉得表达不够准确;各章节之间的衔接&#xff0…...

2025届学术党必备的五大降重复率神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 使知网AI检测率降低之核心要点在于把文本里机械生成的特征给消除掉。给出这样的建议&#xf…...

别再死记硬背了!用一张图+三个比喻,彻底搞懂三极管三种放大电路的区别

三极管放大电路:用生活化比喻破解电子学迷宫 刚接触三极管放大电路时,很多人都会陷入公式和参数的泥沼。共射、共集、共基这三种组态就像三胞胎,看似相似却各有脾性。传统教材往往堆砌数学推导,让初学者在β值和等效电路中迷失方向…...

Zotero 7.x 保姆级配置指南:从坚果云同步到Word引用,一站式搞定科研文献管理

Zotero 7.x 科研文献管理全流程配置手册:从云端同步到论文写作 刚踏入科研领域时,最让我头疼的不是实验设计,而是海量文献的管理。直到遇见Zotero,这款开源文献管理工具彻底改变了我的工作流。但第一次打开Zotero 7.x时&#xff0…...

保姆级教程:在RK3588上部署PaddleOCR,从ONNX转换到NPU推理全流程(附避坑指南)

RK3588实战:PaddleOCR模型从训练到NPU推理的全链路避坑指南 当OCR技术遇上边缘计算设备,RK3588凭借其6TOPS算力的NPU成为绝佳载体。但将PaddleOCR这样的复杂模型部署到嵌入式平台,就像在迷宫中寻找出口——每个转角都可能遇到版本兼容性、工具…...

别只扫二维码!用Gnuplot把坐标点画成图的完整避坑指南(附Python预处理脚本)

从坐标点到二维码:Gnuplot数据可视化实战指南 1. 数据可视化中的坐标处理挑战 在数据分析和技术探索过程中,我们常常会遇到需要将原始坐标数据转化为可视化图形的场景。不同于常见的图表绘制工具,专业绘图软件Gnuplot提供了更精细的控制能力&…...

Jetson Orin Nano无头模式实战:用XRDP远程桌面告别显示器(Ubuntu 22.04 + GNOME)

Jetson Orin Nano无头模式实战:XRDP远程桌面全流程配置指南 当你把Jetson Orin Nano塞进机器人底盘或者嵌入到某个工业设备中时,物理显示器往往成了最不实用的配件。但调试时盯着SSH黑窗口操作图形界面?这就像用螺丝刀吃牛排——不是不行&…...

AGI已越过“认知奇点”?2026奇点大会闭门报告首度公开:37项实测指标证实虚拟世界正进入自主演化阶段

第一章:2026奇点智能技术大会:AGI与虚拟世界 2026奇点智能技术大会(https://ml-summit.org) AGI架构演进的核心突破 本届大会首次公开展示了基于神经符号混合推理(Neuro-Symbolic Hybrid Reasoning)的AGI原型系统“Orion-7”&am…...

Explorer.exe进程占用100%导致Win10黑屏?深度解析注册表启动项与系统优化软件的冲突

Windows 10黑屏故障深度解析:从Explorer进程崩溃到系统启动项修复 上周帮朋友处理一台突然黑屏的Win10笔记本时,发现任务管理器里explorer.exe进程CPU占用率长期100%,重启后直接进入黑屏状态。这种看似简单的故障背后,其实是Wind…...

从一道笔试题看Java内存模型:String s = new String(“abc“) 到底创建了几个对象?

从一道笔试题看Java内存模型:String s new String("abc") 到底创建了几个对象? 在Java开发者的技术面试中,关于字符串对象创建的问题几乎成了必考题。这道看似简单的题目背后,隐藏着Java内存模型(JMM&#…...

烽火HG5143D光猫折腾实录:用Fiddler抓包+U盘拷贝,一步步拿到超级密码

烽火HG5143D光猫深度探索:从抓包分析到权限获取实战指南 家里新装的烽火HG5143D光猫限制太多?想实现桥接模式却找不到入口?作为一名长期折腾家庭网络的技术爱好者,我最近就遇到了这个棘手问题。电信提供的这款光猫默认屏蔽了许多高…...

告别拍脑袋:用攻击树和STRIDE模型为你的车联网服务做一次安全体检(含R155自查清单)

车联网安全实战:基于攻击树与STRIDE的威胁建模与合规自查指南 当你的车钥匙变成手机App,当远程启动成为标配功能,车联网服务在带来便利的同时,也打开了潘多拉魔盒。去年某豪华品牌被曝出通过蓝牙协议漏洞可无钥匙开走车辆&#x…...

PHP = 分配文件描述符 (FD)?

PHP 是“申请者”,操作系统内核才是“分配者”。** PHP 无法直接创建或分配文件描述符 (FD)。它只能通过调用标准库函数(如 fopen, curl_init, socket_create),向操作系统发起系统调用 (System Call),请求内核分配一个…...