当前位置: 首页 > news >正文

【论文阅读】AlphaFold2阅读笔记

摘要

给一串氨基酸的序列,去预测他的结构是什么样的

蛋白质的折叠问题

alphaFold精度不够

这里可以达到原子精度的预测

CASP14 精度

  • 这个是什么问题
  • 是不是解决了问题

模型的结果并不重要

导论

摘要故事的详细版本

在写论文的时候,可以这样写:达到了原子精度的结果

此时就是一个里程碑式的结果,换算成一个大家可以理解的概念

PDB数据集:目前为止所有了解的蛋白质的结构

模型和训练

分为三个部分

  • 特征抽取
  • 编码器
  • 解码器

特征抽取

  • MSA 多序列比对

把人、鱼、鸡相似的蛋白质拿出来比对;同一个氨基酸在不同蛋白质的表现;去基因数据库中搜索与当前人的氨基酸序列有没有相似的序列

  • 氨基酸之间的关系

氨基酸之间的关系,构建一个矩阵,每一对的项是每两个氨基酸之间的关系

得到两大特征:

  • 氨基酸序列特征
  • 氨基酸对之间的特征

encoder

两大特征矩阵进入evoformer

不再是序列的关系,而是二维关系

输入是两个不同的张量

编码器里有48个block,用的transformer架构

编码器的输出很好的表征了每个氨基酸的关系

一块处理的是按行的序列信息、一块处理的是按列的序列信息


自注意力

编码器中有48个块

多头自注意力、MLP

两个特征之间存在信息交互

在MSA中按行拿出一个序列,做attention;按列

用每一行,做sigmoid,去打造一个门,0/1

对偏移:每一个氨基酸对的关系,作为一个偏移加进去,再进去softmax,这样的自注意力分数可以有关系的信息

MLP模块

做信息的提炼

解码器

重构蛋白质的结构

对每个氨基酸去预测他在3D中的位置

编码器的输出和解码器的输出,回收,传回输入,再做一次精调

回收机制就相当于把模型复制了三次,但权重还是基于前面的


都是相对位置

主干网络

欧几里得变换

对蛋白质的全局结构做旋转或者位移,不会影响局部的变换

进入IPA的模块,氨基酸的表示有了位置的信息

氨基酸对的信息、不断更新的序列信息、主干信息

经过8个IPA,每一次在结构中做不断的调整

慢慢地到我们要的氨基酸的形状

预测模块:做一个线性的投影层就可以得到输出

结论

在前人的基础上做10-20点改进

把所有的东西积累在一起,最后憋一个大招

相关文章:

【论文阅读】AlphaFold2阅读笔记

摘要 给一串氨基酸的序列,去预测他的结构是什么样的 蛋白质的折叠问题 alphaFold精度不够 这里可以达到原子精度的预测 CASP14 精度 这个是什么问题是不是解决了问题 模型的结果并不重要 导论 摘要故事的详细版本 在写论文的时候,可以这样写&a…...

机器学习基础知识之数据归一化

文章目录 归一化的原因1、最大最小归一化2、Z-score标准化3、不同方法的应用 归一化的原因 在进行机器学习训练时,通常一个数据集中包含多个不同的特征,例如在土壤重金属数据集中,每一个样本代表一个采样点,其包含的特征有经度、…...

QCC51XX---pydbg_cmd集合

目录 common pydbg_cmd headset pydbg_cmd earbud pydbg_cmd common pydbg_cmd log apps1.log_level() apps1.fw.gbl.debug_log_level__global 查看log等级apps1.fw.gbl.debug_log_level__global.value = 5 设置log等级 apps1.log()...

camx 马达的MSM_ACTUATOR_WRITE_DAC 操作

camx 马达的MSM_ACTUATOR_WRITE_DAC操作 为什么要分析 MSM_ACTUATOR_WRITE_DACmm-camera MSM_ACTUATOR_WRITE_DACcamx MSM_ACTUATOR_WRITE_DAC总结 为什么要分析 MSM_ACTUATOR_WRITE_DAC 目前的camx源码 省略了hw_mask 的处理。 一般来说 hw_mask 是0 ,但是对于非0…...

【无人机】无人机平台的非移动 GPS 干扰器进行位置估计的多种传感器融合算法的性能分析(Matlab代码实现)

💥 💥 💞 💞 欢迎来到本博客 ❤️ ❤️ 💥 💥 🏆 博主优势: 🌞 🌞 🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 …...

一篇文章搞定《RecyclerView缓存复用机制》

------《RecyclerView缓存复用机制》 前言零、为什么要缓存一、RecyclerView如何构建我们的列表视图二、缓存过程三、缓存结构1、mChangedScrap/mAttachedScrap2、mCachedViews3、mViewCacheExtension4、mRecyclerPool 四、总结 前言 本篇文章,暂时不加入预加载进行…...

Elasticsearch概述

1.Elasticsearch干啥的? Elasticsearch 是一个开源的分布式搜索和分析引擎,用于实时搜索、分析和存储大规模数据。它可以帮助用户在海量数据中快速进行全文搜索、聚合分析、地理空间分析等操作,并支持水平扩展以应对高并发访问需求。 Elasti…...

停车场收费系统

1.系统的开发工具 1.1 AppServe集成应用 Mysql:MySQL 是一款安全、跨平台、高效的,并与 PHP、Java 等主流编程语言紧密结合的数据库系统。该数据库系统是由瑞典的 MySQL AB 公司开发、发布并支持,由 MySQL 的初始开发人员 David Axmark 和 Mi…...

nodejs+vue+elementui学生毕业生离校系统

学生毕业离校系统的开发过程中。该学生毕业离校系统包括管理员、学生和教师。其主要功能包括管理员:首页、个人中心、学生管理、教师管理、离校信息管理、费用结算管理、论文审核管理、管理员管理、留言板管理、系统管理等,前台首页;首页、离…...

儿童用灯哪个品牌好?推荐专业的儿童护眼台灯

一款好的儿童台灯,主要是从5个方面决定,照度及均匀度,蓝光,色温,显指,频闪 ① 照度及均匀度最高是国AA级,其次就是国A级 ② 蓝光一定要选择RG0无危险级,蓝光能量最强,…...

探究Android插件化开发的新思路——Shadow插件化框架

Shadow插件化框架是什么? Shadow是一种Android App的插件化框架,它利用类似于ClassLoader的机制来实现应用程序中的模块化,并让这些模块可以在运行时灵活地进行加载和卸载。Shadow框架主张将一个大型的Android App拆分成多个小模块&#xff…...

SimpleDateFormat和DateTimeFormatter的区别及使用详解

目录 1.简介2.区别3.SimpleDateFormat3.1 字符串转日期3.2 日期转字符串 4.DateTimeFormatter4.1 字符串转日期4.2 日期转字符串 扩展 1.简介 DateTimeFormatter 和 SimpleDateFormat 都是用于格式化日期和时间的类,但是它们有一些区别。 SimpleDateFormat 是 Jav…...

边缘人工智能——nanodet模型实践指引,从标注数据集到实现部署文件

内容概述 首先获得一个合适的nanodet模型版本,配置nanodet适用的环境,然后对网上公开的生数据集进行重新标注,配置nanodet并进行训练,.pth到.onnx的模型转化及简化,编写推理文件。 文章着重于实践方向指引,…...

SASS的用法指南

一、什么是SASS SASS是一种CSS的开发工具,提供了许多便利的写法,大大节省了设计者的时间,使得CSS的开发,变得简单和可维护。 本文总结了SASS的主要用法。我的目标是,有了这篇文章,日常的一般使用就不需要去…...

MCSM面板一键搭建我的世界服务器-外网远程联机【内网穿透】

文章目录 前言1.Mcsmanager安装2.创建Minecraft服务器3.本地测试联机4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射内网端口 5.远程联机测试6. 配置固定远程联机端口地址6.1 保留一个固定TCP地址6.2 配置固定TCP地址 7. 使用固定公网地址远程联机 转载自远程穿透文章&…...

( 数组和矩阵) 565. 数组嵌套 ——【Leetcode每日一题】

❓565. 数组嵌套 难度:中等 索引从 0 开始长度为N的数组 A,包含 0 到 N - 1 的所有整数。找到最大的集合 S并返回其大小,其中 S[i] {A[i], A[A[i]], A[A[A[i]]], ... } 且遵守以下的规则。 假设选择索引为 i 的元素 A[i] 为 S 的第一个元…...

linux内核网络子系统初探---概述

linux内核网络子系统初探—概述 一、网络模型 简单介绍 学习网络时,必定能在各种教材资料里见到以下三种网络模型: 三种模型间的差异: OSI七层模型是理论上的网络模型,从功能方面分成了相对独立的7个层次,由于太复…...

java版工程项目管理系统源代码-功能清单 图文解析

Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表 项目进度图表:选择(总体或单个)项目显示…...

【chapter30】【PyTorch】[动量与学习率衰减】

前言: SGD的不足: ①呈“之”字型,迂回前进,损失函数值在一些维度的改变得快(更新速度快),在一些维度改变得慢(速度慢)- 在高维空间更加普遍 ②容易陷入局部极小值和鞍点…...

【键入网址到网页显示】

文章目录 HTTPDNS五层协议TCPIPMAC网卡(物理层)交换机路由器 HTTP 对 URL 进行解析之后,浏览器确定了 Web 服务器和文件名,接下来就是根据这些信息来生成 HTTP 请求消息了。 http://www.server.com/dir1/file1.html http:访问数…...

【UE6.5 C++27 调试终极指南】:20年引擎老兵亲授GDB/LLDB/Visual Studio三端协同调试黄金流程

第一章:UE6.5 C27 调试体系演进与核心挑战Unreal Engine 6.5 正式引入对 ISO/IEC 14882:2027(C27)标准的实验性支持,并重构了底层调试基础设施,以应对现代C语言特性带来的可观测性断层。传统基于符号表与行号映射的调试…...

我用AI替换了高级工程师,结果...

周二下午 2:47,我们的 CFO 在 Slack 上发了一条消息。 “你团队的年薪是 120 万美元。我们能谈谈优化吗?” 我知道要发生什么了。我们刚刚完成了 A 轮融资。风投想要"运营效率"。翻译:削减成本、更快交付、展示增长。 我们的高级…...

华硕笔记本性能控制终极方案:G-Helper完全指南

华硕笔记本性能控制终极方案:G-Helper完全指南 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, and…...

AGI 主要技术路径及核心技术:归一融合及未来之路6

七、其他新兴路径(一)因果表示学习核心理念:智能的核心是理解世界的因果机制,而非仅仅识别统计关联。该路径旨在让AI模型学会像人类一样,构建因果关系图,进行反事实推理(思考“如果当时…会怎样…...

数据分析中的异常值处理:MAD

在数据处理(尤其是金融、生物统计、信号处理等)中,极值(异常值) 会严重影响均值、方差、相关系数等统计量的估计,并扭曲模型训练。MAD法(Median Absolute Deviation,绝对中位差法&am…...

前端日常快速开发必备工具库

一、通用工具库(任何项目都能用) lodash 最常用 JS 工具库:防抖、节流、深拷贝、数组/对象处理、判空等。dayjs 轻量时间格式化,替代 moment,体积小、API 一样。axios 请求封装、拦截器、取消请求、统一错误处理。qs 对…...

Druid监控页面登录失败?你可能踩了这个Request Body的坑

Druid监控登录异常排查:Request Body解析的隐蔽陷阱 最近在调试Druid监控面板时遇到一个诡异现象——明明配置了正确的用户名密码,却始终无法登录。控制台没有报错,前端参数也正常发送,但后端就是接收不到登录凭证。这种"看似…...

OpenClaw技能组合技:用SecGPT-14B实现ATTCK框架检测

OpenClaw技能组合技:用SecGPT-14B实现ATT&CK框架检测 1. 为什么需要自动化安全检测 去年处理某次安全事件时,我花了整整三天手工比对日志中的异常行为与ATT&CK框架。这种重复劳动让我开始思考:能否让AI自动完成TTPs(战术…...

用快马平台5分钟打造heic转jpg在线工具原型,零代码实现图片格式转换

最近工作中遇到一个需求:需要把手机拍摄的HEIC格式照片批量转换成JPG格式。这种格式转换的需求其实很常见,特别是现在iPhone默认都使用HEIC格式保存照片。作为一个前端开发者,我决定用InsCode(快马)平台快速实现一个在线转换工具的原型。 需求…...

【深度解析】二维半导体晶体管:突破摩尔定律的下一代集成电路核心

1. 二维半导体晶体管的崛起:摩尔定律的终结者? 当硅基芯片的制程工艺逼近1纳米物理极限时,整个集成电路行业都在寻找"后硅时代"的突破口。我第一次在实验室见到二硫化钼(MoS2)晶体管时,那片厚度不…...