【论文阅读】AlphaFold2阅读笔记
摘要
给一串氨基酸的序列,去预测他的结构是什么样的
蛋白质的折叠问题
alphaFold精度不够
这里可以达到原子精度的预测
CASP14 精度
- 这个是什么问题
- 是不是解决了问题
模型的结果并不重要
导论
摘要故事的详细版本
在写论文的时候,可以这样写:达到了原子精度的结果
此时就是一个里程碑式的结果,换算成一个大家可以理解的概念
PDB数据集:目前为止所有了解的蛋白质的结构
模型和训练
分为三个部分
- 特征抽取
- 编码器
- 解码器
特征抽取
- MSA 多序列比对
把人、鱼、鸡相似的蛋白质拿出来比对;同一个氨基酸在不同蛋白质的表现;去基因数据库中搜索与当前人的氨基酸序列有没有相似的序列
- 氨基酸之间的关系
氨基酸之间的关系,构建一个矩阵,每一对的项是每两个氨基酸之间的关系
得到两大特征:
- 氨基酸序列特征
- 氨基酸对之间的特征
encoder
两大特征矩阵进入evoformer
不再是序列的关系,而是二维关系
输入是两个不同的张量
编码器里有48个block,用的transformer架构
编码器的输出很好的表征了每个氨基酸的关系
一块处理的是按行的序列信息、一块处理的是按列的序列信息
自注意力
编码器中有48个块
多头自注意力、MLP
两个特征之间存在信息交互
在MSA中按行拿出一个序列,做attention;按列
用每一行,做sigmoid,去打造一个门,0/1
对偏移:每一个氨基酸对的关系,作为一个偏移加进去,再进去softmax,这样的自注意力分数可以有关系的信息
MLP模块
做信息的提炼
解码器
重构蛋白质的结构
对每个氨基酸去预测他在3D中的位置
编码器的输出和解码器的输出,回收,传回输入,再做一次精调
回收机制就相当于把模型复制了三次,但权重还是基于前面的
都是相对位置
主干网络
欧几里得变换
对蛋白质的全局结构做旋转或者位移,不会影响局部的变换
进入IPA的模块,氨基酸的表示有了位置的信息
氨基酸对的信息、不断更新的序列信息、主干信息
经过8个IPA,每一次在结构中做不断的调整
慢慢地到我们要的氨基酸的形状
预测模块:做一个线性的投影层就可以得到输出
结论
在前人的基础上做10-20点改进
把所有的东西积累在一起,最后憋一个大招
相关文章:
【论文阅读】AlphaFold2阅读笔记
摘要 给一串氨基酸的序列,去预测他的结构是什么样的 蛋白质的折叠问题 alphaFold精度不够 这里可以达到原子精度的预测 CASP14 精度 这个是什么问题是不是解决了问题 模型的结果并不重要 导论 摘要故事的详细版本 在写论文的时候,可以这样写&a…...
机器学习基础知识之数据归一化
文章目录 归一化的原因1、最大最小归一化2、Z-score标准化3、不同方法的应用 归一化的原因 在进行机器学习训练时,通常一个数据集中包含多个不同的特征,例如在土壤重金属数据集中,每一个样本代表一个采样点,其包含的特征有经度、…...
QCC51XX---pydbg_cmd集合
目录 common pydbg_cmd headset pydbg_cmd earbud pydbg_cmd common pydbg_cmd log apps1.log_level() apps1.fw.gbl.debug_log_level__global 查看log等级apps1.fw.gbl.debug_log_level__global.value = 5 设置log等级 apps1.log()...
camx 马达的MSM_ACTUATOR_WRITE_DAC 操作
camx 马达的MSM_ACTUATOR_WRITE_DAC操作 为什么要分析 MSM_ACTUATOR_WRITE_DACmm-camera MSM_ACTUATOR_WRITE_DACcamx MSM_ACTUATOR_WRITE_DAC总结 为什么要分析 MSM_ACTUATOR_WRITE_DAC 目前的camx源码 省略了hw_mask 的处理。 一般来说 hw_mask 是0 ,但是对于非0…...
【无人机】无人机平台的非移动 GPS 干扰器进行位置估计的多种传感器融合算法的性能分析(Matlab代码实现)
💥 💥 💞 💞 欢迎来到本博客 ❤️ ❤️ 💥 💥 🏆 博主优势: 🌞 🌞 🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 …...
一篇文章搞定《RecyclerView缓存复用机制》
------《RecyclerView缓存复用机制》 前言零、为什么要缓存一、RecyclerView如何构建我们的列表视图二、缓存过程三、缓存结构1、mChangedScrap/mAttachedScrap2、mCachedViews3、mViewCacheExtension4、mRecyclerPool 四、总结 前言 本篇文章,暂时不加入预加载进行…...
Elasticsearch概述
1.Elasticsearch干啥的? Elasticsearch 是一个开源的分布式搜索和分析引擎,用于实时搜索、分析和存储大规模数据。它可以帮助用户在海量数据中快速进行全文搜索、聚合分析、地理空间分析等操作,并支持水平扩展以应对高并发访问需求。 Elasti…...
停车场收费系统
1.系统的开发工具 1.1 AppServe集成应用 Mysql:MySQL 是一款安全、跨平台、高效的,并与 PHP、Java 等主流编程语言紧密结合的数据库系统。该数据库系统是由瑞典的 MySQL AB 公司开发、发布并支持,由 MySQL 的初始开发人员 David Axmark 和 Mi…...
nodejs+vue+elementui学生毕业生离校系统
学生毕业离校系统的开发过程中。该学生毕业离校系统包括管理员、学生和教师。其主要功能包括管理员:首页、个人中心、学生管理、教师管理、离校信息管理、费用结算管理、论文审核管理、管理员管理、留言板管理、系统管理等,前台首页;首页、离…...
儿童用灯哪个品牌好?推荐专业的儿童护眼台灯
一款好的儿童台灯,主要是从5个方面决定,照度及均匀度,蓝光,色温,显指,频闪 ① 照度及均匀度最高是国AA级,其次就是国A级 ② 蓝光一定要选择RG0无危险级,蓝光能量最强,…...
探究Android插件化开发的新思路——Shadow插件化框架
Shadow插件化框架是什么? Shadow是一种Android App的插件化框架,它利用类似于ClassLoader的机制来实现应用程序中的模块化,并让这些模块可以在运行时灵活地进行加载和卸载。Shadow框架主张将一个大型的Android App拆分成多个小模块ÿ…...
SimpleDateFormat和DateTimeFormatter的区别及使用详解
目录 1.简介2.区别3.SimpleDateFormat3.1 字符串转日期3.2 日期转字符串 4.DateTimeFormatter4.1 字符串转日期4.2 日期转字符串 扩展 1.简介 DateTimeFormatter 和 SimpleDateFormat 都是用于格式化日期和时间的类,但是它们有一些区别。 SimpleDateFormat 是 Jav…...
边缘人工智能——nanodet模型实践指引,从标注数据集到实现部署文件
内容概述 首先获得一个合适的nanodet模型版本,配置nanodet适用的环境,然后对网上公开的生数据集进行重新标注,配置nanodet并进行训练,.pth到.onnx的模型转化及简化,编写推理文件。 文章着重于实践方向指引,…...
SASS的用法指南
一、什么是SASS SASS是一种CSS的开发工具,提供了许多便利的写法,大大节省了设计者的时间,使得CSS的开发,变得简单和可维护。 本文总结了SASS的主要用法。我的目标是,有了这篇文章,日常的一般使用就不需要去…...
MCSM面板一键搭建我的世界服务器-外网远程联机【内网穿透】
文章目录 前言1.Mcsmanager安装2.创建Minecraft服务器3.本地测试联机4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射内网端口 5.远程联机测试6. 配置固定远程联机端口地址6.1 保留一个固定TCP地址6.2 配置固定TCP地址 7. 使用固定公网地址远程联机 转载自远程穿透文章&…...
( 数组和矩阵) 565. 数组嵌套 ——【Leetcode每日一题】
❓565. 数组嵌套 难度:中等 索引从 0 开始长度为N的数组 A,包含 0 到 N - 1 的所有整数。找到最大的集合 S并返回其大小,其中 S[i] {A[i], A[A[i]], A[A[A[i]]], ... } 且遵守以下的规则。 假设选择索引为 i 的元素 A[i] 为 S 的第一个元…...
linux内核网络子系统初探---概述
linux内核网络子系统初探—概述 一、网络模型 简单介绍 学习网络时,必定能在各种教材资料里见到以下三种网络模型: 三种模型间的差异: OSI七层模型是理论上的网络模型,从功能方面分成了相对独立的7个层次,由于太复…...
java版工程项目管理系统源代码-功能清单 图文解析
Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表 项目进度图表:选择(总体或单个)项目显示…...
【chapter30】【PyTorch】[动量与学习率衰减】
前言: SGD的不足: ①呈“之”字型,迂回前进,损失函数值在一些维度的改变得快(更新速度快),在一些维度改变得慢(速度慢)- 在高维空间更加普遍 ②容易陷入局部极小值和鞍点…...
【键入网址到网页显示】
文章目录 HTTPDNS五层协议TCPIPMAC网卡(物理层)交换机路由器 HTTP 对 URL 进行解析之后,浏览器确定了 Web 服务器和文件名,接下来就是根据这些信息来生成 HTTP 请求消息了。 http://www.server.com/dir1/file1.html http:访问数…...
【UE6.5 C++27 调试终极指南】:20年引擎老兵亲授GDB/LLDB/Visual Studio三端协同调试黄金流程
第一章:UE6.5 C27 调试体系演进与核心挑战Unreal Engine 6.5 正式引入对 ISO/IEC 14882:2027(C27)标准的实验性支持,并重构了底层调试基础设施,以应对现代C语言特性带来的可观测性断层。传统基于符号表与行号映射的调试…...
我用AI替换了高级工程师,结果...
周二下午 2:47,我们的 CFO 在 Slack 上发了一条消息。 “你团队的年薪是 120 万美元。我们能谈谈优化吗?” 我知道要发生什么了。我们刚刚完成了 A 轮融资。风投想要"运营效率"。翻译:削减成本、更快交付、展示增长。 我们的高级…...
华硕笔记本性能控制终极方案:G-Helper完全指南
华硕笔记本性能控制终极方案:G-Helper完全指南 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, and…...
AGI 主要技术路径及核心技术:归一融合及未来之路6
七、其他新兴路径(一)因果表示学习核心理念:智能的核心是理解世界的因果机制,而非仅仅识别统计关联。该路径旨在让AI模型学会像人类一样,构建因果关系图,进行反事实推理(思考“如果当时…会怎样…...
数据分析中的异常值处理:MAD
在数据处理(尤其是金融、生物统计、信号处理等)中,极值(异常值) 会严重影响均值、方差、相关系数等统计量的估计,并扭曲模型训练。MAD法(Median Absolute Deviation,绝对中位差法&am…...
前端日常快速开发必备工具库
一、通用工具库(任何项目都能用) lodash 最常用 JS 工具库:防抖、节流、深拷贝、数组/对象处理、判空等。dayjs 轻量时间格式化,替代 moment,体积小、API 一样。axios 请求封装、拦截器、取消请求、统一错误处理。qs 对…...
Druid监控页面登录失败?你可能踩了这个Request Body的坑
Druid监控登录异常排查:Request Body解析的隐蔽陷阱 最近在调试Druid监控面板时遇到一个诡异现象——明明配置了正确的用户名密码,却始终无法登录。控制台没有报错,前端参数也正常发送,但后端就是接收不到登录凭证。这种"看似…...
OpenClaw技能组合技:用SecGPT-14B实现ATTCK框架检测
OpenClaw技能组合技:用SecGPT-14B实现ATT&CK框架检测 1. 为什么需要自动化安全检测 去年处理某次安全事件时,我花了整整三天手工比对日志中的异常行为与ATT&CK框架。这种重复劳动让我开始思考:能否让AI自动完成TTPs(战术…...
用快马平台5分钟打造heic转jpg在线工具原型,零代码实现图片格式转换
最近工作中遇到一个需求:需要把手机拍摄的HEIC格式照片批量转换成JPG格式。这种格式转换的需求其实很常见,特别是现在iPhone默认都使用HEIC格式保存照片。作为一个前端开发者,我决定用InsCode(快马)平台快速实现一个在线转换工具的原型。 需求…...
【深度解析】二维半导体晶体管:突破摩尔定律的下一代集成电路核心
1. 二维半导体晶体管的崛起:摩尔定律的终结者? 当硅基芯片的制程工艺逼近1纳米物理极限时,整个集成电路行业都在寻找"后硅时代"的突破口。我第一次在实验室见到二硫化钼(MoS2)晶体管时,那片厚度不…...
