当前位置: 首页 > article >正文

解码生命语言:深度学习模型TranslationAI揭示RNA翻译新规则

RNA翻译是基因表达的核心环节,其精确调控依赖于翻译起始位点(TIS)和终止位点(TTS)的准确识别。传统方法依赖于简单的经验规则(如Kozak序列或最长开放阅读框ORF),但忽略了RNA结构、顺式调控元件等复杂因素,导致预测准确性有限。近年来,深度学习技术在生物学领域的应用为解决此类复杂问题提供了新思路。近日,《Nucleic Acids Research》发表了一项突破性研究——TranslationAI,一个基于深度学习的模型,能够直接从全长度mRNA序列预测翻译起始位点(TIS)和终止位点(TTS),并揭示了翻译调控的新规律!

 

图示摘要

TranslationAI的架构与训练

TranslationAI基于深度残差卷积神经网络构建,采用独热编码表示mRNA序列作为输入(图1A)。模型包含32层扩张卷积结构,能够处理长达2000 nt的侧翼序列,输出每个位置作为TIS、TTS或非翻译位点(NS)的概率(图1A,补充图S1)。训练数据集来自RefSeq注释的47,098个人类蛋白质编码转录本,其中70%用于训练,30%用于测试。模型通过优化分类交叉熵损失函数,结合Adam优化器进行训练,最终在测试集上实现了>99%的精确召回曲线下面积(PR-AUC)(图1B)。

 

图1:用于翻译预测的深度学习网络构建

模型性能与特征分析

TranslationAI在预测经典TIS/TTS时表现出色,其准确性随输入窗口增大而显著提升(图1B)。值得注意的是,长序列上下文(如2k nt)对预测至关重要,尤其是对于长转录本(图1C)。模型通过系统扰动实验揭示了其学习的关键特征:

  • 密码子身份:替换经典起始或终止密码子会显著降低预测分数(图1F)。

  • UTR序列:5'-UTR的扰动对TIS预测影响显著,而3'-UTR的扰动对TTS预测影响较小(图1G)。

  • 密码子偏好:高密码子适应指数(CAI)的 synonymous 突变提升预测分数,反之则降低(图1I)。

  • 三联体规则:单或双核苷酸缺失破坏阅读框,显著影响预测,而三核苷酸缺失影响较小(图1H)。

 

翻译终止的新调控机制

TranslationAI揭示了密码子使用在翻译终止中的重要作用。强终止位点上游倾向于富含C/G的密码子,且第三位碱基的C/G偏好尤为显著(图2D)。这种密码子偏好可能与进化选择有关,暗示着密码子使用在翻译终止中的未被充分认识的作用(图2D)。实验验证显示,在终止密码子上游引入C/G富集的 synonymous 突变可减少翻译通读,而A/U富集的突变则增加通读(图2F)。此外,核糖体分析数据支持弱TTS位点后存在更高的翻译泄漏(图2G)。

 

图2:TranslationAI预测特征的评估

非经典ORF的发现

TranslationAI成功预测了人类转录组中大量非经典ORF,包括上游ORF(uORF)、下游ORF(dORF)及lncRNA中的新ORF(图3A)。例如,模型在lncRNA中鉴定了3,794个潜在可翻译ORF,其中部分通过核糖体分析(Ribo-seq)和质谱(MS)验证(图3F, 3G)。值得注意的是,模型对经典TIS/TTS的预测准确性高于非经典位点(图3C),可能源于训练数据的偏差。

 

图3:人类转录组中非经典开放阅读框的鉴定

跨物种与病毒的适用性

TranslationAI在多种真核生物(如小鼠、斑马鱼、果蝇等)中表现出高预测准确性(图4A),且优于现有工具(如TITER和TIS-predictor)。此外,模型对依赖宿主翻译机制的病毒(如埃博拉病毒)的ORF预测效果良好(图4B),但对SARS-CoV-2等复杂基因组的预测准确性较低(图4C),可能与多顺反子结构有关。

 

图4:TranslationAI精确预测真核生物、原核生物和病毒翻译起始与终止位点

讨论与展望

TranslationAI通过深度学习框架揭示了RNA翻译的复杂调控规则,其成功依赖于对全长mRNA序列的全局分析。模型的局限性包括对非经典起始密码子(如非AUG)的预测不足,以及对组织特异性翻译调控的有限覆盖。未来可通过整合更多实验数据(如多组织Ribo-seq)进一步优化模型。

总之,TranslationAI不仅为翻译调控研究提供了高效工具,还通过其预测结果拓展了对翻译机制的理解,为基因注释和疾病相关变异研究开辟了新途径。

关注我们,获取更多前沿生物信息学研究成果!有什么想法可以在评论区评论,也可以私信获取原文PDF哦!

 

相关文章:

解码生命语言:深度学习模型TranslationAI揭示RNA翻译新规则

RNA翻译是基因表达的核心环节,其精确调控依赖于翻译起始位点(TIS)和终止位点(TTS)的准确识别。传统方法依赖于简单的经验规则(如Kozak序列或最长开放阅读框ORF),但忽略了RNA结构、顺…...

重磅发布!OpenAI 推出最新模型 GPT-4.1 系列!

今日凌晨,OpenAI宣布开放全新模型GPT-4.1,并于即日起在ChatGPT中投入使用。 超长上下文与卓越编码能力 GPT-4.1作为OpenAI的最新模型,支持长达100万tokens的上下文,是OpenAI首次发布的长窗口模型。相较于前代,GPT-4.1…...

配置别名路径 @

CRA本身把webpack配置包装到了黑盒里无法直接修改,需要借助一个插件 - craco 1. 路径解析配置(Webpack)-- craco 插件 把 / 解析为 src/ 配置步骤: 1.安装 craco npm i -D craco/craco 2. 项目根目录下创建配置文件 craco.co…...

给视频加一个动画。

为什么要给视频加一个动画? 很完整的视频也就是从短动画开始的。遮盖住LOG用。 C:\Users\Sam\Desktop\desktop\startup\workpython\ocr Lottie.py import subprocessdef run_ffmpeg(cmd):print("Running:", " ".join(cmd))subprocess.run(cm…...

sqli-labs靶场第七关——文件导出注入

一:目标 通过sql注入将php代码写入网站目录,通过这个php文件执行命令 二:确认前置条件 %secure_file_priv% 首先我们需要Mysql是否允许导出文件 先尝试在网页中sql注入,检查导出权限 ?id1)) union select 1,secure_file_pr…...

uniapp 弹窗封装(上、下、左、右、中五个方位)

无脑复制即可&#xff01;&#xff01;&#xff01; <template><view><viewv-if"mask"class"tui-drawer-mask":class"{ tui-drawer-mask_show: visible }":style"{ zIndex: maskZIndex }"tap"handleMaskClick&qu…...

解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-docker MCP解析

解密企业级大模型智能体Agentic AI 关键技术&#xff1a;MCP、A2A、Reasoning LLMs-docker MCP解析 这里面有很重要的原因其中一个很其中一个原因是因为如果你使用docker的方式&#xff0c;你可以在虚拟环境下就类似于这个沙箱的这个机制可以进行隔离。这对于安全&#xff0c;…...

Modern C++(一)基本概念

1、基本概念 1.1、注释 注释在翻译阶段3会被替换为单个空白字符从程序中移除 1.2、名字与标识符 标识符是一个由数字、下划线、大小写字符组成的任意长度序列。有效的标识符首个字符必须是以A-Z、a-z、下划线开头&#xff0c;。有效的标识符其他字符可以是0-9、A-Z、a-z、下…...

OpenCV图像旋转原理及示例

OpenCV计算机视觉开发实践&#xff1a;基于Qt C - 商品搜索 - 京东 图像旋转是数字图像处理的一个非常重要的环节&#xff0c;是图像的几何变换手法之一。图像旋转算法是图像处理的基础算法。在数字图像处理过程中&#xff0c;经常要用到旋转&#xff0c;例如在进行图像扫描时…...

LLM Text2SQL NL2SQL 实战总结

目录 尽量全面的描述表的功能 尽量全面的描述字段的功能 适当放弃意义等价的字段 放弃业务上无用的字段 对于LLM来说,由于它没有什么行业经验,所以我们需要尽可能的给予它恰当的“背景信息”,才能使它更好的工作。所谓恰当,不是越多越好,因为太多的信息会消耗掉LLM的可…...

k8s 中使用 Service 访问时NetworkPolicy不生效问题排查

背景 针对一个服务如下NetworkPolicy, 表示只有n9e命名空间的POD才能访问 k8s-man 服务 kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata:name: k8s-mannamespace: n9elabels:app: k8s-manversion: v1 spec:podSelector:matchLabels:app: k8s-manversion: v1…...

【实战篇】数字化打印——打印部署管理接口开发

前言 前面的章节已经介绍了打印管理模块的主要界面设计&#xff0c;本篇介绍用myBuilder开发界面接口&#xff0c;实现最终的功能。 1. 配置打印应用菜单 首先配置挂载好模块菜单 让菜单点击能访问到对应的页面 2. 打印部署管理数据表详细设计 以下是打印部署管理的数据表字…...

MacOS Python3安装

python一般在Mac上会自带&#xff0c;但是大多都是python2。 python2和python3并不存在上下版本兼容的情况&#xff0c;所以python2和python3可以同时安装在一台设备上&#xff0c;并且python3的一些语法和python2并不互通。 所以在Mac电脑上即使有自带python&#xff0c;想要使…...

磁盘I/O瓶颈排查:面试通关“三部曲”心法

想象一下&#xff0c;你就是线上系统的“交通调度总指挥”&#xff0c;服务器的磁盘是所有数据进出的“核心枢纽港口”。当这个“港口”突然拥堵不堪&#xff0c;卡车&#xff08;数据请求&#xff09;排起长龙&#xff0c;进不去也出不来&#xff0c;整个系统的“物流”&#…...

idea启动报错:java: 警告: 源发行版 11 需要目标发行版 11(亲测解决)

引起原因 idea的jdk没有替换干净 1.配置project file–Project Structrue–Project 2.配置Modules-Sources file–Project Structrue–Modules-Sources 改为jdk11 3.配置Modules-Dependencies file–Project Structrue–Modules-Dependencies...

树莓派4 yolo 11l.pt性能优化后的版本

树莓派4 使用 Picamera2 拍摄图像&#xff0c;然后通过 YOLO11l.pt 进行目标检测&#xff0c;并在实时视频流中显示结果。但当前的代码在运行时可能会比较卡顿&#xff0c;主要原因包括&#xff1a; picam2.capture_array() 是一个较慢的操作&#xff1b;YOLO 推理可能耗时较长…...

鸿蒙OSUniApp开发支持多语言的国际化组件#三方框架 #Uniapp

使用UniApp开发支持多语言的国际化组件 在全球化的今天&#xff0c;一个优秀的应用往往需要支持多种语言以满足不同地区用户的需求。本文将详细讲解如何在UniApp框架中实现一套完整的国际化解决方案&#xff0c;从而轻松实现多语言切换功能。 前言 去年接手了一个面向国际市场…...

国产数据库工具突围:SQLynx如何解决Navicat的三大痛点?深度体验报告

引言&#xff1a;Navicat的"中国困境" 当开发者面对达梦数据库的存储过程调试&#xff0c;或是在人大金仓中处理复杂查询时&#xff0c;Navicat突然变得力不从心——这不是个例。 真实痛点&#xff1a;某政务系统迁移至OceanBase后&#xff0c;开发团队发现Navicat无…...

《Adversarial Sticker: A Stealthy Attack Method in the Physical World》论文分享(侵删)

原文链接&#xff1a;Adversarial Sticker: A Stealthy Attack Method in the Physical World | IEEE Journals & Magazine | IEEE Xplore author{Xingxing Wei and Ying Guo and Jie Yu} 摘要 为了评估深度学习在物理世界中的脆弱性&#xff0c;最近的工作引入了对抗补丁…...

Python生成器:高效处理大数据的秘密武器

生成器概述 生成器是 Python 中的一种特殊迭代器&#xff0c;通过普通函数的语法实现&#xff0c;但使用 yield 语句返回数据。生成器自动实现了 __iter__() 和 __next__() 方法&#xff0c;因此可以直接用于迭代。生成器的核心特点是延迟计算&#xff08;lazy evaluation&…...

React Native/Flutter 原生模块开发

以下是关于 React Native 和 Flutter 原生模块开发的基本知识点总结: 一、核心概念对比 维度React NativeFlutter架构基础JavaScriptCore/Hermes + Bridge/TurboModulesDart VM + Skia引擎原生交互方式Native Modules + Native UI ComponentsPlatform Channels + Platform Vie…...

嵌入式STM32学习——继电器

继电器模块引脚说明 VCC&#xff08;&#xff09;&#xff1a; 供电正极。连接此引脚到电源&#xff08;通常是直流电源&#xff09;&#xff0c;以提供继电器线圈所需的电流。 GND&#xff08;-&#xff09;&#xff1a; 地。连接此引脚到电源的负极或地。 IN&#xff08;或…...

从基础到实习项目:C++后端开发学习指南

在当今技术快速迭代的背景下&#xff0c;后端开发作为软件工程的核心支柱持续发挥着关键作用。C凭借其卓越的性能表现和系统级控制能力&#xff0c;依然是构建高性能后端服务的首选语言之一。本文将系统性地解析现代C后端开发的核心技术体系&#xff0c;包括从语言特性精要到架…...

AI软件汇总与功能解析:赋能未来的智能工具库

人工智能&#xff08;AI&#xff09;技术的快速发展催生了大量功能强大的软件工具&#xff0c;覆盖自然语言处理、计算机视觉、数据分析、自动化决策等多个领域。本文将汇总当前主流的AI软件&#xff0c;并解析其核心功能与应用场景&#xff0c;为企业和开发者提供参考指南。 一…...

Xinference推理框架

概述 GitHub&#xff0c;官方文档。 核心优势 性能优化&#xff1a;通过vLLM、SGLang等引擎实现低延迟推理&#xff0c;吞吐量提升2-3倍&#xff1b;企业级支持&#xff1a;支持分布式部署、国产硬件适配及模型全生命周期管理&#xff1b;生态兼容&#xff1a;无缝对接LangC…...

前端ECS简介

ECS概念 ECS是一种软件架构模式&#xff0c;常见于游戏业务场景&#xff0c;其主要对象分类为 • Entity 实体,ECS架构中所有的业务对象都必须拥有一个唯一的Entity实体 • Component 组件,存储着数据结构,对应着某一种业务属性,一个Entity上可以动态挂载多个Component • …...

ET ProcessOuterSender类(实体) 分析

ProcessOuterSender 夸进程发送Actor消息&#xff0c;只在NetInner(Scene)使用。 字段 TIMEOUT_TIME RPC超时时间RpcId rpcIdrequestCallback 存储RPC的回调事件AService 进程之间的网络服务InnerProtocol 内部网络协议类型 目前固定KCP 方法 OnRead 方法&#xff0c;收包…...

redis中key的过期和淘汰

一、过期&#xff08;redis主动删除&#xff09; 设置了ttl过期时间的key&#xff0c;在ttl时间到的时候redis会删除过期的key。但是redis是惰性过期。惰性过期&#xff1a;redis并不会立即删除过期的key&#xff0c;而是会在获取key的时候判断key是否过期&#xff0c;如果发现…...

Dify与n8n全面对比指南:AI应用开发与工作流自动化平台选择【2025最新】

Dify与n8n全面对比指南&#xff1a;AI应用开发与工作流自动化平台选择【2025最新】 随着AI技术与自动化工具的迅速发展&#xff0c;开发者和企业面临着多种平台选择。Dify和n8n作为两个备受关注的自动化平台&#xff0c;分别专注于不同领域&#xff1a;Dify主要面向AI应用开发&…...

【深度学习之四】知识蒸馏综述提炼

知识蒸馏综述提炼 目录 知识蒸馏综述提炼 前言 参考文献 一、什么是知识蒸馏&#xff1f; 二、为什么要知识蒸馏&#xff1f; 三、一点点理论 四、知识蒸馏代码 总结 前言 知识蒸馏作为一种新兴的、通用的模型压缩和迁移学习架构&#xff0c;在最近几年展现出蓬勃的活力…...