当前位置: 首页 > news >正文

植物糖基转移酶数据库-23年-地表最强系列-文献精读-6

pUGTdb: A comprehensive database of plant UDP-dependent glycosyltransferases

pUGTdb:植物UDP依赖糖基转移酶的全面数据库

一篇关于植物糖基转移数据库的综述,地表最强,总结的最全面的版本之一,各位看官有推荐请留言评论区~

植物UDP依赖糖基转移酶(UGTs)属于碳水化合物活性酶糖基转移酶1家族(Louveau和Osbourn,2019),不仅在适应各种环境中发挥重要作用(Cai等,2020;Pastorczyk-Szlenkier和Bednarek,2021),还赋予植物天然产物极大的药用和生态学意义(Margolin等,2020)。近年来,越来越多的植物UGTs已被确定为参与许多生物活性化合物的生物合成,例如人参皂苷(Wei等,2015)、短葶黄芩素(Liu等,2018)和山桃苷(Xu等,2022)。然而,植物基因组中编码的大多数UGTs仍然待表征。我们构建了一个全面的植物UGT数据库(pUGTdb,http://pugtdb.biodesign.ac.cn/),并研究了已表征的UGTs与底物和糖供体的相互作用机制。我们还构建了一个用于未知UGT的虚拟筛选和糖供体预测的网络工具。

基因注释和数据库构建

为了从国家生物技术信息中心(NCBI)基因组数据库中获取未注释基因组中的UGTs,我们开发了一个快速注释流程,命名为GMind(图1A)(补充方法1–3)。简要地说,我们首先使用NCBI数据库中所有已注释植物UGTs作为查询进行blast,以获取植物基因组中的潜在UGTs的基因组区域;其次,我们使用多种基因注释方法独立地对提取的基因组区域进行de novo注释;第三,我们使用HMMER过滤和准确度评分对已注释的UGTs进行评估(补充方法4和5);最后,我们结合多种方法的结果,并将最佳候选人定义为UGTs。与NCBI基因组数据库中注释的UGTs相比(补充方法6),我们注释了额外的28.5%的UGTs(22.5%的完整UGTs)(补充图1)。仅有1%的NCBI注释UGTs由于极长的内含子而被GMind遗漏(补充表1;补充图2)。总共,GMind从574个未注释的植物基因组中注释了110,702个UGTs。总之,通过整合转录组注释(补充方法7)、GMind注释、NCBI基因组注释以及其他资源中已知的UGTs(包括碳水化合物活性酶数据库和糖基转移酶数据库)构建了一个全面的植物UGT数据库(pUGTdb)(图1B)。根据已发表的文献和数据库收集,pUGTdb包含285,293个UGTs,几乎是NCBI基因组数据库中UGTs数量的9倍(补充图3);然而,到目前为止,只有0.1%的UGTs(381个已表征的UGTs)已进行了功能研究(图1C;补充方法10)。

图1 植物UGT数据库的构建和分析

UGT的底物分析

基因家族分类有助于对未知UGT的功能研究。根据序列相似性和系统发育关系,所有植物UGT被分成了90个UGT家族(补充方法8和9)。约78%的植物UGT属于20个UGT家族,其中至少包含一个已功能表征的UGT(图1C)。此外,通过比较分析已表征的UGT和相应底物,我们观察到蛋白质的相似性与底物的分子相似性之间有一个有趣的正相关关系(补充图4;R2 = 0.25)。为进一步研究UGT中底物识别的潜在机制,我们通过一个快速的AlphaFold2流程对所有已表征的UGT进行了蛋白质结构的预测(补充方法11),并分析了底物及其结合口袋的结构特征(补充方法12)。我们发现催化口袋和底物之间存在着更强的正相关关系(图1D;R2 = 0.5174)。因此,我们提供了一个用于植物UGT虚拟筛选的工具,结合了底物相似性、催化口袋的体积和底物结合亲和力(补充方法12;补充图5)。为了测试我们工具的潜力,我们选择了最近报道的三个UGT作为例子(苹果酸槲皮素 4-O-葡萄糖转移酶[Xiong等,2022]、槲皮素 3-O-鼠李糖转移酶[Ren等,2022]和白藜芦醇 3-O-葡萄糖转移酶[Liu等,2021])。当使用相应物种的底物和所有UGT作为输入时,所有报告的UGT都排在前10位(补充图6)。总的来说,底物结合口袋的配置为未知UGT的底物预测和鉴定提供了可行线索,这将极大地节省实验筛选的时间和精力。

植物UGT的糖供体分析

对未知UGT的功能确定包括底物和糖供体。为了研究UGT中糖供体识别的潜在机制,我们对已表征的UGT与其糖供体进行了全面的结构分析(补充方法13;补充图10和11)。我们发现28个残基位点参与了通过氢键相互作用来结合和稳定UDP-糖的过程(补充图12)。除了与UDP相互作用的19个位点外,其余的9个位点观察到围绕着顶部、中部和底部的糖分子(图1E和1F)。在顶部区域,位于20、141和142位置的残基主要与三个六碳糖(包括UDP-葡萄糖、UDP-半乳糖和UDP-葡萄糖醛酸)中C6的羟基/羧基形成氢键。在中部,位于372–375位置的残基主要与糖分子的C2和C3位置的羟基形成氢键。374和375位置的残基与所有六种糖供体有相互作用,因为它们与糖分子的碳骨架平行。最后,从底部,353和378位置的残基维持着糖分子的骨架,并且主要与UDP-木糖、UDP-阿拉伯糖、UDP-葡萄糖、UDP-葡萄糖醛酸的C4-OH(S)的羟基形成氢键,但它们很少与UDP-半乳糖和UDP-鼠李糖的C4-OH(R)相互作用,因为羟基的上升取向。因此,我们的结果表明,这三个区域的残基起着不同的作用,稳定和识别糖供体,并且根据这些区域中氨基酸组成可以预测未知UGT的糖供体。

我们开发了一个通过整合上述关键残基位点的功能预测工具,用于UDP-糖供体的预测。简而言之,已知功能的UGT被嵌入到基于关键残基的特征向量中,并建立回归模型来拟合这些特征向量到糖供体类型(补充方法13;补充图13)。使用已知功能的UGT作为测试数据集,该工具获得了平均准确率达到89.6%。对于葡萄糖供体的准确率达到了95.5%,但对于其他糖供体的准确率仅为63.4%,这可能主要是因为只有约17%的已表征UGT参与了葡萄糖的转移。此外,我们通过设计突变体,将两个已表征的UGT(槲皮素 7-O-葡萄糖醇苷转移酶[Liu等,2018]和黄酮类化合物 7-O-葡萄糖醇苷转移酶[Ono等,2010])中的UDP-葡萄糖醛酸转化为UDP-葡萄糖供体。我们的实验验证了这些突变体显著提高了将UDP-葡萄糖醛酸作为糖供体的活性(补充图14;补充方法14–18)。最后,我们预测了我们数据库中所有未知UGT的糖供体:UDP-葡萄糖供体占94.7%,其他糖供体约占5.3%(补充表8),表明UDP-葡萄糖供体在自然界中起着主导作用。

总之,我们开发了一个UGT挖掘的基因组注释流程(GMind),并构建了一个包含285,293个植物UGT的全面植物UGT数据库(补充方法19和补充图15)。我们还研究了UGT对底物和糖供体识别的潜在机制,并开发了一个用于未知UGT的底物虚拟筛选和糖供体预测的网络工具。植物UGT的全面平台将成为社区的有用数据来源。

网址在这里
https://pugtdb.biodesign.ac.cn/    #官网

相关文章:

植物糖基转移酶数据库-23年-地表最强系列-文献精读-6

pUGTdb: A comprehensive database of plant UDP-dependent glycosyltransferases pUGTdb:植物UDP依赖糖基转移酶的全面数据库 一篇关于植物糖基转移数据库的综述,地表最强,总结的最全面的版本之一,各位看官有推荐请留言评论区~…...

虚拟机打不开

问题 另一个程序已锁定文件的一部分,进程无法访问 打不开磁盘“G:\centeros\hadoop104kl\hadoop100-cl2.vmdk”或它所依赖的某个快照磁盘。 模块“Disk”启动失败。 未能启动虚拟机。 原因 前一次非正常关闭虚拟机导致.lck 文件是VMWare软件的一种磁盘锁文件&…...

MySQL数据库版本为5.5.62,时间戳超出2038年1月19日的解决方案

MySQL数据库版本是 5.5.62,已设置字段的类型为BIGINT,使用FROM_UNIXTIME()函数来转换时间戳,返回NULL。 SELECT FROM_UNIXTIME(1617970800)SELECT FROM_UNIXTIME(2185743121)MySQL数据库版本为5.5.62,已设置字段的类型为BIGINT&a…...

C++20 semaphore(信号量) 详解

头文件在C20中是并发库技术规范(Technical Specification, TS)的一部分。信号量是同步原语,帮助控制多线程程序中对共享资源的访问。头文件提供了标准C方式来使用信号量。 使用环境 Windows:VS中打开项目属性,修改C语…...

【简单讲解下Lisp的学习历程】

🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...

构建高效网络:深入理解正向与反向代理的作用与配置

正向代理 如果把局域网外的互联网环境想象成一个巨大的资源库,则局域网中的客户端要访问互联网则需要通过代理服务器来访问,这种代理成为正向代理。 示例: 用户想要访问 https://chensir.ink (目标服务器)&#xff0…...

Linux:make/makefile的使用

一、什么是makefile/make 会不会写makefile,从一个侧面说明了一个人是否具备完成大型工程的能力 一个工程中的源文件不计数,其按类型、功能、模块分别放在若干个目录中,makefile定义了一系列的 规则来指定,哪些文件需要先编译&am…...

Java设计模式—策略模式(商场打折)

策略这个词应该怎么理解,打个比方说,我们出门的时候会选择不同的出行方式,比如骑自行车、坐公交、坐火车、坐飞机、坐火箭等等,这些出行方式,每一种都是一个策略。 再比如我们去逛商场,商场现在正在搞活动&…...

FOR循环

oracle从入门到总裁:​​​​​​https://blog.csdn.net/weixin_67859959/article/details/135209645 前面两种循环都要根据条件是否成立而确定循环体的执行,具体循环体执行多少次事先并不知道。 FOR 循环可以控制循环执行的次数,由循环变量控制循环体的…...

C++: 命名空间/C++输入输出/缺省参数/函数重载/引用/内联函数

进入C以后,就翻开了新的篇章。C支持C语言的使用。事实上,C是创建者在发现C语言中有很多不好用的地方(在后续学习中会明显看到)后,在C语言基础上又加入了许多语法,于是就成了C。 1.命名空间 来源&#xff…...

Java | Leetcode Java题解之第13题罗马数字转整数

题目&#xff1a; 题解&#xff1a; class Solution {Map<Character, Integer> symbolValues new HashMap<Character, Integer>() {{put(I, 1);put(V, 5);put(X, 10);put(L, 50);put(C, 100);put(D, 500);put(M, 1000);}};public int romanToInt(String s) {int …...

题目:学习使用register定义变量的方法。

题目&#xff1a;学习使用register定义变量的方法。 There is no nutrition in the blog content. After reading it, you will not only suffer from malnutrition, but also impotence. The blog content is all parallel goods. Those who are worried about being cheated …...

IO_DAY7

1:实现2个终端之间的互相聊天 要求:千万不要做出来2个终端之间的消息发送是读一写的&#xff0c;一定要能够做到&#xff0c;一个终端发送n条消息&#xff0c;另一个终端一条消息都不回复都是没有问题的 终端A&#xff1a; #include<myhead.h> int main(int argc, char…...

大模型学习笔记八:手撕AutoGPT

文章目录 一、功能需求二、演示用例三、核心模块流程图四、代码分析1&#xff09;Agent类目录创建智能体对象2&#xff09;开始主流程3&#xff09;在prompt的main目录输入主prompt和最后prompt4&#xff09;增加实际的工具集tools&#xff08;也就是函数&#xff09;5&#xf…...

Java常用API_System——常用方法及代码演示

1.System.exit(int status) 方法的形参int status为状态码&#xff0c;如果是0&#xff0c;说明虚拟机正常停止&#xff0c;如果非0&#xff0c;说明虚拟机非正常停止。需要将程序结束时可以调用这个方法 代码演示&#xff1a; public class Test {public static void main(S…...

neo4j图数据库下载安装配置

neo4j下载地址Index of /doc/neo4j/3.5.8/ 1.说明&#xff1a;jdk 1.8 版本对应的 neo4j 数据库版本 推荐安装3.X版本 2.配置系统环境变量 3.启动 neo4j.bat console 4.访问...

结构化面试-有矛盾的人际沟通题

例题一&#xff1a; 你和小张一起值班&#xff0c;但是小张没来&#xff0c;刚好领导检查发现后批评了他&#xff0c;事后小张埋怨你&#xff0c; 认为你在领导面前表现&#xff0c;并在同事中传播&#xff0c;同事也觉得你不通人情&#xff0c;你怎么处理&#xff1f; 回答&a…...

AI技术创业机会之金融科技

金融科技服务(FinTech)领域正经历着一场由人工智能(AI)技术引领的深刻变革,为创业者提供了无数创新与颠覆传统金融服务模式的机会。以下详述了金融科技服务中AI技术的具体创业机会及其细节与内容,以期为有志于涉足此领域的创业者提供全面的洞察与参考。 一、智能投顾与财…...

LC低通滤波

LC滤波器&#xff0c;是指将电感L与电容器 C进行组合设计构成的滤波电路&#xff0c;可去除或通过特定频率的无源器件。电容器具有隔直流通交流&#xff0c;且交流频率越高越容易通过的特性。而电感则具有隔交流通直流&#xff0c;且交流频率越高越不易通过的特性。因此&#x…...

CS162 Operating System笔记

What is an Operating System? it’s typically a special layer of software that provides the application access to hardware resources.So.it’s convenient abs fractions of complex hardware devices....

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引&#xff0c;可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度&#xff08;创建索引的主要原因&#xff09;。3. 可以加速表和表之间的连接&#xff0c;实现数据的参考完整性。4. 可以在查询过程中&#xff0c;…...

ssc377d修改flash分区大小

1、flash的分区默认分配16M、 / # df -h Filesystem Size Used Available Use% Mounted on /dev/root 1.9M 1.9M 0 100% / /dev/mtdblock4 3.0M...

智能在线客服平台:数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展&#xff0c;消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁&#xff0c;不仅优化了客户体验&#xff0c;还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用&#xff0c;并…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

Python爬虫(一):爬虫伪装

一、网站防爬机制概述 在当今互联网环境中&#xff0c;具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类&#xff1a; 身份验证机制&#xff1a;直接将未经授权的爬虫阻挡在外反爬技术体系&#xff1a;通过各种技术手段增加爬虫获取数据的难度…...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币&#xff0c;另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额&#xff0c;返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...

Java求职者面试指南:计算机基础与源码原理深度解析

Java求职者面试指南&#xff1a;计算机基础与源码原理深度解析 第一轮提问&#xff1a;基础概念问题 1. 请解释什么是进程和线程的区别&#xff1f; 面试官&#xff1a;进程是程序的一次执行过程&#xff0c;是系统进行资源分配和调度的基本单位&#xff1b;而线程是进程中的…...

OD 算法题 B卷【正整数到Excel编号之间的转换】

文章目录 正整数到Excel编号之间的转换 正整数到Excel编号之间的转换 excel的列编号是这样的&#xff1a;a b c … z aa ab ac… az ba bb bc…yz za zb zc …zz aaa aab aac…; 分别代表以下的编号1 2 3 … 26 27 28 29… 52 53 54 55… 676 677 678 679 … 702 703 704 705;…...

【FTP】ftp文件传输会丢包吗?批量几百个文件传输,有一些文件没有传输完整,如何解决?

FTP&#xff08;File Transfer Protocol&#xff09;本身是一个基于 TCP 的协议&#xff0c;理论上不会丢包。但 FTP 文件传输过程中仍可能出现文件不完整、丢失或损坏的情况&#xff0c;主要原因包括&#xff1a; ✅ 一、FTP传输可能“丢包”或文件不完整的原因 原因描述网络…...