宏基因组学Metagenome-磷循环Pcycle功能基因分析-从分析过程到代码及结果演示-超详细保姆级流程
大背景介绍
生信分析,凡事先看论文,有了论文就有了参考,后续分析就有底了,直接上硬菜开干:
PCycDB: a comprehensive and accurate database for fast analysis of phosphorus cycling genes - PubMed
数据库及部分分析代码github库:
GitHub - ZengJiaxiong/Phosphorus-cycling-database: This is a comprehensive database for fast and accurately analyzing the phosphorus cycling genes.

磷循环基因库介绍Phosphorus-cycling-database (PCyCDB):
磷循环数据库 (PCyCDB),包含 138 个基因家族和 10 个代谢过程。将同源基因添加到数据库中,以降低假阳性率。通过识别已知的模拟基因数据集和模拟细菌群落,对序列相似性搜索工具(如BLAST、USEARCH、DIAMOND)生成的比对结果进行过滤的标准(即身份、命中长度)进行了细化,以获得最佳准确性并进一步减少假阳性和假阴性。在70%的同一性和25个氨基酸的截留点下,准确率、PPV、灵敏度、特异性和NPV分别为99.76%、95.70%、99.94%、99.74%和99.99%。重要的是,编码细胞内磷代谢过程的基因被添加到PCyCDB中,这应该有助于研究人员不仅拓宽对地球化学磷循环的见解,而且扩大对微生物磷代谢的见解。
作者对数据库的介绍:
这是磷循环数据库的新版本(PCycDBv1.1)。在Lidbury博士(英国谢菲尔德大学动植物科学系)的帮助下,我们检索了许多重要的磷循环基因(PCG),包括glpQ(细胞质甘油磷酸二酯磷酸二酯酶)、glpT(甘油-3-)基因磷酸盐通透酶)、ushA(5'-核苷酸酶)、phnD_phosphite(可能的 ABC 转运蛋白亚磷酸盐结合蛋白)、ptxABC(可能的亚磷酸盐转运系统)、htxB(推定的特异性次磷酸盐转运蛋白)、ptxD(NAD:亚磷酸盐氧化还原酶/亚磷酸盐脱氢酶)、htxA (次磷酸盐/2-酮戊二酸双加氧酶)、pbfA(磷酸盐分解因子 A)、pafA(磷酸盐不敏感磷酸单酯酶)、aepXVW、aepP 和 aepS(三种新型 2-氨基乙基磷酸盐转运蛋白)。此外,我们还纳入了在约氏黄杆菌 DSM2064 中鉴定的两个 phoA 基因(碱性磷酸酶)(Fjoh_3187 和 Fjoh_3249)。
基因库直接下载链接,v1.1版:
https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/id2genemap.txt
https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/PCycDBv1.1.faa
数据库准备
下载数据库
# 直接克隆整个仓库
git clone https://github.com/ZengJiaxiong/Phosphorus-cycling-database.git# 下载基因idmaping库
wget -c https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/id2genemap.txt
wget -c https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/PCycDBv1.1.faa### 查看id2genemap文件内容
head id2genemap.txt
521169598 lysR COG
260599187 lysR COG
560158809 lysR COG
15832950 lysR COG
296104502 lysR COG
455738413 lysR COG
126640099 lysR COG
71907275 lysR COG
386742586 lysR COG
197284247 lysR COG### fasta文件内容
head PCycDBv1.1.faa
>161934.XP_010688184.1 [description=ADE2 ontology=COG0152 source=eggNOG]
MLLQQGLLSNKPAPFFSIKSSLMYSSKFSSSVSLTSVKSNIHPFISCKTSIEAHNSSIKSENLPVHGVSEKIVGVLGGGQLGRMLCQAASELAIKIAILDPSQNCPASSLAYYHMVGSFDDSATVEEFAKRCGVLTVETEHVDVATLDKLEQQGVDCEPKASTIRIIQDKYLQKSHFSRLGIPLPKFMEIDSVESARRAGELFGYPLMIKSKRFAYDGRGNAVAKGEEDLSSAVAALGGYERGLYVEKWAPFVKELAVIVARGRDNSILCYPVVETIHKENICHIVKAPAVVPWKVRKLANDVAHKAVSSLEGAGVFAVELFLTEAGEILLNEVAPRPHNSGHHTIESCYTSQYEQHLRAVVGLPLGDPSMKTTAAIMYNILGEDEGEPGFLLAHEFMRRSLTVPGASVHWYDKSEMKRQRKMGHITIVGSSMGIVEGHLKSLLKQDKTDGAISARVGIIMGSDSDLPVMKDASRILDMFGVEHEVRIVSAHRTPEMMFTYAKSAWERGIQVIIAGAGGAAHLPGMVAALTPVPVIGVPVRGSSIDGLDSLLSIVQMPRGVPVATVAINNATNAGLLAVRMLGVGDSDLKSRMAQYLEDARDEVLVKADRLHKDGWEVYLNT
>159749.K0RBF6 [description=ADE2 ontology=COG0152 source=eggNOG]
GRAAGPDDVPRGPPAQHNDALPRRLRPTLPRDAGRRHVRRRRRGPVADRRGLAPRRVEAQGALVGVRRGDDGDRARGRRRAGGAGEGGGERPAVEQGFWRDVCGCYVSDEYDWMSCNASVLGLGLWPGGKRKTTAKPRDELRGRKQEHFAGHSIPLPPYVNLPSVQSIHDAASRFGLPLMLKSRKGAYDGRGNTVLKSTDDAAVSSALSDLGLTESDLPNDALYAEGWIDFRSEVAVMVVRSTTGETRAYPATTAIQTDSICRVVLVPARNVAPDVRERCESVAMAAVDCLGDGATGVFGVELFLVNKPGGGLDVLLNEVAPRPHNTGHYTQDACAVSQFENHLRAVCGLPLGDTGLVVGAAAMVNVLGAPSGGIEETMKGVNAAMTMPRTSVHWYGKGYRAGRKMGHINVTADSHAELDGPLSKLLAAESIDENVIPEDGRIGTNPLVGVIMGSQSDLPTMSDAVKILKEFGIPHEVDIVSAHRTPEKLMTYSRSAAGRGIQVIIAGAGGAAHLPGMVAAMTPLPVVGVPIKTSTLNGQDSLLSIVQMPRGVPVATVAIGNATNAGLLAVRSLCASRPGLRAKMEEYQLKMKEAVDANSSTLLELGCDEFLSMLPNKNKAVNV
>192875.XP_004363538.1 [description=ADE2 ontology=COG0152 source=eggNOG]
MST相关文章:
宏基因组学Metagenome-磷循环Pcycle功能基因分析-从分析过程到代码及结果演示-超详细保姆级流程
大背景介绍 生信分析,凡事先看论文,有了论文就有了参考,后续分析就有底了,直接上硬菜开干: PCycDB: a comprehensive and accurate database for fast analysis of phosphorus cycling genes - PubMed 数据库及部分分析代码github库: GitHub - ZengJiaxiong/Phospho…...
element plus 日期范围 自定义内容
问题: 按照官网上的自定义内容示例,修改日期选择器没有问题,如果修改日期范围选择器,修改后会丢失日期范围选择时的样式。 解决: 从F12中不难看出日期范围的选择样式来自于.el-date-table-cell 而示例中写的是.cell&…...
[23] GaussianAvatars: Photorealistic Head Avatars with Rigged 3D Gaussians
[paper | proj] 给定FLAME,基于每个三角面片中心初始化一个3D Gaussian(3DGS);当FLAME mesh被驱动时,3DGS根据它的父亲三角面片,做平移、旋转和缩放变化;3DGS可以视作mesh上的辐射场࿱…...
JSON Ajax
1. JSON概念 JSON,全称JavaScript Object Notation,即JavaScript对象表示法,是一种轻量级的数据交换格式。它基于JavaScript的子集,易于人阅读和编写,同时也易于机器解析和生成。 JSON的诞生,是为了解决电…...
ElasticSearch与HBase的分布式存储设计
本文内容覆盖如今两大非结构化数据库之间的区别 详情介绍 从各个角度详细对比 1. 官方定位 HBase 是 Hadoop 数据库,是一个分布式、可扩展的大数据存储。 当您需要对大数据进行随机、实时的读/写访问时,请使用 Apache HBase™。 这个项目的目标是在商用硬件集群上托管非常大…...
回归预测 | MATLAB实现NGO-SCN北方苍鹰算法优化随机配置网络的数据回归预测 (多指标,多图)
回归预测 | MATLAB实现NGO-SCN北方苍鹰算法优化随机配置网络的数据回归预测 (多指标,多图) 目录 回归预测 | MATLAB实现NGO-SCN北方苍鹰算法优化随机配置网络的数据回归预测 (多指标,多图)效果一览基本介绍…...
Bezier 曲线 2D
Bezier 曲线于 1962 年由法国雪铁龙汽车公司的工程师 Bezier 所发表,主要应用于汽车的外形设计。虽然 Bezier 曲线早在 1959 年便由法国雷诺汽车公司的 De Casteljau 运用递推算法开发成功,但是 Bezier 却给出了曲线的详细的曲线计算公式。所以ÿ…...
Linux静态ip
Linux静态ip Ⅰ、修改静态ip Ⅰ、修改静态ip 修改静态ip必须是root用户 su root //切换root用户 ip a //查看修改前的动态ipvi /etc/sysconfig/network-scripts/ifcfg-ens33 //打开网卡配置文件,修改一处,新增四处 BOOTPROTO&quo…...
一种基于外观-运动语义表示一致性的视频异常检测框架 论文阅读
A VIDEO ANOMALY DETECTION FRAMEWORK BASED ON APPEARANCE-MOTION SEMANTICS REPRESENTATION CONSISTENCY 论文阅读 ABSTRACT1. INTRODUCTION2. PROPOSED METHOD3. EXPERIMENTAL RESULTS4. CONCLUSION阅读总结: 论文标题:A VIDEO ANOMALY DETECTION FRA…...
Netty—NIO万字详解
文章目录 NIO基本介绍同步、异步、阻塞、非阻塞IO的分类NIO 和 BIO 的比较NIO 三大核心原理示意图NIO的多路复用说明 核心一:缓存区 (Buffer)Buffer类及其子类Buffer缓冲区的分类MappedByteBuffer类说明: 核心二:通道 (Channel)Channel类及其…...
面试经典150题(32-37)
leetcode 150道题 计划花两个月时候刷完,今天(第十五天)完成了6道(32-37)150: 今天刚好有点没精神的感觉,然后碰到的题也不难。。天意!!! 32.(289. 生命游戏࿰…...
手撕分布式缓存---HTTP Client搭建
经过上个章节的学习,我们已经实现了一致性哈希算法,这个算法保证我们可以在节点发生变动时,最少的key请求受到影响,并返回这个节点的名称;这很大程度上避免了哈希雪崩和哈希穿透的问题。这个章节我们要基于此实现完整的…...
word如何快速制作简易代码块
先上解决方案。 方式一(全自动): typora编辑,导出选择word文档即可。内网环境,故放弃。 方式二(全手动): 在修改文档时,左侧会有“段落布局”按钮,点击该按…...
Linux常用网络指令
网络参数设定使用的指令 手动/自动设定与启动/关闭 IP 参数:ifconfig, ifup, ifdown ifconfig ifconfig常用于修改网络配置以及查看网络参数的指令 [rootwww ~]# ifconfig {interface} {up|down} < 观察与启动接口 [rootwww ~]# ifconfig interface {options…...
Spark on Yarn 安装配置实验(3.1.1)
子任务二: Spark on Yarn 安装配置 本任务需要使用 root 用户完成相关配置, 已安装 Hadoop 及需要配置前置环境,具体要求如下: 1 、从宿主机 /opt 目录下将文件 spark-3.1.1-bin-hadoop3.2.tgz 复制到容器 Master 中的 /opt/software (若 路径不存在,则需新…...
详解YOLOv5网络结构/数据集获取/环境搭建/训练/推理/验证/导出/部署
一、本文介绍 本文给大家带来的教程是利用YOLOv5训练自己的数据集,以及有关YOLOv5的网络结构讲解/数据集获取/环境搭建/训练/推理/验证/导出/部署相关的教程,同时通过示例的方式让大家来了解具体的操作流程,过程中还分享给大家一些好用的资源…...
ansible(不能交互)
1、定义 基于python开发的一个配置管理和应用部署工具,在自动化运维中异军突起,类似于xshell一键输入的工具,不需要每次都切换主机进行操作,只要有一台ansible的固定主机,就可以实现所有节点的操作。不需要agent客户端…...
黑马点评06分布式锁 2Redisson
实战篇-17.分布式锁-Redisson功能介绍_哔哩哔哩_bilibili 1.还存在的问题 直接实现很麻烦,借鉴已有的框架。 2.Redisson用法 3.Redisson可重入原理 在获取锁的时候,看看申请的线程和拿锁的线程是否一致,然后计算该线程获取锁的次数。一个方法…...
深度剖析知识图谱:方法、工具与实战案例
💂 个人网站:【 海拥】【神级代码资源网站】【办公神器】🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 知识图谱作为一种强大的知识表示和关联技术&am…...
Oracle中的dblink简介
Oracle中的dblink简介 是一种用于在不同数据库之间进行通信和数据传输的工具。它允许用户在一个数据库中访问另一个数据库中的对象,而无需在本地数据库中创建这些对象。 使用dblink,用户可以在一个数据库中执行SQL语句,然后访问另一个数据库中…...
PP-DocLayoutV3入门必看:从零部署到JSON结构化输出完整流程
PP-DocLayoutV3入门必看:从零部署到JSON结构化输出完整流程 1. 开篇:认识文档布局分析利器 你是否曾经遇到过这样的困扰:面对扫描的文档图片,想要提取其中的文字和结构信息,却不知道从何下手?或者需要处理…...
不止于画图:用IPC-7351标准和Mentor LP工具高效生成标准PCB焊盘(Cadence实战)
从标准到实践:基于IPC-7351的PCB焊盘设计全流程解析 在高速数字电路和精密模拟电路设计中,焊盘作为元器件与PCB之间的物理连接点,其设计质量直接影响产品可靠性。一个常见的误区是仅关注软件操作技巧,而忽视行业标准对设计质量的…...
Windows下用CMake和MinGW编译NLopt 2.6.2的完整指南(附测试代码)
Windows平台下NLopt 2.6.2源码编译与实战应用全解析 在科学计算与工程优化领域,NLopt作为一款开源的非线性优化库,因其丰富的算法支持和跨平台特性而广受欢迎。本文将深入探讨如何在Windows系统中从零开始构建NLopt 2.6.2开发环境,并通过完整…...
WRF风场后处理实战:用Python+Cartopy绘制500hPa风场矢量图(附完整代码)
WRF风场后处理实战:用PythonCartopy绘制500hPa风场矢量图(附完整代码) 气象数据分析中,风场可视化是理解大气环流特征的关键环节。WRF(Weather Research and Forecasting)模式输出的数据包含丰富的三维风场…...
TinyXML2性能优化终极指南:10个技巧让XML处理速度飙升
TinyXML2性能优化终极指南:10个技巧让XML处理速度飙升 【免费下载链接】tinyxml2 TinyXML2 is a simple, small, efficient, C XML parser that can be easily integrated into other programs. 项目地址: https://gitcode.com/gh_mirrors/ti/tinyxml2 TinyX…...
March7thAssistant智能工具:3步解锁星穹铁道全场景效率提升方案
March7thAssistant智能工具:3步解锁星穹铁道全场景效率提升方案 【免费下载链接】March7thAssistant 🎉 崩坏:星穹铁道全自动 Honkai Star Rail 🎉 项目地址: https://gitcode.com/gh_mirrors/ma/March7thAssistant 每天登…...
QGIS属性表关联Excel实战:5步搞定空间数据分析(附避坑指南)
QGIS属性表与Excel高效关联:从数据匹配到空间分析的完整指南 1. 为什么需要关联Excel与QGIS属性表? 在日常空间分析工作中,我们经常遇到这样的场景:拥有完整的空间数据(如行政区划边界),但关键分…...
为什么你的FastAPI AI接口在K8s里流式失败?——基于eBPF追踪的12层网络栈+ASGI生命周期时序图(含cgroup内存隔离失效证据)
第一章:FastAPI 2.0 异步 AI 流式响应对比评测报告FastAPI 2.0 原生强化了对 async/await 的深度支持,尤其在处理大语言模型(LLM)的逐 token 流式生成场景中,显著提升了吞吐量与首字节延迟(TTFB)…...
RStudio Server部署与运维实战:从零搭建到高效管理
1. 环境准备:搭建RStudio Server的基石 在开始部署RStudio Server之前,我们需要确保服务器环境已经准备就绪。就像盖房子需要打地基一样,这一步决定了后续所有工作的稳定性。我遇到过不少因为环境问题导致的安装失败案例,大多数都…...
【具身智能06】具身智能多模态感知与传感器融合:从看见到理解
06_具身智能多模态感知与传感器融合 关键词 多模态感知,传感器融合,触觉传感器,力觉传感器,时空对齐,环境建模,IMU,视觉-触觉融合,深度感知一、引言:从单模态感知到多模态融合的必然之路 具身智能机器人的本质是在物理世界中行动,而行动的前提是感知。传统的工业机器…...
