当前位置: 首页 > news >正文

RAxML-NG安装与使用-raxml-ng-v1.2.0(bioinfomatics tools-013)

01 背景
1.1 ML树

ML树,或最大似然树,是一种在进化生物学中用来推断物种之间进化关系的方法。最大似然(Maximum Likelihood, ML)是一种统计框架,用于估计模型参数,使得观察到的数据在该模型参数下的概率最大。在进化树的构建中,这意味着选择一棵树(包括其分支长度和模型参数),使得给定的序列数据在该树模型下出现的概率最大

ML树的特点:

- 模型驱动:ML方法依赖于复杂的统计模型来描述序列进化过程中的变化。这些模型可以包括核苷酸或氨基酸替换的不同速率、遗传密码的变异等。
- 数据适应:最大似然方法能够适应不同类型的分子数据(如DNA、RNA或蛋白质序列),并考虑序列间的进化距离和速率变异。
- 计算密集:相比其他方法(如邻接法或最大简约法),ML方法在计算上更为密集,因为它需要评估多种树形和参数组合下的概率。

ML树的应用:

- 物种分类:帮助科学家理解不同物种间的亲缘关系
- 进化研究:通过分析物种的遗传变化,研究它们的进化历史
- 功能预测:通过比较进化上相关的序列,预测未知序列的功能。
- 生态和保护生物学:了解物种的进化关系,有助于生态保护和生物多样性研究。

最大似然树提供了一种强大的方法来推断物种间的进化关系,尽管它在计算上更为要求,但通过提供更准确的估计和适应多样化数据的能力,已成为分子系统发育学中的一个重要工具。

1.2 RAxML-NG

RAxML(Stamatakis,2014年)是一个受欢迎的最大似然(ML)树推断工具,过去15年来一直由Alexey M Kozlov的团队开发和支持。最近,我们还发布了ExaML(Kozlov等人,2015年),这是一个专门用于在超级计算机上分析基因组规模数据集的代码。ExaML实现了RAxML的核心树搜索功能,并且可以扩展到数千个CPU核心。其他广泛使用的ML推断工具包括IQ-Tree(Nguyen等人,2015年),PhyML(Guindon等人,2010年)和FastTree(Price等人,2010年)。

在这里,我们介绍我们的新代码RAxML-NGRAxML下一代)。它结合了RAxML和ExaML的优势和概念,并提供了我们在下一节中将描述的几项额外改进。

所以,ML建树的最新一代版本软件,横空出世,一代版本一代神,代代版本ML树!

 常配合MAFFT使用,详见MAFFT安装及使用-mafft v7.520(bioinfomatics tools-004)

02 参考
https://github.com/amkozlov/raxml-ng    #官网
03 安装
这里是原码安装,就帮大家省略了hhh,编译好多人服务器可能配置不够
https://github.com/stamatak/standard-RAxML.git 
Build RAxML-NG.
PTHREADS version:git clone --recursive https://github.com/amkozlov/raxml-ng
cd raxml-ng
mkdir build && cd build
cmake ..
make下载zip注意解压即可
#下载安装包
wget -c https://github.com/amkozlov/raxml-ng/releases/download/1.2.0/raxml-ng_v1.2.0_linux_x86_64.zip
unzip raxml-ng_v1.2.0_linux_x86_64.zip  -d ./raxml-ng
#将raxml-ng_v1.2.0_linux_x86_64.zip文件解压到当前目录下的一个名为raxml-ng的新文件夹里。
04 使用
RAxML-NG v. 1.2.0 发布于 2023年5月9日,由 Exelixis Lab 开发。
开发者包括 Alexey M. Kozlov 和 Alexandros Stamatakis。
贡献者有 Diego Darriba, Tomas Flouri, Benoit Morel, Sarah Lutteropp, Ben Bettisworth, Julia Haag, Anastasis Togkousidis。
最新版本可在 https://github.com/amkozlov/raxml-ng 获取。
有问题/问题/建议?请访问:https://groups.google.com/forum/#!forum/raxml系统:Intel(R) Xeon(R) Platinum 8173M CPU @ 2.00GHz,56核,502 GB RAM使用方法:raxml-ng [选项]命令(互斥):--help                                     显示帮助信息--version                                  显示版本信息--evaluate                                 评估一棵树的似然(包含模型+分支长度优化)--search                                   最大似然(ML)树搜索(默认:10个拟合树 + 10个随机起始树)--bootstrap                                引导法(默认:使用引导停止自动检测复制品数量)--all                                      一体化(ML搜索 + 引导法)--support                                  计算给定参考树(例如,最佳ML树)的分割支持和一组复制树(例如,来自引导分析的树)--bsconverge                               使用autoMRE标准测试引导收敛性--bsmsa                                    生成引导复制MSAs--terrace                                  检查树是否位于系统发育露台上--check                                    检查校正并移除空列/行--parse                                    解析校正,压缩模式并创建二进制MSA文件--start                                    生成拟合/随机起始树并退出--rfdist                                   计算树之间的成对Robinson-Foulds(RF)距离--consense [ STRICT | MR | MR<n> | MRE ]   构建严格、多数规则(MR)或扩展MR(MRE)共识树(默认:MR)例如:--consense MR75 --tree bsrep.nw--ancestral                                在所有内节点上重建祖先状态--sitelh                                   打印每个站点的对数似然值命令快捷方式(互斥):--search1                                  别名:--search --tree rand{1}--loglh                                    别名:--evaluate --opt-model off --opt-branches off --nofiles --log result--rf                                       别名:--rfdist --nofiles --log result输入输出选项:--tree            rand{N} | pars{N} | FILE 起始树:rand(随机), pars(拟合) 或用户指定(新克文件)N = 树的数量(默认:rand{10},pars{10})--msa             FILE                     校正文件--msa-format      VALUE                    校正文件格式:FASTA, PHYLIP, CATG 或 自动检测(默认)--data-type       VALUE                    数据类型:DNA, AA, BIN(二进制) 或 自动检测(默认)--tree-constraint FILE                     约束树--prefix          STRING                   输出文件的前缀(默认:MSA文件名)--log             VALUE                    日志详细程度:ERROR,WARNING,RESULT,INFO,PROGRESS,DEBUG(默认:PROGRESS)--redo                                     覆盖现有结果文件并忽略检查点(默认:关闭)--nofiles                                  不创建任何输出文件,仅在终端打印结果--precision       VALUE                    打印的小数位数(默认:6)--outgroup        o1,o2,..,oN              逗号分隔的外群类群名称列表(只是一个绘制选项!)--site-weights    FILE                     MSA列权重文件(仅正整数!)  通用选项:--seed         VALUE                       伪随机数生成器的种子(默认:当前时间)--pat-comp     on | off                    校正模式压缩(默认:开启)--tip-inner    on | off                    尖端-内部案例优化(默认:关闭)--site-repeats on | off                    使用站点重复优化,比尖端-内部快10%-60%(默认:开启)--threads      VALUE                       使用的并行线程数(默认:56)--workers      VALUE                       并行运行的树搜索数量(默认:1)--simd         none | sse3 | avx | avx2    使用的向量指令集(默认:自动检测)--rate-scalers on | off                    对每个速率类别使用单独的CLV缩放器(对于>2000物种默认开启)--force        [ <CHECKS> ]                禁用安全检查(请三思!)模型选项:--model        <name>+G[n]+<Freqs> | FILE  模型规格或分区文件--brlen        linked | scaled | unlinked  分区间分支长度链接(默认:scaled)--blmin        VALUE                       最小分支长度(默认:1e-6)--blmax        VALUE                       最大分支长度(默认:100)--blopt        nr_fast    | nr_safe        分支长度优化方法(默认:nr_fast)nr_oldfast | nr_oldsafe     --opt-model    on | off                    ML优化所有模型参数(默认:开启)--opt-branches on | off                    ML优化所有分支长度(默认:开启)--prob-msa     on | off                    使用概率校正(与CATG和VCF兼容)--lh-epsilon   VALUE                       优化/树搜索的对数似然epsilon(默认:0.1)拓扑搜索选项:--spr-radius           VALUE               SPR重新插入半径,快速迭代(默认:自动)--spr-cutoff           VALUE | off         下降到子树的相对LH截断(默认:1.0)--lh-epsilon-triplet   VALUE               分支长度三元组优化的对数似然epsilon(默认:1000)引导选项:--bs-trees     VALUE                       引导复制品数量--bs-trees     autoMRE{N}                  使用基于MRE的引导收敛标准,最多N个复制品(默认:1000)--bs-trees     FILE                        包含一组引导复制树的Newick文件(与--support一起使用)--bs-cutoff    VALUE                       MRE-based引导停止标准的截断阈值(默认:0.03)--bs-metric    fbp | tbe                   分支支持度量:fbp = Felsenstein引导(默认),tbe = 转移距离--bs-write-msa on | off                    写下所有引导校正(默认:关闭)
05 常用命令行

常配合MAFFT使用,详见MAFFT安装及使用-mafft v7.520(bioinfomatics tools-004)

  1. 对DNA校正进行树推断(10个随机+10个拟合起始树,通用时间可逆模型,ML估计替换率和核苷酸频率,离散GAMMA异质性率模型,4类):./raxml-ng --msa testDNA.fa --model GTR+G  ##这个属于all的一部分2. 进行一体化分析(ML树搜索 + 非参数引导)(10个随机化拟合起始树,固定经验替换矩阵(LG),校正中的经验氨基酸频率,8个离散GAMMA类别,200个引导复制品):./raxml-ng --all --msa testAA.fa --model LG+G8+F --tree pars{10} --bs-trees 200    ##涵盖上述search  就是103. 在固定拓扑上优化分支长度和自由模型参数(使用比例分支长度的多个分区)./raxml-ng --evaluate --msa testAA.fa --model partitions.txt --tree test.tree --brlen scaled      ##使用一个合适的枝长参数   evalute一个参数  他有一个优化模式     优化的话,这里就是选择最优模型进行打分判定。需要给定模型集合实际上常用的
./raxml-ng --support --tree bestML.tree --bs-trees bootstraps.tree       ##给予一个最好模型的数据,然后在进行,这种本文不予采用##还是需要模型文件,然后筛选最佳模型,然后进行打分,但是模型文件
./raxml-ng/raxml-ng  --msa singlecopy.mafft  --prefix singlecopy.mafft.ML --threads 20  --bs-trees 1000  --model  XXX
06 参考文献

Kozlov AM, Darriba D, Flouri T, Morel B, Stamatakis A. RAxML-NG: a fast, scalable and user-friendly tool for maximum likelihood phylogenetic inference. Bioinformatics. 2019 Nov 1;35(21):4453-4455. doi: 10.1093/bioinformatics/btz305. PMID: 31070718; PMCID: PMC6821337.

周颖,祝波,钱冬等.  虾肝肠胞虫感染病理特征、18S rRNA基因序列及系统进化树分析    [J].  宁波大学学报(理工版),  2022,  35  (02):  8-14.  
季梦玮,滕飞翔,周敏等.  原生动物AQPs系统进化树的构建以及结构分析    [J].  江苏科技信息,  2019,  36  (13):  46-51.  
李晓凤.    基于物种系统进化树的已批准天然来源药物物种分布与机制研究[D].    重庆大学,    2018. 
杜鹏程,于伟文,陈禹保等.  利用系统进化树对H7N9大数据预测传播模型的评估    [J].  中国生物工程杂志,  2014,  34  (11):  18-23.  DOI:10.13523/j.cb.20141103.
李玲.    基于线粒体基因组构建生物系统进化树[D].    内蒙古工业大学,    2014.  
 

相关文章:

RAxML-NG安装与使用-raxml-ng-v1.2.0(bioinfomatics tools-013)

01 背景 1.1 ML树 ML树&#xff0c;或最大似然树&#xff0c;是一种在进化生物学中用来推断物种之间进化关系的方法。最大似然&#xff08;Maximum Likelihood, ML&#xff09;是一种统计框架&#xff0c;用于估计模型参数&#xff0c;使得观察到的数据在该模型参数下的概率最…...

Tomcat内存马

Tomcat内存马 前言 描述Servlet3.0后允许动态注册组件 这一技术的实现有赖于官方对Servlet3.0的升级&#xff0c;Servlet在3.0版本之后能够支持动态注册组件。 而Tomcat直到7.x才支持Servlet3.0&#xff0c;因此通过动态添加恶意组件注入内存马的方式适合Tomcat7.x及以上。…...

pytorch之诗词生成3--utils

先上代码&#xff1a; import numpy as np import settingsdef generate_random_poetry(tokenizer, model, s):"""随机生成一首诗:param tokenizer: 分词器:param model: 用于生成古诗的模型:param s: 用于生成古诗的起始字符串&#xff0c;默认为空串:return: …...

OpenAI的ChatGPT企业版专注于安全性、可扩展性和定制化。

OpenAI的ChatGPT企业版&#xff1a;安全、可扩展性和定制化的重点 OpenAI的ChatGPT在商业世界引起了巨大反响&#xff0c;而最近推出的ChatGPT企业版更是证明了其在企业界的日益重要地位。企业版ChatGPT拥有企业级安全、无限GPT-4访问、更长的上下文窗口以及一系列定制选项等增…...

JS06-class对象

class对象 className 修改样式 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content&quo…...

深度学习1650ti在win10安装pytorch复盘

深度学习1650ti在win10安装pytorch复盘 前言1. 安装anaconda2. 检查更新显卡驱动3. 根据pytorch选择CUDA版本4. 安装CUDA5. 安装cuDNN6. conda安装pytorch结语 前言 建议有条件的&#xff0c;可以在安装过程中&#xff0c;开启梯子。例如cuDNN安装时登录 or 注册&#xff0c;会…...

Node.js与webpack(三)

上一节&#xff1a;Node.js与Webpack笔记&#xff08;二&#xff09;-CSDN博客 从0来一遍&#xff08;webpack项目&#xff09; 将之前的webpack 的纯开发配置&#xff0c;重新创建空白项目&#xff0c;重新做一遍&#xff0c;捋一遍思路防止加入生产模式时候弄混 1.创建文件夹…...

测试覆盖率那些事

在测试过程中&#xff0c;会出现测试覆盖不全的情况&#xff0c;特别是工期紧张的情况下&#xff0c;测试的时间被项目的周期一压再压&#xff0c;测试覆盖概率不全就会伴随而来。 网上冲浪&#xff0c;了解一下覆盖率的文章&#xff0c;其中一篇感觉写的很不错&#xff0c;将…...

Etcd 介绍与使用(入门篇)

etcd 介绍 etcd 简介 etc &#xff08;基于 Go 语言实现&#xff09;在 Linux 系统中是配置文件目录名&#xff1b;etcd 就是配置服务&#xff1b; etcd 诞生于 CoreOS 公司&#xff0c;最初用于解决集群管理系统中 os 升级时的分布式并发控制、配置文件的存储与分发等问题。基…...

Docker 安装 LogStash

关于LogStash Logstash&#xff0c;作为Elastic Stack家族中的核心成员之一&#xff0c;是一个功能强大的开源数据收集引擎。它专长于从各种来源动态地获取、解析、转换和丰富数据&#xff0c;并将这些结构化或非结构化的数据高效地传输到诸如Elasticsearch等存储系统中进行集…...

Selenium笔记

Selenium笔记 Selenium笔记 Selenium笔记element not interactable页面刷新 element not interactable "element not interactable"是Selenium在执行与网页元素交互操作&#xff08;如点击、输入等&#xff09;时抛出的一个常见错误。这个错误意味着虽然找到了对应的…...

ChatGPT :确定性AI源自于确定性数据

ChatGPT 幻觉 大模型实际应用落地过程中&#xff0c;会遇到幻觉&#xff08;Hallucination&#xff09;问题。对于语言模型而言&#xff0c;当生成的文本语法正确流畅&#xff0c;但不遵循原文&#xff08;Faithfulness&#xff09;&#xff0c;或不符合事实&#xff08;Factua…...

linux驱动开发面试题

1.linux中内核空间及用户空间的区别&#xff1f; 记住“22”&#xff0c;两级分段两级权限。 例如是32位的机器&#xff0c;从内存空间看&#xff1a;顶层1G是内核的&#xff0c;底3G是应用的&#xff1b;从权限看&#xff1a;内核是0级特权&#xff0c;应用是3级特权。 2.用…...

【AI】Ubuntu系统深度学习框架的神经网络图绘制

一、Graphviz 在Ubuntu上安装Graphviz&#xff0c;可以使用命令行工具apt进行安装。 安装Graphviz的步骤相对简单。打开终端&#xff0c;输入以下命令更新软件包列表&#xff1a;sudo apt update。之后&#xff0c;使用命令sudo apt install graphviz来安装Graphviz软件包。为…...

AI推介-大语言模型LLMs论文速览(arXiv方向):2024.03.05-2024.03.10—(2)

论文目录~ 1.Debiasing Large Visual Language Models2.Harnessing Multi-Role Capabilities of Large Language Models for Open-Domain Question Answering3.Towards a Psychology of Machines: Large Language Models Predict Human Memory4.Can we obtain significant succ…...

AI解答——DNS、DHCP、SNMP、TFTP、IKE、RIP协议

使用豆包帮助我解答计算机网络通讯问题—— 1、DHCP 服务器是什么&#xff1f; DHCP 服务器可是网络世界中的“慷慨房东”哦&#x1f923; 它的全称是 Dynamic Host Configuration Protocol&#xff08;动态主机配置协议&#xff09;服务器。 DHCP 服务器的主要任务是为网络中的…...

【TypeScript系列】声明合并

声明合并 介绍 TypeScript中有些独特的概念可以在类型层面上描述JavaScript对象的模型。 这其中尤其独特的一个例子是“声明合并”的概念。 理解了这个概念,将有助于操作现有的JavaScript代码。 同时,也会有助于理解更多高级抽象的概念。 对本文件来讲,“声明合并”是指编…...

zookeeper基础学习之六: zookeeper java客户端curator

简介 Curator是Netflix公司开源的一套zookeeper客户端框架&#xff0c;解决了很多Zookeeper客户端非常底层的细节开发工作&#xff0c;包括连接重连、反复注册Watcher和NodeExistsException异常等等。Patrixck Hunt&#xff08;Zookeeper&#xff09;以一句“Guava is to Java…...

MySQL数据库操作学习(2)表查询

文章目录 一、表查询1.表字段的操作①查看表结构②字段的增加③字段长度/数据类型的修改④字段名的修改⑤删除字符段⑥清空表数据⑦修改表名⑧删除表 2、表数据查询3、where 字段4、聚合函数 一、表查询 1.表字段的操作 ①查看表结构 desc 表名; # 查看表中的字段类型&#…...

Java学习

目录 treeSet StringBuilder treeSet TreeSet 是 Java 中实现了 Set 接口的一种集合类&#xff0c;它使用红黑树数据结构来存储元素&#xff0c;放到TreeSet集合中的元素: 无序不可重复&#xff0c;但是可以按照元素的大小顺序自动排序。 TreeSet一般会和Iterator迭代器一起使…...

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

2025年能源电力系统与流体力学国际会议&#xff08;EPSFD 2025&#xff09;将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会&#xff0c;EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

FastAPI 教程:从入门到实践

FastAPI 是一个现代、快速&#xff08;高性能&#xff09;的 Web 框架&#xff0c;用于构建 API&#xff0c;支持 Python 3.6。它基于标准 Python 类型提示&#xff0c;易于学习且功能强大。以下是一个完整的 FastAPI 入门教程&#xff0c;涵盖从环境搭建到创建并运行一个简单的…...

基于当前项目通过npm包形式暴露公共组件

1.package.sjon文件配置 其中xh-flowable就是暴露出去的npm包名 2.创建tpyes文件夹&#xff0c;并新增内容 3.创建package文件夹...

MVC 数据库

MVC 数据库 引言 在软件开发领域,Model-View-Controller(MVC)是一种流行的软件架构模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种模式有助于提高代码的可维护性和可扩展性。本文将深入探讨MVC架构与数据库之间的关系,以…...

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包&#xff1a; for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

蓝桥杯 冶炼金属

原题目链接 &#x1f527; 冶炼金属转换率推测题解 &#x1f4dc; 原题描述 小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V&#xff0c;是一个正整数&#xff0c;表示每 V V V 个普通金属 O O O 可以冶炼出 …...

return this;返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请&#xff0c;不同级别的经理有不同的审批权限&#xff1a; // 抽象处理者&#xff1a;审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

springboot整合VUE之在线教育管理系统简介

可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生&#xff0c;小白用户&#xff0c;想学习知识的 有点基础&#xff0c;想要通过项…...

【分享】推荐一些办公小工具

1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由&#xff1a;大部分的转换软件需要收费&#xff0c;要么功能不齐全&#xff0c;而开会员又用不了几次浪费钱&#xff0c;借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中&#xff0c;附加包含目录、附加库目录和附加依赖项是三个至关重要的设置&#xff0c;它们相互配合&#xff0c;确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中&#xff0c;这些概念容易让人混淆&#xff0c;但深入理解它们的作用和联…...