文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。
常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右,一般由四部分组成,包括一个LSC和一个SSC,以及二者之间的两个IR区。随着高通量测序技术的快速发展,利用叶绿体来研究细胞器的起源、结构、进化正受到越来越广泛的关注。
图1 具有代表性的金腰属叶绿体基因组图谱[1]
凌恩生物负责对每一个样本的叶绿体DNA(cpDNA)进行富集及抽提,有自主研发的细胞器提取技术,提取经验丰富。有专业团队负责跟进每一个项目,从细胞器DNA制备、Hiseq建库及测序、后续生物信息分析,直至为客户提供满意的结果。
本期主要介绍叶绿体基因组的一些高级分析内容。
1、共线性分析
共线性是指遗传学中的基因连锁关系,是不同物种染色体上同源基因以相同顺序排列的现象。两个物种之间的共线性程度可以作为衡量他们之间进化距离的尺度,可以知道物种间的亲缘关系。对基因组间的局部共线性块进行相似度、重排、倒置等现象的分析可以来阐述物种演化中发生的事件。
图2 叶绿体基因组mVista共线性分析
2、系统进化树分析
系统发育树(Phylogenetic tree)又称为系统进化树,是用一种类似树状分支的图形来概括各物种之间的亲缘关系,可用来描述物种之间的进化关系。通过系统进化树分析可以找出不同物种间的进化关系,理解祖先序列与其后代之间的关系,同时也可以估算一组共有共同祖先的物种间的分歧时间。
细胞器基因组非常保守,常用来构建系统发育进化树来研究动植物的物种分类和进化地位。凌恩生物构建细胞器系统发生树的方法有以下两种:
(1)基于样品与参考基因组的群体SNP矩阵构建进化树:对于每一个样本,按照相同顺序将所有SNP相连,获得相同长度的fasta格式的序列(其中一个为参考序列),作为输入文件用于进化树构建。
(2)基于Core基因构建进化树:对细胞器基因组鉴定出来的单拷贝Core基因,利用MUSCLE v3.8.31软件进行蛋白多序列的比对,比对结果用于进化树构建。
图3 基于cpPCGs+nrDNA矩阵的金腰属系统发育树[1]
3、选择压力分析
选择压力是指外界施加给某物种生物进化过程中的压力,使得物种适应自然环境。在遗传学中,ω= Ka/Ks或者dN/dS表示的是非同义突变(Ka)和同义突变(Ks)之间的比率。一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。通常认为,ω > 1表明有正选择(Positive Selection)效应,即有些有利突变正受到选择;ω = 1不受选择,即中性进化(Neutral Evolution);如果0 < ω < 1,则认为有纯化选择(Negative or Purifying Selection)作用,ω值越小,说明受到的负选择压越大,氨基酸序列越保守。
图4 金腰属的选择压力分析[1]
4、叶绿体基因组的IR区扩张与收缩
叶绿体基因组IR区指的是叶绿体基因组中2个反向重复区域(IRs)。叶绿体基因组的IR区域被认为是最保守的区域,但其边界区序列可能会向外延伸扩张,也可能向内部收缩,从而导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,这是叶绿体基因组进化中的共有现象,也是其长度变异的主因。
通过IR区的扩张与收缩研究,可以获悉导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,以此来描述造成不同谱系间叶绿体基因组大小差异的原因。
图5 IR区的扩张与收缩[2]
5、结构变异检测
细胞器基因组进行结构变异检测主要有三种:SNP、InDel和SV。与参考基因组比对,分析近源物种细胞器基因组之间的变异情况,能够更好的对个体或群体进行差异性分析。
SNP(单核苷酸多态性)是指由单个核苷酸的变异所引起的DNA序列多态性。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在编码基因内,也有可能在非编码序列上,位于编码区内的SNP(coding SNP,cSNP)因其可能影响个体的功能而备受关注。
InDel是DNA序列的插入(Insertion)和缺失(Deletion)现象的总称,狭义的InDel表示1~10bp的短InDel。在基因组编码区域,InDel的发生可能会引起移码突变、氨基酸改变、假基因的出现等等现象。这里分析的是狭义的InDel。
基因组结构变异(SV,Structural Variation)通常是指基因组内DNA片段缺失、插入、重复、倒位、异位。使用MUMmer软件对目标基因组和参考基因组进行比对,再使用LASTZ对区域间进行比对,从区域比对结果中查找SV。
图6 全基因组结构变异类型配对图
6、核苷酸多态性(Pi)分析
核苷酸多态性(Pi)是衡量特定群体多态性高低的参数,是指在同一群体中随机挑选的两条DNA序列在各个核首酸位点上核昔酸差异的均值。核苷酸多态性(Pi)能揭示不同物种核酸序列的变异大小,变异度较高的区域可以为种群遗传学提供潜在的分子标记。例:基因和基因间区的核苷酸多样性分析。
图7 44个金腰属物种cp基因组的核苷酸多样性(Pi)分析[1]
7、共有基因和特有基因分析
所有样本中都存在的同源基因称为“共有基因”(core gene),去掉共有基因后得到的为非共有基因(Dispensable gene),特有基因(specific gene)为只有该样本特异拥有的基因。共有基因和特有基因很有可能与样品的共性和特性相对应,可以作为样本间功能差异的研究依据。
图8 Core-Pan基因稀释曲线
图9 基因组的共有/特有基因数
8、密码子偏好性分析
某一特定密码子在编码对应氨基酸的同义密码子中的相对概率,可以反应密码子的偏好性程度。通过计算Relative synonymous codon usage(RSCU)获得密码子的偏好性值。研究密码子的使用模式,对于探明物种进化压力以及进一步的遗传研究都有重要的意义。
图10 乌头属物种密码子偏好性分析[3]
9、简单重复序列SSR分析
简单重复序列(simple sequence repeat, SSR)又称作微卫星序列(microsatellite, MS),是一类由1-6个核苷酸为基本单位多次重复而形成的DNA片段。SSR数量丰富、多态性高、均匀覆盖整个基因组、呈共显性遗传且检测简单,因此被作为第二代分子标记广泛应用于遗传图谱构建、目标基因定位、遗传多样性研究、分子辅助育种、种质资源鉴定等领域。
图11 姜科植物叶绿体基因组的简单序列重复序列(SSR)分析[3]
10、重复序列分析
重复序列被认为在基因组重组和重排中起重要作用,并且在某些群体中也包含有系统发育信息。叶绿体基因组的重复序列包括串联和散在重复,其中散在重复又称为长重复序列,分为:正向重复(forward repeat)、反向重复(reverse repeat)、回文重复(palindromic repeat)和互补重复(complement repeat)四种类型。
图12 长重复序列分类图
参考文献
[1] A Comprehensive Analysis of Chloroplast Genome Provides New Insights into the Evolution of the Genus Chrysosplenium. International Journal of Molecular Sciences, 2023.
[2] Complete chloroplast genomes provide insights into evolution and phylogeny of Zingiber (Zingiberaceae). BMC Genomics, 2023.
[3] Comparative Analysis of the Chloroplast Genome for Aconitum Species: Genome Structure and Phylogenetic Relationships. Frontiers in Genetics, 2022.
相关文章:

文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。 常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右…...

阿里实习JAVA后端面经总结
暑期实习面试阿里Java后端岗位的一面的面经。 主要拷打了项目+Java 集合+Java并发+网络+mysql,一场面试大概问了 20 个题目,问的还是比较基础,不算太难。 问题记录 简历上有两个项目,选一个你比较熟悉的介绍 (略) 项目用到了哪个线程实现类? 用了ScheduledThreadP…...

利用 NLP 超能力:一步步介绍Hugging Face微调教程
导入必要的库 导入必要的库类似于为特定编程和数据分析活动构建工具包。这些库通常是预先编写的代码集合,提供广泛的功能和工具,有助于加快开发速度。开发人员和数据科学家可以通过导入适当的库来访问新功能、提高生产力并使用现有解决方案。 import pandas as pd import n…...

凝聚技术力量 共建测试生态 ——集成电路测试技术交流日成功举办
10月18日下午,凝聚技术力量,共建测试生态 ——集成电路测试技术交流会在上海成功举办。来自全国各地知名专家学者、技术大咖及企业代表齐聚一堂,共同探讨封装测试技术的发展方向,共话产业未来,共促产业发展。 本次活动…...

机器学习-ROC曲线:技术解析与实战应用
目录 一、引言ROC曲线简介 二、ROC曲线的历史背景二战雷达信号检测在医学和机器学习中的应用横跨多个领域的普及 三、数学基础True Positive Rate(TPR)与False Positive Rate(FPR)True Positive Rate(TPR)F…...

macos平台好用的FTP客户端 Transmit 5最新中文
Transmit 5是一款Mac平台上的FTP(文件传输协议)客户端软件,它可以让用户方便地在不同的计算机之间传输文件,例如从本地计算机上传或下载文件到远程服务器。以下是Transmit 5的一些主要功能和特点: 用户友好的界面:Transmit 5具有…...

用JavaScript输出0-9的两种方法、以及setTimeout的三个参数的意义
方法一: for (let i 0; i < 10; i) {setTimeout(() > {console.log(i);}, 1000) } 方法二:利用 setTimeout 函数的第三个参数,会作为回调函数的第一个参数传入 for (var i 0; i < 10; i) {setTimeout(i > {console.log(i);…...

酷鸟云近期主要新功能合集
近期,根据用户需求,酷鸟云上线了一系列新功能,让大家在使用过程中,更加灵活和高效。 1、仿真指纹功能优化 酷鸟云内置的专业防关联浏览器的仿真指纹功能,可以解决注册谷歌账号/谷歌邮箱(Gmail)…...

【大数据开发技术】实验06-SequenceFile、元数据操作与MapReduce单词计数
文章目录 SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附:系列文章 SequenceFile、元数据操作与MapReduce单词计数 一、实验目标 熟练掌握hadoop操作指令及HDFS命令行接口掌握HDFS SequenceFile读写操作掌握Map…...

【C语言】输入一个正整数,判断其是否为素数
1、素数又叫质数。素数,指的是“大于1的整数中,只能被1和这个数本身整除的数”。 2、素数也可以被等价表述成:“在正整数范围内,大于1并且只有1和自身两个约数的数”。 #include<stdio.h>int main() {int i,m;printf("…...

2023年Q3季度国内手机大盘销额下滑2%,TOP品牌销售数据分析
根据Canalys机构发布的最新报告,2023年第三季度,全球智能手机市场出货量仅下跌1%,可以认为目前全球手机市场的下滑势头有所减缓。而国内线上市场的表现也类似。 根据鲸参谋数据显示,今年Q3京东平台手机累计销量约1100万件…...

使用按钮从 SAP 系统内打开 Excel 文件
了解如何通过 SAP 屏幕上创建的按钮打开所需的 Excel 文件。为了演示这一点,将指导您完成以下步骤。 使用 del 命令删除 SAP 上不必要的元素添加一个按钮,单击后打开弹出窗口创建一个函数来选择 excel 文件创建打开所需 excel 文件的函数 定制 登录 S…...

人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍
大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍,随着人工智能和深度学习技术的飞速发展,文本到视频生成已经成为计算机视觉领域中一个重…...

C/C++面试常见问题——指针和引用的区别
首先想要理解指针和引用的区别,我们要明确什么是指针,什么是引用 一,指针和引用的基本概念及特性 指针是一个特殊变量,其中存储着所指向变量的地址 指针主要有以下特性: 1. 在使用时需要*解引用 2. sizeof(指针)的…...

探索DeFi世界,MixGPT引领智能金融新时代
随着区块链技术的迅猛发展,DeFi(去中心化金融)正成为金融领域的新宠。在这个充满活力的领域里,MixTrust站在创新的前沿,推出了一款引领智能金融新时代的核心技术——MixGPT。 MixGPT:引领智能金融体验的大型…...

留学教育咨询机构如何通过软文强势突围
近年来留学市场逐渐回暖,但是行业竞争也更加激烈,留学教育咨询机构想要在激烈的市场竞争中强势突围,除了优秀的职业素养,专业的服务态度外,还需要具备品牌形象打造和推广的能力,也有不少留学机构找盒子进行…...

苹果平板可以用别的电容笔吗?电容笔和Apple pencil区别
和苹果原装的Pencil相比,这种平替的电容笔并没具备重力压感,只有一种倾斜的压感功能。如果你不经常用来作画,一支普通的电容笔就足够了。不管是用来记笔记,还是用来解决一些数学问题,都能用得上。再说了,即…...

【Matlab笔记_16】yyyy-MM-dd HH:mm:ss的datetime格式拆分为yyyy-MM-dd日期部分和HH:mm:ss时间部分
实例:需要拆分的时间为’2002-04-17 11:00:00’ 1拆分出 ‘2002-04-17’ % 假设datetime对象是 dt,例如: dt datetime(2002-04-17 11:00:00);% 使用dateshift提取日期部分 dateOnly dateshift(dt, start, day);% 显示提取的日期部分 disp…...

Android12之DRM架构(一)
简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…...

檀香香料经营商城小程序的作用是什么
檀香香料有安神、驱蚊、清香等作用,办公室或家庭打坐等场景,都有较高的使用频率,不同香料也有不同效果,高品质香料檀香也一直受不少消费者欢迎。 线下流量匮乏,又难以实现全消费路径完善,线上是商家增长必…...

RPA在票据处理中的应用
随着大中型企业的数字化转型进程加速,企业财务方面每天都存在大量票据需要处理,包括发票、收据、报销单等。传统的票据处理流程通常繁琐、耗时且容易出错,重复且枯燥的工作消耗了财务人员宝贵的时间和精力,也增加了企业的人力成本…...

Jmeter接口测试 —— jmeter对图片验证码的处理
jmeter对图片验证码的处理 在web端的登录接口经常会有图片验证码的输入,而且每次登录时图片验证码都是随机的;当通过jmeter做接口登录的时候要对图片验证码进行识别出图片中的字段,然后再登录接口中使用; 通过jmeter对图片验证码…...

minikube创建一个pod并暴露端口(使用docker驱动安装)
因为minikube使用service暴露端口是使用nodeIP:nodePort 而不是 localhost:nodePort 公开访问。我们只能使用kubectl的端口转发功能或者使用iptables的转发功能来实现外网服务暴露。 我这里使用shiro来举例 apiVersion: apps/v1 kind: Deployment metadata:name: shiro550 spe…...

2023国考证件照要求什么底色?证件照换背景底色的方法
2023年国家公务员考试报名已经开始了,我们在考试平台提交报名信息的时候,有一项就是需要上传证件照片,对于证件照片也会有具体的要求,比如背景底色、尺寸大小、dpi和kb大小。今天就为大家详细介绍一下关于国考证件照背景色的内容&…...

【SA8295P 源码分析 (一)】87 - SA8295P HQNX + Android 编译环境搭建指导
【SA8295P 源码分析 一】87 - SA8295P HQNX + Android 编译环境搭建指导 一、Android 编译环境搭建:Android + sa8295p-hqx-4-2-4-0_hlos_dev_la.tar.gz1.1 更新 Ubuntu 18.04 源路径1.2 安装基础编译环境1.3 设置JDK8 的环境变量1.4 配置sh为bash(默认为dash)1.5 Android 编…...

网络基本结构及数据传输方式
nternet 网络基本结构及数据传输方式根据传统的网络结构,用户的访问流程基本如下: 用户在自己的浏览器中输入要访问的网站的域名 浏览器向本地DNS请求对该域名的解析 本地DNS将请求发到网站授权的DNS服务器。 授权DNS将服务器的IP地址作为解析结果送给本…...

从实体经济和数字经济融合展开,思考商业模式的变化
对于《关于构建数据基础制度更好发挥数据要素作用的意见》想必大家已经不陌生了,之前的文章中也围绕数据要素说了很多东西,数据、数字化、数字经济之类的已经称得上是绝大部分人对未来发展方向的共识,不过今天想从这个《意见》出发࿰…...

Python 框架学习 Django篇 (四) 数据库增删改查(CURD)
在上一章结尾我们了解到如采用前后端开发分离的架构模式开发,后端几乎不负责任何展现界面的工作,只负责对数据进行管理 ,对数据的管理主要体现在: (增加、修改、删除、列出 )具体的接口参考大佬的文档BYSM…...

关于错误码
初学编程,在C语言中定义错误码,是使用宏: #define SUCCESS 0 //成功 #define FAILED 1 //失败 后来知道,用枚举更适合,因为宏的名声实在不好,而枚举可以帮你自动编号,减少…...

Linux | gcc/g++的使用
目录 前言 一、程序的翻译过程 1、预编译 2、编译 3、汇编 4、链接 (1)链接做了什么 (2)动态链接 (3)静态链接 (4)如何使用gcc进行动态链接和静态链接 前言 本章主要带着大…...