文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。
常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右,一般由四部分组成,包括一个LSC和一个SSC,以及二者之间的两个IR区。随着高通量测序技术的快速发展,利用叶绿体来研究细胞器的起源、结构、进化正受到越来越广泛的关注。
图1 具有代表性的金腰属叶绿体基因组图谱[1]
凌恩生物负责对每一个样本的叶绿体DNA(cpDNA)进行富集及抽提,有自主研发的细胞器提取技术,提取经验丰富。有专业团队负责跟进每一个项目,从细胞器DNA制备、Hiseq建库及测序、后续生物信息分析,直至为客户提供满意的结果。
本期主要介绍叶绿体基因组的一些高级分析内容。
1、共线性分析
共线性是指遗传学中的基因连锁关系,是不同物种染色体上同源基因以相同顺序排列的现象。两个物种之间的共线性程度可以作为衡量他们之间进化距离的尺度,可以知道物种间的亲缘关系。对基因组间的局部共线性块进行相似度、重排、倒置等现象的分析可以来阐述物种演化中发生的事件。
图2 叶绿体基因组mVista共线性分析
2、系统进化树分析
系统发育树(Phylogenetic tree)又称为系统进化树,是用一种类似树状分支的图形来概括各物种之间的亲缘关系,可用来描述物种之间的进化关系。通过系统进化树分析可以找出不同物种间的进化关系,理解祖先序列与其后代之间的关系,同时也可以估算一组共有共同祖先的物种间的分歧时间。
细胞器基因组非常保守,常用来构建系统发育进化树来研究动植物的物种分类和进化地位。凌恩生物构建细胞器系统发生树的方法有以下两种:
(1)基于样品与参考基因组的群体SNP矩阵构建进化树:对于每一个样本,按照相同顺序将所有SNP相连,获得相同长度的fasta格式的序列(其中一个为参考序列),作为输入文件用于进化树构建。
(2)基于Core基因构建进化树:对细胞器基因组鉴定出来的单拷贝Core基因,利用MUSCLE v3.8.31软件进行蛋白多序列的比对,比对结果用于进化树构建。
图3 基于cpPCGs+nrDNA矩阵的金腰属系统发育树[1]
3、选择压力分析
选择压力是指外界施加给某物种生物进化过程中的压力,使得物种适应自然环境。在遗传学中,ω= Ka/Ks或者dN/dS表示的是非同义突变(Ka)和同义突变(Ks)之间的比率。一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。通常认为,ω > 1表明有正选择(Positive Selection)效应,即有些有利突变正受到选择;ω = 1不受选择,即中性进化(Neutral Evolution);如果0 < ω < 1,则认为有纯化选择(Negative or Purifying Selection)作用,ω值越小,说明受到的负选择压越大,氨基酸序列越保守。
图4 金腰属的选择压力分析[1]
4、叶绿体基因组的IR区扩张与收缩
叶绿体基因组IR区指的是叶绿体基因组中2个反向重复区域(IRs)。叶绿体基因组的IR区域被认为是最保守的区域,但其边界区序列可能会向外延伸扩张,也可能向内部收缩,从而导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,这是叶绿体基因组进化中的共有现象,也是其长度变异的主因。
通过IR区的扩张与收缩研究,可以获悉导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,以此来描述造成不同谱系间叶绿体基因组大小差异的原因。
图5 IR区的扩张与收缩[2]
5、结构变异检测
细胞器基因组进行结构变异检测主要有三种:SNP、InDel和SV。与参考基因组比对,分析近源物种细胞器基因组之间的变异情况,能够更好的对个体或群体进行差异性分析。
SNP(单核苷酸多态性)是指由单个核苷酸的变异所引起的DNA序列多态性。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在编码基因内,也有可能在非编码序列上,位于编码区内的SNP(coding SNP,cSNP)因其可能影响个体的功能而备受关注。
InDel是DNA序列的插入(Insertion)和缺失(Deletion)现象的总称,狭义的InDel表示1~10bp的短InDel。在基因组编码区域,InDel的发生可能会引起移码突变、氨基酸改变、假基因的出现等等现象。这里分析的是狭义的InDel。
基因组结构变异(SV,Structural Variation)通常是指基因组内DNA片段缺失、插入、重复、倒位、异位。使用MUMmer软件对目标基因组和参考基因组进行比对,再使用LASTZ对区域间进行比对,从区域比对结果中查找SV。
图6 全基因组结构变异类型配对图
6、核苷酸多态性(Pi)分析
核苷酸多态性(Pi)是衡量特定群体多态性高低的参数,是指在同一群体中随机挑选的两条DNA序列在各个核首酸位点上核昔酸差异的均值。核苷酸多态性(Pi)能揭示不同物种核酸序列的变异大小,变异度较高的区域可以为种群遗传学提供潜在的分子标记。例:基因和基因间区的核苷酸多样性分析。
图7 44个金腰属物种cp基因组的核苷酸多样性(Pi)分析[1]
7、共有基因和特有基因分析
所有样本中都存在的同源基因称为“共有基因”(core gene),去掉共有基因后得到的为非共有基因(Dispensable gene),特有基因(specific gene)为只有该样本特异拥有的基因。共有基因和特有基因很有可能与样品的共性和特性相对应,可以作为样本间功能差异的研究依据。
图8 Core-Pan基因稀释曲线
图9 基因组的共有/特有基因数
8、密码子偏好性分析
某一特定密码子在编码对应氨基酸的同义密码子中的相对概率,可以反应密码子的偏好性程度。通过计算Relative synonymous codon usage(RSCU)获得密码子的偏好性值。研究密码子的使用模式,对于探明物种进化压力以及进一步的遗传研究都有重要的意义。
图10 乌头属物种密码子偏好性分析[3]
9、简单重复序列SSR分析
简单重复序列(simple sequence repeat, SSR)又称作微卫星序列(microsatellite, MS),是一类由1-6个核苷酸为基本单位多次重复而形成的DNA片段。SSR数量丰富、多态性高、均匀覆盖整个基因组、呈共显性遗传且检测简单,因此被作为第二代分子标记广泛应用于遗传图谱构建、目标基因定位、遗传多样性研究、分子辅助育种、种质资源鉴定等领域。
图11 姜科植物叶绿体基因组的简单序列重复序列(SSR)分析[3]
10、重复序列分析
重复序列被认为在基因组重组和重排中起重要作用,并且在某些群体中也包含有系统发育信息。叶绿体基因组的重复序列包括串联和散在重复,其中散在重复又称为长重复序列,分为:正向重复(forward repeat)、反向重复(reverse repeat)、回文重复(palindromic repeat)和互补重复(complement repeat)四种类型。
图12 长重复序列分类图
参考文献
[1] A Comprehensive Analysis of Chloroplast Genome Provides New Insights into the Evolution of the Genus Chrysosplenium. International Journal of Molecular Sciences, 2023.
[2] Complete chloroplast genomes provide insights into evolution and phylogeny of Zingiber (Zingiberaceae). BMC Genomics, 2023.
[3] Comparative Analysis of the Chloroplast Genome for Aconitum Species: Genome Structure and Phylogenetic Relationships. Frontiers in Genetics, 2022.
相关文章:

文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。 常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右…...
阿里实习JAVA后端面经总结
暑期实习面试阿里Java后端岗位的一面的面经。 主要拷打了项目+Java 集合+Java并发+网络+mysql,一场面试大概问了 20 个题目,问的还是比较基础,不算太难。 问题记录 简历上有两个项目,选一个你比较熟悉的介绍 (略) 项目用到了哪个线程实现类? 用了ScheduledThreadP…...
利用 NLP 超能力:一步步介绍Hugging Face微调教程
导入必要的库 导入必要的库类似于为特定编程和数据分析活动构建工具包。这些库通常是预先编写的代码集合,提供广泛的功能和工具,有助于加快开发速度。开发人员和数据科学家可以通过导入适当的库来访问新功能、提高生产力并使用现有解决方案。 import pandas as pd import n…...

凝聚技术力量 共建测试生态 ——集成电路测试技术交流日成功举办
10月18日下午,凝聚技术力量,共建测试生态 ——集成电路测试技术交流会在上海成功举办。来自全国各地知名专家学者、技术大咖及企业代表齐聚一堂,共同探讨封装测试技术的发展方向,共话产业未来,共促产业发展。 本次活动…...

机器学习-ROC曲线:技术解析与实战应用
目录 一、引言ROC曲线简介 二、ROC曲线的历史背景二战雷达信号检测在医学和机器学习中的应用横跨多个领域的普及 三、数学基础True Positive Rate(TPR)与False Positive Rate(FPR)True Positive Rate(TPR)F…...

macos平台好用的FTP客户端 Transmit 5最新中文
Transmit 5是一款Mac平台上的FTP(文件传输协议)客户端软件,它可以让用户方便地在不同的计算机之间传输文件,例如从本地计算机上传或下载文件到远程服务器。以下是Transmit 5的一些主要功能和特点: 用户友好的界面:Transmit 5具有…...

用JavaScript输出0-9的两种方法、以及setTimeout的三个参数的意义
方法一: for (let i 0; i < 10; i) {setTimeout(() > {console.log(i);}, 1000) } 方法二:利用 setTimeout 函数的第三个参数,会作为回调函数的第一个参数传入 for (var i 0; i < 10; i) {setTimeout(i > {console.log(i);…...

酷鸟云近期主要新功能合集
近期,根据用户需求,酷鸟云上线了一系列新功能,让大家在使用过程中,更加灵活和高效。 1、仿真指纹功能优化 酷鸟云内置的专业防关联浏览器的仿真指纹功能,可以解决注册谷歌账号/谷歌邮箱(Gmail)…...

【大数据开发技术】实验06-SequenceFile、元数据操作与MapReduce单词计数
文章目录 SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附:系列文章 SequenceFile、元数据操作与MapReduce单词计数 一、实验目标 熟练掌握hadoop操作指令及HDFS命令行接口掌握HDFS SequenceFile读写操作掌握Map…...

【C语言】输入一个正整数,判断其是否为素数
1、素数又叫质数。素数,指的是“大于1的整数中,只能被1和这个数本身整除的数”。 2、素数也可以被等价表述成:“在正整数范围内,大于1并且只有1和自身两个约数的数”。 #include<stdio.h>int main() {int i,m;printf("…...

2023年Q3季度国内手机大盘销额下滑2%,TOP品牌销售数据分析
根据Canalys机构发布的最新报告,2023年第三季度,全球智能手机市场出货量仅下跌1%,可以认为目前全球手机市场的下滑势头有所减缓。而国内线上市场的表现也类似。 根据鲸参谋数据显示,今年Q3京东平台手机累计销量约1100万件…...

使用按钮从 SAP 系统内打开 Excel 文件
了解如何通过 SAP 屏幕上创建的按钮打开所需的 Excel 文件。为了演示这一点,将指导您完成以下步骤。 使用 del 命令删除 SAP 上不必要的元素添加一个按钮,单击后打开弹出窗口创建一个函数来选择 excel 文件创建打开所需 excel 文件的函数 定制 登录 S…...

人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍
大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍,随着人工智能和深度学习技术的飞速发展,文本到视频生成已经成为计算机视觉领域中一个重…...

C/C++面试常见问题——指针和引用的区别
首先想要理解指针和引用的区别,我们要明确什么是指针,什么是引用 一,指针和引用的基本概念及特性 指针是一个特殊变量,其中存储着所指向变量的地址 指针主要有以下特性: 1. 在使用时需要*解引用 2. sizeof(指针)的…...

探索DeFi世界,MixGPT引领智能金融新时代
随着区块链技术的迅猛发展,DeFi(去中心化金融)正成为金融领域的新宠。在这个充满活力的领域里,MixTrust站在创新的前沿,推出了一款引领智能金融新时代的核心技术——MixGPT。 MixGPT:引领智能金融体验的大型…...

留学教育咨询机构如何通过软文强势突围
近年来留学市场逐渐回暖,但是行业竞争也更加激烈,留学教育咨询机构想要在激烈的市场竞争中强势突围,除了优秀的职业素养,专业的服务态度外,还需要具备品牌形象打造和推广的能力,也有不少留学机构找盒子进行…...

苹果平板可以用别的电容笔吗?电容笔和Apple pencil区别
和苹果原装的Pencil相比,这种平替的电容笔并没具备重力压感,只有一种倾斜的压感功能。如果你不经常用来作画,一支普通的电容笔就足够了。不管是用来记笔记,还是用来解决一些数学问题,都能用得上。再说了,即…...
【Matlab笔记_16】yyyy-MM-dd HH:mm:ss的datetime格式拆分为yyyy-MM-dd日期部分和HH:mm:ss时间部分
实例:需要拆分的时间为’2002-04-17 11:00:00’ 1拆分出 ‘2002-04-17’ % 假设datetime对象是 dt,例如: dt datetime(2002-04-17 11:00:00);% 使用dateshift提取日期部分 dateOnly dateshift(dt, start, day);% 显示提取的日期部分 disp…...

Android12之DRM架构(一)
简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…...

檀香香料经营商城小程序的作用是什么
檀香香料有安神、驱蚊、清香等作用,办公室或家庭打坐等场景,都有较高的使用频率,不同香料也有不同效果,高品质香料檀香也一直受不少消费者欢迎。 线下流量匮乏,又难以实现全消费路径完善,线上是商家增长必…...
FFmpeg 低延迟同屏方案
引言 在实时互动需求激增的当下,无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作,还是游戏直播的画面实时传输,低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架,凭借其灵活的编解码、数据…...
【Java学习笔记】Arrays类
Arrays 类 1. 导入包:import java.util.Arrays 2. 常用方法一览表 方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序(自然排序和定制排序)Arrays.binarySearch()通过二分搜索法进行查找(前提:数组是…...

Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
python报错No module named ‘tensorflow.keras‘
是由于不同版本的tensorflow下的keras所在的路径不同,结合所安装的tensorflow的目录结构修改from语句即可。 原语句: from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后: from tensorflow.python.keras.lay…...
C#中的CLR属性、依赖属性与附加属性
CLR属性的主要特征 封装性: 隐藏字段的实现细节 提供对字段的受控访问 访问控制: 可单独设置get/set访问器的可见性 可创建只读或只写属性 计算属性: 可以在getter中执行计算逻辑 不需要直接对应一个字段 验证逻辑: 可以…...

如何更改默认 Crontab 编辑器 ?
在 Linux 领域中,crontab 是您可能经常遇到的一个术语。这个实用程序在类 unix 操作系统上可用,用于调度在预定义时间和间隔自动执行的任务。这对管理员和高级用户非常有益,允许他们自动执行各种系统任务。 编辑 Crontab 文件通常使用文本编…...
苹果AI眼镜:从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会
在2025年的AI硬件浪潮中,苹果AI眼镜(Apple Glasses)正在引发一场关于“人机交互形态”的深度思考。它并非简单地替代AirPods或Apple Watch,而是开辟了一个全新的、日常可接受的AI入口。其核心价值不在于功能的堆叠,而在于如何通过形态设计打破社交壁垒,成为用户“全天佩戴…...
从面试角度回答Android中ContentProvider启动原理
Android中ContentProvider原理的面试角度解析,分为已启动和未启动两种场景: 一、ContentProvider已启动的情况 1. 核心流程 触发条件:当其他组件(如Activity、Service)通过ContentR…...
第八部分:阶段项目 6:构建 React 前端应用
现在,是时候将你学到的 React 基础知识付诸实践,构建一个简单的前端应用来模拟与后端 API 的交互了。在这个阶段,你可以先使用模拟数据,或者如果你的后端 API(阶段项目 5)已经搭建好,可以直接连…...
土建施工员考试:建筑施工技术重点知识有哪些?
《管理实务》是土建施工员考试中侧重实操应用与管理能力的科目,核心考查施工组织、质量安全、进度成本等现场管理要点。以下是结合考试大纲与高频考点整理的重点内容,附学习方向和应试技巧: 一、施工组织与进度管理 核心目标: 规…...