文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。
常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右,一般由四部分组成,包括一个LSC和一个SSC,以及二者之间的两个IR区。随着高通量测序技术的快速发展,利用叶绿体来研究细胞器的起源、结构、进化正受到越来越广泛的关注。

图1 具有代表性的金腰属叶绿体基因组图谱[1]
凌恩生物负责对每一个样本的叶绿体DNA(cpDNA)进行富集及抽提,有自主研发的细胞器提取技术,提取经验丰富。有专业团队负责跟进每一个项目,从细胞器DNA制备、Hiseq建库及测序、后续生物信息分析,直至为客户提供满意的结果。
本期主要介绍叶绿体基因组的一些高级分析内容。
1、共线性分析
共线性是指遗传学中的基因连锁关系,是不同物种染色体上同源基因以相同顺序排列的现象。两个物种之间的共线性程度可以作为衡量他们之间进化距离的尺度,可以知道物种间的亲缘关系。对基因组间的局部共线性块进行相似度、重排、倒置等现象的分析可以来阐述物种演化中发生的事件。

图2 叶绿体基因组mVista共线性分析
2、系统进化树分析
系统发育树(Phylogenetic tree)又称为系统进化树,是用一种类似树状分支的图形来概括各物种之间的亲缘关系,可用来描述物种之间的进化关系。通过系统进化树分析可以找出不同物种间的进化关系,理解祖先序列与其后代之间的关系,同时也可以估算一组共有共同祖先的物种间的分歧时间。
细胞器基因组非常保守,常用来构建系统发育进化树来研究动植物的物种分类和进化地位。凌恩生物构建细胞器系统发生树的方法有以下两种:
(1)基于样品与参考基因组的群体SNP矩阵构建进化树:对于每一个样本,按照相同顺序将所有SNP相连,获得相同长度的fasta格式的序列(其中一个为参考序列),作为输入文件用于进化树构建。
(2)基于Core基因构建进化树:对细胞器基因组鉴定出来的单拷贝Core基因,利用MUSCLE v3.8.31软件进行蛋白多序列的比对,比对结果用于进化树构建。

图3 基于cpPCGs+nrDNA矩阵的金腰属系统发育树[1]
3、选择压力分析
选择压力是指外界施加给某物种生物进化过程中的压力,使得物种适应自然环境。在遗传学中,ω= Ka/Ks或者dN/dS表示的是非同义突变(Ka)和同义突变(Ks)之间的比率。一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。通常认为,ω > 1表明有正选择(Positive Selection)效应,即有些有利突变正受到选择;ω = 1不受选择,即中性进化(Neutral Evolution);如果0 < ω < 1,则认为有纯化选择(Negative or Purifying Selection)作用,ω值越小,说明受到的负选择压越大,氨基酸序列越保守。

图4 金腰属的选择压力分析[1]
4、叶绿体基因组的IR区扩张与收缩
叶绿体基因组IR区指的是叶绿体基因组中2个反向重复区域(IRs)。叶绿体基因组的IR区域被认为是最保守的区域,但其边界区序列可能会向外延伸扩张,也可能向内部收缩,从而导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,这是叶绿体基因组进化中的共有现象,也是其长度变异的主因。
通过IR区的扩张与收缩研究,可以获悉导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,以此来描述造成不同谱系间叶绿体基因组大小差异的原因。

图5 IR区的扩张与收缩[2]
5、结构变异检测
细胞器基因组进行结构变异检测主要有三种:SNP、InDel和SV。与参考基因组比对,分析近源物种细胞器基因组之间的变异情况,能够更好的对个体或群体进行差异性分析。
SNP(单核苷酸多态性)是指由单个核苷酸的变异所引起的DNA序列多态性。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在编码基因内,也有可能在非编码序列上,位于编码区内的SNP(coding SNP,cSNP)因其可能影响个体的功能而备受关注。
InDel是DNA序列的插入(Insertion)和缺失(Deletion)现象的总称,狭义的InDel表示1~10bp的短InDel。在基因组编码区域,InDel的发生可能会引起移码突变、氨基酸改变、假基因的出现等等现象。这里分析的是狭义的InDel。
基因组结构变异(SV,Structural Variation)通常是指基因组内DNA片段缺失、插入、重复、倒位、异位。使用MUMmer软件对目标基因组和参考基因组进行比对,再使用LASTZ对区域间进行比对,从区域比对结果中查找SV。

图6 全基因组结构变异类型配对图
6、核苷酸多态性(Pi)分析
核苷酸多态性(Pi)是衡量特定群体多态性高低的参数,是指在同一群体中随机挑选的两条DNA序列在各个核首酸位点上核昔酸差异的均值。核苷酸多态性(Pi)能揭示不同物种核酸序列的变异大小,变异度较高的区域可以为种群遗传学提供潜在的分子标记。例:基因和基因间区的核苷酸多样性分析。

图7 44个金腰属物种cp基因组的核苷酸多样性(Pi)分析[1]
7、共有基因和特有基因分析
所有样本中都存在的同源基因称为“共有基因”(core gene),去掉共有基因后得到的为非共有基因(Dispensable gene),特有基因(specific gene)为只有该样本特异拥有的基因。共有基因和特有基因很有可能与样品的共性和特性相对应,可以作为样本间功能差异的研究依据。

图8 Core-Pan基因稀释曲线

图9 基因组的共有/特有基因数
8、密码子偏好性分析
某一特定密码子在编码对应氨基酸的同义密码子中的相对概率,可以反应密码子的偏好性程度。通过计算Relative synonymous codon usage(RSCU)获得密码子的偏好性值。研究密码子的使用模式,对于探明物种进化压力以及进一步的遗传研究都有重要的意义。

图10 乌头属物种密码子偏好性分析[3]
9、简单重复序列SSR分析
简单重复序列(simple sequence repeat, SSR)又称作微卫星序列(microsatellite, MS),是一类由1-6个核苷酸为基本单位多次重复而形成的DNA片段。SSR数量丰富、多态性高、均匀覆盖整个基因组、呈共显性遗传且检测简单,因此被作为第二代分子标记广泛应用于遗传图谱构建、目标基因定位、遗传多样性研究、分子辅助育种、种质资源鉴定等领域。

图11 姜科植物叶绿体基因组的简单序列重复序列(SSR)分析[3]
10、重复序列分析
重复序列被认为在基因组重组和重排中起重要作用,并且在某些群体中也包含有系统发育信息。叶绿体基因组的重复序列包括串联和散在重复,其中散在重复又称为长重复序列,分为:正向重复(forward repeat)、反向重复(reverse repeat)、回文重复(palindromic repeat)和互补重复(complement repeat)四种类型。


图12 长重复序列分类图
参考文献
[1] A Comprehensive Analysis of Chloroplast Genome Provides New Insights into the Evolution of the Genus Chrysosplenium. International Journal of Molecular Sciences, 2023.
[2] Complete chloroplast genomes provide insights into evolution and phylogeny of Zingiber (Zingiberaceae). BMC Genomics, 2023.
[3] Comparative Analysis of the Chloroplast Genome for Aconitum Species: Genome Structure and Phylogenetic Relationships. Frontiers in Genetics, 2022.
相关文章:
文章必备| 叶绿体基因组高级分析内容汇总
叶绿体普遍存在于植物体中,叶绿体基因组是一个典型的双链环状DNA分子,一个植物当中含有多个叶绿体,一个叶绿体中含有12个cpDNA分子。 常见的植物叶绿体基因组大小一般在150-160 kb左右,藻类会略小一些,在80-100 kb左右…...
阿里实习JAVA后端面经总结
暑期实习面试阿里Java后端岗位的一面的面经。 主要拷打了项目+Java 集合+Java并发+网络+mysql,一场面试大概问了 20 个题目,问的还是比较基础,不算太难。 问题记录 简历上有两个项目,选一个你比较熟悉的介绍 (略) 项目用到了哪个线程实现类? 用了ScheduledThreadP…...
利用 NLP 超能力:一步步介绍Hugging Face微调教程
导入必要的库 导入必要的库类似于为特定编程和数据分析活动构建工具包。这些库通常是预先编写的代码集合,提供广泛的功能和工具,有助于加快开发速度。开发人员和数据科学家可以通过导入适当的库来访问新功能、提高生产力并使用现有解决方案。 import pandas as pd import n…...
凝聚技术力量 共建测试生态 ——集成电路测试技术交流日成功举办
10月18日下午,凝聚技术力量,共建测试生态 ——集成电路测试技术交流会在上海成功举办。来自全国各地知名专家学者、技术大咖及企业代表齐聚一堂,共同探讨封装测试技术的发展方向,共话产业未来,共促产业发展。 本次活动…...
机器学习-ROC曲线:技术解析与实战应用
目录 一、引言ROC曲线简介 二、ROC曲线的历史背景二战雷达信号检测在医学和机器学习中的应用横跨多个领域的普及 三、数学基础True Positive Rate(TPR)与False Positive Rate(FPR)True Positive Rate(TPR)F…...
macos平台好用的FTP客户端 Transmit 5最新中文
Transmit 5是一款Mac平台上的FTP(文件传输协议)客户端软件,它可以让用户方便地在不同的计算机之间传输文件,例如从本地计算机上传或下载文件到远程服务器。以下是Transmit 5的一些主要功能和特点: 用户友好的界面:Transmit 5具有…...
用JavaScript输出0-9的两种方法、以及setTimeout的三个参数的意义
方法一: for (let i 0; i < 10; i) {setTimeout(() > {console.log(i);}, 1000) } 方法二:利用 setTimeout 函数的第三个参数,会作为回调函数的第一个参数传入 for (var i 0; i < 10; i) {setTimeout(i > {console.log(i);…...
酷鸟云近期主要新功能合集
近期,根据用户需求,酷鸟云上线了一系列新功能,让大家在使用过程中,更加灵活和高效。 1、仿真指纹功能优化 酷鸟云内置的专业防关联浏览器的仿真指纹功能,可以解决注册谷歌账号/谷歌邮箱(Gmail)…...
【大数据开发技术】实验06-SequenceFile、元数据操作与MapReduce单词计数
文章目录 SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附:系列文章 SequenceFile、元数据操作与MapReduce单词计数 一、实验目标 熟练掌握hadoop操作指令及HDFS命令行接口掌握HDFS SequenceFile读写操作掌握Map…...
【C语言】输入一个正整数,判断其是否为素数
1、素数又叫质数。素数,指的是“大于1的整数中,只能被1和这个数本身整除的数”。 2、素数也可以被等价表述成:“在正整数范围内,大于1并且只有1和自身两个约数的数”。 #include<stdio.h>int main() {int i,m;printf("…...
2023年Q3季度国内手机大盘销额下滑2%,TOP品牌销售数据分析
根据Canalys机构发布的最新报告,2023年第三季度,全球智能手机市场出货量仅下跌1%,可以认为目前全球手机市场的下滑势头有所减缓。而国内线上市场的表现也类似。 根据鲸参谋数据显示,今年Q3京东平台手机累计销量约1100万件…...
使用按钮从 SAP 系统内打开 Excel 文件
了解如何通过 SAP 屏幕上创建的按钮打开所需的 Excel 文件。为了演示这一点,将指导您完成以下步骤。 使用 del 命令删除 SAP 上不必要的元素添加一个按钮,单击后打开弹出窗口创建一个函数来选择 excel 文件创建打开所需 excel 文件的函数 定制 登录 S…...
人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍
大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型20-基于pytorch搭建文本生成视频的生成对抗网络,技术创新点介绍,随着人工智能和深度学习技术的飞速发展,文本到视频生成已经成为计算机视觉领域中一个重…...
C/C++面试常见问题——指针和引用的区别
首先想要理解指针和引用的区别,我们要明确什么是指针,什么是引用 一,指针和引用的基本概念及特性 指针是一个特殊变量,其中存储着所指向变量的地址 指针主要有以下特性: 1. 在使用时需要*解引用 2. sizeof(指针)的…...
探索DeFi世界,MixGPT引领智能金融新时代
随着区块链技术的迅猛发展,DeFi(去中心化金融)正成为金融领域的新宠。在这个充满活力的领域里,MixTrust站在创新的前沿,推出了一款引领智能金融新时代的核心技术——MixGPT。 MixGPT:引领智能金融体验的大型…...
留学教育咨询机构如何通过软文强势突围
近年来留学市场逐渐回暖,但是行业竞争也更加激烈,留学教育咨询机构想要在激烈的市场竞争中强势突围,除了优秀的职业素养,专业的服务态度外,还需要具备品牌形象打造和推广的能力,也有不少留学机构找盒子进行…...
苹果平板可以用别的电容笔吗?电容笔和Apple pencil区别
和苹果原装的Pencil相比,这种平替的电容笔并没具备重力压感,只有一种倾斜的压感功能。如果你不经常用来作画,一支普通的电容笔就足够了。不管是用来记笔记,还是用来解决一些数学问题,都能用得上。再说了,即…...
【Matlab笔记_16】yyyy-MM-dd HH:mm:ss的datetime格式拆分为yyyy-MM-dd日期部分和HH:mm:ss时间部分
实例:需要拆分的时间为’2002-04-17 11:00:00’ 1拆分出 ‘2002-04-17’ % 假设datetime对象是 dt,例如: dt datetime(2002-04-17 11:00:00);% 使用dateshift提取日期部分 dateOnly dateshift(dt, start, day);% 显示提取的日期部分 disp…...
Android12之DRM架构(一)
简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…...
檀香香料经营商城小程序的作用是什么
檀香香料有安神、驱蚊、清香等作用,办公室或家庭打坐等场景,都有较高的使用频率,不同香料也有不同效果,高品质香料檀香也一直受不少消费者欢迎。 线下流量匮乏,又难以实现全消费路径完善,线上是商家增长必…...
conda相比python好处
Conda 作为 Python 的环境和包管理工具,相比原生 Python 生态(如 pip 虚拟环境)有许多独特优势,尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处: 一、一站式环境管理:…...
Python:操作 Excel 折叠
💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 Python 操作 Excel 系列 读取单元格数据按行写入设置行高和列宽自动调整行高和列宽水平…...
Frozen-Flask :将 Flask 应用“冻结”为静态文件
Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是:将一个 Flask Web 应用生成成纯静态 HTML 文件,从而可以部署到静态网站托管服务上,如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...
P3 QT项目----记事本(3.8)
3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张(Windows/Linux)
要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况,可以通过以下几种方式模拟或触发: 1. 增加CPU负载 运行大量计算密集型任务,例如: 使用多线程循环执行复杂计算(如数学运算、加密解密等)。运行图…...
【前端异常】JavaScript错误处理:分析 Uncaught (in promise) error
在前端开发中,JavaScript 异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如 Promise、async/await 等),开发者常常会遇到 Uncaught (in promise) error 错误。这个错误是由于未正确处理 Promise 的拒绝(r…...
uniapp 实现腾讯云IM群文件上传下载功能
UniApp 集成腾讯云IM实现群文件上传下载功能全攻略 一、功能背景与技术选型 在团队协作场景中,群文件共享是核心需求之一。本文将介绍如何基于腾讯云IMCOS,在uniapp中实现: 群内文件上传/下载文件元数据管理下载进度追踪跨平台文件预览 二…...
ubuntu系统文件误删(/lib/x86_64-linux-gnu/libc.so.6)修复方案 [成功解决]
报错信息:libc.so.6: cannot open shared object file: No such file or directory: #ls, ln, sudo...命令都不能用 error while loading shared libraries: libc.so.6: cannot open shared object file: No such file or directory重启后报错信息&…...
【无标题】湖北理元理律师事务所:债务优化中的生活保障与法律平衡之道
文/法律实务观察组 在债务重组领域,专业机构的核心价值不仅在于减轻债务数字,更在于帮助债务人在履行义务的同时维持基本生活尊严。湖北理元理律师事务所的服务实践表明,合法债务优化需同步实现三重平衡: 法律刚性(债…...
