ATAC-seq 数据分析实战
文章目录
- 一、 ATAC-seq原理和基础知识
- 1. ATAC-seq原理
- 2. Tn5转座子
- 1. 转座概念
- 2. 参与分子
- 1. 转座子
- (1) 简化的转座子结构
- (2) Tn5转座子的结构
- 2. 转座酶
- 3. 转座过程
- 二、数据比对和过滤
一、 ATAC-seq原理和基础知识
1. ATAC-seq原理
真核生物的DNA并不是裸漏的,而是组蛋白和染色体/染色质结合。DNA一圈一圈的缠绕在8个组蛋白上,形成核小体。一个个核小体构成串珠式的结构,然后进一步折叠、聚合,并在其他架构蛋白的协助下,形成染色体。经过一系列操作就将超长的DNA链,折叠成很小的结构,塞进小小的细胞核内。
基因的转录,需要将DNA的高级结构打开,但是不需要DNA链全部解开,只需要打开一部分,也就是基因表达的区域解开即可。这一过程,主要由染色体组蛋白的修饰(尤其是乙酰化)来实现的。这部分打开的染色质,就叫做开放染色质(染色体和染色质是同一种物质的两种形态,染色质是伸展状态,染色体是高度螺旋的状态)。而染色质一旦打开,就允许一些调控蛋白(比如转录因子)跑过来与之结合。而染色质的这种特性,就叫做染色质的可及性,所以说染色质的可及性反应的是调控因子与开放染色质结合的状态,与转录调控密切相关。
ATAC-seq是如何找开放染色质区域的呢?
使用了转座酶Tn5:DNA转座是一种由DNA转座酶介导,把DNA序列从染色体的一个区域插入到另一个区域的现象,类似”粘贴复制“。这个过程也是需要插入位点的染色质是开放的。
既然转座酶Tn5容易结合在开放染色质上,只要人为的将NGS接头连接到转座酶,携带这些接头的转座酶进入细胞核后,切开染色质开放区域,使染色质断裂并将这些接头插入到开放的染色质区域中,这样裂解细胞、破碎DNA后,利用已知序列的测序标签进行NGS测序,就知道哪些区域是开放区域了。
2. Tn5转座子
1. 转座概念
可移动的DNA片段即可移动因子在基因组上自由转移称为转座,DNA与所插入的基因位点可以是非同源的。转座是产生基因多样性的重要机制,可移动因子可产生插入、缺失、倒置以及染色体融合突变。
转座需要通过转座酶来催化。原核生物的转座分为两种方式,复制转座和保守转座:
- 复制转座的供体DNA完整,把通过复制的DNA片段插入基因位点上
- 保守转座则是从供体DNA上分离一段DNA,以转座酶为中介,连接到目标DNA上而实现的
2. 参与分子
- 转座子(Transposon) : 可移动DNA片段
- 转座酶(Transposase / TNP):催化转座的蛋白质;野生型Tn5转座酶是一种活性极低的蛋白质
- 目标DNA(Target DNA): 可以与转座子在同一个DNA分子上,甚至转座子内;或在另一个DNA分子上
1. 转座子
(1) 简化的转座子结构
包含合成Tnp的DNA序列,两个19bp长的末端以及任意DNA序列。
- 末端是两个19bp长的片段,将Tnp和任意DNA序列包含在其中。
- 常见的末端有三种:外末端(outside end / OE),内末端(inside end / IE)和镶嵌性尾端(mosaic end / ME)。组合方式有两个反向的OE,或者两个反向的IE,或两个反向的ME,又或是两组反向的 OE和IE组合
(2) Tn5转座子的结构
Tn5转座子由两个反向的插入片段 IS50 以及两组 OE 和 IE 构成
- IS50 包括三个抗生素抗性基因。 IS50R 负责编码 Tnp 和转座抑制物(Inh),而 IS50L 负责编码两个低活性蛋白
IS(insertion sequence): 插入序列,很小(< 2.5 kb)DNA片段,可以在不同的基因位点跳跃,或自我复制。通常存在于细菌与古细菌基因中,但也存在于真核生物的转座元素中。编码的基因一般只与移动有关。
2. 转座酶
- Tn5 Tnp是一种转座酶,可以将DNA片段从一个位置移动到另一个位置,来自大肠杆菌,全长477个氨基酸。
- Tn5 Tnp可以与特异性DNA识别和结合,特异性DAN是指Tn5或IS50的末端反向重复序列。
- Tn5 Tnp的主要功能区有三个,N末端、催化结构域和C末端:
1. N末端是特异性结合DNA结构域,可以识别和结合Tn5或IS50的末端反向重复序列
2. 催化结构域是转座反应的核心,可以切割和连接DNA,并形成双聚体
3. C末端是合成复合体的必需部分,可以促进Tn5 Tnp之间的相互作用,并影响转座效率
3. 转座过程
Tn5转座对目标DNA的特异性要求不高,可以插入到任何双链DNA上。但是,Tn5也有一些偏好性,比如倾向于插入到AT富的区域,或者靠近某些特定的序列。Tn5转座酶(Tnp)的突变也可以改变其对目标DNA的结合特异性和亲和力
二、数据比对和过滤
相关文章:

ATAC-seq 数据分析实战
文章目录一、 ATAC-seq原理和基础知识1. ATAC-seq原理2. Tn5转座子1. 转座概念2. 参与分子1. 转座子(1) 简化的转座子结构(2) Tn5转座子的结构2. 转座酶3. 转座过程二、数据比对和过滤一、 ATAC-seq原理和基础知识 1. ATAC-seq原…...

设计模式-第13章(状态模式)
状态模式状态模式状态模式的好处和用处工作状态状态模式 状态模式(State),当一个对象的内在状态改变时允许改变其行为,这个对象看起来像是改变了其类。 状态模式主要解决的是当控制一个对象状态转换的条件表达式过于复杂时的情况…...

ReentrantLock源码分析(一)加锁流程分析
一、ReetrantLock的使用示例 static ReentrantLock lock new ReentrantLock(); public static void main(String[] args) throws InterruptedException { new Thread(ClassLayOutTest::reentrantLockDemo, "threadA").start(); Thread.sleep(1000);…...

【C++】list的模拟实现
文章目录1.list 底层2. list的模拟实现1. list_node 类设计2. list类如何调用类型3 .push_back(正常实现)4. 迭代器的实现第一个模板参数Tconst迭代器第二个模板参数Ref第三个模板参数Ptr对list封装的理解5. insert6.push_back与 push_front(复用)7. erase8. pop_back与pop_fro…...
Python连接es笔记三之es更新操作
这一篇笔记介绍如何使用 Python 对数据进行更新操作。 对于 es 的更新的操作,不用到 Search() 方法,而是直接使用 es 的连接加上相应的函数来操作,本篇笔记目录如下: 获取连接update()update_by_query()批量更新UpdateByQuery()…...

哪个牌子的蓝牙耳机音质好?音质比较好的蓝牙耳机排名
蓝牙耳机经过多年发展,无论是在外观设计还是性能配置上都有很大的进步,越来越多的蓝牙耳机开始注重音质表现,逐渐有HIFI音质、无损音质出现在大众视野。那么哪个牌子的蓝牙耳机音质好?接下来,我来给大家分享几款音质比…...

Qt实用技巧:Qt中浮点数的相等比较方式(包括单精度和双精度)
若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/129464152 红胖子(红模仿)的博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软…...
【数据结构初阶】双向循环链表
目录一.链表的分类二.与单链表相比三.实现增删查改1.双向循环链表结构的创建2.创建新节点3.初始化链表4.头插和尾插5.判断链表是否为空6.头删和尾删7.打印函数8.查找函数9.删除pos位置节点10.在pos前位置插入数据11.优化升级一.链表的分类 链表可有根据单向双向、有无哨兵位、…...
0104BeanDefinition合并和BeanClass加载-Bean生命周期详解-spring
文章目录1 前言2 BeanDefinition合并2.1 BeanDefinition合并在做什么?2.2 BeanDefinition怎么合并2.3 示例演示3 Bean Class 加载后记1 前言 下面要介绍的阶段,都是在调用getBean()从容器中获取bean对象的过程中发生的操作,我们需要更多的去…...

Java集合进阶(三)
文章目录一、Map1. 概述2. 基本功能3. 遍历4. 遍历学生对象5. 集合嵌套6. 统计字符出现次数二、Collections1. 常用方法2. 学生对象排序三、模拟斗地主一、Map 1. 概述 Interface Map<K, V>:K 是键的类型,V 是值的类型。 将键映射到值的对象&…...

【网络】什么是RPC?RPC与HTTP有什么关系?
文章目录RPC是什么RPC和HTTP的关系和区别[附]关于REST论文中提到的"HTTP不是RPC"重点参考 凤凰架构-远程过程调用 既然有HTTP为什么还要有RPC? RPC是什么 RPC(Remote Procedure Call):即远程过程调用,目的是为了让计算机能够跟调用…...

[手撕数据结构]栈的深入学习-java实现
CSDN的各位uu们你们好,今天千泽带来了栈的深入学习,我们会简单的用代码实现一下栈, 接下来让我们一起进入栈的神奇小世界吧!0.速览文章一、栈的定义1. 栈的概念2. 栈的图解二、栈的模拟实现三.栈的经典使用场景-逆波兰表达式总结一、栈的定义 1. 栈的概念 栈:一种…...

2.线性表的顺序表示
数据结构很重要! 数据结构很重要!!! 数据结构很重要!!!! 思考 1.线性表的顺序表示内容有哪些?(What) 2.为什么要学线性表的顺序表示? ? (Why)…...

eps文件删除了能恢复吗?恢复误删eps文件的三种方法
eps文件格式专为矢量图像和图形而设计。虽然没有被广泛使用,但它仍然受到各种插画家和平面设计师的钟爱。eps文件十分适合创建徽标和商标设计,主要应用见于广告牌、海报和横幅。可是在使用设备过程中,难免会遇到数据丢失问题,如果…...
【C++】运算符重载练习——Date 类
文章目录👉日期类介绍👈👉日期类实现👈📕 成员变量📕 构造函数📕 对应月份天数📕 赋值重载📕 比较运算符重载📕 计算 运算符重载👉源代码…...

Redis学习(13)之Lua脚本【环境准备】
文章目录一 Lua入门环境准备1.1 Lua简介1.2 Linux 系统安装Lua1.2.1 Lua 下载1.2.2 Lua 安装1.3 Hello World1.3.1 命令行模式1.3.2 脚本文件模式1.3.3 两种脚本运行方式1.4 Win安装Lua1.4.1 LuaForWindows的安装1.4.2 SciTE修改字体大小1.4.3 SciTE中文乱码1.4.4 SciTE快捷键工…...

关于BLE的一些知识总结
数据包长度对于BLE4.0/4.1来说,一个数据包的有效载荷最大为20字节对于BLE4.2以上,数据包的有效载荷扩大为251字节传输速率在不考虑跳频间隔的情况下,最大传输速率为:1)BLE4.0/4.1的理论吞吐率为39kb/s;2&am…...

Spring框架源码分析一
如何看源码(方法论)不要忽略源码中的注释使用翻译工具先梳理脉络,然后梳理细节即总分总,先总体过一遍,再看细节,再做一个总结大胆猜测(8分靠猜),小心验证,再调…...

CSS常用内容总结(扫盲)
文章目录前言相关概念【了解】脚本语言什么是脚本语言脚本语言有什么特点常见的脚本语言什么是动态语言,什么是静态语言动态语言和静态语言两者之间有何区别CSSCSS是什么CSS的特点一、CSS代码怎么写基本语法规则引入方式内部样式内联样式表外部样式代码风格二、CSS的…...

Java启蒙之语言基础
目录 一.Java标识符和关键字 1.1Java标识符 1.2Java关键字 二.数据类型和变量的概述和关系 2.1Java变量 2.2Java的数据类型 2.2.1数据类型的分类的概述 2.2.2数据类型的转换 3.Java运算符 总结 😽个人主页:tq02的博客_CSDN博客-领域博主 &#…...

XCTF-web-easyupload
试了试php,php7,pht,phtml等,都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接,得到flag...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...

label-studio的使用教程(导入本地路径)
文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...
椭圆曲线密码学(ECC)
一、ECC算法概述 椭圆曲线密码学(Elliptic Curve Cryptography)是基于椭圆曲线数学理论的公钥密码系统,由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA,ECC在相同安全强度下密钥更短(256位ECC ≈ 3072位RSA…...

Day131 | 灵神 | 回溯算法 | 子集型 子集
Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣(LeetCode) 思路: 笔者写过很多次这道题了,不想写题解了,大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...
MVC 数据库
MVC 数据库 引言 在软件开发领域,Model-View-Controller(MVC)是一种流行的软件架构模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种模式有助于提高代码的可维护性和可扩展性。本文将深入探讨MVC架构与数据库之间的关系,以…...
适应性Java用于现代 API:REST、GraphQL 和事件驱动
在快速发展的软件开发领域,REST、GraphQL 和事件驱动架构等新的 API 标准对于构建可扩展、高效的系统至关重要。Java 在现代 API 方面以其在企业应用中的稳定性而闻名,不断适应这些现代范式的需求。随着不断发展的生态系统,Java 在现代 API 方…...
前端高频面试题2:浏览器/计算机网络
本专栏相关链接 前端高频面试题1:HTML/CSS 前端高频面试题2:浏览器/计算机网络 前端高频面试题3:JavaScript 1.什么是强缓存、协商缓存? 强缓存: 当浏览器请求资源时,首先检查本地缓存是否命中。如果命…...
【实施指南】Android客户端HTTPS双向认证实施指南
🔐 一、所需准备材料 证书文件(6类核心文件) 类型 格式 作用 Android端要求 CA根证书 .crt/.pem 验证服务器/客户端证书合法性 需预置到Android信任库 服务器证书 .crt 服务器身份证明 客户端需持有以验证服务器 客户端证书 .crt 客户端身份…...

Copilot for Xcode (iOS的 AI辅助编程)
Copilot for Xcode 简介Copilot下载与安装 体验环境要求下载最新的安装包安装登录系统权限设置 AI辅助编程生成注释代码补全简单需求代码生成辅助编程行间代码生成注释联想 代码生成 总结 简介 尝试使用了Copilot,它能根据上下文补全代码,快速生成常用…...