当前位置: 首页 > news >正文

Skewer v0.2.2安装与使用-生信工具43

01 Skewer 介绍

Skewer(来自于 SourceForge)实现了一种基于位掩码的 k-差异匹配算法,专门用于接头修剪,特别设计用于处理下一代测序(NGS)双端序列。

fastp安装及使用-fastp v0.23.4(bioinfomatics tools-002)-CSDN博客

特性

  • 检测并去除接头序列
  • 支持模式匹配中的插入和删除
  • 适用于单端、双端(PE)和长配对(LMP)读取
  • 对带条形码的测序结果进行去重
  • 支持多线程
  • 基于 Phred 质量分数进行修剪
  • 支持条形码和接头中的 IUPAC 字符
  • 支持压缩输入和输出
  • 支持从二进制文件安装
02 安装
2.1 从二进制文件安装
  1. 将 skewer 复制到你喜欢的 BIN 目录,并确保正确设置 PATH 环境变量。例如:

    $ mkdir -p ~/bin
    $ cp -p skewer ~/bin/
    $ echo 'export PATH=~/bin:$PATH' >> ~/.bashrc
    $ source ~/.bashrc
    
2.2 从源代码安装
  1. 进入源代码目录,然后运行以下命令:

    $ make
    $ sudo make install
    
03 Skewer 使用说明

Skewer(一个快速且精确的接头修剪工具,适用于双端读取)

使用方法:

skewer [options] <reads.fastq> [paired-reads.fastq]或者
skewer [options] - (从 STDIN 获取输入)选项说明(括号中的数字为默认值):
接头:
-x <str>:接头序列/文件(默认:AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)
-y <str>:双端读取的接头序列/文件(默认:AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA),如果只指定 -x,则隐式使用。
-M, --matrix <str>:指示有效接头配对的文件(所有为 1 的矩阵)。
-j <str>:Nextera Mate Pair 读取的接头序列/文件(默认:CTGTCTCTTATACACATCTAGATGTGTATAAGAGACAG)。
-m, --mode <str>:修剪模式;
单端:head:5' 端;tail:3' 端;any:任何位置(默认:tail)
双端:pe:双端;mp:mate-pair;ap:amplicon(默认:pe)
-b, --barcode:根据接头/引物去重条形码(默认:no)
容错:
-r <num>:允许的最大错误率(标准化错误数/对齐区域长度)[0, 0.5](默认:0.1)
-d <num>:允许的最大插入/删除错误率(默认:0.03)
-k <int>:接头检测的最小重叠长度 [1, inf);(单端的最大值:max(1, int(4-10*r));mate-pair的值为<junction length>/2)
修剪:
-c, --cut <int>,<int>:强制修剪掉 5' 端引物作为条形码(在放大模式下)(默认:no)
-e, --cut3:如果读取长度大于指定的最大长度,则强制修剪掉 3' 端尾部碱基(默认:no)
过滤:
-q, --end-quality <int>:修剪 3' 端直到达到指定的质量值(默认:0)
-Q, --mean-quality <int>:修剪前允许的最低平均质量值(默认:0)
-l, --min <int>:修剪后允许的最小读取长度(默认:18)
-L, --max <int>:修剪后允许的最大读取长度(默认:no limit)
-n:是否过滤掉高度退化的(包含许多 N)读取(默认:no)
-u:是否过滤掉未确定的 mate-pair 读取(默认:no)
-N, --fillNs:是否将修剪的碱基替换为 N(在 b 或 -m mp 情况下无效)(默认:no)
输入/输出:
-f, --format <str>:FASTQ质量值的格式:sanger|solexa|auto(默认:auto)
-o, --output <str>:输出文件的基本名称(默认:<reads>.trimmed)
-z, --compress:以 GZIP 格式压缩输出(默认:no)
-1, --stdout:重定向输出到 STDOUT,禁止使用 -b、-o 和 -z 选项(默认:no)
--qiime:为 QIIME 处理准备“barcodes.fastq”和“mapping_file.txt”(默认:no)
--quiet:不显示进度更新(默认:not quiet)
-A, --masked-output:为修剪后的读取写输出文件(修剪后的碱基转换为小写)(默认:no)
-X, --excluded-output:为被排除的读取写输出文件(默认:no)
其他:
-i, --intelligent:在 mate-pair 模式下,是否根据接头信息重新分配读取(默认:no)
-t, --threads <int>:并发线程数 [1, 32](默认:1)
    04 常用示例
    skewer -Q 9 -t 2 -x adapters.fa sample.fastq -o trimmed
    skewer -x AGATCGGAAGAGC -q 3 sample-pair1.fq.gz sample-pair2.fq.gz
    skewer -x TCGTATGCCGTCTTCTGCTTGT -l 16 -L 30 -d 0 srna.fastq
    skewer -m mp -i lmp-pair1.fastq lmp-pair2.fastq
    skewer -m ap --cut 0,6 --qiime -x forward-primers.fa -y reverse-primers.fa mix-pair1.fastq mix-pair2.fastq
    
     05 引用

    Jiang, H., Lei, R., Ding, S.W. and Zhu, S. (2014) Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads. BMC Bioinformatics15, 182.

    相关文章:

    Skewer v0.2.2安装与使用-生信工具43

    01 Skewer 介绍 Skewer&#xff08;来自于 SourceForge&#xff09;实现了一种基于位掩码的 k-差异匹配算法&#xff0c;专门用于接头修剪&#xff0c;特别设计用于处理下一代测序&#xff08;NGS&#xff09;双端序列。 fastp安装及使用-fastp v0.23.4&#xff08;bioinfoma…...

    C语言:链表排序与插入的实现

    好的!以下是一篇关于这段代码的博客文章: 从零开始:链表排序与插入的实现 在数据结构的学习中,链表是一种非常基础且重要的数据结构。今天,我们将通过一个简单的 C 语言程序,来探讨如何实现一个从小到大排序的链表,并在其中插入一个新的节点。这个过程不仅涉及链表的基…...

    【Elasticsearch】doc_values 可以用于查询操作

    确实&#xff0c;doc values 可以用于查询操作&#xff0c;尽管它们的主要用途是支持排序、聚合和脚本中的字段访问。在某些情况下&#xff0c;Elasticsearch 也会利用 doc values 来执行特定类型的查询。以下是关于 doc values 在查询操作中的使用及其影响的详细解释&#xff…...

    深度学习深度解析:从基础到前沿

    引言 深度学习作为人工智能的一个重要分支&#xff0c;通过模拟人脑的神经网络结构来进行数据分析和模式识别。它在图像识别、自然语言处理、语音识别等领域取得了显著成果。本文将深入探讨深度学习的基础知识、主要模型架构以及当前的研究热点和发展趋势。 基础概念与数学原理…...

    JVM的GC详解

    获取GC日志方式大抵有两种 第一种就是设定JVM参数在程序启动时查看&#xff0c;具体的命令参数为: -XX:PrintGCDetails # 打印GC日志 -XX:PrintGCTimeStamps # 打印每一次触发GC时发生的时间第二种则是在服务器上监控:使用jstat查看,如下所示&#xff0c;命令格式为jstat -gc…...

    【开源免费】基于Vue和SpringBoot的校园网上店铺系统(附论文)

    本文项目编号 T 187 &#xff0c;文末自助获取源码 \color{red}{T187&#xff0c;文末自助获取源码} T187&#xff0c;文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…...

    测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别

    数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;4862 标注数量(xml文件个数)&#xff1a;4862 标注数量(txt文件个数)&#xff1a;4862 …...

    Vue 3 30天精进之旅:Day 12 - 异步操作

    在现代前端开发中&#xff0c;异步操作是一个非常常见的需求&#xff0c;例如从后端API获取数据、进行文件上传等任务。Vue 3 结合组合式API和Vuex可以方便地处理这些异步操作。今天我们将重点学习如何在Vue应用中进行异步操作&#xff0c;包括以下几个主题&#xff1a; 异步操…...

    【网络】3.HTTP(讲解HTTP协议和写HTTP服务)

    目录 1 认识URL1.1 URI的格式 2 HTTP协议2.1 请求报文2.2 响应报文 3 模拟HTTP3.1 Socket.hpp3.2 HttpServer.hpp3.2.1 start()3.2.2 ThreadRun()3.2.3 HandlerHttp&#xff08;&#xff09; 总结 1 认识URL 什么是URI&#xff1f; URI 是 Uniform Resource Identifier的缩写&…...

    [paddle] 矩阵相关的指标

    行列式 det 行列式定义参考 d e t ( A ) ∑ i 1 , i 2 , ⋯ , i n ( − 1 ) σ ( i 1 , ⋯ , i n ) a 1 , i 1 a 2 , i 2 , ⋯ , a n , i n det(A) \sum_{i_1,i_2,\cdots,i_n } (-1)^{\sigma(i_1,\cdots,i_n)} a_{1,i_1}a_{2,i_2},\cdots, a_{n,i_n} det(A)i1​,i2​,⋯,in​…...

    docker部署SpringBoot项目简单流程

    一、docker基础命令理解学习 1、常见命令 docker启动之前要关闭防火墙systemctl stop firewalld # 关闭防火墙systemctl disable firewalld # 禁止开机启动防火墙systemctl start docker # 启动docker服务systemctl stop docker # 停止docker服务systemctl restart docker # …...

    Python学习——函数参数详解

    Python中的函数参数传递机制允许多种灵活的参数类型&#xff0c;可以根据需求灵活配置参数&#xff0c;这使得函数具有更强大的扩展性和适应性。以下是对各类参数类型的详细说明&#xff1a; 1. 定义函数的不同参数类型 1.1 位置参数 定义方式&#xff1a;def func(a, b2) 特…...

    Chromium132 编译指南 - Android 篇(一):编译前准备

    1. 引言 欢迎来到《Chromium 132 编译指南 - Android 篇》系列的第一部分。本系列指南将引导您逐步完成在 Android 平台上编译 Chromium 132 版本的全过程。Chromium 作为一款由 Google 主导开发的开源浏览器引擎&#xff0c;为众多现代浏览器提供了核心驱动力。而 Android 作…...

    .Net / C# 繁体中文 与 简体中文 互相转换, 支持地方特色词汇

    版本号 Nuget 搜索 “OpenCCNET”, 注意别找错, 好多库的名字都差不多 支持 “繁,简” 的互相转换, 支持多个地区常用词汇的转换, 还支持 日文的新旧转换. OpenCC 在 .Net 中的实现 https://github.com/CosineG/OpenCC.NET <PackageReference Include"OpenCCNET"…...

    Java泛型深度解析(JDK23)

    第一章 泛型革命 1.1 类型安全的进化史 前泛型时代的类型转换隐患 代码的血泪史&#xff08;Java 1.4版示例&#xff09;&#xff1a; List rawList new ArrayList(); rawList.add("Java"); rawList.add(Integer.valueOf(42)); // 编译通过// 灾难在运行时爆发…...

    【贪心算法篇】:“贪心”之旅--算法练习题中的智慧与策略(一)

    ✨感谢您阅读本篇文章&#xff0c;文章内容是个人学习笔记的整理&#xff0c;如果哪里有误的话还请您指正噢✨ ✨ 个人主页&#xff1a;余辉zmh–CSDN博客 ✨ 文章所属专栏&#xff1a;贪心算法篇–CSDN博客 文章目录 一.贪心算法1.什么是贪心算法2.贪心算法的特点 二.例题1.柠…...

    AJAX XML

    AJAX XML 引言 随着互联网技术的不断发展,Web应用对用户交互性和实时性的要求越来越高。AJAX(Asynchronous JavaScript and XML)技术的出现,为Web应用开发提供了强大的支持。AJAX技术允许Web应用在不重新加载整个页面的情况下,与服务器进行异步通信。XML作为数据传输格式…...

    踏入编程世界的第一个博客

    我&#xff0c;一个双非一本大一新生&#xff0c;普通的不能再普通了&#xff0c;面对宏伟庞大的计算机世界仍显得举手无措&#xff0c;我自以为自身仍有些许骨气&#xff0c;不想普普通通&#xff0c;甚是浑浑噩噩的度过四年大学&#xff0c;经历了高考的打击&#xff0c;双非…...

    2025年1月22日(网络编程 udp)

    系统信息&#xff1a; ubuntu 16.04LTS Raspberry Pi Zero 2W 系统版本&#xff1a; 2024-10-22-raspios-bullseye-armhf Python 版本&#xff1a;Python 3.9.2 已安装 pip3 支持拍摄 1080p 30 (1092*1080), 720p 60 (1280*720), 60/90 (640*480) 已安装 vim 已安装 git 学习…...

    数据结构与算法之栈: LeetCode 641. 设计循环双端队列 (Ts版)

    设计循环双端队列 https://leetcode.cn/problems/design-circular-deque/description/ 描述 设计实现双端队列。 实现 MyCircularDeque 类: MyCircularDeque(int k) &#xff1a;构造函数,双端队列最大为 k 。boolean insertFront()&#xff1a;将一个元素添加到双端队列头部…...

    uniapp 对接腾讯云IM群组成员管理(增删改查)

    UniApp 实战&#xff1a;腾讯云IM群组成员管理&#xff08;增删改查&#xff09; 一、前言 在社交类App开发中&#xff0c;群组成员管理是核心功能之一。本文将基于UniApp框架&#xff0c;结合腾讯云IM SDK&#xff0c;详细讲解如何实现群组成员的增删改查全流程。 权限校验…...

    微信小程序之bind和catch

    这两个呢&#xff0c;都是绑定事件用的&#xff0c;具体使用有些小区别。 官方文档&#xff1a; 事件冒泡处理不同 bind&#xff1a;绑定的事件会向上冒泡&#xff0c;即触发当前组件的事件后&#xff0c;还会继续触发父组件的相同事件。例如&#xff0c;有一个子视图绑定了b…...

    理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端

    &#x1f31f; 什么是 MCP&#xff1f; 模型控制协议 (MCP) 是一种创新的协议&#xff0c;旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议&#xff0c;它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

    linux arm系统烧录

    1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 &#xff08;忘了有没有这步了 估计有&#xff09; 刷机程序 和 镜像 就不提供了。要刷的时…...

    解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

    出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

    Spring Boot+Neo4j知识图谱实战:3步搭建智能关系网络!

    一、引言 在数据驱动的背景下&#xff0c;知识图谱凭借其高效的信息组织能力&#xff0c;正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合&#xff0c;探讨知识图谱开发的实现细节&#xff0c;帮助读者掌握该技术栈在实际项目中的落地方法。 …...

    关于 WASM:1. WASM 基础原理

    一、WASM 简介 1.1 WebAssembly 是什么&#xff1f; WebAssembly&#xff08;WASM&#xff09; 是一种能在现代浏览器中高效运行的二进制指令格式&#xff0c;它不是传统的编程语言&#xff0c;而是一种 低级字节码格式&#xff0c;可由高级语言&#xff08;如 C、C、Rust&am…...

    DeepSeek 技术赋能无人农场协同作业:用 AI 重构农田管理 “神经网”

    目录 一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析 三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍 四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度 五、实际案例大…...

    保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek

    文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama&#xff08;有网络的电脑&#xff09;2.2.3 安装Ollama&#xff08;无网络的电脑&#xff09;2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

    android RelativeLayout布局

    <?xml version"1.0" encoding"utf-8"?> <RelativeLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_parent"android:gravity&…...