Bowtie2的简单使用笔记
简介
Bowtie 2是一个超快的、内存效率高的工具,用于将测序读数与长参考序列进行比对。它特别擅长将大约50个到100个或1000个字符的读数进行比对,尤其擅长与相对较长的(如哺乳动物)基因组比对。Bowtie 2用FM索引对基因组进行索引,以保持其内存占用小:对于人类基因组,其内存占用通常约为3.2GB。Bowtie 2支持间隙式、局部式和成对端对齐模式。
其中FM index就是就是一个BWT[T],一个checkpoint data,一个简化了的SA(具体参考bowtie里的FM-index简介_stormlovetao的博客-CSDN博客)
如果目的是对齐两个非常大的序列(例如两个基因组),请考虑使用MUMmer。如果目的是与相对较短的参考序列(如细菌基因组)非常灵敏的比对,可以使用Bowtie 2完成,但您可能需要考虑使用NUCmer,BLAT或BLAST等工具。当参考基因组很长时,这些工具可能会非常缓慢,但当参考基因组很短时通常就足够了。
使用
构建index
官方index:wget ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip unzip mm10.zip rm mm10.zip make_mm10.sh
自建index:
wget --.fna bowtie2-build --.fna index
比对
bowtie2 [options]* -x <index> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | -b <bam>} [-S <sam>]
其中参数:
-x 由bowtie2-build所生成的索引文件的前缀,需要指定路径及其共用文件名 -1 使用trimmomatic质控后与read2配对(paired)的read1。可以为多个文件,并用逗号分开;多个文件必须和 -2 <m2> 中制定的文件一一对应。 -2 使用trimmomatic质控后与read1配对的read2 -U 使用trimmomatic质控后未配对(unpaired)的reads。可以为多个文件,并用逗号分开,测序文件中的reads的长度可以不一样。 -S 所生成的SAM格式的文件前缀。默认是输入到标准输出。
#事例: #单末端 bowtie2 -x insect -U input.fq #双末端 bowtie2 -x insect -1 input_1.fq -2 input_2.fq
SAM 文件转为 BAM 文件
$ samtools sort example.sam > example.bam
Bowtie2的简单使用笔记相关推荐
- 3.2.1 配置构建Angular应用——简单的笔记存储应用——展示功能
本节我们会通过构建一个简单的笔记存储应用(可以载入并修改一组简单的笔记)来学习如何应用Angular的特性.这个应用用到的特性有: 在JSON文件中存储笔记 展示.创建.修改和删除笔记 在笔记中使用M ...
- 深度学习中反向传播算法简单推导笔记
反向传播算法简单推导笔记 1.全连接神经网络 该结构的前向传播可以写成: z(1)=W(1)x+b(1)z^{(1)} = W^{(1)}x+b^{(1)}z(1)=W(1)x+b(1) a(1)=σ ...
- flex简单常用笔记
flex简单常用笔记 多行换行操作: ul {display: flex;flex-direction: row;justify-content: space-between;flex-wrap: w ...
- 《Python编程 从入门到实践》简单读书笔记
目录 第2章 变量和简单数据类型 第3章 列表简介 第4章 操作列表 第5章 if语句 第6章 字典 第7章 用户输入和while循环 第8章 函数 第9章 类 第10章 文件和异常 第11章 测试代 ...
- OSX上pf的简单配置笔记
OSX上pf的简单配置笔记 水果的OSX上没有iptables,在10.10以后以pf取代ipfw.相比于iptables,pf一般使用配置文件保存防火墙规则,语法规范上更严谨,但是配置也更复杂.规则 ...
- Spring Data Querydsl-JPA 的简单入门笔记
Spring Data Querydsl-JPA 的简单入门笔记 一. Querydsl面试常识问题 1.Querydsl是什么? 二.简单项目使用 1.pom依赖 2.新增插件,自动生成Q版实体类: ...
- 特征提取算法简单学习笔记
update 2021.04.22 这几年的经验下来,以前以为特征提取的方法时共通的,注意力都在后续算法部分,现在的感受是,不同领域算法反而很多时候时共通的,特征提取差异很大,不能简单的一言以蔽之,这 ...
- C++ primer(第五版)简单读书笔记
目录 第一章 开始 第二章 变量和基本类型 第三章 字符串.向量和数组 第四章 表达式 第五章 语句 第六章 函数 第七章 类 第八章 IO库 第九章 顺序容器 第十章 泛型算法 第十一章 关联容器 ...
- MFC Group Box 组合框的简单使用 笔记
开发环境版本:Visual Studio 2010 应用程序类型:MFC application 1 组合框 Group Box作用 在MFC基于对话框的应用程序中,Group Box组合框就是将组合 ...
最新文章
- 虚拟电脑键盘app_说到弹吉他,这几个APP你一定用得上
- Android开发举步维艰,上弘法寺七七四十九天取得“真经”!
- 数字类型及常用的数学函数(Python)
- aliyun maven 添加jar_阿里云Maven配置,Maven仓库配置,Maven镜像配置
- Mirantis OpenStack fuel web 安装 使用
- 二月,劝 Java 工程师不要跳槽!
- 收藏 | 《周志华机器学习详细公式推导版》发布,Datawhale开源项目pumpkin-book
- 华为系列设备优先级总结(二)
- 朋友圈加粗字体数字_字体:新游黑体(游ゴシック)重大更新,精巧的日系字体~...
- Flash Media Server 4.5 序列号
- kali暴力破解WiFi
- 求逆元模版 (Java版)
- 戴尔服务器虚拟光驱,SupportAssist
- Error from chokidar (C:\): Error: EBUSY: resource busy or locked, lstat ‘D:\DumpStack.log.tmp
- Haiku将通过GSoC获得对x86_64的支持
- 解决问题:Oracle存储过程执行成功,但数据没有变化
- 第八章第一节:Java继承之继承概念、语法、成员访问和super关键字
- Python如何自制包、如何安装自己的包并导入
- STC15F2K60S2设置内部时钟工作频率
- FANUC机器人使用U盘进行文件备份的操作步骤
热门文章
- VisualSVN的下载与安装
- 雾计算和边缘计算有什么区别
- Linux之dos2unix和unix2dos
- [Java经典题目] 随机得到一个[ 1-100]之间的年龄
- [转]MATLAB 主要函数指令表(按功能分类)
- centos7 vim查找_Linux CentOS7 中vim命令的使用
- virtualenv virtualenvwrapper
- Redis事务与Pipeline功能
- 线性规划的对偶问题(The Dual of LP)
- SQL 注释语句 (--与/*...*/)