简介

Bowtie 2是一个超快的、内存效率高的工具,用于将测序读数与长参考序列进行比对。它特别擅长将大约50个到100个或1000个字符的读数进行比对,尤其擅长与相对较长的(如哺乳动物)基因组比对。Bowtie 2用FM索引对基因组进行索引,以保持其内存占用小:对于人类基因组,其内存占用通常约为3.2GB。Bowtie 2支持间隙式、局部式和成对端对齐模式。

其中FM index就是就是一个BWT[T],一个checkpoint data,一个简化了的SA(具体参考bowtie里的FM-index简介_stormlovetao的博客-CSDN博客)

如果目的是对齐两个非常大的序列(例如两个基因组),请考虑使用MUMmer。如果目的是与相对较短的参考序列(如细菌基因组)非常灵敏的比对,可以使用Bowtie 2完成,但您可能需要考虑使用NUCmer,BLAT或BLAST等工具。当参考基因组很长时,这些工具可能会非常缓慢,但当参考基因组很短时通常就足够了。

使用

  1. 构建index
    官方index:

    wget ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip
    unzip mm10.zip
    rm mm10.zip make_mm10.sh
    

    自建index:

    wget  --.fna
    bowtie2-build --.fna index
    
  2. 比对

     bowtie2 [options]* -x <index> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | -b <bam>} [-S <sam>]
    

    其中参数:

    -x  由bowtie2-build所生成的索引文件的前缀,需要指定路径及其共用文件名
    -1  使用trimmomatic质控后与read2配对(paired)的read1。可以为多个文件,并用逗号分开;多个文件必须和 -2 <m2> 中制定的文件一一对应。
    -2  使用trimmomatic质控后与read1配对的read2
    -U  使用trimmomatic质控后未配对(unpaired)的reads。可以为多个文件,并用逗号分开,测序文件中的reads的长度可以不一样。
    -S  所生成的SAM格式的文件前缀。默认是输入到标准输出。
    
    #事例:
    #单末端
    bowtie2 -x insect -U input.fq
    #双末端
    bowtie2 -x insect -1 input_1.fq -2 input_2.fq
    
  3. SAM 文件转为 BAM 文件

     $ samtools sort example.sam > example.bam
    

Bowtie2的简单使用笔记相关推荐

  1. 3.2.1 配置构建Angular应用——简单的笔记存储应用——展示功能

    本节我们会通过构建一个简单的笔记存储应用(可以载入并修改一组简单的笔记)来学习如何应用Angular的特性.这个应用用到的特性有: 在JSON文件中存储笔记 展示.创建.修改和删除笔记 在笔记中使用M ...

  2. 深度学习中反向传播算法简单推导笔记

    反向传播算法简单推导笔记 1.全连接神经网络 该结构的前向传播可以写成: z(1)=W(1)x+b(1)z^{(1)} = W^{(1)}x+b^{(1)}z(1)=W(1)x+b(1) a(1)=σ ...

  3. flex简单常用笔记

    flex简单常用笔记 多行换行操作: ul {display: flex;flex-direction: row;justify-content: space-between;flex-wrap: w ...

  4. 《Python编程 从入门到实践》简单读书笔记

    目录 第2章 变量和简单数据类型 第3章 列表简介 第4章 操作列表 第5章 if语句 第6章 字典 第7章 用户输入和while循环 第8章 函数 第9章 类 第10章 文件和异常 第11章 测试代 ...

  5. OSX上pf的简单配置笔记

    OSX上pf的简单配置笔记 水果的OSX上没有iptables,在10.10以后以pf取代ipfw.相比于iptables,pf一般使用配置文件保存防火墙规则,语法规范上更严谨,但是配置也更复杂.规则 ...

  6. Spring Data Querydsl-JPA 的简单入门笔记

    Spring Data Querydsl-JPA 的简单入门笔记 一. Querydsl面试常识问题 1.Querydsl是什么? 二.简单项目使用 1.pom依赖 2.新增插件,自动生成Q版实体类: ...

  7. 特征提取算法简单学习笔记

    update 2021.04.22 这几年的经验下来,以前以为特征提取的方法时共通的,注意力都在后续算法部分,现在的感受是,不同领域算法反而很多时候时共通的,特征提取差异很大,不能简单的一言以蔽之,这 ...

  8. C++ primer(第五版)简单读书笔记

    目录 第一章  开始 第二章 变量和基本类型 第三章 字符串.向量和数组 第四章 表达式 第五章 语句 第六章 函数 第七章 类 第八章 IO库 第九章 顺序容器 第十章 泛型算法 第十一章 关联容器 ...

  9. MFC Group Box 组合框的简单使用 笔记

    开发环境版本:Visual Studio 2010 应用程序类型:MFC application 1 组合框 Group Box作用 在MFC基于对话框的应用程序中,Group Box组合框就是将组合 ...

最新文章

  1. 虚拟电脑键盘app_说到弹吉他,这几个APP你一定用得上
  2. Android开发举步维艰,上弘法寺七七四十九天取得“真经”!
  3. 数字类型及常用的数学函数(Python)
  4. aliyun maven 添加jar_阿里云Maven配置,Maven仓库配置,Maven镜像配置
  5. Mirantis OpenStack fuel web 安装 使用
  6. 二月,劝 Java 工程师不要跳槽!
  7. 收藏 | 《周志华机器学习详细公式推导版》发布,Datawhale开源项目pumpkin-book
  8. 华为系列设备优先级总结(二)
  9. 朋友圈加粗字体数字_字体:新游黑体(游ゴシック)重大更新,精巧的日系字体~...
  10. Flash Media Server 4.5 序列号
  11. kali暴力破解WiFi
  12. 求逆元模版 (Java版)
  13. 戴尔服务器虚拟光驱,SupportAssist
  14. Error from chokidar (C:\): Error: EBUSY: resource busy or locked, lstat ‘D:\DumpStack.log.tmp
  15. Haiku将通过GSoC获得对x86_64的支持
  16. 解决问题:Oracle存储过程执行成功,但数据没有变化
  17. 第八章第一节:Java继承之继承概念、语法、成员访问和super关键字
  18. Python如何自制包、如何安装自己的包并导入
  19. STC15F2K60S2设置内部时钟工作频率
  20. FANUC机器人使用U盘进行文件备份的操作步骤

热门文章

  1. VisualSVN的下载与安装
  2. 雾计算和边缘计算有什么区别
  3. Linux之dos2unix和unix2dos
  4. [Java经典题目] 随机得到一个[ 1-100]之间的年龄
  5. [转]MATLAB 主要函数指令表(按功能分类)
  6. centos7 vim查找_Linux CentOS7 中vim命令的使用
  7. virtualenv virtualenvwrapper
  8. Redis事务与Pipeline功能
  9. 线性规划的对偶问题(The Dual of LP)
  10. SQL 注释语句 (--与/*...*/)