懒人必看Bowtie2 -q --phred33 --sensitive --end-to-end -I 0 -X 500 --fr --un unpaired --al aligned \

--un-conc unconc --al-conc alconc -p 6 --reorder -x{-1-2| -U} -S []

用法:bowtie2 [options]* -x {-1 -2 | -U } -S []

必须参数:-x 由bowtie2-build所生成的索引文件的前缀。首先 在当前目录搜寻,然后

在环境变量 BOWTIE2_INDEXES 中制定的文件夹中搜寻。

-1 双末端测寻对应的文件1。可以为多个文件,并用逗号分开;多个文件必须和 -2

中制定的文件一一对应。比如:"-1 flyA_1.fq,flyB_1.fq -2 flyA_2.fq,flyB

_2.fq". 测序文件中的reads的长度可以不一样。

-2 双末端测寻对应的文件2.

-U 非双末端测寻对应的文件。可以为多个文件,并用逗号分开。测序文件中的reads的

长度可以不一样。

-S 所生成的SAM格式的文件前缀。默认是输入到标准输出。

以下是可选参数:

输入参数-q 输入的文件为FASTQ格式文件,此项为默认值。

-qseq 输入的文件为QSEQ格式文件。

-f 输入的文件为FASTA格式文件。选择此项时,表示--ignore-quals也被选择了。

-r 输入的文件中,每一行代表一条序列,没有序列名和测序质量等。选择此项时,表示--

ignore-quals也被选择了。

-c 后直接为比对的reads序列,而不是包含序列的文件名。序列间用逗号隔开。选择此项时,

表示—ignore-quals也被选择了。

-s/--skip input的reads中,跳过前个reads或者pairs。

-u/--qupto 只比对前个reads或者pairs(在跳过前个reads或者

pairs后)。Default: no limit.

-5/--trim5 剪掉5'端长度的碱基,再用于比对。(default: 0).

-3/--trim3 剪掉3'端长度的碱基,再用于比对。(default: 0).

--phred33 输入的碱基质量等于ASCII码值加上33. 在最近的illumina pipiline中

得以运用。

--phred64 输入的碱基质量等于ASCII码值加上64.

--solexa-quals 将Solexa的碱基质量转换为Phred。在老的GA Pipeline版本中得以

运用。Default: off.

--int-quals 输入文件中的碱基质量为用“ ”分隔的数值,而不是ASCII码。比如 40 40

30 40...。Default: off.

–end-to-end模式下的预设参数--very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50

--fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50

--sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in --end-to-end mode)

--very-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50

–loca模式下的预设参数–loca模式下的预设参数

--very-fast-local Same as: -D 5 -R 1 -N 0 -L 25 -i S,1,2.00

--fast-local Same as: -D 10 -R 2 -N 0 -L 22 -i S,1,1.75

--sensitive-local Same as: -D 15 -R 2 -N 0 -L 20 -i S,1,0.75 (default in --local mode)

--very-sensitive-local Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50

比对参数:-N 进行种子比对时允许的mismatch数. 可以设为0或者1. Default: 0.

-L 设定种子的长度.

************************************************************

功能选项

给bowtie的一些参数设定值的时候,使用一个计算公式代替,于是值的大小与比对序列的长

度成一定关系。有三部分组成: (a)计算方法, 包括常数(C),线性(L),平方根(S)和

自然对数(G); (b)一个常数; (c)一个系数.

例如:

为 L,-0.4,-0.6 则计算公式为: f(x) = -0.4 + -0.6 * x

为G,1,5.4 则计算公式为: f(x) = 1.0 + 5.4 * ln(x)

************************************************************

-i 设定两个相邻种子间所间距的碱基数。

************************************************************

例如:如果read的长度为30, 种子的长度为10, 相邻种子的间距为6,则提取出的种子如下

所示:

Read: TAGCTACGCTCTACGCTATCATGCATAAAC

Seed 1 fw: TAGCTACGCT

Seed 1 rc: AGCGTAGCTA

Seed 2 fw: CGCTCTACGC

Seed 2 rc: GCGTAGAGCG

Seed 3 fw: ACGCTATCAT

Seed 3 rc: ATGATAGCGT

Seed 4 fw: TCATGCATAA

Seed 4 rc: TTATGCATGA

************************************************************

在--end-to-end模式中默认值为”-i S,1,1.15”.即表示f(x) = 1 + 1.15 *

sqrt(x). 如果read长度为100, 则相邻种子的间距为12.

--n-ceil 设定read中允许含有不确定碱基(非GTAC,通常为N)的最大数目.

Default: L,0,0.15. 计算公式为: f(x) = 0 + 0.15 * x, 表示长度为100的read

最多运行存在15个不确定碱基. 一旦不确定碱基数超过15, 则该条read会被过滤掉.

--dpad Default: 15.

--gbar 在read头尾个碱基内不允许gap. Default: 4.

--ignore-quals 计算错配罚分的时候不考虑碱基质量. 当输入序列的模式为-f, -r 或

者-c的时候, 该设置自动成为默认设置.

--nofw/--norc –nofw设定read不和前导链(forward reference strand)进行比对;

--norc设定不和后随链(reverse-complement reference strand)进行比对.

Default: both strands enabled.

--end-to-end 比对是将整个read和参考序列进行比对. 该模式--ma的值为0. 该模式为

默认模式, --local模式冲突.

--local 该模式下对read进行局部比对, 从而, read两端的一些碱基不比对,从而使比

对得分满足要求. 该模式下 –ma默认为2.

得分罚分参数--ma 设定匹配得分. --local模式下每个read上碱基和参考序列上碱基匹配, 则

加分. 在—end-to-end模式中无效. Default: 2.

--mp MX,MN 设定错配罚分. 其中MX为所罚最高分, MN为所罚最低分. 默认设置下罚分与

碱基质量相关. 罚分遵循的公式为: MN + floor( (MX-MN)(MIN(Q, 40.0)/40.0) ).

其中Q为碱基的质量值. 如果设置了—ignore-qual参数, 则错配总是罚最高分. Default:

MX = 6, MN = 2.

--np 当匹配位点中read, reference上有不确定碱基(比如N)时所设定的罚分值.

Default: 1.

--rdg , 设置在read上打开gap 罚分, 延长gap罚分.

Default: 5, 3.

--rfg , 设置在reference上打开gap 罚分, 延长gap罚分

. Default: 5, 3.

--score-min 设定成为有效比对的最小分值. 在—end-to-end模式下默认值为:

L,-0.6,-0.6; 在--local模式下默认值为: G,20,8.

报告参数-k 默认设置下, bowtie2搜索出了一个read不同的比对结果, 并报告其中最好的

比对结果(如果好几个最好的比对结果得分一致, 则随机挑选出其中一个). 而在该模式下,

bowtie2最多搜索出一个read 个比对结果, 并将这些结果按得分降序报告出来.

-a 和-k参数一样, 不过不限制搜索的结果数目. 并将所有的比对结果都按降序报告出来.

此参数和-k参数冲突. 值得注意的是: 如果基因组含有很多重复序列时, 该参数会导致程序

运行极其缓慢.

Effort 参数-D 比对时, 将一个种子延长后得到比对结果, 如果不产生更好的或次好的比对结果,

则该次比对失败. 当失败次数连续达到次后, 则该条read比对结束. Bowtie2才会

继续进行下去. Default: 15. 当具有-k或-a参数, 则该参数所产生的限制会自动调整.

-R 如果一个read所生成的种子在参考序列上匹配位点过多. 当每个种子平均匹配超

过300个位置, 则通过一个不同的偏移来重新生成种子进行比对. 则是重新生成种子

的次数. Default: 2.

Paired-end 参数-I/--minins 设定最小的插入片段长度. Default: 0.

-X/--maxins 设定最长的插入片段长度. Default: 500.

--fr/--rf/--ff 设定上下游reads和前导链paired-end比对的方向. --fr: 匹配时,

read1在5'端上游, 和前导链一致, read2在3'下游, 和前导链反向互补. 或者read2在

上游, read1在下游反向互补; --rf: read1在5'端上游, 和前导链反向互补, read2在

3'端下游, 和前导链一致; --fr: 两条reads都和前导链一致. Default: --fr. 默认

设置适合于Illumina的paired-end测序数据; 若是mate-paired, 则要选择—rf参数.

--no-mixed 默认设置下, 一对reads不能成对比对到参考序列上, 则单独对每个read进

行比对. 该选项则阻止此行为.

--no-discordant 默认设置下, 一对reads不能和谐比对(concordant alignment,

即满足-I, -X, --fr/--rf/--ff的条件)到参考序列上, 则搜寻其不和谐比对(discon

cordant alignment, 即两条reads都能独一无二地比对到参考序列上, 但是不满足-I,

-X,--fr/--rf/--ff的条件). 该选项阻止此行为.

--dovetail read1和read2的关系为dovetail的时候,该状况算为和谐比对. 默认情况

下dovetail不算和谐比对.

--no-contain read1和read2的关系为包含的时候, 该状况不算为和谐比对. 默认情况

下包含关系算为和谐比对.

--no-overlap read1和read2的关系为有重叠的时候, 该状况不算为和谐比对. 默认情

况下两个reads重叠算为和谐比对.

输出参数-t/--time --un 将unpaired reads写入到.

--un-gz 将unpaired reads写入到, gzip压缩.

--un-bz2 将unpaired reads写入到, bz2压缩.

--al 将至少能比对1次以上的unpaired reads写入.

--al-gz ... ,gzip压缩.

--al-bz2 ... ,bz2压缩.

--un-conc 将不能和谐比对的paired-end reads写入.

--un-conc-gz ... ,gzip压缩.

--un-conc-bz2 ... ,bz2压缩.

--al-conc 将至少能和谐比对一次以上的paired-end reads写入.

--al-conc-gz ... ,gzip压缩.

--al-conc-bz2 ... ,bz2压缩.

--quiet 安静模式,除了比对错误和一些严重的错误, 不在屏幕上输出任何东西.

--met-file 将bowtie2的检测信息(metrics)写入文件. 用于debug.

Default: metrics disabled.

--met-stderr 将bowtie2的检测信息(metrics)写入标准错误文件句柄. 和上

一个选项不冲突. Default: metrics disabled.

--met 每隔秒写入一次metrics记录. Default: 1.

Sam 参数--no-unal 不记录没比对上的reads.

--no-hd 不记录SAM header lines (以@开头).

--no-sq 不记录@SQ的SAM header lines.

--rg-id 设定read group Id到.

--rg 增加作为一行@RG.

性能参数-o/--offrate 无视index的offrate值, 以取代之. Index默认的

值为5. 值必须大于index的offrate值, 同时越大, 耗时越长,耗内存越少.

-p/--threads NTHREADS 设置线程数. Default: 1

--reorder 多线程运算时, 比对结果在顺序上会和文件中reads的顺序不一致, 使用该选

项, 则使其一致.

--mm 使用内存定位的I/O来载入index, 而不是常规的文件I/O. 从而使多个bowtie程

序共用内存中同样的index, 节约内存消耗.

其它参数:--qc-filter 滤除QSEQ fileter filed为非0的reads. 仅当有—qseq选项时有效.

Default: off.

--seed 使用作为随机数产生的种子. Default: 0.

--version 打印程序版本并退出

-h/--help 打印用法信息并推出

更多详细信息请阅读:http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml

本文来自:http://www.hzaumycology.com/chenlianfu_blog/?p=178

bowtie 加mn标签_Bowtie2使用方法与参数详细介绍相关推荐

  1. bowtie 加mn标签_Bowtie2使用方法与参数详细介绍 - Public Library of Bioinformatics

    Bowtie2 使用方法与参数详细介绍 - Public Library of Bioinformatics 懒人必看 Bowtie2 -q --phred33 --sensitive --end-t ...

  2. bowtie 加mn标签_Bowtie2使用方法与参数详细介绍 | Public Library of Bioinformatics

    懒人必看 Bowtie2 -q --phred33 --sensitive --end-to-end -I 0 -X 500 --fr --un unpaired --al aligned --un- ...

  3. bowtie 加mn标签_Bowtie2用法祥解

    懒人必看 对参考序列构建index $ bowtie2-build genome.fasta index 尝试使用前10000个reads进行比对 $ bowtie2 -u 10000 -p 8 -x ...

  4. bowtie 加mn标签_Bowtie 比对

    [Bowtie]DNA序列拼接的原理 [Jenny点评]我一直以为Bowtie是一个短序列拼接工作,实际上这是错误的.它不是序列拼接工作,只是一个序列比对的工具.最后的结果是相对index而言,对各个 ...

  5. bowtie 加mn标签_bowtie:短序列比对的新工具

    Bowtie是一个超级快速的,较为节省内存的短序列拼接至模板基因组的工具.它在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度. Bowtie并不是一个简单的拼接工具,它不同于Blast等 ...

  6. bowtie 加mn标签_bowtie和bowtie2用法详解

    bowtie 短序列比对工具详解 常见的短序列比对工具有很多,如fasta.blast.bowtie.shrimp.soap等.每个工具都有其自身的优点,但同时也具备了一些缺点.权衡利弊,我选择bow ...

  7. Bowtie2使用方法与参数详细介绍

    bowtie 短序列比对工具详解 常见的短序列比对工具有很多,如fasta.blast.bowtie.shrimp.soap等.每个工具都有其自身的优点,但同时也具备了一些缺点.权衡利弊,我选择bow ...

  8. android飞行模式开启wifi,手机在飞行模式下怎么使用WiFi? 飞行模式下开启WiFi的方法图文教程详细介绍[多图]...

    类型: 大小: 评分: 平台: 标签: 手机在飞行模式下怎么使用WiFi?相信很多朋友都还不太清楚吧?没关系,下面是友情小编搜集相关资料整理出来的手机在飞行模式下开启WiFi的方法图文教程详细介绍,希 ...

  9. html中日期下拉选怎么设置,html中option标签(下拉列表选项)的详细介绍

    大家好,欢迎关注支持,谢谢!本篇将介绍html中option标签(下拉列表选项)的详细用法,有兴趣的朋友可以了解一下! 在网页中,下拉列表是一种很常见的显示效果,你知道在html源代码中是怎样实现的吗 ...

最新文章

  1. 中南民族大学c语言报告,中南民族大学信C语言实验报告.doc
  2. 插入排序---希尔插入排序算法(Javascript版)
  3. harmonyos sdk,HarmonyOS SDK对应的API版本跃迁引发的历史工程适配问题解决方案
  4. 苏州大学文正学院计算机专业,苏州大学文正学院有哪些专业及什么专业好
  5. html让文本框左剧中对齐_Python—Text:功能强大的文本框
  6. 【STM32】关于BOOT引脚和一键下载电路下载的一些事
  7. 我在CSDN上的博客地址!
  8. java+cache使用方法_JVM代码缓存区CodeCache原理及用法解析
  9. js中小数四舍五入问题
  10. Atitit file cms api jcr1 jcr2 目录 1.1. 么是JSR-170幸运的是,被称为Java内容仓库(Java Content Repository,JCR)的JSR-
  11. 点击验证码时候自动刷新功能
  12. 【转】北京大学ACM题目算法分析推荐 acm解决方法
  13. springboot发送邮件(QQ邮箱)
  14. phpMyadmin /scripts/setup.php Execute Arbitrary PHP Code Via A Crafted POST Request CVE-2010-3055
  15. 如何开发一款电商app小程序
  16. 申宝策略-船舶军工表现靓丽
  17. 图解机器学习-稀疏学习-matlab源码
  18. leetcode 526优美的数列
  19. 违法?猝死?你肯定不知道程序员还有这些“高危”操作
  20. “三网融合”的过去、现在与未来

热门文章

  1. 微信小程序火锅店点餐订餐预订餐桌系统+后台管理系统SSM-JAVA【数据库设计、论文、源码、开题报告】
  2. #c语言sinx≈x-x^3^/3!+x^5^/5!-x^7^/7!+x^9^/9!-……,计算sinx的值,直到最后一项小于1e-5,并计算累加次数。
  3. 二分查找——部分题目汇总——长长文详细分享
  4. matlab 字符串 去掉引号,关于vb.net:删除字符串中的双引号
  5. MacOS开发环境配置
  6. mysql 查看表v空间自增涨_分分钟解决MySQL查询速度慢与性能差
  7. 秋天来了,怎么吃最元气?
  8. oracle pga 1407,ogg replicat OGG-00869 OCI Error ORA-01407 OGG-01154 SQL error 1407
  9. MySQL数据库高可用HA实现
  10. Microsoft Office word PPT 中删除COMSOL5.6 加载项后每次启动显示加载错误