samtools的mpileup命令是一个samtools中一个很重要的命令。它的主要功能主要是生成BCF、VCF文件或者pileup一个或多个bam文件。比对记录以在@RG中的样本名作为区分标识符。如果样本标识符缺失,那么每一个输入文件则视为一个样本。

在pileup格式中(没有-u或者-g参数),每一行代表基因组的位置,由染色体名、1个碱基坐标、参考碱基、reads覆盖该位点的数量、reads的碱基、碱基质量和比对质量。有关匹配、错配、插入缺失、链、比对质量和一条reads的开始结束位置都被编码到reads碱基列。在此列上,“.”表示与正链上的参考碱基匹配,“,”表示与负链上的参考碱基匹配,“>”和“<”表示跳过参考基因,“ACGTN”表示正链上的错配,“acgtn”表示负链上的错配。此模式“\\+[0-9]+[ACGTNacgtn]+”表示在此位点至下一个位点之间与参考基因组对应位点相比,多了一段插入碱基,插入长度由模式中的整数表示。与此类似,“\\-[0-9]+[ACGTNacgtn]+”表示缺失,缺失的碱基使用“*”表示。同时,“^”表示reads的开始,“$”表示reads的结束。在“^”后的字符的ASCII码值减去33表示比对质量值。

另外,要注意到在输入文件中,有两种正交方式,通过使用-r和-l参数实现。-r参数需要指定一个索引号去进行随机访问而后者-l参数通过文件中的指定区域进行过滤,无需索引。这两个参数可以同时使用。通常使用bed文件,将待处理的文件进行分割,然后同时进行处理,这样可以加快处理速度。最后,处理完毕后,再合并。

Mpileup命令中参数比较多,这里只介绍一些常用的参数。

参数:

-C --adjust-MQ INT 用于降低比对质量的系数,如果reads中含有过多的错配。不能设置为零。BWA推荐值为50。

-A --count-orphans 在检测变异中,不忽略异常的reads对。

-I –positions FILE BED文件或者包含区域位点的位置列表文件。位置文件包含两列,染色体和位置,从1开始计数。BED文件至少包含3列,染色体、开始位置和结束位置,开始端从0开始计数。

-r –region STR 只在指定区域产生pileup,需要已建立索引的bam文件。通常和-l参数一起使用。

-o –output FILE 生成pileup格式文件或者VCF、BCF文件而不是默认的标准输出。

-g –BCF 计算基因型的似然值和输出文件格式为BCF。

-v –VCF 计算基因型的似然值和输出文件格式为VCF。

-D 输出每个样本的reads深度。

-V 输出每个样本未比对到参考基因组的reads数量。

-t –output-tags LIST设置FORMAT和INFO的列表内容,以逗号分割。

-u –uncompressed 生成未压缩的VCF和BCF文件。

-I –skip-indel 不检测INDEL。

-m –min-ireads INT 候选INDEL的最小间隔的reads。

-F –gap-frac FLOAT 含有间隔reads的最小片段。

下面是一个使用-r参数和-l参数生成vcf文件的实例:

#! /bin/bash
#使用mpileup命令生成vcf文件
#这个示例中只对7号染色体进行了处理
echo "SamtoolsMpileupByChr Begin: " `date` && \
samtools mpileup \
-l chr25Region.bed \
-r 7 \
-q 1 \
-C 50 \
-t DP,DV \
-m 2 \
-F 0.002 \
-uvf \
human.fasta \
test_3.bam \
--output test_3.chr7.raw.vcf && \
echo "SamtoolsMpileupByChr End: " `date`
如有谬误,还请指正。

[samtools]mpileup命令简介相关推荐

  1. [samtools]flagstat命令简介

    samtools flagstat命令简介: 统计输入文件的相关数据并将这些数据输出至屏幕显示.每一项统计数据都由两部分组成,分别是QC pass和QC failed,表示通过QC的reads数据量和 ...

  2. [samtools]index命令简介

    samtools index命令的功能描述: 为了能够快速访问bam文件,可以为已经基于坐标排序后bam或者cram的文件创建索引,生成以.bai或者.crai为后缀的索引文件.必须使用排序后的文件, ...

  3. samtools常用命令详解

    samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以 ...

  4. samtools 常用命令详解

    samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件:然后对bam文件进行各种操作, ...

  5. linux wc 命令简介

    此wc命令不是让大家没有食欲的地方.而是linux下一个简单的小命令. NAME wc - word, line, character, and byte count SYNOPSIS wc [-cl ...

  6. WINCE cvrtbin命令简介

    ********************************LoongEmbedded******************************** 作者:LoongEmbedded(kandi ...

  7. find与grep命令简介及正则表达式(转)

    find与grep命令简介及正则表达式 两个更为有用的命令和正则表达式 在我们开始学习新的Shell编程知识之前,我们先来看一下两个更为有用的两个命令,这两个命令虽然并不是Shell的一部分,但是在进 ...

  8. NoSQL数据库Redis使用命令简介

    NoSQL 数据库Redis使用命令简介 NOSQL数据库可以按照它们的数据模型分成4类: 1.键-值对存储库(Key-Value) redis-- 2.BigTable实现(BigTable-imp ...

  9. 快速上手Linux核心命令(一):核心命令简介

    Linux核心命令系列文章目录 快速上手Linux核心命令(一):核心命令简介 快速上手Linux核心命令(二):关机.重启 快速上手Linux核心命令(三):文件和目录操作命令 快速上手Linux核 ...

最新文章

  1. 模态对话框的父窗口设置
  2. 5G对AIoT的作用并无夸大,最大价值在于融合
  3. JQuery+ajax+jsonp 跨域访问
  4. 图解C# Console 输出和Console相关编程复习总结
  5. 成功者五大因素 奸的好人-笔记
  6. 【Transformer】ViT:An image is worth 16x16: transformers for image recognition at scale
  7. taskset设置CPU affinity
  8. 业务太复杂?教你如何降低软件的复杂性
  9. CSS 的三种样式 内联 内部 外部
  10. Android 创建自己的Camera App
  11. InstallAnywhere制作出来的安装包在64位机上无法卸载
  12. Python Day 19 面向对象(初识面向对象)
  13. 一篇好奇心文,带你看懂基金的运营全貌
  14. ISO27001:2013和ISO27001:2005的差异对比
  15. Matlab:厄米-高斯光束合成拉盖尔-高斯光束
  16. 网络服务器是硬盘吗,云盘与网络服务器硬盘是什么?它们一样吗?
  17. php iis7.5_浅析iis7.5安装配置php环境
  18. 世界标准时间(日期带T)转北京时间
  19. Chmox - Mac下的CHM电子书阅读器
  20. [DAX] MIN函数 | MINX函数

热门文章

  1. 如何把微信语音汇总成一个MP3文件?
  2. Python3引入ssl报错(解决方案)
  3. CIC梳妆滤波器matlab仿真
  4. 荔枝派nano上手记录
  5. 【电气专业知识问答】问:什么是交流不停电电源(UPS)?
  6. 【沐风老师】3dMax模型贴图贴画插件使用方法详解
  7. 递推公式求时间复杂度
  8. 【go】配置goproxy
  9. 微信一直无妨链接服务器,女人心里没有你,微信不会拉黑,不会删除,却会有这些信号!...
  10. 呼吸笔记3-From Fresnel Diffraction Model to Fine-grained Human Respiration Sensing with Commodity Wi-Fi