[samtools]mpileup命令简介
samtools的mpileup命令是一个samtools中一个很重要的命令。它的主要功能主要是生成BCF、VCF文件或者pileup一个或多个bam文件。比对记录以在@RG中的样本名作为区分标识符。如果样本标识符缺失,那么每一个输入文件则视为一个样本。
在pileup格式中(没有-u或者-g参数),每一行代表基因组的位置,由染色体名、1个碱基坐标、参考碱基、reads覆盖该位点的数量、reads的碱基、碱基质量和比对质量。有关匹配、错配、插入缺失、链、比对质量和一条reads的开始结束位置都被编码到reads碱基列。在此列上,“.”表示与正链上的参考碱基匹配,“,”表示与负链上的参考碱基匹配,“>”和“<”表示跳过参考基因,“ACGTN”表示正链上的错配,“acgtn”表示负链上的错配。此模式“\\+[0-9]+[ACGTNacgtn]+”表示在此位点至下一个位点之间与参考基因组对应位点相比,多了一段插入碱基,插入长度由模式中的整数表示。与此类似,“\\-[0-9]+[ACGTNacgtn]+”表示缺失,缺失的碱基使用“*”表示。同时,“^”表示reads的开始,“$”表示reads的结束。在“^”后的字符的ASCII码值减去33表示比对质量值。
另外,要注意到在输入文件中,有两种正交方式,通过使用-r和-l参数实现。-r参数需要指定一个索引号去进行随机访问而后者-l参数通过文件中的指定区域进行过滤,无需索引。这两个参数可以同时使用。通常使用bed文件,将待处理的文件进行分割,然后同时进行处理,这样可以加快处理速度。最后,处理完毕后,再合并。
Mpileup命令中参数比较多,这里只介绍一些常用的参数。
参数:
-C --adjust-MQ INT 用于降低比对质量的系数,如果reads中含有过多的错配。不能设置为零。BWA推荐值为50。
-A --count-orphans 在检测变异中,不忽略异常的reads对。
-I –positions FILE BED文件或者包含区域位点的位置列表文件。位置文件包含两列,染色体和位置,从1开始计数。BED文件至少包含3列,染色体、开始位置和结束位置,开始端从0开始计数。
-r –region STR 只在指定区域产生pileup,需要已建立索引的bam文件。通常和-l参数一起使用。
-o –output FILE 生成pileup格式文件或者VCF、BCF文件而不是默认的标准输出。
-g –BCF 计算基因型的似然值和输出文件格式为BCF。
-v –VCF 计算基因型的似然值和输出文件格式为VCF。
-D 输出每个样本的reads深度。
-V 输出每个样本未比对到参考基因组的reads数量。
-t –output-tags LIST设置FORMAT和INFO的列表内容,以逗号分割。
-u –uncompressed 生成未压缩的VCF和BCF文件。
-I –skip-indel 不检测INDEL。
-m –min-ireads INT 候选INDEL的最小间隔的reads。
-F –gap-frac FLOAT 含有间隔reads的最小片段。
下面是一个使用-r参数和-l参数生成vcf文件的实例:
#! /bin/bash
#使用mpileup命令生成vcf文件
#这个示例中只对7号染色体进行了处理
echo "SamtoolsMpileupByChr Begin: " `date` && \
samtools mpileup \
-l chr25Region.bed \
-r 7 \
-q 1 \
-C 50 \
-t DP,DV \
-m 2 \
-F 0.002 \
-uvf \
human.fasta \
test_3.bam \
--output test_3.chr7.raw.vcf && \
echo "SamtoolsMpileupByChr End: " `date`
[samtools]mpileup命令简介相关推荐
- [samtools]flagstat命令简介
samtools flagstat命令简介: 统计输入文件的相关数据并将这些数据输出至屏幕显示.每一项统计数据都由两部分组成,分别是QC pass和QC failed,表示通过QC的reads数据量和 ...
- [samtools]index命令简介
samtools index命令的功能描述: 为了能够快速访问bam文件,可以为已经基于坐标排序后bam或者cram的文件创建索引,生成以.bai或者.crai为后缀的索引文件.必须使用排序后的文件, ...
- samtools常用命令详解
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以 ...
- samtools 常用命令详解
samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件:然后对bam文件进行各种操作, ...
- linux wc 命令简介
此wc命令不是让大家没有食欲的地方.而是linux下一个简单的小命令. NAME wc - word, line, character, and byte count SYNOPSIS wc [-cl ...
- WINCE cvrtbin命令简介
********************************LoongEmbedded******************************** 作者:LoongEmbedded(kandi ...
- find与grep命令简介及正则表达式(转)
find与grep命令简介及正则表达式 两个更为有用的命令和正则表达式 在我们开始学习新的Shell编程知识之前,我们先来看一下两个更为有用的两个命令,这两个命令虽然并不是Shell的一部分,但是在进 ...
- NoSQL数据库Redis使用命令简介
NoSQL 数据库Redis使用命令简介 NOSQL数据库可以按照它们的数据模型分成4类: 1.键-值对存储库(Key-Value) redis-- 2.BigTable实现(BigTable-imp ...
- 快速上手Linux核心命令(一):核心命令简介
Linux核心命令系列文章目录 快速上手Linux核心命令(一):核心命令简介 快速上手Linux核心命令(二):关机.重启 快速上手Linux核心命令(三):文件和目录操作命令 快速上手Linux核 ...
最新文章
- 模态对话框的父窗口设置
- 5G对AIoT的作用并无夸大,最大价值在于融合
- JQuery+ajax+jsonp 跨域访问
- 图解C# Console 输出和Console相关编程复习总结
- 成功者五大因素 奸的好人-笔记
- 【Transformer】ViT:An image is worth 16x16: transformers for image recognition at scale
- taskset设置CPU affinity
- 业务太复杂?教你如何降低软件的复杂性
- CSS 的三种样式 内联 内部 外部
- Android 创建自己的Camera App
- InstallAnywhere制作出来的安装包在64位机上无法卸载
- Python Day 19 面向对象(初识面向对象)
- 一篇好奇心文,带你看懂基金的运营全貌
- ISO27001:2013和ISO27001:2005的差异对比
- Matlab:厄米-高斯光束合成拉盖尔-高斯光束
- 网络服务器是硬盘吗,云盘与网络服务器硬盘是什么?它们一样吗?
- php iis7.5_浅析iis7.5安装配置php环境
- 世界标准时间(日期带T)转北京时间
- Chmox - Mac下的CHM电子书阅读器
- [DAX] MIN函数 | MINX函数
热门文章
- 如何把微信语音汇总成一个MP3文件?
- Python3引入ssl报错(解决方案)
- CIC梳妆滤波器matlab仿真
- 荔枝派nano上手记录
- 【电气专业知识问答】问:什么是交流不停电电源(UPS)?
- 【沐风老师】3dMax模型贴图贴画插件使用方法详解
- 递推公式求时间复杂度
- 【go】配置goproxy
- 微信一直无妨链接服务器,女人心里没有你,微信不会拉黑,不会删除,却会有这些信号!...
- 呼吸笔记3-From Fresnel Diffraction Model to Fine-grained Human Respiration Sensing with Commodity Wi-Fi