UMI:unique molecular identifier,UMI建库检测稀有突变、校正测序错误与PCR偏差等。

得到包含UMI分子标签信息的BAM文件

1.提取UMI

# 也能处理.gz 压缩文件

picard FastqToSam F1=test_read1.fq F2=test_read2.fq O=test.uBam SM=testsamplefgbio  -Xmx50G ExtractUmisFromBam  -i  test.uBam  -o  test.umi.uBam  -r  5M2S+T 5M2S+T  -s  RX -t ZA  ZB

2. 比对去掉umi的序列

samtools fastq  test.umi.uBam | bwa mem -t 50 -p /data/ref/hg38/hg38 /dev/stdin | samtools view -b > test.umi.Bam

3. 合并uBam 和 Bam 得到带有UMI信息的比对文件

picard MergeBamAlignment R=/data/ref/hg38/hg38.fa \UNMAPPED_BAM=test.umi.uBam  \ALIGNED_BAM=test.umi.Bam \O=test.umi.merged.Bam  \CREATE_INDEX=true    \MAX_GAPS=-1 \ALIGNER_PROPER_PAIR_FLAGS=true \VALIDATION_STRINGENCY=SILENT \SO=coordinate \ATTRIBUTES_TO_RETAIN=XS

4. Call Consensus Reads

fgbio GroupReadsByUmi \--input=test.umi.merged.Bam \--output=test.umi.group.Bam  \--strategy=paired  --min-map-q=20  --edits=1 --raw-tag=RXfgbio CallMolecularConsensusReads \--min-reads=1 \--min-input-base-quality=20 \--input=test.umi.group.Bam \--output=test.consensus.uBamsamtools fastq test.consensus.uBam | bwa mem -t 50 -p /data/ref/hg38/hg38  /dev/stdin | samtools view -b - > test.consensus.Bampicard MergeBamAlignment R=/data/ref/hg38/hg38.fa \UNMAPPED_BAM=test.consensus.uBam  \ALIGNED_BAM=test.consensus.Bam \O=test.consensus.merge.Bam  \CREATE_INDEX=true    \MAX_GAPS=-1 \ALIGNER_PROPER_PAIR_FLAGS=true \VALIDATION_STRINGENCY=SILENT \SO=coordinate \ATTRIBUTES_TO_RETAIN=XSfgbio FilterConsensusReads \--input=test.consensus.merge.Bam  \--output=test.consensus.merge.filter.Bam \--ref=/data/ref/hg38/hg38.fa --min-reads=2 \--max-read-error-rate=0.05 \--max-base-error-rate=0.1 \--min-base-quality=30 \--max-no-call-fraction=0.20fgbio ClipBam \--input=test.consensus.merge.filter.Bam   \--output=test.consensus.merge.filter.clip.Bam \--ref=/data/ref/hg38/hg38.fa  \--clip-overlapping-reads=true

参考:

http://fulcrumgenomics.github.io/fgbio/tools/latest/
https://broadinstitute.github.io/picard/command-line-overview.html#LiftOverIntervalList

fgbio,picard处理带有UMI的fq序列相关推荐

  1. linux中fq格式转fa,利用linux处理fq/fa小练习

    刘小泽写于19.1.11 知识就是这样,越用越熟练,像awk.grep.sed等,用时间长了就有感觉了:另外所有我们遇到的问题都能搜索到,所以不用担心办法解决 这份题不是我出的,数据也不是我的,我只是 ...

  2. bam文件转fq.gz文件

    bam转fq过程 1.fq文件格式 2.bam文件格式 3.转换思路 3.1 软件bedtools自带功能 3.2 自己写代码 3.3 代码示例 4.参考资料 1.fq文件格式   fastq格式是一 ...

  3. Sentieon软件UMI单分子标记处理模块发布,大幅提升准确度和速度

    单分子标签技术(Unique Molecular Identifier, UMI)被广泛应用在极高灵敏度的NGS检测中,尤其是目前炙手可热的循环肿瘤DNA (ctDNA) 检测.ctDNA作为一种非侵 ...

  4. 利用python处理dna序列_利用Python编程提取基因组基因序列

    生物技术. DOI: 10.16660/j.cnki.1674-098X.2019.11.141 利用Python编程提取基因组基因序列 ① 庞雪原 张婷婷 (东北农业大学生命科学学院 黑龙江哈尔滨 ...

  5. 序列操作神器:Seqkit

    导读 本文[1]将介绍 SeqKit :用于 FASTA/Q 文件操作的跨平台和超快工具包,后续提供了一些长用的示例. 1. 安装 conda 安装 conda install -c bioconda ...

  6. NAR:UNITE真菌鉴定ITS数据库——处理未分类和并行分类

    上方文章标题要求:包括杂志名缩写(一个词的杂志名不缩写,两个及上用实词首字母)和吸引人且有重要信息的语句,中间用中文冒号(:)分隔 注:文中灰色部分(引用格式)为写作说明文字,帮助编辑规范Markdo ...

  7. NAR:UNITE真菌鉴定ITS数据库——处理未分类和并行分类(数据库文章阅读笔记Markdown模板)...

    上方文章标题要求:包括杂志名缩写(一个词的杂志名不缩写,两个及上用实词首字母)和吸引人且有重要信息的语句,中间用中文冒号(:)分隔 注:文中灰色部分(引用格式)为写作说明文字,帮助编辑规范Markdo ...

  8. NAR:UNITE真菌鉴定ITS数据库——处理未分类和并行分类(数据库文章阅读模板)

    上方文章标题要求:包括杂志名缩写(一个词的杂志名不缩写,两个及上用实词首字母)和吸引人且有重要信息的语句,中间用中文冒号(:)分隔 注:文中灰色部分(引用格式)为写作说明文字,帮助编辑规范Markdo ...

  9. 空间转录组学(Spatial Transcriptomics)

    01.空间转录组技术的发展 近年来单细胞转录组测序技术的应用大大拓宽了人们的视野,使人们能够深入了解组织中细胞的构成的多样性和基因表达状态.众所周知,基因表达具有时间和空间的特异性,通过对不同时间点的 ...

最新文章

  1. 京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要
  2. 立体视觉动态测量技术
  3. jenkins的基本操作
  4. music算法_“要热爱 请深爱”系列(5)浅谈模拟退火算法
  5. 现代3D图形编程学习-关于本书(译)
  6. linux 提示符 异常,linux终端提示符异常 bash-4.1$
  7. mysql 建立索引的例子_mysql建立合适的索引的例子
  8. 数据库事务隔离级别+Spring 声明性事务隔离级别
  9. 计算机网络章末总结,计算机网络 (前两章总结)
  10. 《金字塔原理》学习笔记 | 第1篇—表达的逻辑
  11. win7美化_win7/8/10桌面插件美化
  12. Trained Ternary Quantization
  13. log4j2远程代码执行漏洞学习总结
  14. STLINK怎么与STM32单片机连接
  15. 学业水平考试b能上985吗_会考c能上985吗 985211对会考的要求
  16. 眼光毒辣!这家投资团队让 “鸡蛋森” 马克安德森投了都说好
  17. 关于微新分享PC微信端成功,手机微信失败
  18. 早期股权分配不是有钱就能搞定的!
  19. “改造” VS Code 编辑器,一起写个插件吧!
  20. 电商平台-团购模块设计与架构

热门文章

  1. python3安装常见问题_Python3下安装spyder及常见问题解决
  2. go语言中的变量与作用域
  3. ubuntu16.04下ROS最新换源方法,解决Hash sum mismatch 问题
  4. 饥荒怎么自动订阅服务器,饥荒联机版自动挂礼物mod及使用方法详解
  5. winhttp get 实例_实例|CASS的绘制的航道断面,怎么多了两个边沟? 135
  6. threejs画面拖动事件判断
  7. RDKit | 基于RDKit计算3D药效团指纹
  8. nature | 基于深度学习方法的虚拟组织染色
  9. 第九课.Python文件操作
  10. Shiny平台构建与R包开发(三)——数据输出