03比对与 bam 文件格式

参考基因组及索引

通 过 trim 过滤后的到的 fq,需要比对到参考基因组上才能让这些数据有意义。前面我们已经下载了人类参考基因组 hg38 版本,而且是从 GATK 数据库下载的,原文件大小为 800 多M,解压后为 3G 左右。同时也需要构建该参考基因组的 bwa 索引文件,即:

20K   gatk_hg38.amb
3.0G  gatk_hg38.bwt
1.5G  gatk_hg38.sa
445K  gatk_hg38.ann
768M  gatk_hg38.pac

索引文件的作用类似于一本书的目录的作用,起到一个快速查找的功能。构建过程非常消耗时间和服务器的资源,方法是:

conda activate wes
cd ~/wes_cancer/data
gunzip Homo_sapiens_assembly38.fasta.gz
time bwa index -a bwtsw -p gatk_hg38 ~/wes_cancer/data/Homo_sapiens_assembly38.fasta
cd ~/wes_cancer/project

构建过程中会产生很多信息:

[bwa_index

03比对与 bam 文件格式相关推荐

  1. linux bam文件格式,pysam - 多种格式基因组数据(sam/bam/vcf/bcf/cram/…)读写与处理模块(python)...

    在开发基因组相关流程或工具时,经常需要读取.处理和创建bam.vcf.bcf文件.目前已经有一些主流的处理此类格式文件的工具,如samtools.picard.vcftools.bcftools,但此 ...

  2. linux bam文件格式介绍,Sam和bam文件说明

    SAM文件 SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息. SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割 ...

  3. linux bam文件格式,sam和bam格式文件的shell小练习-答案

    sam和bam格式文件的shell小练习 首先使用bowtie2软件自带的测试数据生成sam/bam文件,代码如下: mkdir -p ~/biosoft cd ~/biosoft wget http ...

  4. SAM/BAM文件格式简介(一)

    欢迎关注"生信修炼手册"! 将reads比对到参考基因组上,我们称之为mapping.mapping的工具很多,为了方便下游分析,对于mapping产生的文件,业界有一个统一的标准 ...

  5. SAM和BAM文件格式详解

    在SAM输出的结果中每一行都包括十二项通过Tab分隔(\t),从左到右分别是: 1 QNAME,序列的名字(Read的名字) 2 FLAG, 概括出一个合适的标记,各个数字分别代表 1     序列是 ...

  6. bam文件转fq.gz文件

    bam转fq过程 1.fq文件格式 2.bam文件格式 3.转换思路 3.1 软件bedtools自带功能 3.2 自己写代码 3.3 代码示例 4.参考资料 1.fq文件格式   fastq格式是一 ...

  7. 捋一下测序后生信分析内容及其常用软件

    捋一下测序后生信分析内容及其常用软件 当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤.质控过滤软件如fastqc.multiQC.trimmomatic等. 得到基因组的cle ...

  8. 共享收集的图像处理方面的一些资源和网站。

    首先,共享在软件编写过程访问和收集到的一些与图像或优化有关的网站和博客. http://blog.csdn.net/housisong/category/325273.aspx            ...

  9. 实用遗传咨询 | 精神与行为异常-Autism

    [1] Practical Genetic Counselling (7th Edition. Peter S. Harper) PART 2 GENEtIC COUNSELLING: Specifi ...

最新文章

  1. apply()和call()的区别
  2. Android Fragment 解析(上)
  3. 特性开关框架 java_关于Mosfet你应当知道的开关特性
  4. 【以太坊】Ethereum交易过程及ethereumjs-tx的应用
  5. Understand分析Kinect SDK 1.7自带例子(C++)图集一
  6. DNN结构演进History—CNN-GoogLeNet :Going Deeper with Convolutions
  7. 解决Qt5 Creator无法切换输入法(fcitx),Ubuntu中不能使用搜狗输入法录入汉字问题...
  8. 域名升级访问中拿笔记好_SEO优化中如何让你的页面访问速度更快
  9. Blazor服务器应用程序中使用EF Core的多租户
  10. js遍历树节点下的所有子节点_「Javascript数据结构」× 二叉搜索树
  11. MVC利用URLRoute实现伪静态后正真的静态html无法访问
  12. 聚类算法教程(3):层次聚类算法Hierarchical Clustering Algorithms
  13. VS2010使用c++、gSOAP创建WebService 图文教程
  14. CAD增强属性编辑器的使用
  15. 前端实现 导出图片,导出PDF(截图原理)
  16. android 自定义 snackbar,Android Study Material Design 五 之:自定义Toast以及玩转SnackBar...
  17. kolla 部署openstack train版本(三节点controller+compute+storage)------功能测试
  18. 【写在中秋时刻】硬件冷钱包、软件冷钱包、多签(Multisig)钱包多视角比较分析
  19. eplan部件列表手动修改_EPLAN的批量修改功能
  20. 天融信学习笔记---DOS命令

热门文章

  1. Round 1—数据结构基本概念
  2. 6个杰出的国产APP推荐,你知道多少呢?
  3. 计算机工程制图标注,工程制图与计算机辅助设计:第3章 组合体视图即尺寸标注...
  4. DASCTFNepCTF 部分writeup
  5. 服务器 z盘 映射,小脚本:在终端上映射网络驱动器Z盘
  6. 高手速成android开源项目[View篇]
  7. CoinCola可盈可乐研究院2月报 | 加密货币集体上涨
  8. 力扣K神图解算法数据结构解析04
  9. java图形用户界面设计之计算器【加减乘除】
  10. java js hexmd5_JAVA与JS在MD5上问题