用BWA进行序列比对
用BWA进行序列比对
BWA,即Burrows-Wheeler-Alignment Tool。BWA 是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。今天分享的是使用BWA进行序列比对:
BWA包含三种算法:
BWA-bactrack 用于进行illumina reads的比对,最大长度为100bp
BWA-SW 用于long read,支持长度为70bp-1M,同时支持剪切性比对
BWA-MEM最新的算法,比BWA-SW更加快速和准确。
操作步骤
$ tar jxf /opt/software/bwa-0.7.10.tar.bz2 -C /opt/biosoft/
$ cd /opt/biosoft/bwa-0.7.10/
$ make
$ echo 'PATH=
$PATH:/opt/biosoft/bwa-0.7.10' >> ~/.bashrc
$ source ~/.bashrc
$ mkdir -p /opt/bwa
$ cd /opt/bwa
$ ln -s /opt/genome.fasta
$ ln -s /opt/DATA.* ./
$ bwa index genome.fasta -p genome
建立index数据库
$ bwa mem -t 4 genome DATA.1.fastq DATA.2.fastq > DATA.mem.sam
结果为DATA.mem.sam。先用MEM算法,再用SW算法延伸,执行局部比对和剪切性比对,可能出现多个最优比,这对long reads很重要。
$ bwa bwasw -t 4 genome DATA.1.fastq DATA.2.fastq > DATA.bwasw.sam
结果为DATA.bwasw.sam。对输入的第一个文件的所有序列进行比对,假如输入两个文件,则进行paired end 比对,这种模式仅对illumina的short-insert数据进行比对,在paired end 模式下仍会输出剪切性比对结果,但是会标记为not properly paired,有多个位点,则不会写入mate的匹配位置。
$ bwa aln -t 4 genome DATA.1.fastq > DATA.1.sai
$ bwa aln -t 4 genome DATA.2.fastq > DATA.2.sai
$ bwa sampe genome DATA.1.sai DATA.2.sai DATA.1.fastq DATA.2.fastq > DATA.backtrack.sam
结果为DATA.backtrack.sam。经典的bwa使用方式,先使用aln命令将单独的reads比对到参考序列,再使用sampe生成sam文件。
用BWA进行序列比对相关推荐
- BWA mem序列比对时出现:paired reads have different names 问题解决
问题: 在用BWA进行序列比对时出现:[mem_sam_pe] paired reads have different names: "A00920:973:H5GWJDSX3:2:1103 ...
- BWA/BWT 比对软件
名称 bwa – Burrows-Wheeler Alignment Tool 内容 摘要 描述 命令行与选项 SAM 比对格式 短序列比对注意事项 比对精确性 估计插入大小分布 ...
- figtree需要在JAVA下运行吗_Phylogenomic_Tutorial || ML_Tree inference
Github/mmatschiner的phylogenetic & phylogenomic学习教程记录[一]多序列比对:核算替换模型的选择:最大似然法建树的学习 [TOC] 软件准备Prep ...
- 基因组大数据变异检测算法的并行优化
基因组大数据变异检测算法的并行优化 基因组大数据变异检测算法的并行优化 崔英博1, 黄春1, 唐滔1, 杨灿群1, 廖湘科1, 彭绍亮2,3 1 国防科技大学计算机学院,湖南 长沙 410073 2 ...
- 宏基因组实战7. bwa序列比对, samtools查看, bedtools丰度统计
前情提要 如果您在学习本教程中存在困难,可能因为缺少背景知识,建议先阅读本系统前期文章 宏基因组分析理论教程 微生物组入门圣经+宏基因组分析实操课程 1背景知识-Shell入门与本地blast实战 2 ...
- 短序列比对利器-bwa
官方文档 安装 #直接conda简单粗暴了 or 去官网下载安装 conda install bwa 简介 即Burrows-Wheeler-Alignment Tool.BWA 是一种能够将差异度较 ...
- BWA比对及Samtools提取目标序列
今天想看一下自己的序列里面会不会有某细菌基因组存在,主要使用BWA和Samtools: bwa主要用于将低差异度的短序列与参考基因组进行比对.主要包含三种比对算法:backtrack.SW和MEM,第 ...
- fgbio,picard处理带有UMI的fq序列
UMI:unique molecular identifier,UMI建库检测稀有突变.校正测序错误与PCR偏差等. 得到包含UMI分子标签信息的BAM文件 1.提取UMI # 也能处理.gz 压缩文 ...
- 一种PacBio测序数据组装得到的基因组序列的纠错方法
技术领域 本发明涉及生物信息技术领域,更具体的说,它涉及一种PacBio测序数据组装得到的基因组序列的纠错方法. 背景技术 PacBio是一家测序仪公司,提供第三代测序技术测序平台,他们的测序仪产生的 ...
最新文章
- Develop chrome extension study
- LeetCode中二叉树相关题
- SAP UI5 Fiori flower动画效果的实现明细
- 一周工作60个小时并不值得骄傲,这是个问题!
- 数学建模学习笔记(九)——聚类模型
- ElasticSearch多字段查询best_fieldsmost_fields
- 转型个股赚钱机会最大--封起“345”选股
- 期待已久的Java 9 今日正式发布,新特性解读
- 极光笔记 | 极光clickhouse千亿级数据分析实践之路
- 日语输入法下载(转)
- Ubuntu 如何更换软件源
- js 实现删除确认提示框
- -verbose:gc 和 -XX:+PrintGC 的区别
- UICollectionViewCell复用时修改子页面属性出现混乱的解决方法
- MSCL超级工具类(C#),开发人员必备,开发利器
- 【图像分割】基于计算机视觉实现视网膜图像中的血管分割附matlab代码
- 教你如何用VB做控件*.ocx
- 用 Matlab 实现 GS 算法设计计算全息图
- C++模板函数的声明和定义是否可以分开?
- 考研作文重点框架、句子、词汇总结