安装

可以用conda安装

构建本地比对库

收集mask信息

为了屏蔽简单重复序列的干扰,需要收集mask信息。

核酸序列

算法有windomasker和dustmasker两种。
此处用的是dustmasker.

dustmasker -in genome.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out dust.asnb

-in:输入文件
-infmt: 输入文件格式
-parse_seqids:按序列id解析,此外用了,下面也要用,保持一致
-outfmt:输出文件格式
-out:输出文件名

蛋白序列
segmasker -in peptide.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out peptide_seg.asnb > seg.log 2>&1 &

创建本地数据库

makeblastdb -in genome.fasta -input_type fasta -dbtype nucl -parse_seqids -mask_data dust.asnb -out genome
makeblastdb -in peptide.fasta -input_type fasta -dbtype prot -parse_seqids -mask_data peptide_seg.asnb -out peptide

-dbtype:数据库类型地:nucl(核酸)、prot(蛋白)
-mask_data:上一步收集的mask信息

查看数据库信息

blastdbcmd -db blastdatabse -info

megablast

MegaBlast 是blastn的一个功能,相比于经典balstn更快.
缺点是MegaBlast只适合找相似度较高的序列(一般90%以上),可以用于物种内部或分歧不太大的物种间比对。
序列相似性不高 的序列可以使用dc-megablast(Discontiguous-blast),适于70%以上相似度的序列。
使用index可以让MegaBlast更快,特别适合1M以下的序列比对,缺点是index文件比较大,是blast库的4倍,word size必须至少16以上dc-megablast不支持。
建立MegaBlast专用的index

nohup makembindex -iformat blastdb -input HAU1.1_chr &

使用

-use_index true

使用blast比对序列

1. 查看mask算法ID

之前的masked信息并不会默认使用,需要手动加入参数-db_soft_mask 算法ID或者`-db_hard_mask 算法ID。

blastdbcmd -db genome -infoDatabase: genome.fasta2,190 sequences; 2,348,137,562 total bases
Date: Mar 29, 2019 9:50 PM    Longest sequence: 124,056,332 bases
Available filtering algorithms applied to database sequences:
Algorithm ID Algorithm name Algorithm options
11 dust window=64; level=20; linker=1
Volumes:/genome

可以看到算法ID:11,算法名字:dust
另外,windowmasker的算法ID可能是:30

2. 使用megablast比对,加入masked信息和index

blastn -query test.txt -task megablast -db_soft_mask 11 -use_index true -db genome -outfmt 7 -out test.out -num_threads 20
  • -query:需要查询的序列,fasta格式,支持多序列
  • -task:子模块,默认blastn,可选blastn-shortmegablastdc-megablast
  • -db_soft_mask:使用mask信息,接算法ID,dust11window30,可以提高比对速度。另一个备选参数为-db_hard_mask
  • -use_index:megablast特有参数,使用index信息
  • -db:balst数据库
  • -outfmt:输出文件格式,如果仅想找到最相似的序列,可以用格式6或者7;如果想自看两个序列间的具体差异,可以用格式0或者1
  • -num_threads:线程

转出格式比较

0 = Pairwise

比对到结果分别显示

1 = Query-anchored showing identities

比对到的结果一起显示

2 = Query-anchored no identities

不省略正确比对碱基

3 = Flat query-anchored showing identities

同格式1相似

4 = Flat query-anchored no identities

同格式2相似

5 = BLAST XML

XML格式

6 = Tabular

制表符分隔格式

7 = Tabular with comment lines

与格式6相比,加了注释行

8 = Seqalign (Text ASN.1)

9 = Seqalign (Binary ASN.1)

10 = Comma-separated values

CSV格式

11 = BLAST archive (ASN.1),

12 = Seqalign (JSON),

13 = Multiple-file BLAST JSON,

14 = Multiple-file BLAST XML2,

15 = Single-file BLAST JSON,

16 = Single-file BLAST XML2,

17 = Sequence Alignment/Map (SAM),

18 = Organism Report

blast 简单使用相关推荐

  1. csv转为矩阵 python_超简单python脚本实现从resfinder+blast下机数据到csv抗性基因矩阵...

    今天还是在做张阿姨的项目,还是那100多个菌,她说要blast一下抗性基因,那就比咯,最出名与权威的的细菌抗性基因库自然肯定是resfinder了. for i in $(cat list); do ...

  2. Blast+安装使用的简单流程

    Blast+使用 安装 安装 通过https://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/网站下载,并执行安装 $ tar zxvpf ncbi-b ...

  3. USEARCH — 最简单易学的扩增子分析流程(中国总代理)

    USEARCH -- 最简单易学的扩增子分析流程 USEARCH官方英文主页:http://www.drive5.com/usearch/ 本站经USEARCH作者Robert Edgar授权,由&l ...

  4. USEARCH —— 最简单易学的扩增子分析流程(中国总代理)

    USEARCH -- 最简单易学的扩增子分析流程 USEARCH中文帮助文档(USEARCH Chinese manual) USEARCH官方英文主页:http://www.drive5.com/u ...

  5. USEARCH —— 最简单易学的扩增子分析流程

    USEARCH -- 最简单易学的扩增子分析流程 USEARCH中文帮助文档(USEARCH Chinese manual) USEARCH官方英文主页:http://www.drive5.com/u ...

  6. Microbiome:芝麻菜中肠杆菌科主导核心微生物组并贡献抗生素抗性组(简单套路16S+meta+培养组发高分文章)

    文章目录 日报 文章思路总结 摘要 主要结果 图1. 三类样本的细菌组成 图2. 宏基因组中肠杆菌群体结构和丰度 图3. 叶际和根际中肠杆菌科的核心微生物组 图4. 芝麻菜抗性组评估 图5. 可食用植 ...

  7. Basic local alignment search tool (BLAST)

    Basic local alignment search tool (BLAST) 包括:blastn, blastp, blastx, tblastn, tblastx等. 使用conda安装即可. ...

  8. blast | diamond 输出结果选择和解析 | 比对

    之前的文章:构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb 本地运行blast时,需要指定out fo ...

  9. python简单编程语言_功能强大而又简单易学的编程语言Python

    Python是一种面向对象.直译式计算机程序设计语言,也是一种功能强大的通用型语言(维基百科).自从上次写那个批量Blast小程序的时候接触了Python,发现这个玩意儿真是好用,后来还用它弄了个动态 ...

最新文章

  1. 干货丨一份不可多得的深度学习技巧指南
  2. struts.xml向页面传参
  3. python3 str bytes 字符串 字节 互相转换
  4. c++同时读取文本_VBA专题08:使用VBA操作文本文件
  5. python教程实例-Python中函数的用法实例教程
  6. python培训中心-深圳Python培训
  7. 揭密微信《跳一跳》小游戏那些外挂
  8. android 设置点击ProgressDialog外的区域不消失
  9. linux 进程通信比较,浅析Linux进程通信的几种方式及其比较
  10. Ubuntu工具zsh和Byobu
  11. 华为云推UGO:一手抓结构迁移,一手抓SQL转换
  12. socks5 转换为 http 代理(使用privoxy)
  13. WebMagic springboot 多站点垂直数据采集(支持插队采集)
  14. Vplayer服务配置-手机播放局域网视频
  15. 利用web实现android的界面,利用WebView加载手机端网页实现APP封装
  16. java微信多客服_怎么实现微信多公众号管理?有哪些多客服系统?
  17. 有一种爱,我们不能称之为爱情
  18. Linux shell 命令学习 大全
  19. 2022年可可香精市场前景分析及研究报告
  20. 华为语音解锁设置_华为手机免费语音转文字功能如何开启?手把手教你如何设置,超赞...

热门文章

  1. 【技术篇】IP寻址与地址解析
  2. 51单片机控制LED灯显示模式
  3. sql学习顺序指导(转)
  4. 从零实现3D图像引擎:(10)Hello3DWorld
  5. 企业实战之VCSA 6.5的安装图文教程
  6. 怎么释放mysql连接数_MySQL连接数太多应该怎么解决?
  7. vue拖动缩放组件(vue-drag-zoom) 增加禁止缩放拖拽功能
  8. 双倍余额递减法和年数总和法计提折旧的公式及方法
  9. js判断移动端是否安装某款app的多种方法
  10. 【记录】VUE3 + VITE + TS 配置跨域