blast 简单使用
安装
可以用conda
安装
构建本地比对库
收集mask信息
为了屏蔽简单重复序列的干扰,需要收集mask信息。
核酸序列
算法有windomasker和dustmasker两种。
此处用的是dustmasker.
dustmasker -in genome.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out dust.asnb
-in:输入文件
-infmt: 输入文件格式
-parse_seqids:按序列id解析,此外用了,下面也要用,保持一致
-outfmt:输出文件格式
-out:输出文件名
蛋白序列
segmasker -in peptide.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out peptide_seg.asnb > seg.log 2>&1 &
创建本地数据库
makeblastdb -in genome.fasta -input_type fasta -dbtype nucl -parse_seqids -mask_data dust.asnb -out genome
makeblastdb -in peptide.fasta -input_type fasta -dbtype prot -parse_seqids -mask_data peptide_seg.asnb -out peptide
-dbtype:数据库类型地:nucl
(核酸)、prot
(蛋白)
-mask_data:上一步收集的mask信息
查看数据库信息
blastdbcmd -db blastdatabse -info
megablast
MegaBlast 是blastn的一个功能,相比于经典balstn更快.
缺点是MegaBlast只适合找相似度较高的序列(一般90%以上),可以用于物种内部或分歧不太大的物种间比对。
序列相似性不高 的序列可以使用dc-megablast
(Discontiguous-blast),适于70%以上相似度的序列。
使用index可以让MegaBlast更快,特别适合1M以下的序列比对,缺点是index文件比较大,是blast库的4倍,word size
必须至少16以上,dc-megablast
不支持。
建立MegaBlast专用的index
nohup makembindex -iformat blastdb -input HAU1.1_chr &
使用
-use_index true
使用blast比对序列
1. 查看mask算法ID
之前的masked信息并不会默认使用,需要手动加入参数-db_soft_mask 算法ID
或者`-db_hard_mask 算法ID。
blastdbcmd -db genome -infoDatabase: genome.fasta2,190 sequences; 2,348,137,562 total bases
Date: Mar 29, 2019 9:50 PM Longest sequence: 124,056,332 bases
Available filtering algorithms applied to database sequences:
Algorithm ID Algorithm name Algorithm options
11 dust window=64; level=20; linker=1
Volumes:/genome
可以看到算法ID:11,算法名字:dust
另外,windowmasker的算法ID可能是:30
2. 使用megablast比对,加入masked信息和index
blastn -query test.txt -task megablast -db_soft_mask 11 -use_index true -db genome -outfmt 7 -out test.out -num_threads 20
- -query:需要查询的序列,fasta格式,支持多序列
- -task:子模块,默认
blastn
,可选blastn-short
、megablast
、dc-megablast
等 - -db_soft_mask:使用mask信息,接算法ID,
dust
为11
,window
为30
,可以提高比对速度。另一个备选参数为-db_hard_mask
- -use_index:megablast特有参数,使用index信息
- -db:balst数据库
- -outfmt:输出文件格式,如果仅想找到最相似的序列,可以用格式6或者7;如果想自看两个序列间的具体差异,可以用格式0或者1
- -num_threads:线程
转出格式比较
0 = Pairwise
比对到结果分别显示
1 = Query-anchored showing identities
比对到的结果一起显示
2 = Query-anchored no identities
不省略正确比对碱基
3 = Flat query-anchored showing identities
同格式1相似
4 = Flat query-anchored no identities
同格式2相似
5 = BLAST XML
XML格式
6 = Tabular
制表符分隔格式
7 = Tabular with comment lines
与格式6相比,加了注释行
8 = Seqalign (Text ASN.1)
9 = Seqalign (Binary ASN.1)
10 = Comma-separated values
CSV格式
11 = BLAST archive (ASN.1),
12 = Seqalign (JSON),
13 = Multiple-file BLAST JSON,
14 = Multiple-file BLAST XML2,
15 = Single-file BLAST JSON,
16 = Single-file BLAST XML2,
17 = Sequence Alignment/Map (SAM),
18 = Organism Report
blast 简单使用相关推荐
- csv转为矩阵 python_超简单python脚本实现从resfinder+blast下机数据到csv抗性基因矩阵...
今天还是在做张阿姨的项目,还是那100多个菌,她说要blast一下抗性基因,那就比咯,最出名与权威的的细菌抗性基因库自然肯定是resfinder了. for i in $(cat list); do ...
- Blast+安装使用的简单流程
Blast+使用 安装 安装 通过https://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/网站下载,并执行安装 $ tar zxvpf ncbi-b ...
- USEARCH — 最简单易学的扩增子分析流程(中国总代理)
USEARCH -- 最简单易学的扩增子分析流程 USEARCH官方英文主页:http://www.drive5.com/usearch/ 本站经USEARCH作者Robert Edgar授权,由&l ...
- USEARCH —— 最简单易学的扩增子分析流程(中国总代理)
USEARCH -- 最简单易学的扩增子分析流程 USEARCH中文帮助文档(USEARCH Chinese manual) USEARCH官方英文主页:http://www.drive5.com/u ...
- USEARCH —— 最简单易学的扩增子分析流程
USEARCH -- 最简单易学的扩增子分析流程 USEARCH中文帮助文档(USEARCH Chinese manual) USEARCH官方英文主页:http://www.drive5.com/u ...
- Microbiome:芝麻菜中肠杆菌科主导核心微生物组并贡献抗生素抗性组(简单套路16S+meta+培养组发高分文章)
文章目录 日报 文章思路总结 摘要 主要结果 图1. 三类样本的细菌组成 图2. 宏基因组中肠杆菌群体结构和丰度 图3. 叶际和根际中肠杆菌科的核心微生物组 图4. 芝麻菜抗性组评估 图5. 可食用植 ...
- Basic local alignment search tool (BLAST)
Basic local alignment search tool (BLAST) 包括:blastn, blastp, blastx, tblastn, tblastx等. 使用conda安装即可. ...
- blast | diamond 输出结果选择和解析 | 比对
之前的文章:构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb 本地运行blast时,需要指定out fo ...
- python简单编程语言_功能强大而又简单易学的编程语言Python
Python是一种面向对象.直译式计算机程序设计语言,也是一种功能强大的通用型语言(维基百科).自从上次写那个批量Blast小程序的时候接触了Python,发现这个玩意儿真是好用,后来还用它弄了个动态 ...
最新文章
- 干货丨一份不可多得的深度学习技巧指南
- struts.xml向页面传参
- python3 str bytes 字符串 字节 互相转换
- c++同时读取文本_VBA专题08:使用VBA操作文本文件
- python教程实例-Python中函数的用法实例教程
- python培训中心-深圳Python培训
- 揭密微信《跳一跳》小游戏那些外挂
- android 设置点击ProgressDialog外的区域不消失
- linux 进程通信比较,浅析Linux进程通信的几种方式及其比较
- Ubuntu工具zsh和Byobu
- 华为云推UGO:一手抓结构迁移,一手抓SQL转换
- socks5 转换为 http 代理(使用privoxy)
- WebMagic springboot 多站点垂直数据采集(支持插队采集)
- Vplayer服务配置-手机播放局域网视频
- 利用web实现android的界面,利用WebView加载手机端网页实现APP封装
- java微信多客服_怎么实现微信多公众号管理?有哪些多客服系统?
- 有一种爱,我们不能称之为爱情
- Linux shell 命令学习 大全
- 2022年可可香精市场前景分析及研究报告
- 华为语音解锁设置_华为手机免费语音转文字功能如何开启?手把手教你如何设置,超赞...