步骤一:NT/NR库全库下载

用wget 对数据库进行下载

NT/NR库:https://ftp.ncbi.nlm.nih.gov/blast/db/

NT库有76个子文件构建成NT全库

NR库有63个子文件构建成NR全库

(ncbi网站处理好的文件,不需要建库)

https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz

https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz

这两个为nr/nt的fasta文件,需要建库

写一个简单的脚本,对nr/nt库进行下载

#!/bin/bash
for i in {00..76}
dowget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nt.${i}.tar.gzwget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nt.${i}.tar.gz.md5md5sum -c nt.${i}.tar.gz.md5tar -zxvf nt.${i}.tar.gz -Cecho "nt.${i} has done."
done
#!/bin/bash
for i in {00..63}
dowget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nr.${i}.tar.gzwget -c https://ftp.ncbi.nlm.nih.gov/blast/db/nr.${i}.tar.gz.md5md5sum -c nr.${i}.tar.gz.md5tar -zxvf nr.${i}.tar.gz -Cecho "nr.${i} has done."
done

注意:下载的时候要加-c参数,避免因网络问题下载失败

下载完后注意删除安装包

步骤二:把序列与nt/nr库进行比对

基本用法

蛋白质序列比对蛋白质数据库(blastp)

blastp -query seq.fast -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_des
criptions 10 -num_threads 8

核酸序列比对核算数据库(blastn)

blastn -query seq.fasta -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_descriptions 10 -num_threads 8

核酸序列比对蛋白质数据库(blastx)

blastx -query seq.fasta -out seq.blast -db dbname -outfmt 7 -evalue 1e-5 -num_descriptions 10 -num_threads 8

参数:
-query: 输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式
-evalue:设置输出结果的e-value值
-num_descriptions:tabular格式输出结果的条数
-num_threads:线程数

创建索引数据库

makeblastdb -in mouse.faa -dbtype nucl -input_type fasta -out dna

参数:
-in: 输入数据库文件
-dbtype:数据库类型 如果是蛋白质数据库则 nucl改为 prot
-out: 索引数据库名称

创建索引文件

dustmasker -in Nuc.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out Nuc_all.asnb

参数:
in:输入数据库文件
-infmt:输入文件的格式
-parse_seqids:解析序列的id,这个只需要提供参数,不要提供文件名
-outfmt:输出文件的格式,直接填写即可maskinfo_asnl_bin即可。
out:输出文件的文件名(索引文件名)。

创建数据库

makeblastdb -in Nuc.fasta -input_type fasta -dbtype nucl -parse_seqids -mask_data NucDatsBase.asnb -out Nuc_all

参数:
in:原本我们数据库的文件
input_type:输入文件的格式,很明显,我这里是fasta格式

本地blast与nr/nt库相关推荐

  1. 构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb...

    参考链接: FTP README 如何下载 NCBI NR NT数据库? 下载blast:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 先了解 ...

  2. NCBI下载nt/nr/swissprot库

    NCBI下载nt/nr/swissprot库 1. 确定你要下载文件的位置 https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/ 2. 进行下载 方法一:使用wge ...

  3. 生物信息学习--nr/nt 数据库(总+子)构建

    1. 从ncbi上下载数据 下载地址:https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/ mac端: 安装brew,运行如下命令: /bin/zsh -c &qu ...

  4. 本地blast详细用法

    本地Blast的详细使用方法 blastall -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T ...

  5. NCBI的NT库比对——blastn

    NCBI的NT库比对--blastn NT库比对,包括对测序数据和组装后的基因组序列进行NT库比对,查看是否存在菌污染以及是否是自己的数据.这里我提供这一部分的具体操作过程. 步骤一:NT全库下载 前 ...

  6. 生成mysql nt文件_linux下安装blast并创建nt数据库

    BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序.BLAST是"局部相似性基本查询工具"(Basic Local Alignment S ...

  7. 生信分析-本地BLAST

    一. 本地blast简介 本地Blast(Basic Local Alignment Search Tool),是基于本地的比对搜索工具,可以在自己建立的数据库进行blast搜索,与NCBI的在线bl ...

  8. 基因家族的鉴定-基于windows系统上的本地blast

    文章首发于简书链接(https://www.jianshu.com/p/c876a5636554).发此备份. 基因家族的鉴定-基于windows系统上的本地blast 基因组的序列提取,详情请看我之 ...

  9. 本地BLAST的使用方法及基本操作步骤

    文章目录 BLAST+程序下载与安装 基因组数据下载 制作数据库 BLAST 叮! BLAST+程序下载与安装 BLAST+安装包下载地址:ftp://ftp.ncbi.nlm.nih.gov/bla ...

最新文章

  1. Idea--使用Idea调试设置
  2. log4j WARN 的解决办法
  3. 内核数据结构之红黑树
  4. CString的部分实现剖析
  5. php面向对象全攻略 (十四),php面向对象全攻略 (十四) php5接口技术
  6. python算法与数据结构-单链表
  7. HDU - 3551 Hard Problem(一般图最大匹配)
  8. 【阿里妈妈营销科学系列】第七篇:目标群组发现
  9. 速览Java 7 MethodHandle及其用法
  10. 【LeetCode笔记】4. 寻找两个正序数组的中位数(Java、二分、递归)
  11. C语言十五位正整数相加,二个超长正整数的相加
  12. (转)使用XMind打开.mmap文件不显示问题
  13. 解决maven打包 错误: 程序包com.sun.istack.internal不存在 - BBSMAX
  14. APP安全测试点概述
  15. php程序员自我描述_php程序员自我评价简历范文
  16. 上海航芯 | 热敏打印机方案分享
  17. net idautomationhc39m条形码字体生成条形码
  18. 中间件选型标准和流程
  19. 支付开发(七)----支付宝开发之手机网站支付(H5支付)
  20. vue 实现导入 导出

热门文章

  1. 计算机二级c内容,计算机二级C语言考试内容大纲
  2. [年终总结] 2023,希望一切都能够好起来
  3. Kubernetes网络三部曲之三 ~ NodePort vs LoadBalancer vs Ingress
  4. Python项目--拼图游戏(附源码)
  5. 安卓电子书格式_如何将电子书导入kindle App?
  6. 计算机网络之父是谁,因特网_被成为网络之父的是_计算机网络之父
  7. CellID 基站定位
  8. matlab中长整数表示,matlab – 整数的因式分解
  9. 【大数据开发】Python基础——Python序列
  10. 数字编码电位器c语言,数字电位器x9c103应用电路