linux比对nt数据库,linux BLAST序列比对 (nt/nr库)
安装本地blast序列比对软件,我们可以搜索一个查询序列定制数据库,例如想研究一个新测序的基因组,或者感兴趣的一组蛋白质序列。有时我们希望把程序插入到一个流程中,例如搜索一个大量的查询序列,例如你的测序数据含有大量的污染片段,你想知道这些片段比对到了什么物种。
blast软件安装
从NCBI下载安装包https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/。下载2.11.0 linux版本,下载并解压,解压之后BLAST就安装好了。用户需要设置环境变量,目的是为了告诉系统在那里可以找到安装好的BLAST软件。
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.11.0+-x64-linux.tar.gz
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.11.0+-x64-linux.tar.gz.md5
md5sum -c ncbi-blast-2.11.0+-x64-linux.tar.gz.md5
tar -zxvf ncbi-blast-2.11.0+-x64-linux.tar.gz
#加入到环境变量
export PATH=$PATH:$PWD/ncbi-blast-2.11.0+/bin
nt/nr fasta下载
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz.md5
wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz.md5
md5sum -c nt.gz.md5
md5sum -c nr.gz.md5
tar -xzvf nr.gz
tar -xzvf nt.gz
mkdir nr_db
mkdir nt_db
makeblastdb -in nr -dbtype prot -title make_nr -parse_seqids -out ./nr_db/nr -logfile make_nr.log
makeblastdb -in nt -dbtype nucl -title make_nt -parse_seqids -out ./nt_db/nt -logfile make_nt.log
或者使用NCBI处理好的db。
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nt*
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*
序列比对
blastp:蛋白序列与蛋白库作比对,直接比对蛋白序列的同源性。
blastx:核酸序列与蛋白库作比对,将核酸序列先翻译成蛋白序列,再将其与蛋白库作比对。
-blastn:核酸序列与核酸库的比对,直接比对核酸序列的同源性。
tblastn:蛋白序列对核算库的比对,现将核酸库翻译成蛋白库,再将蛋白序列与翻译后的蛋白库进行比对。
tblastx:核酸与核酸数据库在蛋白质水平比较
如果是fastq先转为fasta序列格式在进行比对,比对结果如下图1所示。将相同序列复制到NCBI网站进行比对,如下图2,两种结果最前面的比对条目基本一致。
awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' test.fastq > test.fasta
blastn -query test.fasta -out test.result -db ./nt_db/nt
图1 本地blast比对结果
图2 NCBI blast比对结果
使用NCBI网站下载的db进行比对。
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*
for i in `ls nt_db_NCBI/*gz`do;tar -zxvf $i;done
## 输出一条最优比对结果
blastn -query test1.fa -out test1.align -db ./nt_db_NCBI/nt -outfmt 6 -subject_besthit -num_threads 4
linux比对nt数据库,linux BLAST序列比对 (nt/nr库)相关推荐
- 查询linux安装了什么数据库,Linux系统中安装MySQL数据库操作手册
Linux系统中MySQL数据库安装手册 一.安装概述: 在Linux操作系统中安装MySQL数据库是一个我们必须要掌握的一门技术,也决定了你以后找工作的薪资待遇,所以你知道它的厉害了吧!学会安装只是 ...
- linux 自动配置 mysql数据库,Linux下配置mysql数据库主从自动备份
当网站内容越来越多的时候,数据库也变得越来越大了.如果不小心误删了,或者被攻击了,那就什么都没有了,一切归零.到现在博主也认识到了数据库的重要性,于是决定研究研究数据库的自动备份.如果你是土豪那可以直 ...
- linux安装通用plsql数据库,linux centOs中安装好数据库,客户端用plsql连接oracle
原创作品,转载请在文章显眼位置注明出处:https://www.cnblogs.com/sunshine5683/p/10030375.html 首先,回顾上篇 一.在客户端安装oracle客户端,我 ...
- 在linux下安装mongo数据库,Linux系统下安装MongoDB
MongoDB提供了Linux系统上32位和64位的安装包,你可以在官网下载安装包. 下载完安装包,并解压 tgz(以下演示的是 64 位 Linux上的安装) . curl-O https://fa ...
- linux链接达梦数据库,linux下面 达梦数据库的JDBC链接
此次由于学习上面的事情,接触到了达梦数据库,这是第一次用,去年有个关于隐通道的课程设计,其实就已经差很少算了解了点点,相对与国外主流数据库,Dm7有个很明显的特色,那就是它的安全级别,国外数据卖给中国 ...
- linux 多域名访问数据库,Linux下虚拟域名的实现
目前Linux操作系统十分火爆,所以很多朋友希望了解一下Linux下虚拟域名的实现过程.下面就基于目前比较流行的RedHat来讨论一下. 一.DNS服务器的设置 我们知道互联网网是基于TCP/IP协议 ...
- 怎么查看linux系统中有哪些数据库,linux命令查询mysql的有哪些
linux命令查询mysql的有:1.启动mysql的命令[mysqladmin start]:2.重启mysql的命令[mysqladmin restart]:3.关闭mysql的命令[mysqla ...
- linux shell 输出到数据库,linux shell 入门
利用vi等文本编辑器编写Shell脚本的格式是固定的,如下: Yourcommandsgohere chmod+xfilename.sh 下面我们从经典的"helloworld"入 ...
- Linux系统mongdb还原数据库,linux下mongodb数据库备份与还原
MongoDb数据库备份还原 数据库迁移,可视化工具NoSQLBooster for MongoDB 付费版才具有数据导入功能.代价过高,索性采起命令行web 数据备份 备份命令mongodb mon ...
最新文章
- JavaSE--jdom解析之bom
- 正确生成浮点型的方法,解决sqlachemy Float浮点型的坑,生成float类型时,长度和精度均为0,导致查询不到结果!...
- 【Eclipse 插件】JD-Eclipse
- 如何使用@component-scan排除不需要的类
- [vue] 说说你对vue的mixin的理解,有什么应用场景?
- JPA分页查询与条件分页查询
- jemalloc mysql5.6_Mysql-5.6安装编译全教程
- php定时任务sw,[原创]Swoole和Swoft的那些事(Task投递/定时任务篇)
- Spring Cloud Feign声明式服务调用 (学习总结)
- 3D打印gcode命令大全及解析
- matlab 画图 方程,matlab 画图与解方程
- Theme Holo
- 新唐 Nuvoton M031 入门 点亮板载LED
- apache ii评分怎么评_APACHE II评分表
- 时间、延迟以及延缓操作
- VC中_T()的作用
- 超市收银系统无法连接服务器,超市收银系统常见问题介绍与回答
- 2022Java最新真实面试题汇总
- SUST OJ 1642: 绝地求生—死亡顺序
- PS CC2019 安装过程中遇到 Command line option syntax error. Type Command /? for Help.
热门文章
- Java PrintWriter类简介说明
- 《降临》作者特德·姜:ChatGPT是网上所有文本的模糊图像
- python从键盘输入一个数、判断其是奇数还是偶数_从键盘上输入一个整数,判断该数是奇数还是偶数并输出结果...
- Flutter 季度调研结果分享 | 开发者的选择
- 计算机一级第十四套完整解析,2012年计算机一级MsOffice第十四套练习题及答案解析...
- 【代码+实例】Python播放MP3音频作为背景音乐
- 【UML类图】空心菱形和实心菱形的区别
- openCV数字图像处理
- 基于Python实现的模拟退火算法
- lol无法启动此程序因为计算机丢失,Win7系统玩英雄联盟lol提示计算机丢失auncher.dll如何解决...