linux系统下 blast,Linux下BLAST安装及BLAST使用
1、把BLAST的压缩文件解压,然后将bin目录下的文件拷贝至/usr/local/bin下;
2、制作软链接,将解压后的文件中bin目录链接至/home/username下,eg:ln
-s /home/username/blast/bin;
3、在当前用户目录下,编辑bashrc文件,在文件中加入export
PATH=/home/username/bin/=$PATH;
4、在当前目录下,将数据文件格式化,$formatdb
-i filename.后缀 -p F -o T
5、将待进行blast的文件转化为test.txt文件,拷贝文件内容如下:
>test....
ACGTCAGTCGATCGAT.....
6、进行比对
$blastall -p blastn -d filename.后缀 -i
test.txt -o test.out
formatdb -i ncbi_arab2.fna -o T -p F
$blastall -p
blastn -i Cereon_Ath_Ler.fasta -d
ncbi_arab2.fna -e 1e-10 -o result
假设:
你安装的blast路径为 /opt/blast/
1、把BLAST的压缩文件解压,然后将bin目录下的文件拷贝至/usr/local/bin下;
目的:所有用户,不管其当前路径是什么,均可以在命令行下直接调用blast包中的程序,而无需指定该程序的路径
解释:系统的PATH环境变量中包含/usr/local/bin,在命令行下调用blast包中的程序时,系统会去/usr/local/bin路径下寻找相应的命令程序
建议:简单起见,你可以略过这一步,除非你希望当使用其他用户登录后,也可以直接输入程序名来使用你安装的blast
2、制作软链接,将解压后的文件中bin目录链接至/home/username下,eg:ln
-s /home/username/blast/bin;
目的:为第3步所做的准备工作
建议:简单起见,你可以略过这一步
3、在当前用户目录下,编辑bashrc文件,在文件中加入export
PATH=/home/username/bin/=$PATH;
纠正:这里有一些笔误,应当是编辑.bashrc文件,并在文件中加入export
PATH=/home/username/bin/:$PATH;
目的:当前用户登录后,可以直接输入程序名来使用blast
建议:简单起见,你可以略过这一步
4、在当前目录下,将数据文件格式化,$formatdb
-i filename.后缀 -p F -o T
执行:
代码:
/opt/blast/bin/formatdb -i {data file here} -p F -o T
5、将待进行blast的文件转化为test.txt文件,拷贝文件内容如下:
>test....
ACGTCAGTCGATCGAT.....
这个没什么好说的,改个文件名
6、进行比对
$blastall -p blastn -d filename.后缀 -i
test.txt -o test.out
执行:
代码:
/opt/blast/bin/blastall -p blastn -d {database file here} -i test.txt -o test.out
补充说明:
1.运行建库程序formatdb:
建库的过程是建立目标序列的索引文件,所用程序是formatdb。程序允许的输入格式FASTA或者ASN.1格式,通常我们使用FASTA格式的序列作为输入。用于建库的FASTA序列是db.seq,formatdb的基本命令是:
formatdb -i db.seq [-options]
常用的参数有以下几个:
-p (T/F):-p参数的意义是选择建库的类型,"T"表示蛋白库,"F"表示核酸库。缺省值为"T"。
-o (T/F):-o参数的意义是判断是否分析序列名并建立序列名索引。"T"表示建立序列名索引,"F"表示不建立序列名索引。缺省值为"F"。
程序输出:
如果建立的是核酸库,输出为db.seq.nhr、db.seq.nin、db.seq.nsq,如果选择了参数"-o
T",还会同时输出db.seq.nsd、db.seq.nsi、db.seq.nni、db.seq.nnd。
蛋白库和核酸库的输出类似,相应的输出文件为:db.seq.phr、db.seq.pin、db.seq.psq和db.seq.psd、db.seq.psi、db.seq.pni、db.seq.pnd。
除了这些结果,程序还会输出LOG文件(默认为formatdb.log),里面记录了运行时间、版本号、序列数量等信息。
2.运行比对程序blastall:
Blast的主程序是blastall。程序的输入文件是query序列(-i 参数)和库文件(-d 参数),比对类型的选择(-p参数)和输出文件(-o 参数)由用户指定。其中“-p”参数有5种取值:
-p blastp:蛋白序列与蛋白库做比对。
-p blastx:核酸序列对蛋白库的比对。
-p blastn:核酸序列对核酸库的比对。
-p tblastn:蛋白序列对核酸库的比对。
-p tblastx:核酸序列对核酸库在蛋白级别的比对
blastall是最常用的blast程序之一,其功能非常强大,其下面有非常多的参数,但是一般使用的参数如:-p、-i、-d、-o、-e等几个。
3.运行参数说明:
-p: 执行的程序名称
-d: 搜索的数据库名称
-i : 要查询的序列文件名(Query
File)
-e:(数学)期望值(Expectation
value),E值是个统计阈值,缺省值10, 意指比对结果中由于随机偶然性产生的匹配结果不大于10,E值越小结果越可靠。
-o :查询结果输出文件名
-m: 比对结果显示格式选项,缺省值为0 ,即pairwise格式。另外还可以根据不同的需要选择1~6等不同的格式。
-I :在描述行中显示gi号[T/F],缺省值F
-v :单行描述(one-line
description)的最大数目,缺省值500
-b :显示的比对结果的最大数目,缺省值250
-F :对于要查询的序列做低复杂度区域(low
complexity regions, LCR)的过滤[T/F],缺省值T。对blastn用的是DUST程序,其他比对用的是SEG程序。
所谓“低复杂度区域”是指某些或一些残基过多表现,短周期重复等。对于高等哺乳动物的基因组序列,可以先用RepeatMask程序遮蔽重复元件。在输出结果中,对LCR区的序列核酸用“N”代替,蛋白质序列用“X”代替。
-a:运行BLAST程序所使用的处理器的数目,缺省值1
-S:在数据库中搜索时所使用的核酸链(strand),只对blastn、blastx和tblastx有效;1表示top,2表示bottom,3表示both;缺省值3
-T: 产生HTML格式的输出[T/F],缺省值F
-n: 使用MegaBlast搜索[T/F],缺省值F
-G: 打开一个gap的罚分(0表示使用缺省设置值),默认0
-E: 扩展一个gap的罚分(0表示使用缺省设置值),默认0
-q: 一个核酸碱基的错配(mismatch)的罚分(只对blastn有效),缺省值-3
-r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效),缺省值1
-M: 所使用的打分矩阵,缺省值BLOSUM62
4.输出结果参数说明:
-m: 比对结果显示格式选项
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = query-anchored no identities and blunt ends,
6 = flat query-anchored, no identities and blunt ends,
7 = XML Blast output,
8 = tabular,
9 tabular with comment lines
10 ASN, text
11 ASN, binary
输出结果是m8格式
linux系统下 blast,Linux下BLAST安装及BLAST使用相关推荐
- linux防火墙文件路径,防火墙问题 Linux系统 /etc/sysconfig/路径下无iptables文件
虚拟机新装了一个CentOs7,然后做防火墙配置的时候找不到iptables文件,解决方法如下: 因为默认使用的是firewall作为防火墙,把他停掉装个iptable systemctl stop ...
- U盘刻录linux系统后在windows下无法识别完整容量
U盘刻录linux系统后在windows下无法识别完整容量 问题描述: 将linux系统刻录进U盘,会导致原本比如16G的U盘在windows上只能显示2m左右的容量. 这实际上是因为windows系 ...
- ThinkPad物理机安装Linux系统实战企业级项目之CentOS安装
ThinkPad物理机安装Linux系统实战企业级项目之CentOS安装 系统安装 下载CentOS系统制作系统U盘 笔记本电源设置 网络设置 WiFi类型查看验证设置联网 设置固定IP 安装MySQ ...
- 在笔记本上安装 linux系统--Ubuntu 20.04(实体机安装而非虚拟机)
在笔记本上安装 linux系统–Ubuntu 20.04(实体机安装而非虚拟机) 一.刻录操作系统镜像到U盘 Ubuntu有详细的操作说明(5分钟左右能看完)大概如下 Create a bootabl ...
- frdora10_a8_linux,8楼 【A8】 linux系统的不刻盘的安装 一:.pdf
8楼 [A8] linux系统的不刻盘的安装 一: 8 楼 [A8] linux 系统的不刻盘的安装 一: [A8] linux 系统的不刻盘的安装 一: 目录: ①,打造 windows xp 与 ...
- linux系统连接校园无线网卡,RedHat Linux系统能不能连接无线网 如何安装无线网卡驱动 - 驱动管家...
想要使用RedHat Linux系统实现无线上网,就要先安装无线网卡驱动,这是在任何一个操作系统中不变的真理.那么RedHat Linux系统如何安装无线网卡驱动呢? 输入命令lsusb,可以看到US ...
- linux编译blas,Linux系统CentOS 6.8上yum安装BLAS库
Linux系统CentOS 6.8上yum安装BLAS库 BLAS是一个广泛应用到科学计算软件上面的库文件,在CentOS的软件库中已经有该软件的软件包,我们可以直接使用yum来安装. 1.1.查询C ...
- Linux系统之温度监控工具——lm_sensors的安装和基本使用
Linux系统之温度监控工具--lm_sensors的安装和基本使用 一.lm_sensors介绍 二.检测安装环境 1.检查yum仓库 2.检查系统版本 三.安装lm_sensors 四.侦测硬件 ...
- 连接linux系统的mysql,Linux系统MySQL开启远程连接
1.远程连接上Linux系统,确保Linux系统已经安装上了MySQL数据库.登陆数据库.mysql -uroot -p(密码). 2.创建用户用来远程连接 GRANT ALL PRIVILEGES ...
- linux系统下载经验,linux系统的学习经验首篇
1.linux打开terminal,两种最简单的办法,第一种,直接Ctrl+Alt+T:第二种,Alt+F2,输入gnome-terminal:更复杂的不建议使用. 2.linux没有盘符的概念,只有 ...
最新文章
- usaco Ski Course Design
- 代码改变世界_改变世界,一次只写一行代码
- ctr 平滑_预算平滑技术在58商业的探索与实践
- android image设置adjustviewbounds_探索 Android 平台的 CameraX
- DenseNet论文笔记
- python 桌面提醒_python实现桌面托盘气泡提示
- Netty工作笔记0045---异步模型原理剖析
- RHEL6_yum本地源配置
- matlabapp窗口图像_Matlab在一个图形窗口里画多个图形的操作教程
- 国二c语言程序设计分值分布,计算机二级分值
- 苹果手机屏幕突然放大恢复方法【图文教程】
- css3ps插件,css3ps插件
- python_IED工具下载(pycharm)_windows版
- 批量下载bilibili视频
- 编写一个方法,将一段文本中的各个单词的字母顺序翻转题
- Python 识别图片字符
- js动画效果(移动、变化效果)实现整理
- 除了编程语言本身,你如果还懂这 7 点,绝对可以在北上深杭拿到 15k
- 用户选择云计算机的首要考虑因素是什么,用户选择云计算时的首要考虑因素是...
- 深耕核心技术·赋能数字化转型 ——大快搜索黑科技亮相2019(第四届)大数据产业生态大会,斩获多项大奖...
热门文章
- Hulu在Content Embedding的探索与实践
- 艾永亮:B站破壁出圈,同是弹幕视频网站,为什么倒下的是A站?
- 入职一个月老大教我如何在做测试中运用Linux
- java: You aren‘t using a compiler supported by lombok, so lombok will not work and has been disabled
- 【日志】ubuntu16.04连接不上Logitech M590蓝牙鼠标(亲测可用)
- vue ajax请求结束再次执行查询方法,Vue.js 监控v-for循环渲染完成后再执行方法
- 计算机工程师对社会报答什么,报答作文400字(精选10篇)
- 基于STM32MP1的IOT参考设计分享
- Elementui Tooltip 修改背景色和箭头颜色
- 【CSS】几种尺寸单位