Linux下安装Psi-Blast,HHblits和MUFoldSS,用于预测蛋白质二级结构
0. 简介:
MUFoldSS是预测蛋白质二级结构的软件,但是序列的长度要 <= 700。
详情见文献:Fang, Chao, Yi Shang, and Dong Xu. MUFold-SS: New deep inception-inside-inception networks for protein secondary structure prediction. PROTEINS: Structure, Function, and Bioinformatics 86, no. 5 (2018): 592-598.
Psi-Blast:序列比对,寻找蛋白质的远亲,比Protein Blast在寻找遥远的进化关系方面更加敏感。
详情见Blast官网:https://blast.ncbi.nlm.nih.gov/Blast.cgi
HHblits:一种新的序列搜寻方法用于鉴别数据库中相似序列的蛋白。
详情见文献:Remmert, Michael et al. “HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment.” Nature methods vol. 9,2 173-5. 25 Dec. 2011, doi:10.1038/nmeth.1818
需要注意的是:
该软件的输入有3个:序列fasta文件,Psi-Blast的pssm文件和HHblits的hhm文件。因而下面先介绍Psi-Blast和HHblits软件的安装与运行,再介绍MUFoldSS的安装与运行。
1. Psi-Blast
1.1 下载:
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
1.2 安装:
解压:tar -zxvf ncbi-blast-2.13.0+-x64-linux.tar.gz
1.3 运行:
切换到bin/
目录下,直接运行./psiblast -h
查看帮助文档
1.4 备注:
具体到本实验中,先构建库文件(将待建库的文件放到一个fasta文件中(以lib.fasta
为例,同时假定也在bin/
目录下,或者指定lib.fasta
所在位置),在bin/
目录下:./makeblastdb -in lib.fasta -parse_seqids -hash_index -dbtype prot
);
建库完成之后,bin/
目录下运行./psiblast -query text.fasta -db lib.fasta -num_iterations 3 -evalue 0.001 -out_ascii_pssm outfile.pssm
参数解释:-query text.fasta
是用于比对的序列文件;-db lib.fasta
是用于比对的库文件;-num_iterations 3
表示迭代三次;-out_ascii_pssm outfile.pssm
表示输出文件为pssm
格式,文件名称为outfile.pssm
;
2. HHblits
2.1下载及安装:
直接参考github上的安装教程即可:https://github.com/soedinglab/hh-suite
所需的库文件 (如下图所示,任选其一):
2.2 运行命令:
hhblits -i <input-file> -ohhm <result-file> -n 1 -d <database-basename>
参数说明:-i
输入文件;-ohhm
输出hmm
格式的文件;-n
迭代次数,默认是2;-d
数据库名称。详情见./hhblits --help
3. MUFoldSS
3.1 下载:
从 http://dslsrv8.cs.missouri.edu/~cf797/MUFoldSS/download.html 下载所需的版本,此处以3.0为例。
注意:目前(2022-12-09)上述链接已失效,所以我将之前下载的源码放在了这里:https://download.csdn.net/download/weixin_44065416/87260198?spm=1001.2014.3001.5503
(如要白嫖,请评论区留邮箱)。
3.2 安装:
下载完解压即可 tar -zxvf StandAlone_withProfiles.tar.gz
3.3 运行:
解压完成之后StandAlone_withProfiles/
目录下有一个runMUFOLDSS_WithProfiles
文件,如果要用该文件运行程序的话,需要将execdir
和datadir
的路径改为自己当前的安装路径 (PS:因为runMUFOLDSS_WithProfiles
使用Shell写的,我看不太懂,所以就自己用python重新写了一个名为runMUFoldSS.py
的运行脚本,如下)。
import os
import sys
import timefasta_file = sys.argv[1] ## 输入蛋白序列的 fasta文件 ()
pro_file = sys.argv[2] ## 输入第一步 Psi-Blast 得到的 .pssm 文件
hhm_file = sys.argv[3] ## 输入第二步 hhblits 得到的 .hmm 文件
model_file = 'data/model.h5' ## 模型文件,在 data/ 目录下
outfile = sys.argv[4] ## 输出文件print('Start: %s' % time.asctime(time.localtime(time.time())))
command_line = 'python bin/executable_withHHBlits.py -s '+fasta_file+' -p '+pro_file+' -m '+hhm_file+' -w '+model_file+' > '+outfile
os.system(command_line)
print('End: %s' % time.asctime(time.localtime(time.time())))
上述脚本运行方法:python runMUFOLDSS_WithProfiles.py prot.fasta prot.pssm prot.hmm outfile.txt
Linux下安装Psi-Blast,HHblits和MUFoldSS,用于预测蛋白质二级结构相关推荐
- linux下安装sbt_如何在Linux上安装SBT
linux下安装sbt 介绍 (Introduction) Hi! I am Sanjula, and in this guide I hope to teach you how to install ...
- Linux下安装Oracle参数自动初始化脚本
在linux下安装Oracle通常是一件很头疼的事情, 而如果我们只是为了部署CMS的话,也没有必要对Oracle的参数去做详细的了解. 那么有没有办法简化这个安装过程呢? 下面给出了一个在Linux ...
- Linux下安装和使用boost库
Linux下安装和使用boost库 2016-08-26 20:29:06 zhaomax 阅读数 349更多 分类专栏: C++ 用boost库中的serialization库.Boost库分为两个 ...
- SIPp工具Linux下安装
2019独角兽企业重金招聘Python工程师标准>>> 一.SIPp介绍 SIPp是一个测试SIP协议性能的工具软件,这是一个开源软件. 它可使用INVITE和B YE建立 ...
- Linux下安装rabbitmq3.7.8
Linux下安装rabbitmq 1.安装Erlang环境 1)安装GCC GCC-C++ Openssl等模块 2)安装ncurses 3)安装erlang环境 4)配置安装 5)验证是否安装成功 ...
- 如何在Linux下安装Docker
如何在Linux下安装Docker Docker概念: Docker包括三个基本概念: l 镜像(Image) l 容器(Container) l 仓库(Repository) 理解了这三个概念 ...
- 如何在Linux下安装MySQL8.0
如何在Linux下安装MySQL8.0 准备工作: mysql8.0 rpm文件 测试工具(比如 idea的database工具) 安装步骤: 1. 下载mysql的repo源,下载地址:ht ...
- Linux下安装Weblogic10.3.6并创建简单集群测试
Linux下安装Weblogic10.3.6并创建简单集群进行测试 一.卸载随系统安装的openjdk 1.先查看安装的jdk信息,常用命令有rpm -qa | grep java, rpm -qa ...
- Linux下安装、配置PHP环境
Linux下安装.启动MySQL :http://blog.csdn.net/wy3552128/article/details/8143686 Linux下安装.配置.启动Apache:http:/ ...
最新文章
- 网络和大数据成为重要文化生产力
- SQL Server改MySQL注意事项
- C语言一维数组、二维数组、结构体的初始化
- 【单片机相关】的网站
- MongoDB安装和启动
- oracle升级补丁报错,oracle rac升级补丁及中间的错误提示
- 复习篇1.对象和封装
- java 1.7 环境变量_安装JDK1.8之后又安装1.7出现的环境变量问题
- Combinations leetcode 组合问题
- 操作系统 李治军 操作系统基础(一)
- 新创建了用户没有计算机图标,w10我的电脑图标没了怎么办
- 郑中基 英雄寞 08版射雕英雄传片头曲 LRC歌词
- Internet选项 添加信任站点
- C语言基础 阶乘:输入一个数,输出它的阶乘。
- 北京华为HCIE认证里的数通深入学习QOS流量整形令牌桶机制和规则-ielab网络实验室
- [转载]HEVC的快速模式选择(一)
- lrs_save_searched_string
- STC8H驱动hub75e接口的64*64LED点阵屏
- 程序员表白专用: 5 种实用表白方法!帮你快速攻陷心仪女生
- 中秋节祝福程序源代码分享:土地分类数据阈值筛选和重投影分类
热门文章
- 惠普360 g5服务器系统如何做阵列,求HP DL360G5 2.5服务器,基于windows server 2008系统安装RAID 1方法...
- ROS报错处理--1
- 关于if exists及if..else的用法及理解
- C/S架构的简单文件传输系统的实现
- Mac如何使用python创建Excel文件,并进行内容写入
- 算法- 递归算法 分治算法
- python编程练习-正常血压
- 三维匹配_三维GIS数据融合的基本方法与进展
- 前端图形验证码的实现
- Invalid bound statement (not found): com.xxx.dao.xxxDao.selectByxx错误