0. 简介:

MUFoldSS是预测蛋白质二级结构的软件,但是序列的长度要 <= 700。
详情见文献:Fang, Chao, Yi Shang, and Dong Xu. MUFold-SS: New deep inception-inside-inception networks for protein secondary structure prediction. PROTEINS: Structure, Function, and Bioinformatics 86, no. 5 (2018): 592-598.

Psi-Blast:序列比对,寻找蛋白质的远亲,比Protein Blast在寻找遥远的进化关系方面更加敏感。
详情见Blast官网:https://blast.ncbi.nlm.nih.gov/Blast.cgi

HHblits:一种新的序列搜寻方法用于鉴别数据库中相似序列的蛋白。
详情见文献:Remmert, Michael et al. “HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment.” Nature methods vol. 9,2 173-5. 25 Dec. 2011, doi:10.1038/nmeth.1818

需要注意的是:
该软件的输入有3个:序列fasta文件,Psi-Blast的pssm文件和HHblits的hhm文件。因而下面先介绍Psi-Blast和HHblits软件的安装与运行,再介绍MUFoldSS的安装与运行。

1. Psi-Blast

1.1 下载:

https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

1.2 安装:

解压:tar -zxvf ncbi-blast-2.13.0+-x64-linux.tar.gz

1.3 运行:

切换到bin/目录下,直接运行./psiblast -h查看帮助文档

1.4 备注:

具体到本实验中,先构建库文件(将待建库的文件放到一个fasta文件中(以lib.fasta为例,同时假定也在bin/目录下,或者指定lib.fasta所在位置),在bin/目录下:./makeblastdb -in lib.fasta -parse_seqids -hash_index -dbtype prot);
建库完成之后,bin/目录下运行./psiblast -query text.fasta -db lib.fasta -num_iterations 3 -evalue 0.001 -out_ascii_pssm outfile.pssm
参数解释:-query text.fasta是用于比对的序列文件;-db lib.fasta是用于比对的库文件;-num_iterations 3表示迭代三次;-out_ascii_pssm outfile.pssm表示输出文件为pssm格式,文件名称为outfile.pssm

2. HHblits

2.1下载及安装:

直接参考github上的安装教程即可:https://github.com/soedinglab/hh-suite
所需的库文件 (如下图所示,任选其一):

2.2 运行命令:

hhblits -i <input-file> -ohhm <result-file> -n 1 -d <database-basename>
参数说明:-i输入文件;-ohhm输出hmm格式的文件;-n迭代次数,默认是2;-d数据库名称。详情见./hhblits --help

3. MUFoldSS

3.1 下载:

从 http://dslsrv8.cs.missouri.edu/~cf797/MUFoldSS/download.html 下载所需的版本,此处以3.0为例。
注意:目前(2022-12-09)上述链接已失效,所以我将之前下载的源码放在了这里:https://download.csdn.net/download/weixin_44065416/87260198?spm=1001.2014.3001.5503 (如要白嫖,请评论区留邮箱)。

3.2 安装:

下载完解压即可 tar -zxvf StandAlone_withProfiles.tar.gz

3.3 运行:

解压完成之后StandAlone_withProfiles/目录下有一个runMUFOLDSS_WithProfiles文件,如果要用该文件运行程序的话,需要将execdirdatadir的路径改为自己当前的安装路径 (PS:因为runMUFOLDSS_WithProfiles使用Shell写的,我看不太懂,所以就自己用python重新写了一个名为runMUFoldSS.py的运行脚本,如下)。

import os
import sys
import timefasta_file = sys.argv[1] ## 输入蛋白序列的 fasta文件 ()
pro_file = sys.argv[2] ## 输入第一步 Psi-Blast 得到的 .pssm 文件
hhm_file = sys.argv[3] ## 输入第二步 hhblits 得到的 .hmm 文件
model_file = 'data/model.h5' ## 模型文件,在 data/ 目录下
outfile = sys.argv[4] ## 输出文件print('Start: %s' % time.asctime(time.localtime(time.time())))
command_line = 'python bin/executable_withHHBlits.py -s '+fasta_file+' -p '+pro_file+' -m '+hhm_file+' -w '+model_file+' > '+outfile
os.system(command_line)
print('End: %s' % time.asctime(time.localtime(time.time())))

上述脚本运行方法:python runMUFOLDSS_WithProfiles.py prot.fasta prot.pssm prot.hmm outfile.txt

Linux下安装Psi-Blast,HHblits和MUFoldSS,用于预测蛋白质二级结构相关推荐

  1. linux下安装sbt_如何在Linux上安装SBT

    linux下安装sbt 介绍 (Introduction) Hi! I am Sanjula, and in this guide I hope to teach you how to install ...

  2. Linux下安装Oracle参数自动初始化脚本

    在linux下安装Oracle通常是一件很头疼的事情, 而如果我们只是为了部署CMS的话,也没有必要对Oracle的参数去做详细的了解. 那么有没有办法简化这个安装过程呢? 下面给出了一个在Linux ...

  3. Linux下安装和使用boost库

    Linux下安装和使用boost库 2016-08-26 20:29:06 zhaomax 阅读数 349更多 分类专栏: C++ 用boost库中的serialization库.Boost库分为两个 ...

  4. SIPp工具Linux下安装

    2019独角兽企业重金招聘Python工程师标准>>> 一.SIPp介绍 SIPp是一个测试SIP协议性能的工具软件,这是一个开源软件.      它可使用INVITE和B YE建立 ...

  5. Linux下安装rabbitmq3.7.8

    Linux下安装rabbitmq 1.安装Erlang环境 1)安装GCC GCC-C++ Openssl等模块 2)安装ncurses 3)安装erlang环境 4)配置安装 5)验证是否安装成功 ...

  6. 如何在Linux下安装Docker

    如何在Linux下安装Docker Docker概念: Docker包括三个基本概念: l  镜像(Image) l  容器(Container) l  仓库(Repository) 理解了这三个概念 ...

  7. 如何在Linux下安装MySQL8.0

    如何在Linux下安装MySQL8.0 准备工作: mysql8.0 rpm文件 测试工具(比如 idea的database工具) 安装步骤: 1.     下载mysql的repo源,下载地址:ht ...

  8. Linux下安装Weblogic10.3.6并创建简单集群测试

    Linux下安装Weblogic10.3.6并创建简单集群进行测试 一.卸载随系统安装的openjdk 1.先查看安装的jdk信息,常用命令有rpm -qa | grep java, rpm -qa  ...

  9. Linux下安装、配置PHP环境

    Linux下安装.启动MySQL :http://blog.csdn.net/wy3552128/article/details/8143686 Linux下安装.配置.启动Apache:http:/ ...

最新文章

  1. 网络和大数据成为重要文化生产力
  2. SQL Server改MySQL注意事项
  3. C语言一维数组、二维数组、结构体的初始化
  4. 【单片机相关】的网站
  5. MongoDB安装和启动
  6. oracle升级补丁报错,oracle rac升级补丁及中间的错误提示
  7. 复习篇1.对象和封装
  8. java 1.7 环境变量_安装JDK1.8之后又安装1.7出现的环境变量问题
  9. Combinations leetcode 组合问题
  10. 操作系统 李治军 操作系统基础(一)
  11. 新创建了用户没有计算机图标,w10我的电脑图标没了怎么办
  12. 郑中基 英雄寞 08版射雕英雄传片头曲 LRC歌词
  13. Internet选项 添加信任站点
  14. C语言基础 阶乘:输入一个数,输出它的阶乘。
  15. 北京华为HCIE认证里的数通深入学习QOS流量整形令牌桶机制和规则-ielab网络实验室
  16. [转载]HEVC的快速模式选择(一)
  17. lrs_save_searched_string
  18. STC8H驱动hub75e接口的64*64LED点阵屏
  19. 程序员表白专用: 5 种实用表白方法!帮你快速攻陷心仪女生
  20. 中秋节祝福程序源代码分享:土地分类数据阈值筛选和重投影分类

热门文章

  1. 惠普360 g5服务器系统如何做阵列,求HP DL360G5 2.5服务器,基于windows server 2008系统安装RAID 1方法...
  2. ROS报错处理--1
  3. 关于if exists及if..else的用法及理解
  4. C/S架构的简单文件传输系统的实现
  5. Mac如何使用python创建Excel文件,并进行内容写入
  6. 算法- 递归算法 分治算法
  7. python编程练习-正常血压
  8. 三维匹配_三维GIS数据融合的基本方法与进展
  9. 前端图形验证码的实现
  10. Invalid bound statement (not found): com.xxx.dao.xxxDao.selectByxx错误