InterPro是一个数据库,其提供蛋白序列的功能分析并归纳为一个个蛋白家族,同时还预测了presence of domains和important sites。为了将蛋白分类,InterPro使用先验模型,整合了不同的数据库形成一个整体

而InterProScan则是一款可以使用InterPro数据库的软件(more information about InterProScan)

至于Why is InterPro useful? and Who uses InterPro?则可以查看下述网址InterPro。其不仅做了很好的介绍,而且还提到了所整合的数据的名称以及简介,如:Pfam, HAMAP, CATH-Gene3D等等

所以总而言之,就是对蛋白序列或者核酸序列通过这几个数据库的整合信息进行注释

InterProScan 5.0 的安装

这款软件的安装可以完全按照InterProScan说明文档中的教程来操作,简单的介绍下:$JAVA_HOME should point to the location of the JVM

$JAVA_HOME/bin should be added to the $PATH64-bit Linux

Perl (default on most Linux distributions)

Python 2.7.x only

Oracle’s Java JDK/JRE version 8 (required by InterProScan 5.17-56.0 onwards). Earlier InterProScan release versions required Java 6 (version 6u4 and above) or Java 7.

Environment variables set

配置完后可以进行安装了,其实解压缩就可以了:tar -zxvf interproscan-5.24-63.0-64-bit.tar.gz

cd interproscan-5.24-63.0/data/#记得把panther-data-11.1.tar.gz压缩包先移到上述目录下tar -zxvf panther-data-11.1.tar.gz

接下来是一个可选项,看你需要不要Match Lookup Service,因为我是本地化,不想联网操作,因此就会禁止这项操作vim interproscan-5.24-63.0/interproscan.properties#然后 #掉下面这行代码precalculated.match.lookup.service.url=http://www.ebi.ac.uk/interpro/match-lookup

经过上述几步,InterProScan的安装基本完成

InterProScan 5.0 的使用

在安装完后,我们可以拿Interproscan文件夹中的测试文件进行测试下./interproscan.sh -i test_proteins.fasta -f tsv

如果没有报错,则表示InterProScan能正常运行了

一般常用的参数有这些:1. -appl,--applications 用于指定使用Interpro中哪些数据库,默认全部数据库

2. -b,--output-file-base 用于指定输出文件的路径or文件夹,默认是输入文件的路径

3. -f,--formats 用于指定输出文件的后缀,蛋白序列默认输出TSV, XML and GFF3 4. -i,--input 输入文件,一般要为fasta格式,不要带有其他特殊符号

最后就是查看结果即可,没有特殊要求的话,InterProScan 5.0的使用就这样了。强烈推荐看文档https://github.com/ebi-pf-team/interproscan/wiki,写的实在很详细!

转载本文请联系原作者获取授权,同时请注明本文来自黄顺谋科学网博客。

链接地址:http://blog.sciencenet.cn/blog-442719-1171426.html

上一篇:NCBI怎么上传数据

下一篇:[转载]cygwin 的不同文件类型显示不同的颜色

pfamscan 的使用_科学网—[转载]InterProScan的使用教程 - 黄顺谋的博文相关推荐

  1. python将汉字转为拼音字母_科学网—[转载]python中文汉字转拼音 - 陈明杰的博文...

    将汉字转为拼音.可以用于汉字注音.排序.检索(Russian translation) . 特性根据词组智能匹配最正确的拼音. 支持多音字. 简单的繁体支持, 注音支持. 支持多种不同拼音/注音风格. ...

  2. python的安装包下载_科学网—[转载]python常用的安装包下载 - 林清莹的博文

    Python常用的安装包下载 1.首先应该下载dlib安装包(例如:dlib-19.8.1-cp36-cp36m-win_amd64.whl) 可以通过此网址进行下载对应的dlib包   https: ...

  3. fpga arm 通讯_科学网-[转载]【电子技术】【2014】FPGA增强的数据处理系统

    大约十年前,功耗和散热问题迫使半导体行业从顺序计算模式转向并行计算模式.然而,在多核CPU和GPGPU等通用并行设备中实现并行性往往很困难.此外,在暗硅前景中,不久的将来,单个程序是否可以在数千个CP ...

  4. pbe近似_pbe近似_科学网—[转载]赝势及泛函介绍(1) - 冯宇超的博文

    vasp计算中用到的三种赝势:模守恒赝势,超软赝势,PAW赝势(按产生顺序). 按方法不同分为USPP(ultrasoft pesudopotential,超软赝势)和PAW(projector au ...

  5. umap算法_科学网—[转载]【源码】均匀流形近似与投影(UMAP)算法仿真 - 刘春静的博文...

    UMAP算法是Leland McInnes.John Healy和James Melville的发明. The UMAP algorithm is the invention of Leland Mc ...

  6. 光通量发光强度照度亮度关系_科学网—[转载]光通量、发光强度、亮度、照度等概念的定义 - 姬海鹏的博文...

    1 光通量 (单位:流明lm) 光通量,指人眼所能感觉到的电磁波辐射能量,其等于单位时间内每一波段的辐射能量与该波段相对视见率(又称为光谱光效应函数)的乘积.众所周知,人眼对不同波长的光的感受灵敏度( ...

  7. umap算法_科学网-[转载]【源码】均匀流形近似与投影(UMAP)算法仿真-刘春静的博文...

    UMAP算法是Leland McInnes.John Healy和James Melville的发明. The UMAP algorithm is the invention of Leland Mc ...

  8. python 海象运算符_科学网—[转载]海象运算符 := - 龚云国的博文

    PEP 572: Assignment Expressions 新增一种新语法形式::=,又称为"海象运算符"(为什么叫海象,看看这两个符号像不像颜表情),如果你用过 Go 语言, ...

  9. g2 折线图点与点之间直线_科学网—ggplot2实现散点折线图 - 肖斌的博文

    准备的数据: 第一列是时间,第二列是样本,第三列是具体数值.横轴标为时间,纵坐标为具体数值,图中不同颜色展示不同样本. 具体的代码: library(ggplot2) png("./xyz. ...

最新文章

  1. python表白程序-我喜欢你 抖音表白程序python版
  2. Windows 驱动开发头文件wdfchildlist.h
  3. 小菜的 VUE 使用技巧 持续更新
  4. ABAPプログラム開発において使用実績のある汎用モジュール一覧
  5. RHCE课程-初级部分6、编辑工具VIM,网络配置,进程优先,日志文件简介。
  6. Android官方开发文档Training系列课程中文版:构建第一款安卓应用之程序运行
  7. 将Linux代码移植到Windows的简单方法
  8. algorithm头文件下的sort()
  9. PG: Setting up streaming log replication (Hot Standby )
  10. L1-026 I Love GPLT (5 分)—团体程序设计天梯赛
  11. PHP发微信消息必须开网吗,关于php微信订阅号开发之token验证后自动发送消息给订阅号但是没有消息返回的问题...
  12. Flutter自定义iconfont字体图标
  13. Kubuntu 安装fcitx 5
  14. AR/VR/MR三者之间的区别和联系
  15. 设计分享|基于单片机的计数器设计(汇编)
  16. 新生宝宝取名大全:带梓字寓意大气的男孩名字
  17. 数据结构PTA案例7-1.3 寻找大富翁
  18. nRF24L01 无线数传模块之间的区别 干货分析
  19. 实验三 基于A*算法的迷宫游戏
  20. java-net-php-python-11jspm健身管理网站计算机毕业设计程序

热门文章

  1. css3扇形及简单动画
  2. 每月自评之四:2013年4月
  3. ChatGPT开源平替——OpenChatKit(前OpenAI团队打造)
  4. 不懂游戏类型?敢说你懂游戏音乐
  5. 腾讯云8核 16G 18M配置服务器评测
  6. 百度地图开发 之 坑中坑
  7. 设计模式-访问者模式练习
  8. CenterNet:Objects as Points代码解析(九):通过高斯函数画热点图
  9. 【ESP32-IDF】04-2 存储-NVS
  10. Java——使用多线程模拟真实高并发业务并保证安全性(一)