使用Interpro数据库,可以将蛋白质序列进行家族分类,预测其结构域和重要位点。Interpro综合了多种不同的数据库来构成一个综合的Interpro数据库。这些数据库有:PROSITE.HAMAP,Pfam,PRINTS,ProPom,SMART/TIGRFAMs,PIRSF,SUPERFAMILY,CATH-Gene3D,PANTHER

方法1网页版

http://www.ebi.ac.uk/interpro/

将序列粘贴到输入框中进行Interpro注释。

优点:方便。。。

缺点:输入必须为蛋白质序列;InterProScan每次查询一次性最多能比对25条蛋白质序列。

方法2使用EBI提供的脚本程序进行远程比对

EBI:The European Bioinformatics Institute

推荐使用EBI提供的perl程序来进行Interpro注释。程序能将序列发送到官方服务器进行InterPro注释,再将结果返回本地。

脚本的下载网页:http://www.ebi.ac.uk/Tools/Webservices/services/pfa/iprscan5_rest

在这里,有perl,Python和Ruby程序各一支。分别是:iprscan_lwp.pl,iprscan_urllib2.py和iprscan_net_http.rb

[Required]

seqFile            : file : query sequence ("-" for STDIN, @filename for
                              identifier list file)

[Optional]

--appl         : str  : Comma separated list of signature methods to run,
                              see --paramDetail appl.
      --goterms      :      : retrieve GO terms
      --nogoterms    :      : do not retrieve GO terms
      --pathways     :      : retrieve pathway terms
      --nopathways   :      : do not retrieve pathway terms
      --multifasta   :      : treat input as a set of fasta formatted sequences
 
[General]

-h, --help         :      : prints this help text
      --async        :      : forces to make an asynchronous query
      --email        : str  : e-mail address
      --title        : str  : title for job
      --status       :      : get job status
      --resultTypes  :      : get available result types for job
      --polljob      :      : poll for the status of a job
      --jobid        : str  : jobid that was returned when an asynchronous job
                              was submitted.
      --outfile      : str  : file name for results (default is jobid;
                              "-" for STDOUT)
      --useSeqId     :      : use sequence identifiers for output filenames.
                              Only available in multifasta or list file modes.
      --maxJobs      : int  : maximum number of concurrent jobs. Only
                              available in multifasta or list file modes.
      --outformat    : str  : result format to retrieve
      --params       :      : list input parameters
      --paramDetail  : str  : display details for input parameter
      --quiet        :      : decrease output
      --verbose      :      : increase output

Synchronous job:

The results/errors are returned as soon as the job is finished.
  Usage: iprscan5_lwp.pl --email <your@email> [options...] seqFile
  Returns: results as an attachment

优点:

缺点:不能进行核苷酸序列的注释

$perl iprscan5_lwp.pl --email fsczhenjiang@foxmail.com  test.fa

结果:

JobId: iprscan5-R20160605-043400-0109-32295822-es
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
FINISHED
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.out.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.log.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.tsv.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.xml.xml
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.htmltarball.html.tar.gz
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.gff.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.svg.svg
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.sequence.txt

Interpro注释相关推荐

  1. 基因注释 InterProScan的三种使用方法

    InterProScan的三种使用方法 Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能.是EBI开发的一个集成了蛋白质家族.结构域和功能位点的非冗余数据库.Interpros ...

  2. 如何对基因组序列进行注释

    基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释.注释之前首先得构建基因模型,有三种策略: 从头注释(de novo prediction):通过已有的概率模型来预 ...

  3. oracle euk 什么系统,【T】每日一生信--interproscan安装及使用(终结版)

    本博文已整理到新地址:http://qinqianshan.com/interproscan-installation-and-usage/ Interpro是一个数据库,它里面有蛋白功能,蛋白家族等 ...

  4. 根据ID从FASTA文件中批量提取序列【Python】

    根据ID从FASTA文件中批量提取序列[Python] 生信问题记录 我的需求 input: FASTA文件,含六千余个蛋白序列.命名为FA.fasta txt文件,经过interpro注释后,筛选出 ...

  5. interProScan的使用

    InterProScan的三种使用方法 Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能.是EBI开发的一个集成了蛋白质家族.结构域和功能位点的非冗余 数据库.Interpro ...

  6. 不同测序数据应用与基因组组装|Canu

    介绍 Canu专门组装PacBio或Oxford Nanopore序列.Canu分为三个阶段:校正.修整和装配.校正阶段将提高读取中基数的准确性.微调阶段将微调显示为高质量序列的部分的读取,删除可疑区 ...

  7. cath数据库fasta备注_sam's note

    Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息.而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释. Interproscan5新增了一些功能 ...

  8. InterProScan安装

    InterPro是集成了蛋白质家族.结构域和功能位点的非冗余蛋白质特征序列数据库, InterPro数据库成员包括Coils .Gene3D.Pfam.PRINTS.ProSitePatterns. ...

  9. MPB:林科院袁志林组-​内生镰刀菌基因组染色体级别组装和注释

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

最新文章

  1. ACM 配置中心实战:Spring + MyBatis + Druid + ACM
  2. json前台后台解析和拼接使用
  3. postman接口测试实例_postman接口测试实例
  4. python3字符编码str_聊聊Python 3 的字符串:str 和 bytes 的区别
  5. echarts图表大小随着外部div大小变化
  6. 解析stm32的时钟
  7. Java性能调优小技巧
  8. 最小生成树(MST,minimum spanning tree)
  9. jsp模糊查询_[内附完整源码和文档] 基于JSP+Servlet校园二手交易平台
  10. C++ std::enable_shared_from_this
  11. ArcSDE数据库学习总结
  12. 解决windows 您没有权限访问\\192.168.1.X(局域网) 请与网络管理员联系请求访问权限
  13. Sublime Text3自定义主题
  14. Linux 音频编程 -- 如何使用ALSE库播放wav文件
  15. 【HTML】极简个人主页设计
  16. tibco rv java实例_java – 我不允许使用Tibco Rendezvous确认消息的任何原因?
  17. 阿里P6+Java研发工程师,到底牛在哪儿?
  18. uni-App快速开发一个安卓应用
  19. 高仿蓝奏云盘下载页面源码
  20. 易语言 不支持html5,微凉模块可穿透框架,解决网页点击不了的问题

热门文章

  1. PDF、Word、Excel文件前端预览实操干货都在这!
  2. C/C++ 使用信号量控制线程运行顺序
  3. 第 11 章 一 执行引擎概述、解释器、JIT编译器-热点代码优化
  4. minio实现大文件分片上传+断点续传+预览
  5. 塑胶模具注射分类有哪大几类?
  6. 如何正确使用SIM卡呢?
  7. 安川机器人怎样与变位器编程_基于CAM Function的安川机器人弧焊焊接离线编程与离线仿真...
  8. 移动硬盘只读属性不能改
  9. Django-Docker容器化部署:Django-Docker-MySQL-Nginx-Gunicorn云端部署
  10. 【MySQL】函数提取字符串中的数字