Interpro注释
使用Interpro数据库,可以将蛋白质序列进行家族分类,预测其结构域和重要位点。Interpro综合了多种不同的数据库来构成一个综合的Interpro数据库。这些数据库有:PROSITE.HAMAP,Pfam,PRINTS,ProPom,SMART/TIGRFAMs,PIRSF,SUPERFAMILY,CATH-Gene3D,PANTHER
方法1网页版
http://www.ebi.ac.uk/interpro/
将序列粘贴到输入框中进行Interpro注释。
优点:方便。。。
缺点:输入必须为蛋白质序列;InterProScan每次查询一次性最多能比对25条蛋白质序列。
方法2使用EBI提供的脚本程序进行远程比对
EBI:The European Bioinformatics Institute
推荐使用EBI提供的perl程序来进行Interpro注释。程序能将序列发送到官方服务器进行InterPro注释,再将结果返回本地。
脚本的下载网页:http://www.ebi.ac.uk/Tools/Webservices/services/pfa/iprscan5_rest
在这里,有perl,Python和Ruby程序各一支。分别是:iprscan_lwp.pl,iprscan_urllib2.py和iprscan_net_http.rb
[Required]
seqFile : file : query sequence ("-" for STDIN, @filename for
identifier list file)
[Optional]
--appl : str : Comma separated list of signature methods to run,
see --paramDetail appl.
--goterms : : retrieve GO terms
--nogoterms : : do not retrieve GO terms
--pathways : : retrieve pathway terms
--nopathways : : do not retrieve pathway terms
--multifasta : : treat input as a set of fasta formatted sequences
[General]
-h, --help : : prints this help text
--async : : forces to make an asynchronous query
--email : str : e-mail address
--title : str : title for job
--status : : get job status
--resultTypes : : get available result types for job
--polljob : : poll for the status of a job
--jobid : str : jobid that was returned when an asynchronous job
was submitted.
--outfile : str : file name for results (default is jobid;
"-" for STDOUT)
--useSeqId : : use sequence identifiers for output filenames.
Only available in multifasta or list file modes.
--maxJobs : int : maximum number of concurrent jobs. Only
available in multifasta or list file modes.
--outformat : str : result format to retrieve
--params : : list input parameters
--paramDetail : str : display details for input parameter
--quiet : : decrease output
--verbose : : increase output
Synchronous job:
The results/errors are returned as soon as the job is finished.
Usage: iprscan5_lwp.pl --email <your@email> [options...] seqFile
Returns: results as an attachment
优点:
缺点:不能进行核苷酸序列的注释
$perl iprscan5_lwp.pl --email fsczhenjiang@foxmail.com test.fa
结果:
JobId: iprscan5-R20160605-043400-0109-32295822-es
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
RUNNING
FINISHED
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.out.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.log.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.tsv.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.xml.xml
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.htmltarball.html.tar.gz
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.gff.txt
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.svg.svg
Creating result file: iprscan5-R20160605-043400-0109-32295822-es.sequence.txt
Interpro注释相关推荐
- 基因注释 InterProScan的三种使用方法
InterProScan的三种使用方法 Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能.是EBI开发的一个集成了蛋白质家族.结构域和功能位点的非冗余数据库.Interpros ...
- 如何对基因组序列进行注释
基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释.注释之前首先得构建基因模型,有三种策略: 从头注释(de novo prediction):通过已有的概率模型来预 ...
- oracle euk 什么系统,【T】每日一生信--interproscan安装及使用(终结版)
本博文已整理到新地址:http://qinqianshan.com/interproscan-installation-and-usage/ Interpro是一个数据库,它里面有蛋白功能,蛋白家族等 ...
- 根据ID从FASTA文件中批量提取序列【Python】
根据ID从FASTA文件中批量提取序列[Python] 生信问题记录 我的需求 input: FASTA文件,含六千余个蛋白序列.命名为FA.fasta txt文件,经过interpro注释后,筛选出 ...
- interProScan的使用
InterProScan的三种使用方法 Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能.是EBI开发的一个集成了蛋白质家族.结构域和功能位点的非冗余 数据库.Interpro ...
- 不同测序数据应用与基因组组装|Canu
介绍 Canu专门组装PacBio或Oxford Nanopore序列.Canu分为三个阶段:校正.修整和装配.校正阶段将提高读取中基数的准确性.微调阶段将微调显示为高质量序列的部分的读取,删除可疑区 ...
- cath数据库fasta备注_sam's note
Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息.而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释. Interproscan5新增了一些功能 ...
- InterProScan安装
InterPro是集成了蛋白质家族.结构域和功能位点的非冗余蛋白质特征序列数据库, InterPro数据库成员包括Coils .Gene3D.Pfam.PRINTS.ProSitePatterns. ...
- MPB:林科院袁志林组-内生镰刀菌基因组染色体级别组装和注释
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
最新文章
- ACM 配置中心实战:Spring + MyBatis + Druid + ACM
- json前台后台解析和拼接使用
- postman接口测试实例_postman接口测试实例
- python3字符编码str_聊聊Python 3 的字符串:str 和 bytes 的区别
- echarts图表大小随着外部div大小变化
- 解析stm32的时钟
- Java性能调优小技巧
- 最小生成树(MST,minimum spanning tree)
- jsp模糊查询_[内附完整源码和文档] 基于JSP+Servlet校园二手交易平台
- C++ std::enable_shared_from_this
- ArcSDE数据库学习总结
- 解决windows 您没有权限访问\\192.168.1.X(局域网) 请与网络管理员联系请求访问权限
- Sublime Text3自定义主题
- Linux 音频编程 -- 如何使用ALSE库播放wav文件
- 【HTML】极简个人主页设计
- tibco rv java实例_java – 我不允许使用Tibco Rendezvous确认消息的任何原因?
- 阿里P6+Java研发工程师,到底牛在哪儿?
- uni-App快速开发一个安卓应用
- 高仿蓝奏云盘下载页面源码
- 易语言 不支持html5,微凉模块可穿透框架,解决网页点击不了的问题
热门文章
- PDF、Word、Excel文件前端预览实操干货都在这!
- C/C++ 使用信号量控制线程运行顺序
- 第 11 章 一 执行引擎概述、解释器、JIT编译器-热点代码优化
- minio实现大文件分片上传+断点续传+预览
- 塑胶模具注射分类有哪大几类?
- 如何正确使用SIM卡呢?
- 安川机器人怎样与变位器编程_基于CAM Function的安川机器人弧焊焊接离线编程与离线仿真...
- 移动硬盘只读属性不能改
- Django-Docker容器化部署:Django-Docker-MySQL-Nginx-Gunicorn云端部署
- 【MySQL】函数提取字符串中的数字