pfamscan 的使用_使用 HMMER 进行 PFAM 注释
1. HMMER 简介
HMMER 和 BLAST 类似,主要用于序列比对。
2. HMMER 与 PFAM 的下载安装
安装 HMMER
$ wget ftp://selab.janelia.org/pub/software/hmmer3/3.1b2/hmmer-3.1b2.tar.gz
$ tar zxf hmmer-3.1b2.tar.gz
$ cd hmmer-3.1b2
$ ./configure --prefix=/opt/biosoft/hmmer-3.1b2 && make -j 8 && make install
$ echo 'PATH=$PATH:/opt/biosoft/hmmer-3.1b2/bin/' >> ~/.bashrc
$ source ~/.bashrc
下载 HMMER 软件说明文档
$ wget ftp://selab.janelia.org/pub/software/hmmer3/3.1b2/Userguide.pdf -P /opt/biosoft/hmmer-3.1b2/
下载 PFAM 数据库
$ cd /opt/biosoft/hmmer-3.1b2/
$ wget ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam27.0/Pfam-A.hmm.gz
$ wget ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam27.0/Pfam-B.hmm.gz
$ gzip -d Pfam-A.hmm.gz; gzip -d Pfam-B.hmm.gz
得到 PFAM 数据库的 HMM 文件。 HMM 文件是文本文件,需要将其变成二进制格式,以加快运算速度,同时进行压缩,并建立成索引数据库。
$ hmmpress Pfam-A.hmm
$ hmmpress Pfam-B.hmm
3. 使用 hmmscan 进行 Pfam 注释
Pfam 数据库中每个编号代表一个蛋白质家族。Pfam 分 A 和 B 两个数据库,其中 A 数据库是经过手工校正的高质量数据库, B 数据库虽然质量低些,依然可以用来寻找蛋白质家族的保守位点。Pfam 最新 v27.0 版本的数据库中, A 数据库包含 14,836 个蛋白质家族编号(以 PF 开头); B 数据库包含 20,000 个蛋白质家族编号 (以 PB 开头)。
使用 hmmscan 进行 Pfam 注释示例:
$ /opt/biosoft/hmmer-3.1b2/bin/hmmscan -o out.txt --tblout out.tbl --noali -E 1e-5 /opt/biosoft/hmmer-3.1b2/Pfam-A.hmm file.fasta
生成结果文件 out.txt 和 out.tbl
out.txt 文件信息比较全面,但是不好阅读;
out.tbl 文件则是表格形式的结果,是一般需要的结果。
hmmscan 命令的常用参数:
$ hmmscan [-options] -h
显示帮助信息
-o FILE
将结果输出到指定的文件中。默认是输出到标准输出。
--tblout FILE
将蛋白质家族的结果以表格形式输出到指定的文件中。默认不输出该文件。
--domtblout FILE
将蛋白结构域的比对结果以表格形式输出到指定的文件中。默认不输出该文件。该表格中包含query序列起始结束位点与目标序列起始结束位点的匹配信息。
--acc
在输出结果中包含 PF 的编号,默认是蛋白质家族的名称。
--noali
在输出结果中不包含比对信息。输出文件的大小则会更小。
-E FLOAT default:10.0
设定 E_value 阈值,推荐设置为 1e-5 。
-T FLOAT
设定 Score 阈值。
--domE FLOAT default:10.0
设定 E_value 阈值。该参数和 -E 参数类似,不过是 domain 比对设定的值。
--cpu
多线程运行的CPU。默认应该是大于1的,表示支持多线程运行。但其实估计一般一个hmmscan程序利用150%个CPU。并且若进行并行化调用hmmscan,当并行数高于4的时候,会报错:Fatal exception (source file esl_threads.c, line 129)。这时,设置--cpu的值为1即可。
pfamscan 的使用_使用 HMMER 进行 PFAM 注释相关推荐
- pfamscan 的使用_基础工具-HMMER用法
(二)使用蛋白质(核酸)序列搜索已构建HMM数据库 该方法为常用的功能注释方法. 构建HMM数据库.使用多序列比对文件,同上述命令即可完成构建.同时可以从Pfam.SMART等网站下载现成额HMM.举 ...
- pfamscan 的使用_【HMMSCAN】使用pfam数据库对多序列文件进行结构域注释
写在前面 做基因功能的人都会特别注意基因上有什么功能结构域,通常我们认为,结构域决定了这个基因的功能.随着高通量测序技术的发展,我们完全可以通过一级序列来预测该基因的结构域,pfam和smart数据库 ...
- 使用HMMER搜索PFam
1. 安装HMMer 2. 从ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/下载pfam数据库Pfam-A.hmm 3. 得到 PFAM 数据库的 H ...
- pfamscan 的使用_使用pfam-scan进行Pfam注释
安装 使用conda安装 123 conda create -n pfam_scan ##可新建一个环境,用于安装pfam-scan source activate pfam_scan conda i ...
- pfamscan 的使用_蛋白编码能力预测软件pfam流程
原标题:蛋白编码能力预测软件pfam流程 一.分析背景 蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性.鉴定一个蛋白中的结构域有助于更深入地理解蛋 ...
- pfamscan 的使用_科学网—[转载]InterProScan的使用教程 - 黄顺谋的博文
InterPro是一个数据库,其提供蛋白序列的功能分析并归纳为一个个蛋白家族,同时还预测了presence of domains和important sites.为了将蛋白分类,InterPro使用先 ...
- python变量标识符_简谈-Python的注释、变量类型、标识符及关键字
在Python程序中,要想支持中文输出,则要在代码前面添加 标识符:开发人员在程序中自定义的一些符号和名称 标示符是自己定义的,如变量名 .函数名等 标识符的规则: 标示符由字目.下划线和数字组成,且 ...
- java事务写法_【Spring4】采用注释写法,事务回滚报错问题
有如下代码: public class Test{ @Autowired private Dao dao; @Autowired private Service service; @Transacti ...
- java编写字符串连接程序注释_一种利用JAVA注释支持多行字符串的方法
从BeetlSql项目将SQL全放在Beetl模板里得到启发,又想到一个比较偏门的用法.以下代码实测通过,详见jSqlBox项目的test\examples\multipleLineSQL\SqlTe ...
最新文章
- WebDev.WebServer 学习
- 华为平板wps语音朗读_华为隐藏的这五大功能,个个都很实用,如果你不知道,钱就白花了...
- oracle开审计记录变动的表,Oracle未开启审计情况下追踪表变更记录
- 解决同一页面中两个iframe互相调用jquery,js函数
- k均值例子 数据挖掘_人工智能、数据挖掘、机器学习和深度学习的关系
- fastreport dll_报表如何连接到VistaDB嵌入式数据库?FastReport.Net轻松搞定
- php if a 3 b 5,$a=0; $b=0; if($a=3 || $b=3){ $a++; $b++;} echo $a.”,”.$b;为什么结果是1,1啊...
- linux search用法,在Linux中使用ldapsearch只返回一个值
- 86相似标准形07——若尔当(Jordan)标准形
- 编程基本功:为了突出工作重点,正确造假
- Python MySQL 教程
- linux办公软件wps字体,linux版wps-office安装缺少的字体
- UG NX 12 同步建模:删除面
- windows ip管理之netsetman
- html 文本框选中状态,JavaScript onselect 事件:文本框中的文本被选中
- python tif转jpg_怎样把TIF转化为JPG图片格式
- npmnjs学习笔记-moddle description编写规则
- 六一小学生计算机创新活动总结,小学科技创新活动总结4篇
- 可惜知乎没有注销账号的选项
- 小米的逆转密码:MIX2与新零售