Pfam(http://pfam.sanger.ac.uk/)是一个被广泛使用的蛋白家族数据库,在最新的版本26.0中包含超过13000个手工确定的蛋白家族,Pfam可以通过http://pfam.sanger.ac.uk/使用,他有两个数据库,高质量,手工确定的Pfam-A,自动注释的Pfam-B数据库。后面的数据产生是根据ADDA算法。是对A的补充。

下载:

应的数据库(ftp://ftp.sanger.ac.uk/pub/databases/Pfam/current_release/),按照说明说我下载的是

Pfam-A.hmm

Pfam-A.hmm.dat

Pfam-B.hmm

Pfam-B.hmm.dat

active_site.dat

HMMER3 (http://hmmer.janelia.org/software)

前准备工作:

Perl 和bioperl的安装 我的已经安装过了,据说可以通过一下方法安装

sudo

apt-get install perl ( replace perl with bioperl for installation

of bioperl)

Moose的安装

sudo -i ( the system will ask for

password type it in and youll find the user name change to root

marked in red. its ready to go now)

(因为之前没有权限,没用这一步,所以安装不来,导致后面的报错)

then use CPAN to install Moose use this:

CPAN Moose ( this will take a while)

HMMER3的安装

HMMER用来寻找同源序列数据库,做序列比对,它可用一条序列来寻找数据库,功能非常强大。

tar zxf hmmer-3.1b1.tar.gz

cd hmmer-3.1b1

./configure

make

make check

make install

cd easel;make install

修改环境变量:export

PATH=/sam/hmmer/binaries:$PATH(这个是针对bash而言的)

这个时候可以通过在终端输入:hmmscan -h 来检验是否安装成功

这就可以了嘛,不用怎么安装,修改环境变量即可。

export PERL5LIB=/sam/hmmmer/pfamscan:$PATH

(含有pfam_scan.pl)

(the path to your pfam_scan.pl should be listed if it is

successfully added)可以通过如下命令来查看环境变量是否修改成功

perl -V

为什么用的是PERL5LIB而不是PATH呢

What we’re doing in a nutshell is telling PERL to push values

on to the @INC array before loading any modules. You can do this on

the command line, in your PERL code or with the environment

variable PERL5LIB.

PERL5LIB can contain more than one value. Just set it in you

.bashrc file or wherever you see fit. This method works in

bash:

export

PERL5LIB=/first/path/to/libs"${PERL5LIB:+:$PERL5LIB}"

通过hmmerspress来把下载的数据建库:

hmmpress Pfam-A.hmm

hmmpress Pfam-B.hmm

使用说明:

pfam_scan.pl -fasta -dir

Additonal options:

-h  : show this help

-o  : output file, otherwise send to STDOUT

-clan_overlap  : show

overlapping hits within clan member families (applies to Pfam-A

families only)

-align  : show the HMM-sequence alignment for each

match

-e_seq  : specify hmmscan evalue

sequence cutoff for Pfam-A searches (default Pfam defined)

-e_dom  : specify hmmscan evalue

domain cutoff for Pfam-A searches (default Pfam defined)

-b_seq  : specify hmmscan bit score

sequence cutoff for Pfam-A searches (default Pfam defined)

-b_dom  : specify hmmscan bit score

domain cutoff for Pfam-A searches (default Pfam defined)

-pfamB  : search against Pfam-B HMMs (uses E-value

sequence and domain cutoff 0.001),

in addition to searching Pfam-A HMMs

-only_pfamB  : search against Pfam-B HMMs only (uses E-value

sequence and domain cutoff 0.001)

-as  : predict active site residues for Pfam-A

matches

-json [pretty]  : write

results in JSON format. If the optional value "pretty" is

given,

the JSON output will be formatted using the

"pretty" option in the JSON

module

For more help, check the perldoc:

shell% perldoc pfam_scan.pl

例如:

/sam/hmmer/PfamScan/pfam_scan.pl -fasta contig_proteins.fasta

-dir /sam/hmmer/PfamScan/lib -pfamB -out contig_pfam.fasta

注释出来的结果中含有.后面跟的数字与不跟数字有什么区别??

pfam-help@ebi.ac.uk

There is no difference for the user.

The extra numerals after the . are for internal auditing and

have no meaning

for the results. In effect both are PF00013.24 - that is:

version 24 since

first creation of family.

结果的初步解读:

# < seq id> < alignment start> < alignment

end> < envelope start> < envelope end> < hmm

acc>

< hmm name> < type> < hmm

start> < hmm end> < hmm length> < bit score>

< E-value> < significance>

< clan>

1_1  111  424

110  425 PF01979.15  Amidohydro_1

Domain

2  332

333  185.8  1.5e-54

1 CL0034

1_2  30  130

30  130 PF13600.1  DUF4140

Family  1  104

104  52.1  6.7e-14  1 No_clan

这里的PF代表的是pfam-A,PB代表的是pfam-B数据库。

clan表示上一级的分类

利用官网首页"Jump to”功能,检索注释出来的详细的信息:

Pfam A accession, e.g. PF02171

Pfam A identifier, e.g. piwi

Pfam B accession, e.g. PB000001

Pfam B identifier, e.g. Pfam-B_1

UniProt sequence accession, e.g. P00789

UniProt sequence ID, e.g. CANX_CHICK

NCBI "GI" number, e.g. 113594566

NCBI secondary accession, e.g. BAF18440.1

Pfam clan accession, e.g. CL0005

metaseq ID, e.g. JCVI_ORF_1096665732460

metaseq accession, e.g. JCVI_PEP_1096665732461

Pfam clan accession, e.g. CL0005

Pfam clan ID, e.g. Kazal

PDB entry, e.g. 2abl

Proteome species name, e.g. Homo sapiens

之前的邮箱不好使了。

pfamlist-subscribe@sanger.ac.uk

参考资料:文献:The Pfam protein families database

官网说明说 readme

ps:  1,pfam团队的邮箱:pfam-help@sanger.ac.uk。有问题就可以问他们

2,Can't locate Bio/Pfam/Scan/PfamScan.pm in @INC

(@INC contains: /etc/perl /usr/local/lib/perl/5.14.2

/usr/local/share/perl/5.14.2 /usr/lib/perl5 /usr/share/perl5

/usr/lib/perl/5.14 /usr/share/perl/5.14 /usr/local/lib/site_perl .)

at /sam/hmmer/PfamScan/pfam_scan.pl line 8.

BEGIN failed--compilation aborted at

/sam/hmmer/PfamScan/pfam_scan.pl line

8.这个问题折腾了我很久,最后我改了两点,一个就是通过cpan下载Moose,另一个就是修改了pfam_scan.pl的环境变量,就OK了。那就根据我博文中提到的PERL5LIB,我觉得应该是第二个原因。反正问题解决了,who

care 呢?

pfamscan 的使用_【T】每日一生信--PfamScan及fam数据库相关推荐

  1. tcount在哪个文件里_【T】每日一生信--MEGAN4命令行参数

    该博文已整理到新地址: http://qinqianshan.com/ngs/annoation/megan/ MEGAN4命令模式写各个参数 为了搞明白biotech文献中这个MEGAN所用参数,特 ...

  2. oracle euk 什么系统,【T】每日一生信--interproscan安装及使用(终结版)

    本博文已整理到新地址:http://qinqianshan.com/interproscan-installation-and-usage/ Interpro是一个数据库,它里面有蛋白功能,蛋白家族等 ...

  3. 实力验证—— 热璞数据库以卓越的产品性能成为首批通过信通院金融数据库性能测评厂商

    硬实力-- 热璞数据库以卓越的产品性能成为首批通过信通院金融数据库性能测评厂商 昨日,为防止北京疫情扩散,响应政府抗议号召,由中国信息通信研究院(简称"中国信通院")主办的2020 ...

  4. 信创铺路,数据库格局颠覆的时刻到了

    昂贵.专有.厂商锁定· · · · · ·传统的商用数据库的众多弊端一直为用户所诟病. 面对传统数据库的一堆噪点,在信创发展多年后,对于Oracle数据库能否被替代这样的问题,依然没有"能& ...

  5. oracle opidrv,华创信科oracle培训:数据库ORA-600[kcbchg1_6]解决

    华创信科oracle培训:数据库ORA-600[kcbchg1_6]解决. 1.背景描述 从2008年12月31日开始,数据库在执行大的update语句是出现ORA-600[kcbchg1_6]报错, ...

  6. 如何构建满足信创需求的数据库云一体机?

    近期,SmartX 推出了数据库云化基础设施解决方案,目标是更好满足企业数据库云底座在性能.稳定.敏捷.简单等方面的需求.该方案目前进行了多配置方案下的Oracle 数据库性能评测,也有超融合承载某头 ...

  7. bars 除障句完整_精选每日一句早安问候语语录49句

    精选每日一句早安问候语语录49句 任何事情都是这样一个过程,决定去做了,就着手去做,一旦找到了舒适区,你就会乐在其中,或许就发现:"喜欢比努力更重要."乐在其中地去坚持一件事,总好 ...

  8. 用python祝福父亲节_父亲节短信祝福怎么发 最经典的感恩父亲句子

    舔犊之情父爱情深,都爬满了你满手的碎纹:牵挂之暖鼓励之心,都灌满了你深邃的眼神:简短的叮嘱成长的隐忍,都渗透在你呼唤的乡音.父亲节快乐,祝福送给所有父亲! 人生路上,曾历遍风霜.唏嘘感慨,曾充斥心房. ...

  9. python父亲节祝福_用python祝福父亲节_父亲节短信祝福怎么发 最经典的感恩父亲句子...

    舔犊之情父爱情深,都爬满了你满手的碎纹:牵挂之暖鼓励之心,都灌满了你深邃的眼神:简短的叮嘱成长的隐忍,都渗透在你呼唤的乡音.父亲节快乐,祝福送给所有父亲! 人生路上,曾历遍风霜.唏嘘感慨,曾充斥心房. ...

  10. java 代码圣诞的祝福_圣诞祝福短信全集

    1.一天我擦亮阿拉丁的神灯,灯神说:我会满足你一个愿望.我说:请祝福正在看短信的人圣诞快乐! 2.孩子,我是圣诞老人,有一份圣诞大礼要送给你.什么--你们家没有烟囱?还不去买! 3.如果圣诞老人给我一 ...

最新文章

  1. 还在用 BeanUtils来做对象转换吗?快试试 MapStruct吧
  2. 仿探探卡片滑动vue封装并发布到npm
  3. 使用RNN解决NLP中序列标注问题的通用优化思路
  4. 【转】SVN各种颜色状态
  5. linux初级命令行
  6. 机器学习笔记(十二):随机梯度下降
  7. web sevice 生成代理类及使用
  8. android mat分析,android内存泄露MAT分析心得与注意点
  9. OFDM信号的产生与解调
  10. 没用过Node.js,就别瞎逼逼
  11. vs2012窗体嵌入表格_2012年电子表格日
  12. MFI认证——什么是苹果MFI认证
  13. python三重积分_(整理)三重积分及其计算和多重积分.
  14. html登陆成功自动跳转,点击登录,登陆成功,自动跳转到起始页面,这要怎么做?...
  15. android 字符串中截取,【安卓按键精灵】几种字符串提取的方法(源码)
  16. 《沈剑架构师训练营》第1章 - 技术选型
  17. 数据库应用----Mongodb 4.0 版本 基础操作---复制集,选举方法、部署认证 (二)
  18. ★Kali信息收集★8.Nmap :端口扫描
  19. 用R建立岭回归和lasso回归
  20. 参加SODA数据比赛

热门文章

  1. echart 三维可视化地图_ECharts实现三维可视化
  2. golang中的URL 的编码和解码(转)
  3. 【评测】Alfa Aesar分子砌块
  4. 什么是USB Key?
  5. b站python弹幕签到_一个python脚本就可以B站查找弹幕发送者!
  6. 基于python技术的酒店管理系统
  7. c++实现求梯形面积
  8. 怎样卸载deepin系统_双系统卸载deepin的方法是什么_双系统完全卸载deepin的方法图文步骤...
  9. python怎么算二元一次方程_Python简单实现二元一次方程求根
  10. 几分钟来了解下什么是嵌入式开发?