hmmer建立hmmscan

学术辣鸡前两天想要用hmmsearch 比对文件，但是发现hmmsearch所使用的pfam-a.hmm他就是一个hmm，依赖数据库vogdb就没有一个完整的hmm，所以不会设置。。。。

然后我发现了hmmscan(学术辣鸡没有认真查看HMMER说明书HMMER User’s Guide，淦，hmmscan写了可以在调用任务之前把所有文件整合成一个hmm，调用的时hmmpress：

Constructs binary compressed datafiles for hmmscan, starting from a profile database
hmmfile in standard HMMER3 format. The hmmpress step is required for hmmscan to work.
Four files are created: hmmfile.h3m, hmmfile.h3i, hmmfile.h3f, and hmmfile.h3p. The
hmmfile.h3m file contains the profile HMMs and their annotation in a binary format.
The hmmfile.h3i file is an SSI index for the hmmfile.h3m file. The hmmfile.h3f file contains precomputed data structures for the fast heuristic filter (the MSV filter). The
hmmfile.h3p file contains precomputed data structures for the rest of each profile.
hmmfile may not be ’-’ (dash); running hmmpress on a standard input stream rather
than a file is not allowed.

hmmpress [options] hmmfile
用法如下：
如果需要下载数据库，怎么下的无所谓，只是参照：
curl -LO http://fileshare.csb.univie.ac.at/vog/latest/vog.hmm.tar.gz
如果你下好数据库就直接创建文件夹吧！
mkdir vog
tar -C vog -xf vog.hmm.tar.gz
cat vog/* > VOGs.hmms
hmmpress VOGs.hmms

这样就完成了自己的hmm库建立。
然后再调用hmmscan就可以了：

hmmscan [options] hmmdb seqfile
hmmdb 依赖的数据库，
seqfile 你的文件
-h 查看 options我把它挂起了：
nohup hmmscan -o vog_out/output_19292.txt --tblout vog_out/output_19292_pro.tbl --domtblout
vog_out/output_19292_pro.dom -E 1e-5 VOGs.hmms my_data/1kbvotu/virsorter_vhmm_result_prot.fasta &

-o FILE

将结果输出到指定的文件中。默认是输出到标准输出。

–tblout FILE

将蛋白质家族的结果以表格形式输出到指定的文件中。默认不输出该文件。

–domtblout FILE

将蛋白结构域的比对结果以表格形式输出到指定的文件中。默认不输出该文件。该表格中包含query序列起始结束位点与目标序列起始结束位点的匹配信息。

–acc

在输出结果中包含 PF 的编号，默认是蛋白质家族的名称。

–noali

在输出结果中不包含比对信息。输出文件的大小则会更小。

-E FLOAT default:10.0

设定 E_value 阈值，推荐设置为 1e-5 。（看到的蛮多文章都是-5）

-T FLOAT （目前没有看到太多设定）

设定 Score 阈值。

–domE FLOAT default:10.0

设定 E_value 阈值。该参数和 -E 参数类似，不过是 domain 比对设定的值。

–cpu

多线程运行的CPU。默认应该是大于1的，表示支持多线程运行。但其实估计一般一个hmmscan程序利用150%个CPU。并且若进行并行化调用hmmscan，当并行数高于4的时候，会报错：Fatal exception (source file esl_threads.c, line 129)。这时，设置–cpu的值为1即可。

p.s.
HMMER说hmmsearch要效率更高。可是谁不知道呢，谁让我是学术辣鸡呢！

Either hmmsearch or hmmscan can compare a set of profiles to a set of sequences. Due to disk access patterns of the two tools, it is usually more efficient to use hmmsearch, unless the number of profiles greatly exceeds the number of sequences.

hmmer建立hmmscan相关推荐

pfamscan 的使用_【HMMSCAN】使用pfam数据库对多序列文件进行结构域注释
写在前面做基因功能的人都会特别注意基因上有什么功能结构域,通常我们认为,结构域决定了这个基因的功能.随着高通量测序技术的发展,我们完全可以通过一级序列来预测该基因的结构域,pfam和smart数据库 ...
如何获取一个基因家族的所有小麦基因
如何获取一个基因家族的所有小麦基因昨天有同学问我如何获得谷子中一个基因家族的所有基因.谷子已经测过序,获得起来还是比较简单.想要获得一个基因组家族的所有基因,方法很多.比方说,IWGSCv1.0的基 ...
使用HMMER搜索PFam
1. 安装HMMer 2. 从ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/下载pfam数据库Pfam-A.hmm 3. 得到 PFAM 数据库的 H ...
pfamscan 的使用_使用 HMMER 进行 PFAM 注释
1. HMMER 简介 HMMER 和 BLAST 类似,主要用于序列比对. 2. HMMER 与 PFAM 的下载安装安装 HMMER $ wget ftp://selab.janelia.org ...
生信步骤｜MAFFT结合HMMER进行多序列比对和基于隐马模型的基因搜索
蛋白质都是由相似的小型结构域组成的.如果我们有若干个已知的蛋白序列,那我们就可以根据这些蛋白序列比较其含有的保守域,寻找在蛋白数据库中上是否也有一样保守域的蛋白.而后根据统计学模型,将显著性较高的蛋白 ...
结构域对比~HMMER安装及应用
安装网址:http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip 要复制到讯雷里下载要不然就是404 no found 下载完成后 ...
pfamscan 的使用_基础工具-HMMER用法
(二)使用蛋白质(核酸)序列搜索已构建HMM数据库该方法为常用的功能注释方法. 构建HMM数据库.使用多序列比对文件,同上述命令即可完成构建.同时可以从Pfam.SMART等网站下载现成额HMM.举 ...
Hmmer using Guide
Hmmer using Guide 从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高 ...
HPC应用软件安装《hmmer》
一.简介 HMMER通常与已构建好的HMM数据集一起使用,例如Pfam以及Interpro收纳的一些数据库.同时HMMER也可以像BLAST一样使用查询序列,对序列数据库(非HMM数据库)进行检索.例 ...

hmmer建立hmmscan

hmmer建立hmmscan相关推荐

最新文章

热门文章