学术辣鸡前两天想要用hmmsearch 比对文件,但是发现hmmsearch所使用的pfam-a.hmm他就是一个hmm,依赖数据库vogdb就没有一个完整的hmm,所以不会设置。。。。

然后我发现了hmmscan(学术辣鸡没有认真查看HMMER说明书HMMER User’s Guide,淦,hmmscan写了可以在调用任务之前把所有文件整合成一个hmm,调用的时hmmpress:

Constructs binary compressed datafiles for hmmscan, starting from a profile database
hmmfile in standard HMMER3 format. The hmmpress step is required for hmmscan to work.
Four files are created: hmmfile.h3m, hmmfile.h3i, hmmfile.h3f, and hmmfile.h3p. The
hmmfile.h3m file contains the profile HMMs and their annotation in a binary format.
The hmmfile.h3i file is an SSI index for the hmmfile.h3m file. The hmmfile.h3f file contains precomputed data structures for the fast heuristic filter (the MSV filter). The
hmmfile.h3p file contains precomputed data structures for the rest of each profile.
hmmfile may not be ’-’ (dash); running hmmpress on a standard input stream rather
than a file is not allowed.

hmmpress [options] hmmfile
用法如下:
如果需要下载数据库,怎么下的无所谓,只是参照:
curl -LO http://fileshare.csb.univie.ac.at/vog/latest/vog.hmm.tar.gz
如果你下好数据库就直接创建文件夹吧!
mkdir vog
tar -C vog -xf vog.hmm.tar.gz
cat vog/* > VOGs.hmms
hmmpress VOGs.hmms

这样就完成了自己的hmm库建立。
然后再调用hmmscan就可以了:

hmmscan [options] hmmdb seqfile
hmmdb 依赖的数据库,
seqfile 你的文件
-h 查看 options我把它挂起了:
nohup hmmscan -o vog_out/output_19292.txt --tblout vog_out/output_19292_pro.tbl --domtblout
vog_out/output_19292_pro.dom -E 1e-5 VOGs.hmms my_data/1kbvotu/virsorter_vhmm_result_prot.fasta &

-o FILE

将结果输出到指定的文件中。默认是输出到标准输出。

–tblout FILE

将蛋白质家族的结果以表格形式输出到指定的文件中。默认不输出该文件。

–domtblout FILE

将蛋白结构域的比对结果以表格形式输出到指定的文件中。默认不输出该文件。该表格中包含query序列起始结束位点与目标序列起始结束位点的匹配信息。

–acc

在输出结果中包含 PF 的编号,默认是蛋白质家族的名称。

–noali

在输出结果中不包含比对信息。输出文件的大小则会更小。

-E FLOAT default:10.0

设定 E_value 阈值,推荐设置为 1e-5 。(看到的蛮多文章都是-5)

-T FLOAT (目前没有看到太多设定)

设定 Score 阈值。

–domE FLOAT default:10.0

设定 E_value 阈值。该参数和 -E 参数类似,不过是 domain 比对设定的值。

–cpu

多线程运行的CPU。默认应该是大于1的,表示支持多线程运行。但其实估计一般一个hmmscan程序利用150%个CPU。并且若进行并行化调用hmmscan,当并行数高于4的时候,会报错:Fatal exception (source file esl_threads.c, line 129)。这时,设置–cpu的值为1即可。

p.s.
HMMER说hmmsearch要效率更高。可是谁不知道呢,谁让我是学术辣鸡呢!

Either hmmsearch or hmmscan can compare a set of profiles to a set of sequences. Due to disk access patterns of the two tools, it is usually more efficient to use hmmsearch, unless the number of profiles greatly exceeds the number of sequences.

hmmer建立hmmscan相关推荐

  1. pfamscan 的使用_【HMMSCAN】使用pfam数据库对多序列文件进行结构域注释

    写在前面 做基因功能的人都会特别注意基因上有什么功能结构域,通常我们认为,结构域决定了这个基因的功能.随着高通量测序技术的发展,我们完全可以通过一级序列来预测该基因的结构域,pfam和smart数据库 ...

  2. 如何获取一个基因家族的所有小麦基因

    如何获取一个基因家族的所有小麦基因 昨天有同学问我如何获得谷子中一个基因家族的所有基因.谷子已经测过序,获得起来还是比较简单.想要获得一个基因组家族的所有基因,方法很多.比方说,IWGSCv1.0的基 ...

  3. 使用HMMER搜索PFam

    1. 安装HMMer 2. 从ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/下载pfam数据库Pfam-A.hmm 3. 得到 PFAM 数据库的 H ...

  4. pfamscan 的使用_使用 HMMER 进行 PFAM 注释

    1. HMMER 简介 HMMER 和 BLAST 类似,主要用于序列比对. 2. HMMER 与 PFAM 的下载安装 安装 HMMER $ wget ftp://selab.janelia.org ...

  5. 生信步骤|MAFFT结合HMMER进行多序列比对和基于隐马模型的基因搜索

    蛋白质都是由相似的小型结构域组成的.如果我们有若干个已知的蛋白序列,那我们就可以根据这些蛋白序列比较其含有的保守域,寻找在蛋白数据库中上是否也有一样保守域的蛋白.而后根据统计学模型,将显著性较高的蛋白 ...

  6. 结构域对比~HMMER安装及应用

    安装 网址:http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip 要复制到讯雷里下载要不然就是404 no found 下载完成后 ...

  7. pfamscan 的使用_基础工具-HMMER用法

    (二)使用蛋白质(核酸)序列搜索已构建HMM数据库 该方法为常用的功能注释方法. 构建HMM数据库.使用多序列比对文件,同上述命令即可完成构建.同时可以从Pfam.SMART等网站下载现成额HMM.举 ...

  8. Hmmer using Guide

    Hmmer using Guide 从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高 ...

  9. HPC应用软件安装《hmmer》

    一.简介 HMMER通常与已构建好的HMM数据集一起使用,例如Pfam以及Interpro收纳的一些数据库.同时HMMER也可以像BLAST一样使用查询序列,对序列数据库(非HMM数据库)进行检索.例 ...

最新文章

  1. 自定义控件:Viewpager
  2. 完整的聚合支付中心设计方案
  3. Xception论文阅读笔记
  4. neo4j 显示名字_Neo4j:绘制“我的名字是……我在工作”图
  5. SAP BPC最佳实践-BPC系统备份及恢复
  6. javascript arguments对象研究--针对jquery源码研究再研究
  7. python实现散列表的链表法
  8. ABAP术语-Update Task
  9. GitHub 新手教程 六,Git GUI 新手教程(3),从GitHub远端同步代码库
  10. PID算法的原理和公式
  11. 为了IT,加强身体锻炼之【双盘腿打坐的好处】
  12. docker,deamon.json文件说明
  13. 学习记录657@python计算股价的回撤与收盘价回撤率组合图实现
  14. 2018年南京大学计算机专业录取分数线,南京大学2018年录取分数线
  15. Android通讯录管理遇到的权限问题
  16. @Deprecated的使用
  17. orcad capture 快速制作原理图库
  18. [软件分享]Bandizip(有史以来最好的压缩软件)「v1.0」
  19. 新辰:健身会所不是大人的菜 90后创业两年净赚20万
  20. 埃林哲一面面试经历(记录第一次面试)

热门文章

  1. 我的名字居然是我爸爸用代码算出来的?
  2. 如何理解DevOps
  3. WIFI模块RTL8723BU驱动移植
  4. 数据挖掘实验-week8-关联规则挖掘(Association Rule Mining)
  5. 华为 android 菜单键,没有返回和菜单键!华为P10的Home键简单说明
  6. java IO流之一 IO流介绍
  7. 日本动漫作家和其部分作品
  8. 一个C语言的基本教程—IO篇
  9. Microsoft SQL Server 2000 Service Pack 3a
  10. mongoDB镜像下载