Hmmer using Guide

从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速度,但其应用还远没有blast普及,这里是一篇入门级的介绍文章。

Hmmer下载与安装

对于Mac OS/X, Linux, UNIX系统,用源代码编译安装:

% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % make check

windows系统,直接下载二进制压缩包,解压就可以使用,下载地址:
http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip

Hmmer包含的程序

  • phmmer: 与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;
    > phmmer tutorial/HBB HUMAN uniprot sprot.fa
  • jackhmmer: 与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;
    > jackhmmer tutorial/HBB HUMAN uniprot sprot.fa
  • hmmbuild: 用多重比对序列构建HMM模型;
  • hmmsearch: 使用HMM模型搜索序列库;
  • hmmscan: 使用序列搜索HMM库;
  • hmmalign: 使用HMM为线索,构建多重比对序列;
    > hmmalign globins4.hmm tutorial/globins45.fa
  • hmmconvert: 转换HMM格式
  • hmmemit: 从HMM模型中,得到一个模式序列;
  • hmmfetch: 通过名字或者接受号从HMM库中取回一个HMM模型;
  • hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;
  • hmmstat: 显示HMM数据库的统计信息;

使用HMM模型搜索序列数据库

  1. 使用hmmbuild构建HMM模型,输入为Stockholm格式或者FASTA格式的多重比对序列文件(如:tutorial/globins4.sto),命令如下:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    globins4.hmm为输出的HMM模型
  2. 使用hmmsearch搜索蛋白质序列数据库,蛋白质序列数据库为FASTA格式,命令如下:
    > hmmsearch globins4.hmm uniprot sprot.fasta > globins4.out
    globins4.out为输出的结果文件,如下:

*示例使用官方教程中的示例

使用蛋白质序列搜索HMM数据库

  1. 构建HMM数据库,HMM数据库是包含多个HMM模型的文件,可以从Pfam、SMART、TIGRFams下载,也可以自己由多重比对序列集中构建,如:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    > hmmbuild fn3.hmm tutorial/fn3.sto
    > hmmbuild Pkinase.hmm tutorial/Pkinase.sto
    > cat globins4.hmm fn3.hmm Pkinase.hmm > minifam
  2. 使用hmmpress格式化数据库,包括压缩以及创建索引,命令如下:
    > hmmpress minifam
    这个步骤可以很快的执行完成,输出的内容如下:
    Working… done.
    Pressed and indexed 3 HMMs (3 names and 2 accessions).
    Models pressed into binary file: minifam.h3m
    SSI index for binary model file: minifam.h3i
    Profiles (MSV part) pressed into: minifam.h3f
    Profiles (remainder) pressed into: minifam.h3p
  3. 使用hmmscan搜索HMM数据库,命令如下:
    > hmmscan minifam tutorial/7LESS_DROME
    输出如下:

后记

这里主要是一个入门式的教程,介绍了hmmer的安装,以及最常用功能使用的命令示例。其他程序的使用,以及每个程序的详细参数说明,请参看官方手册,
官方文档手册(pdf):ftp://selab.janelia.org/pub/software/hmmer3/3.1b1/Userguide.pdf (2013.5.27最新版本3.1.b.1)

使用中,遇到的问题,或者疑难,可以留言讨论。

转载于:https://www.cnblogs.com/tsingke/articles/3977316.html

Hmmer using Guide相关推荐

  1. hmmer建立hmmscan

    学术辣鸡前两天想要用hmmsearch 比对文件,但是发现hmmsearch所使用的pfam-a.hmm他就是一个hmm,依赖数据库vogdb就没有一个完整的hmm,所以不会设置.... 然后我发现了 ...

  2. 生信步骤|MAFFT结合HMMER进行多序列比对和基于隐马模型的基因搜索

    蛋白质都是由相似的小型结构域组成的.如果我们有若干个已知的蛋白序列,那我们就可以根据这些蛋白序列比较其含有的保守域,寻找在蛋白数据库中上是否也有一样保守域的蛋白.而后根据统计学模型,将显著性较高的蛋白 ...

  3. Structured Streaming编程 Programming Guide

    Structured Streaming编程 Programming Guide • Overview • Quick Example • Programming Model o Basic Conc ...

  4. Technology Document Guide of TensorRT

    Technology Document Guide of TensorRT Abstract 本示例支持指南概述了GitHub和产品包中包含的所有受支持的TensorRT 7.2.1示例.Tensor ...

  5. Python神经网络集成技术Guide指南

    Python神经网络集成技术Guide指南 本指南将介绍如何加载一个神经网络集成系统并从Python运行推断. 提示 所有框架的神经网络集成系统运行时接口都是相同的,因此本指南适用于所有受支持框架(包 ...

  6. 深度学习框架集成平台C++ Guide指南

    深度学习框架集成平台C++ Guide指南 这个指南详细地介绍了神经网络C++的API,并介绍了许多不同的方法来处理模型. 提示 所有框架运行时接口都是相同的,因此本指南适用于所有受支持框架(包括Te ...

  7. Unity电子游戏优化终极指南 The Ultimate Guide to Video Game Optimisation

    大小解压后:5.2G 含课程文件 时长9h 1280X720 MP4 语言:英语+中英文字幕(根据原英文字幕机译更准确) 电子游戏优化终极指南 信息: 学会从你的Unity游戏开发项目中挤出每一帧表现 ...

  8. Unity 3D游戏代码编程学习教程 Full Guide To Unity 3D C#: Learn To Code Making 3D Games

    Unity 3D游戏代码编程学习教程 Full Guide To Unity 3D & C#: Learn To Code Making 3D Games Full Guide To Unit ...

  9. Unity增强现实初学者指南视频教程 A Beginner’s Guide to Augmented Reality with Unity

    Unity增强现实初学者指南视频教程 A Beginner's Guide to Augmented Reality with Unity MP4 |视频:h264,1280×720 (部分1920X ...

最新文章

  1. 子网地址,广播地址,子网掩码,主机地址范围,求法总结
  2. 概率密度函数pdf(probability densinity function) DOC API
  3. 计算机二级c语言作弊的东西,计算机二级C全部考试题库[作弊必备]编程题.txt
  4. 用WINHEX合并两个或多个BIN文件
  5. JAVA 获取文件的MD5值大小以及常见的工具类
  6. 截取两个标签之间的文本
  7. 程序员的进阶课-架构师之路(12)-2-3-4树
  8. 八 .数据库(多表查询)
  9. oracle 01035,oracle常用命令(一)
  10. win7安装AHCI驱动
  11. UI设计和原型设计的区别
  12. php studay,studay是什么意思
  13. c语言题 设圆的半径,C语言初学者:编程序:设圆半径r圆柱高h,求圆周长面积圆柱体积圆球表面积...
  14. 超简单方法搭建Eclipse下的Android NDK
  15. 手机/笔记本电脑看电视直播
  16. linux 设置django开机启动以及自动开启浏览器全屏
  17. 面向对象与面向过程编程的区别
  18. u盘/移动硬盘的视频文件出现损坏怎么办?修复损坏视频办法分享!
  19. The analysis of frame
  20. 基于PCA的TE过程故障诊断(matlab)

热门文章

  1. 打开Flutter动画的另一种姿势——Flare,android面试题选择题
  2. 第三章 半导体中载流子的统计分布
  3. 程序员的工资大概多少?
  4. 非接触IC卡中typeA卡和typeB卡的区别--总结,二者的调制方式和编码方式不同
  5. JMeter 常用的几种断言方法,你会几种呢?
  6. php提取视频音乐,如何从视频里提取音乐伴奏
  7. plc辅助继电器M的介绍
  8. Android FTP功能开发基于swiftp
  9. 抖音seo源码二次开发,短视频seo源码二次开发
  10. 使用canvas生成水印watermark,有详细注释,简单易懂