欢迎关注”生信修炼手册”!

多序列比对在保守区域鉴定,系统发育分析,motif识别等多个领域发挥重要作用,是生物信息数据分析必备的基础技能之一。Clustal是一款经典的多序列比对工具,支持DNA, RNA, 蛋白质的比对。官网如下

http://www.clustal.org/

clustal 有两个版本可用,之前的版本同时提供了GUI和命令行两种工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。

最新本的omega比对准确度更高,而且速度更快,适合几千条规模的多序列比对,该软件目前只提供了命令行版本。在官网上,提供了源代码和编译好的二进制文件

通常情况下,直接下载对应的二进制可执行文件就行了。软件的基本用法如下:

clustalo -i seq.fasta > align.fa

-i指定输入的序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件中。该软件支持多种格式的输出

  1. fasta

  2. clustal

  3. msf

  4. phylip

  5. selex

  6. stockholm

  7. vienna

默认输出格式为fasta, 可以通过--outfmt参数指定输出文件的格式。多序列比对不同于Blast的地方在于,Blast是局部比对,而多序列比对是全局比对。全局比对意味着需要将输入序列对齐到同一个水平来比对,一般是通过在输入序列中插入碱基的方式来使序列对齐,示意如下

>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin
ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG
CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC
CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG
CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC
CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA
CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT
GACCTCCAAATACCGTTAA
>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin
ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG
TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC
CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC
CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA
CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT
CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT
GACCTCCAAGTACCGTTAA
>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin
ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG
CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA
GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA
GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT
GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA
CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT
CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT
CTCTGAGAAGTACCGCTAA

通过在序列中插入-来使得序列对齐。如果不习惯命令行的操作方式,也有在线服务可以使用。EBI提供的在线服务网址如下

https://www.ebi.ac.uk/Tools/msa/clustalo/

使用非常简单,输入序列,调整参数设置,然后提交即可。在输出结果中,还提供了颜色标记,进化树可视化等功能。

通过Mview可视化多序列比对结果,示意如下

也支持导出到Jalview软件中进行可视化。

通过Phylogenetic Tree可以查看进化树的结果,默认采用NJ法建树,示意如下

也可以通过Send to Simple Phylogeny, 创建进化树,支持NJ和UPGMA两种建树方式。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

使用Clustal进行多序列比对相关推荐

  1. clustalw序列比对_如何做出漂亮的序列比对图——ENDscript/ESPript

    以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 如何做出漂亮的序列比对图--ENDscript/ESPript 大家经常在文献中看到非常好看的序列比对图,现在笔者将目前见过的最好看的 ...

  2. 如何做出漂亮的序列比对图——ENDscript/ESPript

    以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 四川魔德科技有限公司(www.modekeji.cn),专业从事分子模拟,量子化学等计算服务,欢迎咨询! 大家经常在文献中看到非常好看 ...

  3. 生物信息学(4)——多序列比对之CLUSTAL算法详解及C++实现

    生物信息学系列博客索引 生物信息学(1)--双序列比对之Needleman-Wunsch(NW)算法详解及C++实现 生物信息学(2)--双序列比对之Smith-Waterman(SW)算法详解 生物 ...

  4. 生信自学笔记(九)智慧的长者与多序列联配之clustal全局联配算法

    要不,还是先讲个黑暗的小故事吧. 国王愈来愈烦躁了,他觉得这个国家满哪儿都是人,大街上走着人,池塘里泡着人,屋顶上晾着人,自己去四下巡游,什么风景都看不着. "这可不行,这么多人,东西哪够分 ...

  5. 多重比对序列的格式及其应用

    这里对多重序列比对格式(Multiple sequence alignment – MSA)进行总结.在做系统演化分析.序列功能分析.基因预测等,都需要涉及到多重序列比对.特别是当需要用不同软件对多重 ...

  6. 高通量测序技术和序列拼接算法探析

    高通量测序技术和序列拼接算法探析 时间:2019-05-27 来源:计算机科学 作者:周卫星,石海鹤 本文字数:16853字 摘    要: 高通量测序 (High-throughput Sequen ...

  7. 多序列比对的c语言程序,多序列比对的实际应用

    Andreas D.Baxevanis Genome Technology Branch National Human Genome Research Institude National Insti ...

  8. clustalw序列比对_序列比对(二)

    Homology is the central concept for all of biology.--David Wake. Science, 1994 前言 正如前面引用的这句话,同源性是生物学 ...

  9. php时间序列比对,常用在线序列比对工具

    从早期序列比对工具Needleman-Wunsch.Smith-Waterman到后来的Clustal算法,以及近几年的Muscle.MAFFT序列比对算法.算法在向更快.更精确.能处理更多数据这些方 ...

  10. 【生信MOOC】生物序列比对工具——多序列比对

    [生信MOOC]生物序列比对工具2--多序列比对 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信MOOC]生物序列比对工具2--多序列比对 1 ...

最新文章

  1. java common io_Java之Apache Commons-IO使用精讲
  2. java http请求
  3. 随便说说程序员团队精神的荣辱与共
  4. 【微信小程序】带你做一个公众号留言系统(附源码)
  5. BZOJ3282: Tree (LCT模板)
  6. (原创) 心电图机静态心电自动分析算法介绍
  7. hadoop 运行过程中出现Call to localhost/127.0.0.1:9000 failed on connection exception错误。
  8. 高德Android 定位SDK示例
  9. 不服来试试,Excel中被吹上天的Ctrl+E,到底有多厉害?
  10. Android studio中使用NumCpp最新开源库
  11. 【渝粤教育】广东开放大学 计算机导论 形成性考核 (51)
  12. 【基础练习】【DFS】codevs2806 红与黑题解
  13. anaconda使用心得
  14. KNN实现小麦种子分类问题
  15. Java —— 打印杨辉三角形
  16. android app 快速接入支付宝流程(android studio)
  17. Matlab 数组写入文件
  18. NL莉莎食品进口的全球外来直接从种植者 - 中国MP4数码音频播放器
  19. eclipse中svn插件突然出现错误,不能连接svn了:Could not create the view: org.tigris.subversion.subclipse.ui.repositor
  20. StringUtils isEmpty 和 isBlank 区别

热门文章

  1. Setycyas的自定义表情油猴插件
  2. 环境与设备监控计算机套定额,第三章建筑设备监控系统安装工程定额.doc
  3. RS232/RS485转4G DTU 上传基于Modbus协议的温湿度传感器数据到远程TCP服务器
  4. Amesim(七):amesim自带demo动力学模型研究
  5. 姜健:VP9可适性视频编码(SVC)新特性
  6. Oracle函数返回Table集合
  7. Android手机进入9008高通模式(以小米手机为例)
  8. (转)司徒正美:如何挑选适合的前端框架?
  9. 【136天】尚学堂高淇Java300集视频精华笔记(77-78)
  10. 高效开发神器 | 合宙LuatIDE 1.1.0正式版本免费下载