使用Clustal进行多序列比对
欢迎关注”生信修炼手册”!
多序列比对在保守区域鉴定,系统发育分析,motif识别等多个领域发挥重要作用,是生物信息数据分析必备的基础技能之一。Clustal是一款经典的多序列比对工具,支持DNA, RNA, 蛋白质的比对。官网如下
http://www.clustal.org/
clustal 有两个版本可用,之前的版本同时提供了GUI和命令行两种工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。
最新本的omega比对准确度更高,而且速度更快,适合几千条规模的多序列比对,该软件目前只提供了命令行版本。在官网上,提供了源代码和编译好的二进制文件
通常情况下,直接下载对应的二进制可执行文件就行了。软件的基本用法如下:
clustalo -i seq.fasta > align.fa
-i
指定输入的序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件中。该软件支持多种格式的输出
fasta
clustal
msf
phylip
selex
stockholm
vienna
默认输出格式为fasta
, 可以通过--outfmt
参数指定输出文件的格式。多序列比对不同于Blast的地方在于,Blast是局部比对,而多序列比对是全局比对。全局比对意味着需要将输入序列对齐到同一个水平来比对,一般是通过在输入序列中插入碱基的方式来使序列对齐,示意如下
>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin
ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG
CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC
CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG
CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC
CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA
CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT
GACCTCCAAATACCGTTAA
>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin
ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG
TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC
CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC
CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA
CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT
CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT
GACCTCCAAGTACCGTTAA
>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin
ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG
CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA
GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA
GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT
GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA
CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT
CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT
CTCTGAGAAGTACCGCTAA
通过在序列中插入-
来使得序列对齐。如果不习惯命令行的操作方式,也有在线服务可以使用。EBI提供的在线服务网址如下
https://www.ebi.ac.uk/Tools/msa/clustalo/
使用非常简单,输入序列,调整参数设置,然后提交即可。在输出结果中,还提供了颜色标记,进化树可视化等功能。
通过Mview
可视化多序列比对结果,示意如下
也支持导出到Jalview
软件中进行可视化。
通过Phylogenetic Tree
可以查看进化树的结果,默认采用NJ法建树,示意如下
也可以通过Send to Simple Phylogeny, 创建进化树,支持NJ和UPGMA两种建树方式。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
使用Clustal进行多序列比对相关推荐
- clustalw序列比对_如何做出漂亮的序列比对图——ENDscript/ESPript
以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 如何做出漂亮的序列比对图--ENDscript/ESPript 大家经常在文献中看到非常好看的序列比对图,现在笔者将目前见过的最好看的 ...
- 如何做出漂亮的序列比对图——ENDscript/ESPript
以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 四川魔德科技有限公司(www.modekeji.cn),专业从事分子模拟,量子化学等计算服务,欢迎咨询! 大家经常在文献中看到非常好看 ...
- 生物信息学(4)——多序列比对之CLUSTAL算法详解及C++实现
生物信息学系列博客索引 生物信息学(1)--双序列比对之Needleman-Wunsch(NW)算法详解及C++实现 生物信息学(2)--双序列比对之Smith-Waterman(SW)算法详解 生物 ...
- 生信自学笔记(九)智慧的长者与多序列联配之clustal全局联配算法
要不,还是先讲个黑暗的小故事吧. 国王愈来愈烦躁了,他觉得这个国家满哪儿都是人,大街上走着人,池塘里泡着人,屋顶上晾着人,自己去四下巡游,什么风景都看不着. "这可不行,这么多人,东西哪够分 ...
- 多重比对序列的格式及其应用
这里对多重序列比对格式(Multiple sequence alignment – MSA)进行总结.在做系统演化分析.序列功能分析.基因预测等,都需要涉及到多重序列比对.特别是当需要用不同软件对多重 ...
- 高通量测序技术和序列拼接算法探析
高通量测序技术和序列拼接算法探析 时间:2019-05-27 来源:计算机科学 作者:周卫星,石海鹤 本文字数:16853字 摘 要: 高通量测序 (High-throughput Sequen ...
- 多序列比对的c语言程序,多序列比对的实际应用
Andreas D.Baxevanis Genome Technology Branch National Human Genome Research Institude National Insti ...
- clustalw序列比对_序列比对(二)
Homology is the central concept for all of biology.--David Wake. Science, 1994 前言 正如前面引用的这句话,同源性是生物学 ...
- php时间序列比对,常用在线序列比对工具
从早期序列比对工具Needleman-Wunsch.Smith-Waterman到后来的Clustal算法,以及近几年的Muscle.MAFFT序列比对算法.算法在向更快.更精确.能处理更多数据这些方 ...
- 【生信MOOC】生物序列比对工具——多序列比对
[生信MOOC]生物序列比对工具2--多序列比对 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信MOOC]生物序列比对工具2--多序列比对 1 ...
最新文章
- java common io_Java之Apache Commons-IO使用精讲
- java http请求
- 随便说说程序员团队精神的荣辱与共
- 【微信小程序】带你做一个公众号留言系统(附源码)
- BZOJ3282: Tree (LCT模板)
- (原创) 心电图机静态心电自动分析算法介绍
- hadoop 运行过程中出现Call to localhost/127.0.0.1:9000 failed on connection exception错误。
- 高德Android 定位SDK示例
- 不服来试试,Excel中被吹上天的Ctrl+E,到底有多厉害?
- Android studio中使用NumCpp最新开源库
- 【渝粤教育】广东开放大学 计算机导论 形成性考核 (51)
- 【基础练习】【DFS】codevs2806 红与黑题解
- anaconda使用心得
- KNN实现小麦种子分类问题
- Java —— 打印杨辉三角形
- android app 快速接入支付宝流程(android studio)
- Matlab 数组写入文件
- NL莉莎食品进口的全球外来直接从种植者 - 中国MP4数码音频播放器
- eclipse中svn插件突然出现错误,不能连接svn了:Could not create the view: org.tigris.subversion.subclipse.ui.repositor
- StringUtils isEmpty 和 isBlank 区别
热门文章
- Setycyas的自定义表情油猴插件
- 环境与设备监控计算机套定额,第三章建筑设备监控系统安装工程定额.doc
- RS232/RS485转4G DTU 上传基于Modbus协议的温湿度传感器数据到远程TCP服务器
- Amesim(七):amesim自带demo动力学模型研究
- 姜健:VP9可适性视频编码(SVC)新特性
- Oracle函数返回Table集合
- Android手机进入9008高通模式(以小米手机为例)
- (转)司徒正美:如何挑选适合的前端框架?
- 【136天】尚学堂高淇Java300集视频精华笔记(77-78)
- 高效开发神器 | 合宙LuatIDE 1.1.0正式版本免费下载