利用VCF文件构建系统发育树
导读
本文将介绍三种使用VCF
文件,构建系统发育树的方法,包括程序的安装,使用,已及系统发育树的可视化与美化。
1. VCF2Dis
VCF2Dis[1]是一种新的简单高效的软件,用于计算基于VCF
格式的距离矩阵
1.1. 安装
# 下载wget -c https://github.com/hewm2008/VCF2Dis/archive/v1.47.tar.gz
# 解压tar -zxvf v1.47.tar.gz
# 进入程序目录cd VCF2Dis
# 编译make ; make clean
# 测试运行./bin/VCF2Dis
1.2. 距离矩阵
利用 VCF2Dis
生成距离矩阵
VCF2Dis -i test.vcf -o test.mat
1.3. mat2nwk
文件转换
上传距离矩阵到在线网站, FastMe2.0[2]。上传以后,选择Data type
为Distance matrix
。 然后根据自己的需要进行配置,最后填入任务名称和Email
来获取结果通知。
结果下载
点击下载结果
结果文件是一个压缩文件,里面包含:
一个 .nwk
文件用于进化树可视化
stats.txt
记录了文件转换过程中,选择的参数
stdout.txt
转换过程中的日志文件,记录了程序的运行过程
1.4. iTOL美化
十分推荐利用
iTOL
对进化树进行美化,该程序是网页版,配置简单,结果十分漂亮。
导入iTOL[3]美化
2. Phylip
PHYLIP[4]是用于推断系统发育的免费程序包。
2.1. 安装
源码编译安装
# 下载PHYLIP wget -c http://evolution.gs.washington.edu/phylip/download/phylip-3.697.tar.gz
# 解包tar zxf phylip-3.697.tar.gz
# 进入程序文件夹cd phylip-3.695/src/
# 复制文件cp Makefile.unx Makefile
# 编译make install # 可能需要sudo 权限
conda
安装
# 新建phylip环境,并安装phylipconda create -n phylip -c bioconda phylip -y
2.2. 格式转换
转换脚本下载
# 下载wget -c https://github.com/edgardomortiz/vcf2phylip/archive/refs/tags/v2.8.zip
# 解压unzip v2.8.zip
转换为 PHYLIP matrix
python vcf2phylip.py -i test.vcf
# PHYLIP matrix是默认格式,不同输出格式,见下参数# -f FASTA matrix# -n NEXUS matrix# -b binary NEXUS matrix
注意:test.vcf中的样本名一定要少于10个字符,否则会报错
2.3. 建树
构建配置文件
seqboot.par
test.phy # 本程序的输入文件R # 选择bootstrap100 # 设置bootstrap的值,即重复的replicate的数目,通常使用1000或者100,注意此处设定好后,后续两步的M值也为1000或者100Y # yes确认以上设定的参数9 # 设定随机参数,输入奇数值。
dnadist.par
seqboot.out # 本程序的输入文件T # 选择设定Transition/transversion的比值2.3628 # 比值大小M #修改M值D # 修改M值100 # 设定M值大小2 # 将软件运行情况显示出来Y # 确认以上设定的参数
neighbor.par
dnadist.out # 本程序的输入文件M100 # 设定M值大小9 # 设定随机数,输入奇数值Y # 确认以上设定的参数
consense.par
nei.tree #本程序的输入文件Y #确认以上设定的参数
phylip
建树
# 在 phylip 文件夹下,依次运行下面的命令
# seqboot./exe/seqboot < ./seqboot.par && mv ./outfile ./seqboot.out
# dnadist./exe/dnadist < ./dnadist.par && mv ./outfile ./dnadist.out
# neighbor./exe/neighbor < ./neighbor.par && mv ./outfile ./nei.out && mv ./outtree ./nei.tree
# consense./exe/consense < ./consense.par && mv ./outfile ./cons.out && mv ./outtree ./constree
3. IQ-tree
IQ-tree[5]的建树方法与phylip
类似,只是最后一步不一样,同样需要先转换文件格式为:phy
(格式转换见2.2)。
3.1. 安装
利用 conda
安装
# 新建iq-tree环境 并 安装iqtreeconda create -n iqtree -c bioconda iqtree -y
3.2. 建树
IQ-tree
建树(简单)
iqtree -s test.phy
替代模型选择与详细的分支评估,见http://www.iqtree.org/中说明
★
上面三种示例程序运行过程中使用的参数,需要根据自身数据进行调整。
”
参考资料
VCF2Dis: https://github.com/BGI-shenzhen/VCF2Dis
[2]
FastMe2.0: http://www.atgc-montpellier.fr/fastme/
[3]
iTOL: https://itol.embl.de/
[4]
PHYLIP 是用于推断系统发育的免费程序包。: https://evolution.genetics.washington.edu/phylip.html
[5]
IQ-TREE: http://www.iqtree.org/
本文由 mdnice 多平台发布
利用VCF文件构建系统发育树相关推荐
- vbn中使用的3种流程控制结构是_细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定...
细菌进化树 • 构 建 细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定 对于细菌新种或者新属的发现,总是那么让人期待,但是当我们批量获得16S序列后,逐一对这些尚不知分类地位的序列进行比对并 ...
- Linux多线程贝叶斯建树教程,构建系统发育树:贝叶斯法建树
写在前面:我对建树也是一知半解,这里只是想记录一下自己跟别人学习的建树方法,可能不具有普适性.但毕竟写在公众平台,大家自主参考. 用phylosuite进行.nex文件的准备,用在线建树网站CIPRE ...
- 构建单拷贝同源蛋白系统发育树,一条命令提序列!
由于基因重组与基因突变的存在,利用16S rRNA构建的系统发育树通常不够可靠,而使用基于全基因组的单拷贝同源蛋白系统发育树则不会存在这方面的困扰,16S rRNA序列也就1500个碱基左右,而全基因 ...
- MEGA | 多序列比对及系统发育树的构建
MEGA是一个用于多序列比对和可视化.以及构建系统发育树的免费程序.自1993年发布以来,MEGA共更新9个版本 (没有第八.九版),今年发布的MEGA 11为处理更大的数据集进行了优化. 之前我们介 ...
- MEGA软件——系统发育树构建方法(图文讲解) 转载
转载:http://www.plob.org/2012/12/02/4927.html 一.序列文本的准备 构树之前先将目标基因序列都分别保存为txt文本文件中(或者把所有序列保存在同一个txt文本中 ...
- 基于短核苷酸序列频率构建细菌系统发育树
谷禾健康 目前,原核生物的系统发育分类依赖于16S rRNA基因序列,这种序列在细菌中广泛存在且高度保守,但即使16S rDNA测序的结果显示某些细菌间序列相似性≥99%,但它们仍然不能被归为同一物种 ...
- 宏病毒组(五)|病毒基因组系统发育树
我们通过宏病毒组测序,分析鉴定到病毒的种类及丰度后,通常会进一步去研究样品中鉴定到的病毒之间的相关性和互作情况.病毒的进化地位等,以便能更好地了解其生物学特性,提升对检测到的病毒认知. 目前宏病毒组个 ...
- iMeta | 兰大张东等使用PhyloSuite进行分子系统发育及系统发育树的统计分析
点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方 法 ● 原文链接DOI: https://d ...
- iMeta | 兰州大学张东青年研究员:使用PhyloSuite进行分子系统发育及系统发育树的统计分析...
点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方 法 ● 原文链接DOI: https://d ...
- 使用MrBayes构建贝叶斯系统发育树【实践】
建树是分子系统发育与进化研究中绕不过去的一道坎,本文就本人实际经验介绍贝叶斯树的实际操作: 基于不同原理的系统发育树构建方法的比较 Bayesian Inference (BI)建树 需要使用的软件包 ...
最新文章
- 7天学会spring cloud教程
- 读书笔记-《增长黑客》-搭建增长团队
- Sigmoid 函数(To be continued)
- advanced installer重新打包教程
- [译]基于GPU的体渲染高级技术之raycasting算法
- 【GPU编程】体绘制传输函数-分类(Volume Rendering Transfer function:Pre- VS Post-Classification)
- Android打开App2SD
- Java怎样实现验证码?
- 深度学习从入门到实战——卷积神经网络原理解析及其应用
- 第5章 软件质量标准概述
- Liunx 创建隐藏文件夹
- HTML非遗文化网页设计题材【京剧文化】HTML+CSS(大美中国 14页 带bootstarp)
- 广告传媒----数字营销解决方案
- asp.net(c#)字符串转换成字符数组 字符串转换成int 数组
- springboot毕设项目影评网站系统4i684(java+VUE+Mybatis+Maven+Mysql)
- 磁带设备使用方法总结
- K9无线充电5W无线快充pcba方案FS68001
- Apache Pig语法简述
- WordPress自定义文件上传路径的方法
- 陕师大计算机考研856真题,2017年陕西师范大学计算机科学学院856数据结构与程序设计考研题库...