群体结构分析:用 phylip 构建进化树
用 phylip 构N-J树
在 linux 系统,可以用 conda 安装 phylip 软件
1. 将 SNP 文件转换为 phylip 格式
用 tassel 的格式转换功能将 plink 格式转为 phylip 格式。
另外有一个脚本可以将 vcf 格式转换为 phylip ,vcf2phylip.py
run_pipeline.pl -Xmx50G -plink -ped snp.ped -map snp.map -export snp.phy -exportType Phylip_Inter
2. 构建进化树
构建进化树需要先将序列比对好,因为 SNP 文件都是根据参考基因组比对过的,所以不用再次比对。
phylip 在命令行中可以根据提示输入参数,也可以用含有参数的文本导入参数。
phylip 构树需要用到四个程序,按顺序运行:
1. seqboot
:重抽样,生成随机样本。参数文本:seqboot.bar
$ cat seqboot.par
snp.phy
R #选择bootstrap
1000 #设置bootstrap的值,即重复的replicate的数目,通常使用1000或者100,注意此处设定好后,后续两步的M值也为1000或者100
Y #yes确认以上设定的参数
9 #设定随机参数,输入奇数值。$ seqboot < seqboot.bar
$ mv outfile seqboot.out
注意:参数文本的第一行为输入文件,且后面不能跟注释
2. dnadist
:计算距离矩阵,最耗时,几千个SNP可能需要1天甚至数天。 参数文本dnadist.par
$ cat dnadist.par
seqboot.out
T #选择设定Transition/transversion的比值
2 #比值大小
M #修改M值
D #修改M值
1000 #设定M值大小
2 #将软件运行情况显示出来
Y #确认以上设定的参数$ dnadist < dnadist.par
$ mv outfile dnadist.out
3. neighbor
: Neighbor-Joining 建树。参数文本:neighbor.par
$ cat neighbor.par
dnadist.out
M
1000 #设定M值大小
9 #设定随机数,输入奇数值
Y #确认以上设定的参数$ neighbor < neighbor.par
$ mv outfile neighbor.out
$ mv outtree neighbor.tree
4. consense
:将多重树汇总成一个。参数文本:consense.par
$ cat consense.par
neighbor.tree
#确认以上设定的参数
Y$ consense < consense.par
$ mv outfile consense.out
$ mv outtree consense.tree
可视化
可以用iTOL(收费了)、EvolView(经常登不上)、ggtree(美观易用,推荐)、Figtree等。
参考:https://blog.csdn.net/g_r_c/article/details/8869494
群体结构分析:用 phylip 构建进化树相关推荐
- 重测序群体遗传进化分析之进化树构建
tree 重测序大家都不陌生,它是检测样本基因组变异(SNP,indel,SV,CNV)的主要手段之一,有了这些变异信息,后续可以做很多分析工作,例如: 遗传群体可以进行遗传图谱构建.BSA分析等:大 ...
- 派森诺群体遗传进化专题之进化树
导读 岁岁年年花相似,细细推敲,实则年年岁岁花不同.人类进化历程中,万事万物都在悄然的变化着,这积沙成塔的量到质的跳跃,正是无数科研人员孜孜以求的方向–群体进化. 群体进化研究是指通过获得某物种自然群 ...
- phyml:基于最大似然法构建进化树
欢迎关注"生信修炼手册"! phyml 是基于最大似然法原理构建系统发生树的软件,官网如下 http://www.atgc-montpellier.fr/phyml/ 官网提供了在 ...
- linux中mpich的运行线程,贝叶斯法构建进化树:MrBayes
1. 简介 使用贝叶斯法构建进化树的软件有很多.在这里简要介绍MrBayes的安装和使用.以下介绍是对几种贝叶斯法构建进化树软件的简介: MrBayes is a program for Bayesi ...
- linux系统发育树的构建步骤,megacc构建进化树.mao文件生成方法
基于linux版megacc构建系统进化树命令如下: /biosoft/MEGA/megacc -a .mao -d fasta -o ./ -a输入的是构建进化树的参数 .mao文件 -d输入的是多 ...
- 论文模型构建的步骤_构建进化树---核苷酸替换模型的选择
在进行系统发育分析时需要通过构建系统发育树来描述不同物种之间的进化关系,通过同源DNA的核苷酸序列或者同源蛋白质分子的氨基酸序列可以实现构建进化树.在系统发育分析中,最大似然法(ML)和贝叶斯法(BI ...
- 使用admixture进行群体结构分析
软件下载网址:http://software.genetics.ucla.edu/admixture/download.html #使用vcftools进行格式转换,plink.ped与plin.ma ...
- 构建进化树常用方法:生物进化距离(NJ)、统计特征(ML)和离散特征(MP)
常用方法列表 方法名 方法名 ML,Maximum likelihood 最大似然法 NJ,Neighbor-Joining 邻接法 MP,Maximum parsimony 最大简约法 ME,Min ...
- 基于SSR数据的群体结构分析和DeltaK值可视化
1.ssr做群体结构数据准备 1.1数据转换. 1.2原始数据是不符合structure的格式要求的,分享给大家我的python脚本做数据格式转换. $cat dat2structure.py #!/ ...
最新文章
- 数据库数据满足树结构时,求一个结点的子结点有哪些
- 1057. 数零壹(20)
- 电子地图开发中栅格模型与矢量模型的区别
- 乌龟的故事,很精彩滴哟
- 无招胜有招之spring _高频面试题
- 使用带有OAuth2的Web应用程序和使用JWT来调用API – WSO2 API Manager
- Day07-函数(2)
- Java学习之JDK的安装与配置
- CSS grid学习(一)
- 常用的几款抓包工具_ 常见的4种抓包工具比较
- 【Python实现】运输问题的表上作业法(一):利用伏格尔 (Vogel) 法寻找初始基可行解
- 如何禁用或重新启用计算机的休眠功能
- http、https、tcp三次握手,四次挥手学习笔记
- hget和get redis_redis使用手册-hset,hget 和 hmset,hmget
- Excel中28个基本图
- hive 查询表Wrong FS: hdfs://node1/user/hive/warehouse/test1.db, expected: hdfs://node1.zjn.cn:8020/
- 必应 Bing 有点意思的搜索引擎
- newifi无盘服务器,newifi 3 padavan纯净版固件,2.4G挺稳定,2019年5.09更新
- 【Flask】 Not Found: /favicon.ico 项目logo图标加载
- 获取token的两种方法
热门文章
- 威马D轮敲定,「造车新势力」四小龙已定
- mysql进阶教程pdf_Mysql基础到进阶精品视频教程附讲义文档 91课
- cad计算机中怎么用除号,CAD中特殊符号如何输入?超全教程,一看就懂!
- iOS基础 UIWindow
- 怎么给word插入页码,详细图文教学,轻松学会
- IOS – OpenGL ES 图像加亮边缘 GPUImage3x3ConvolutionFilter
- 计算机毕业设计JavaBS高校教师考勤系统(源码+系统+mysql数据库+lw文档)
- uva 10859 放置街灯--Placing Lampposts
- 幅相曲线matlab,控制系统的幅相特性曲线绘制
- Outlook Express 收发邮件出现0x800CCC0F错误代码解决方法