我们通过宏病毒组测序,分析鉴定到病毒的种类及丰度后,通常会进一步去研究样品中鉴定到的病毒之间的相关性和互作情况、病毒的进化地位等,以便能更好地了解其生物学特性,提升对检测到的病毒认知。

目前宏病毒组个性化分析内容主要有:病毒基因组系统发育分析、病毒功能基因分析、病毒互作网络图分析、病毒(噬菌体)宿主预测等。本文给大家带来的是病毒系统发育分析,扫码关注,更多宏病毒组个性化分析详解将陆续给您推送。

系统发育树定义

系统发育树(Phylogenetic tree,又称为系统发生树/系统发生树/系统演化树/进化树等),是用来表示物种间亲缘关系远近的树状结构图(Huelsenbeck JP, et al, 2001)。1965年,Linus Pauling等(Zuckerkandl E, et al, 1965)提出了分子进化理论,基于分子特性(DNA、RNA和蛋白质分子),推断物种之间的系统发生关系,由于核苷酸和氨基酸序列中含有生物进化历史的全部信息,因此利用该方法构建的系统进化树更为准确。

系统发育树的应用

对研究中所关注的病毒或新发现的病毒进行系统发育分析,有助于了解物种间进化过程及与已知病毒亲缘关系的远近。对于由病毒引起的疾病,其有助于快速定位宿主来源、探究病毒传播途径、判断病毒是否在短期内有变异,从而为临床医生用药等提供建设性指导。

系统发育树的构建

系统发育树构建主要步骤分为收集数据、多序列比对、数学建模与分析、检验评估、进化树美化。

数据收集

把目标基因组分别与病毒Refseq数据库和病毒NT数据比对,获得构建进化树备选序列,序列文件格式存储为fasta格式文件。
多序列比对

选取相关的序列比对软件(如下表)进行多序列比对,分析同源性并移除不匹配的序列。

软件 优点 缺点
MEGAX 最常用的比对建树软件 比对速度慢
可视化图形界面 输出格式相对单一
简单方便
Clusterx 可视化图形界面 比对速度较慢
可输出多种格式(如phy)
Muscle/phylip 比对速度快 没有可视化界面,需要有一定编程基础去输入代码运用

数学建模与分析

基于距离的方法:非加权分组平均法(Unweighted pair group method using arithmetic average,UPGMA)、最小进化法(Minimum evolution,ME)、邻位归并法(Neighbor joining,NJ);

基于特征的方法:最大简约法(Maximum parsimony,MP)、最大似然法(Maximum likelihood,ML);

贝叶斯计算法:贝叶斯分析方法(Bayesian Analysis)是一种计算假设概率的方法,贝叶斯分析进化树的准确性被认为很高,但是,贝叶斯系统发育模型很复杂,参数设计比较复杂,普及度相对较低。

检验评估

对分析的结果进行自我检验,即我们能否找到第一步提供的数据与已有的物种之间具有的高度同源性,从而判定其来源(origin)。类似于统计学中的效应t/z值。系统发育分析中使用自展值(Bootstrap)来评估结果是否可靠(一般选取500或1000)。严格来讲,选择的自展值要使统计学差异显著,即可信度大于95%。但在微生物领域,一般大于50%就认为可信。

进化树美化

常用的在线美化软件有Evolview(http://www.evolgenius.info/evolview)及

iTOL (http://itol2.embl.de/index.shtml)。两个软件有些参数可以通过添加文本datasets去设置,具体可以去参考软件的help页面,下载参数模板文件进行修改。

美化后示例图如下:

宏病毒组(五)|病毒基因组系统发育树相关推荐

  1. 宏病毒组分析常见的分析软件

    病毒是地球上数量最多的生物实体,其中细菌病毒(即噬菌体)约有1031个类群,从海洋到陆地再到人体几乎都是它们的栖息地.研究者将病毒视为调节人类生态系统的重要成员,人体内主要包括真核病毒和噬菌体,包括双 ...

  2. 宏病毒组系列4|宏病毒组富集技术详解

    病毒可以说是地球上最大的生物实体之一,但是由于他们具有形态小,遗传物质进化快等的特点,因而不能像细菌.古菌等微生物一样有系统的发育标记,这为其鉴别增加了一定的难度.此外,对于病毒与宿主之间相互关系的研 ...

  3. 易基因:禾本科植物群落的病毒组丰度/组成与人为管理/植物多样性变化的相关性 | 宏病毒组

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 现代农业通过简化生态系统.引入新宿主物种和减少作物遗传多样性来影响植物病毒的出现.因此,更好理解农业生态中种植和未种植群落中的病毒分布, ...

  4. iMeta | 兰大张东等使用PhyloSuite进行分子系统发育及系统发育树的统计分析

    点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方  法 ● 原文链接DOI: https://d ...

  5. iMeta | 兰州大学张东青年研究员:使用PhyloSuite进行分子系统发育及系统发育树的统计分析...

    点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方  法 ● 原文链接DOI: https://d ...

  6. 宏病毒组研究大放异彩!| 凌恩生物1-5月高分宏病毒组文章大盘点!

    凌恩生物现已在宏组学.基因组.表观遗传以及蛋白代谢等多组学及联合分析领域积累了深厚经验,打造出成熟的科研服务平台,以优质售前方案和优秀售后服务助力客户在Nature.Science.PNAS.ISME ...

  7. 西湖大学鞠峰组:环境宏病毒组学分析思路与常用工具

    环境宏病毒组学分析思路与常用工具 袁凌1, 2,倪艳4,鞠峰1, 2, 3 * 1 浙江省海岸带环境与资源研究重点实验室,工学院, 西湖大学, 杭州, 浙江 2  前沿技术研究所, 浙江西湖高等研究院 ...

  8. MEGA | 多序列比对及系统发育树的构建

    MEGA是一个用于多序列比对和可视化.以及构建系统发育树的免费程序.自1993年发布以来,MEGA共更新9个版本 (没有第八.九版),今年发布的MEGA 11为处理更大的数据集进行了优化. 之前我们介 ...

  9. 文献解读:纽约市废水系统宏病毒组初探

    研究简介 噬菌体是迄今为止所研究的所有微生物群落中大量的成员,通过与其细菌宿主的相互作用影响微生物群落.尽管噬菌体在功能上很重要,而且无处不在,但与细菌相比,它们在城市环境中的探索还不够充分.废水是微 ...

最新文章

  1. 那些年的那些事CISC和RISC发展中的纠缠
  2. c++ 传入动态参数_一文了解Mybatis中动态SQL的实现
  3. mysqlfor循环中出错继续_运维大佬教你“打僵尸”——处理Linux系统中大量的僵尸进程(2)...
  4. linux卡片电脑源码,x4412开发板ibox卡片电脑项目实战9-搭建最简单的linux文件系统...
  5. 服务器运维查看大日志文件,Linux 运维必备的 40 个命令总结,收好了~
  6. CALayer与UIView区别和联系【转】
  7. python求一元三次方程的根_关于二次、三次、四次方程求解方法讨论
  8. 你为什么迷茫的像个数据分析师?
  9. C#中的==、Equal、ReferenceEqual
  10. 二维码生成器如何批量制作溯源二维码
  11. 计算机硬件广告语,硬件防毒广告宣传语
  12. 基于控制台的老虎机Java Demo
  13. 麦吉尔 计算机科学学分,麦吉尔大学计算机
  14. 统计学——卡方检验和卡方分布
  15. 解决两台路由器串联上网问题
  16. mysql中文日期转换_mysql 日期转换
  17. 华为nova8和华为nova8Plus哪个好-华为nova8和华为nova8Plus区别-哪个更值得入手-参数对比
  18. 音视频开发1——绘制一张图片
  19. 如何通过域名访问服务器文件,如何通过域名访问云服务器
  20. iPhone升级系统 死机了怎么办

热门文章

  1. 计算机专业的学生注意IT 培训的7 大陷阱
  2. 谷歌浏览器复制禁止复制文字网页上的文字
  3. Hamster Farm
  4. 探探提醒对方账号异常_我告诉你探探中对方账号异常怎么回事
  5. python本科毕设_关于本科毕设选题请教问题
  6. [转载] Rooting with a Locked Boot Loader
  7. 神经网络量化----吐血总结
  8. 文件或目录损坏其无法读取问题解决方法2022-9-15
  9. 郑州轻工业大学OJ python 1060: 逆序数字
  10. 即时编译器的中间表达形式(IR)