QIIME 2教程. 21进化树推断q2-phylogeny(2020.11)
文章目录
- 使用q2-phylogeny进行系统发育推断
- 序列对齐Sequence Alignment
- 减少对齐的歧义:屏蔽和参考对齐方式 Reducing alignment ambiguity: masking and reference alignments
- 构建系统发育 Construct a phylogeny
- 方法Methods
- fasttree
- raxml
- 使用raxml执行多次搜索 Perform multiple searches using raxml
- 快速自展 raxml-rapid-bootstrap
- iqtree
- 指定替代模型Specifying a substitution model
- 单枝检验 Single branch tests
- iqtree-ultrafast-bootstrap
- 与ufboot一起执行单分支检验 Perform single branch tests alongside ufboot
- 确定树的根 Root the phylogeny
- 流程 Pipelines
- 译者简介
- Reference
- 猜你喜欢
- 写在后面
使用q2-phylogeny进行系统发育推断
Phylogenetic inference with q2-phylogeny
https://docs.qiime2.org/2020.11/tutorials/phylogeny/
开始本节分析前,我们假定你已经完成了前面内容的学习。
在QIIME 2中可用的几个下游多样性指标要求使用正在研究的操作分类单位(OTU)或精确序列变体(ESV,也叫扩增序列变体ASV)来构建系统树。
但是,我们如何从序列数据中构建系统发育?
好了,我们可以使用两种基于系统发育的方法。使用哪种决定,很大程度上取决于您的科学问题:
基于参考的片段插入方法(A reference-based fragment insertion approach)。这可能是理想的选择。特别是,如果您的参考系统发育史(和相关的代表性序列)包含您的序列可以被可靠地插入邻近的亲戚。不会插入与参考的匹配程度不高的任何序列。例如,如果您的数据包含在参考系统发育中未很好表示的序列(例如丢失的进化枝等),则此方法可能无法很好地工作。有关更多信息,请查看这些出色的片段插入示例。
从头开始。可以在不同分类单元中全局比对的标记基因通常适合通过这种方法进行序列比对和系统发育研究。在构建从头系统发育史时,请注意序列的长度,短读可能会导致缺乏足够的系统发育信息以捕获有意义的系统发育。本社区教程将重点介绍从头方法。
在这里,您将学习如何使用从头系统发育方法来:
- 在QIIME 2中生成多序列对齐文件
- 如果需要,遮罩对齐中的非保守区
- 构造系统发育树
- 确定系统发育树的根
如果您想通过使用QIIME 2外部的工具来替代此处概述的任何步骤,请在适当的地方查看9数据导入Importing data,10数据导出Exporting data和12数据筛选Filtering data文档。
序列对齐Sequence Alignment
在构建系统发育之前,我们必须生成多序列比对(multiple sequence alignment,MSA)。 在构建MSA时,我们将通过其序列相似性来说明比对残基(MSA列)的推定同源性。
构建MSA的算法数量众多。 我们将通过q2-alignment插件使用MAFFT(使用快速傅里叶变换的多重对齐)。 有关更多信息,请查看MAFFT的文章。
首先,加载QIIME2环境,并创建一个工作目录:
conda activate qiime2-2020.11
mkdir -p phylogeny
cd phylogeny
下载代表序列
wget -c https://data.qiime2.org/2020.11/tutorials/phylogeny/rep-seqs.qza
运行MAFFT
qiime alignment mafft \--i-sequences rep-seqs.qza \--o-alignment aligned-rep-seqs.qza
输出对象:
rep-seqs.qza
:预览 | 下载aligned-rep-seqs.qza
:预览 | 下载
减少对齐的歧义:屏蔽和参考对齐方式 Reducing alignment ambiguity: masking and reference alignments
为什么要屏蔽(mask)序列?
屏蔽/掩码有助于消除在系统发育分析之前系统发育上无用或误导的比对列。 许多时间对准误差会引入噪声并混淆系统发育推断。 在执行系统发生推断之前,通常会屏蔽(删除)这些歧义对齐的区域。 特别是,David Lane(1991)的16S / 23S rRNA测序建议在系统发育分析之前屏蔽SSU数据。 但是,知道如何处理歧义对齐的区域以及何时使用屏蔽很大程度上取决于要分析的标志物基因和数据需要回答的科学问题。
注意
请记住,这仍然是一个活跃的讨论领域,以下非详尽的文章清单突显了这一点:Wu等2012年,Ashkenazy等人2018年,Schloss 2010年,Tan等人2015年,Rajan2015年。
如何屏蔽序列呢?
为了我们的目的,我们假设在上面生成的MAFFT对齐方式中存在不确定的对齐列。 屏蔽对齐默认设置--p-min-conservation
接近QIIME 1的Lane mask。请密切注意对齐插件的更新。
qiime alignment mask \--i-alignment aligned-rep-seqs.qza \--o-masked-alignment masked-aligned-rep-seqs.qza
输出对象:
masked-aligned-rep-seqs.qza
:预览 | 下载
基于参考的多序列比对(Reference based alignments)
有多种工具,例如PyNAST(使用NAST),Infernal和SINA等,它们试图通过使用校对的参考比对(例如SILVA)来减少歧义比对区域的数量。参考比对对rRNA基因特别有效序列数据,因为将二级结构的知识整合到了校对过程中,从而提高了比对质量。有关基于参考的比对方法更深入,更有说服力的概述,请查看SINA社区教程。
注意
就像上面的MAFFT示例一样,使用基于参考的对齐方式构造的对齐方式也可以被屏蔽。 同样,我们在此处讨论的参考对齐方法与我们之前提到的参考系统发生方法(即q2-fragment-insertion)不同。 也就是说,我们不是将数据插入到现有的树中,而只是试图创建更健壮的比对,以实现更好的从头系统发育。
构建系统发育 Construct a phylogeny
与MSA算法一样,系统发育推断工具也很丰富。 幸运的是,有很多很棒的资源可以学习系统发育学。 以下是一些入门资源,可帮助您入门:
- 系统发育学入门教程
- 分子系统发育学-原理与实践
- 系统发育学-简介
qiime2:的 q2-phylogeny
插件中提供了几种方法/流程。 这些基于以下工具:
- FastTree
- RAxML
- IQ-TREE
方法Methods
fasttree
FastTree能够从大型序列比对中快速构建系统发育。 它通过使用CAT-like的速率类别近似值来实现此目的,该近似值也可以通过RAxML获得(如下所述)。 查阅FastTree在线手册以获取更多信息。
qiime phylogeny fasttree \--i-alignment masked-aligned-rep-seqs.qza \--o-tree fasttree-tree.qza
输出对象:
fasttree-tree.qza
:预览 | 下载
小贴示:为了方便而直接地查看您的
tree.qza
文件,请将它们上传到iTOL。 在这里,您可以交互地查看和操纵系统发育树。 更好的是,在“正常模式”下查看树拓扑时,您可以将关联的alignment.qza
(用于构建系统发育的那个)或相关的taxonomy.qza
文件拖放到iTOL树可视化中。 这将允许您直接查看序列比对或分类学以及系统发育。QIIME 2教程. 21进化树推断q2-phylogeny(2020.11)相关推荐
- QIIME 2教程. 21进化树q2-phylogeny(2020.11)
使用q2-phylogeny进行系统发育推断 Phylogenetic inference with q2-phylogeny https://docs.qiime2.org/2020.11/tuto ...
- QIIME 2教程. 12数据筛选Filtering data(2020.11)
文章目录 QIIME 2用户文档. 12数据筛选 下载实验相关数据 过滤特征表 按数据量过滤 偶然因素的过滤 基于标识符的过滤 基于元数据的筛选 基于物种过滤表和序列 过滤序列 过滤距离矩阵 译者简介 ...
- QIIME 2教程. 10数据导出Exporting data(2020.11)
文章目录 QIIME 2用户文档. 10数据导出 导出特征表 导出进化树 导出与提取 译者简介 Reference 猜你喜欢 写在后面 QIIME 2用户文档. 10数据导出 https://docs ...
- QIIME 2教程. 09数据导入Importing data(2020.11)
文章目录 QIIME 2用户文档. 9数据导入 导入带质量值的FASTQ测序数据 EMP标准混样单端数据 EMP混样双端数据 Casava1.8单端混样数据 Casava 1.8双端拆分后数据 **F ...
- QIIME 2教程. 22命令行界面q2cli(2020.11)
文章目录 命令行界面`q2cli` 基本用法 Basic usage 开启命令行补全Enable command-line tab completion Bash Zsh 验证标签页完成 Verify ...
- QIIME 2教程. 23图形界面q2studio(2020.11)
文章目录 图形界面`q2studio` 译者简介 Reference 猜你喜欢 写在后面 图形界面q2studio QIIME 2 Studio (q2studio) https://docs.qii ...
- QIIME 2教程. 32如何写方法和引用Citing(2021.2)
引用QIIME 2 Citing QIIME 2 https://docs.qiime2.org/2021.2/citation/ 请注意,几乎所有QIIME 2插件都实现独立于QIIME 2框架开发 ...
- QIIME 2教程. 31名词Glossary(2021.2)
名词解释 User Glossary https://docs.qiime2.org/2021.2/glossary/ 译者注:以下是QIIME 2中经常会用到的术语,由于有些术语无法准确翻译为中文, ...
- QIIME 2教程. 04人体微生物组分析Moving Pictures(2020.11)
文章目录 QIIME 2用户文档. 4人体各部位微生物组 本节视频视频教程 启动QIIME2运行环境 样本元数据 下载和导入数据 拆分样品 序列质控和生成特征表 方法1. DADA2 方法2. Deb ...
最新文章
- ArcFaceSharp -- ArcFace 2.0 SDK C#封装库分享
- Banner 自动无限轮播(普通)
- 使用ansible安装docker以及docker-compose
- SAP中PDF文件本地保存方法
- 企业“数据压力锅”即将爆炸,CIO该如何防止爆锅?
- 每日一笑 | 3 X 4 = ?
- Objective-C:ARC自动释放对象内存
- php写的注册登录系统吗,php注册登录系统简化版_php技巧
- 在控制台中操作MYSQL数据库步骤以及一些小问题
- 帆软报表重要Activator之DesignerInitActivator之五CenterRegionContainerPane设计器的表格区域
- [ubuntu] duplicated values in $PATH
- 使用Android Studio打包app
- NAT网关自动去掉TCP syn包的时间戳
- vue.js+flask+element-ui简易Demo 气势的信心
- origin柱状图坐标标签_origin菜鸟求助。如何做横坐标连续(如下图)的柱状图?...
- ESPHome 和 Home Assistant传感器之TMT6000 环境光握手
- Velodyne VLP16 WIN下配置
- 计算机操作系统 - 内存管理
- Day629.思考题解答① -Java业务开发常见错误
- 全方位体验Windows的日历功能
热门文章