文章目录

  • 前情提要
  • 序列双端合并的另一种方法`read-joining`
    • 数据下载
    • 序列合并
    • 查看合并序列的数据质量和摘要
    • 序列质控
    • Deblur
    • 查看Deblur特征表
    • 导入双端合并的序列
      • 导入序列
      • 查看导入数据的质量
    • Reference
    • 译者简介
    • 猜你喜欢
    • 写在后面

前情提要

  • QIIME 2可重复、交互和扩展的微生物组数据分析流程
  • 1简介和安装Install
  • 2插件工作流程概述Workflows
  • 3老司机上路指南Experienced
  • 4人体各部位微生物组分析Moving Pictures
  • 5粪菌移植分析练习FMT
  • 6沙漠土壤分析Atacama soil
  • 7差异丰度分析gneiss
  • 8数据导入Importing
  • 9数据导出Exporting
  • 10元数据Metadata
  • 11数据筛选Filtering
  • 12训练特征分类器Training
  • 13数据评估和质控Evaluating
  • 14机器学习分类和回归预测Classifier
  • 15进行纵向和成对样本比较Longitudinal
  • 16鉴定和过滤嵌合体序列q2-vsearch

序列双端合并的另一种方法read-joining

Alternative methods of read-joining in QIIME 2

https://docs.qiime2.org/2018.11/tutorials/read-joining/

注:最好按本教程顺序学习,想直接学习本章,至少完成本系列《1简介和安装》。

注意:本教程不包括DADA2的序列合并和去噪。相反,本教程重点介绍分析qiime 2中双端序列合并的替代方法。如果你有对DADA2去噪感和双端序列合并兴趣,《6沙漠土壤分析Atacama soil》教程演示了如何使用qiime2的dada2去噪双端序列。如果您计划使用DADA2来合并和消除双端数据的噪声,请在用DADA2去噪之前不要合并您的序列;DADA2希望读取尚未合并的序列,并将在去噪过程中为您双端合并。

在qiime 2中,我们使用术语“单端序列”(single-end reads)单独指正向或反向序列;我们使用术语“双端序列”(paired-end reads)单独指尚未合并的正向和反向序列;并且我们使用术语“合并的序列(joined reads)”指已经联接(或合并)的正向和反向序列。理解这些术语中的哪一个适用于您的数据是很重要的,因为这将决定分析成对的最终数据需要哪些步骤。

目前,可以使用qiime 2中的qiime vsearch插件合并双端序列,或者导入已在qiime 2之外合并的的序列(例如,使用fastq-join,有关详细信息,请参阅导入预合并的序列)。本教程将涵盖这两个过程。

数据下载

Obtain the data

mkdir qiime2-read-joining-tutorial
cd qiime2-read-joining-tutorialwget \-O "demux.qza" \"https://data.qiime2.org/2018.11/tutorials/read-joining/atacama-seqs.qza"

序列合并

Joining reads

qiime vsearch join-pairs \--i-demultiplexed-seqs demux.qza \--o-joined-sequences demux-joined.qza
  • 合并结果:demux-joined.qza

查看合并序列的数据质量和摘要

Viewing a summary of joined data with read quality

qiime demux summarize \--i-data demux-joined.qza \--o-visualization demux-joined.qzv
  • 可视化统计结果: demux-joined.qzv


这份摘要报告对于确定你成功合并序列大约有多长特别有用(当我们用deblur去噪时,我们会回到这个问题上)。在这个可视化中查看质量图时,如果您将鼠标悬停在一个特定的位置上,将看到有多少个序列至少有那么长(为计算序列质量而采样的序列数量统计)。记下最高的序列位置,其中大部分(比如,>99%)的序列至少有那么长。

例如,当将鼠标悬停在可视化箱线图中的一个黑箱体上时(该黑箱体是由比本教程中使用的数据集更大的数据集生成的),我看到40126个序列中有10000个用于估计该位置的质量分数分布。

当我将鼠标悬停在位置250(用红色方框表示)上时,我看到一些序列没有这么长,因为只有9994个序列用于估计该位置的质量分数分布。下面的红色框和红色文本告诉我,有些序列没有这么长。

当我将鼠标悬停在254号位置(也用一个红框表示)上时,我看到许多序列没有这么长,因为只有845个序列用于估计该位置的质量分数分布。
基于对这些图的比较,我将注意到我的大多数序列至少有250个碱基长。我们计划在不久的将来简化这个过程。

序列质控

Sequence quality control

接下来,我们将使用质量过滤器quality-filter q-score-joined对序列进行质量控制。此方法与质量过滤 quality-filter q-score 相同,只是它仅对合并的序列进行操作。此方法的参数尚未在双端合并的数据上进行广泛的基准测试,因此我们建议尝试使用不同的参数设置。

qiime quality-filter q-score-joined \--i-demux demux-joined.qza \--o-filtered-sequences demux-joined-filtered.qza \--o-filter-stats demux-joined-filter-stats.qza

输出结果:

  • demux-joined-filter-stats.qza: 统计结果
  • demux-joined-filtered.qza: 数据过滤后结果

在这个阶段,您可以选择继续使用deblur进行额外的质量控制,或者您也可以进行序列去冗余,并选择使用q2-vsearch将它们聚类到OTU中。Deblur可以给出更高质量的结果,因此我们推荐该过程,并将在本教程的下一个步骤中说明该方法。

如果您有兴趣尝试一个更像qiime 1处理的分析工作流(例如,要将Deblur或Dada2结果与qiime 1类似的流程进行比较),那么接下来应该去冗余并聚类您的序列。如果您尝试此选项,我们强烈建议使用 qiime quality-filter q-score-joined 具有更高的最小质量阈值(p-min-quality 20p-min-quality 30)(参见Bokulich等人2013年的文章学习更多细节)。然后,您可以按照OTU聚类教程中的步骤进行操作。在聚类之后,您可能希望使用qiime feature-table filter-features --p-min-samples。此外,还建议使用丰度过滤器去除单体(见Bokulich等人2013年),以及过滤嵌合序列。

Deblur

你现在已经准备好用Deblur去噪你的序列了。您应该从质量分数图中为--p-trim-length选择合适的序列长度值。这将把所有序列修剪到这个长度,并丢弃任何小于这个长度的序列。

注释:我们使用的修剪长度为250,基于从教程数据集生成的质量分数图。不要将250与自己的数据集一起使用,因为该值将取决于数据集的序列长度。使用质量分数图为数据选择适当的修剪长度。

qiime deblur denoise-16S \--i-demultiplexed-seqs demux-joined-filtered.qza \--p-trim-length 250 \--p-sample-stats \--o-representative-sequences rep-seqs.qza \--o-table table.qza \--o-stats deblur-stats.qza

输出结果:

  • rep-seqs.qza: 代表序列
  • deblur-stats.qza: 统计过程
  • table.qza: 特征表

查看Deblur特征表

View summary of Deblur feature table

接下来,您可以总结q2-deblur生成的功能表。这个表和相应的代表序列现在可以用同样的方法和可视化工具来分析,这些方法和可视化工具将用于单端序列数据。

qiime feature-table summarize \--i-table table.qza \--o-visualization table.qzv

输出结果:

  • table.qzv: 特征表可视化

导入双端合并的序列

Importing pre-joined reads

下载测试数据并解压

wget \-O "fj-joined.zip" \"https://data.qiime2.org/2018.11/tutorials/read-joining/fj-joined.zip"unzip fj-joined.zip

导入序列

Import reads

使用 qiime tools import 导入数据,使用的数据格式为 SingleEndFastqManifestPhred33

qiime tools import \--input-path fj-joined/manifest \--output-path fj-joined-demux.qza \--type SampleData[JoinedSequencesWithQuality] \--input-format SingleEndFastqManifestPhred33

输出结果:

  • fj-joined-demux.qza

查看导入数据的质量

Viewing summary of imported data with read quality

qiime demux summarize \--i-data fj-joined-demux.qza \--o-visualization fj-joined-demux.qzv

输出结果:

  • fj-joined-demux.qzv

现在你可以使用上面的方法继续分析此数据了,使用q2-quality-filter质控, q2-deblur去噪, 或q2-vsearch去冗余和挑选OTU。

祝你QIIME使用愉快!

Reference

Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet C, Al-Ghalith GA, Alexander H, Alm EJ, Arumugam M, Asnicar F, Bai Y, Bisanz JE, Bittinger K, Brejnrod A, Brislawn CJ, Brown CT, Callahan BJ, Caraballo-Rodríguez AM, Chase J, Cope E, Da Silva R, Dorrestein PC, Douglas GM, Durall DM, Duvallet C, Edwardson CF, Ernst M, Estaki M, Fouquier J, Gauglitz JM, Gibson DL, Gonzalez A, Gorlick K, Guo J, Hillmann B, Holmes S, Holste H, Huttenhower C, Huttley G, Janssen S, Jarmusch AK, Jiang L, Kaehler B, Kang KB, Keefe CR, Keim P, Kelley ST, Knights D, Koester I, Kosciolek T, Kreps J, Langille MG, Lee J, Ley R, Liu Y, Loftfield E, Lozupone C, Maher M, Marotz C, Martin BD, McDonald D, McIver LJ, Melnik AV, Metcalf JL, Morgan SC, Morton J, Naimey AT, Navas-Molina JA, Nothias LF, Orchanian SB, Pearson T, Peoples SL, Petras D, Preuss ML, Pruesse E, Rasmussen LB, Rivers A, Robeson, II MS, Rosenthal P, Segata N, Shaffer M, Shiffer A, Sinha R, Song SJ, Spear JR, Swafford AD, Thompson LR, Torres PJ, Trinh P, Tripathi A, Turnbaugh PJ, Ul-Hasan S, van der Hooft JJ, Vargas F, Vázquez-Baeza Y, Vogtmann E, von Hippel M, Walters W, Wan Y, Wang M, Warren J, Weber KC, Williamson CH, Willis AD, Xu ZZ, Zaneveld JR, Zhang Y, Zhu Q, Knight R, Caporaso JG. 2018. QIIME 2: Reproducible, interactive, scalable, and extensible microbiome data science. PeerJ Preprints 6:e27295v2 https://doi.org/10.7287/peerj.preprints.27295v2

译者简介

刘永鑫,博士。2008年毕业于东北农大微生物学专业。2014年中科院遗传发育所获生物信息学博士学位,2016年博士后出站留所工作,任宏基因组学实验室工程师,目前主要研究方向为宏基因组数据分析和植物微生物组。QIIME 2项目参与人,目前发于论文12篇,SCI收录9篇。2017年7月创办“宏基因组”公众号,目前分享宏基因组、扩增子原创文章500+篇,代表博文有《扩增子图表解读、分析流程和统计绘图三部曲》,关注人数3.5万+,累计阅读500万+。

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

QIIME 2用户文档. 17序列双端合并read-joining(2018.11)相关推荐

  1. QIIME 2用户文档. 18序列双端合并read-joining(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

  2. QIIME 2教程. 18序列双端合并read-joining(2021.2)

    序列双端合并的另一种方法read-joining Alternative methods of read-joining in QIIME 2 https://docs.qiime2.org/2021 ...

  3. QIIME 2教程. 18序列双端合并read-joining(2020.11)

    文章目录 序列双端合并的另一种方法`read-joining` 数据下载 序列合并 查看合并序列的数据质量和摘要 序列质控 Deblur 查看Deblur特征表 导入双端合并的序列 导入序列 查看导入 ...

  4. QIIME 2用户文档. 12训练特征分类器Training feature classifiers(2018.11)

    文章目录 前情提要 训练特征分类器 下载并导入参考序列 提取参考序列 训练分类集 测试分类集 分类真菌ITS序列 Reference 译者简介 猜你喜欢 写在后面 前情提要 QIIME 2可重复.交互 ...

  5. QIIME 2用户文档. 15进行纵向和成对样本比较q2-longitudinal(2018.11)

    文章目录 前情提要 进行纵向和成对样本比较`q2-longitudinal` 成对差异比较 线性混合效应模型 波动性分析 跟踪变化率的第一个差异 从静态时间点跟踪变化率 非参数微生物相关性试验(NMI ...

  6. QIIME 2用户文档. 17鉴定和过滤嵌合体序列q2-vsearch(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

  7. 再次安装Arch Linux!(Vmware,KDE\Gnome桌面,EFI/BIOS引导,双系统配置)更新时间2018/11/11

    1.下载Arch Linux镜像 下载地址:https://www.archlinux.org/download/ 可以看到一个磁力一个种子,任意下载一个并使用支持的下载软件进行镜像的下载. 2(1) ...

  8. QIIME 2用户文档. 18使用q2-vsearch聚类OTUs(2018.11)

    文章目录 前情提要 使用`q2-vsearch`聚类序列为OTUs 下载数据 序列去冗余 特征[频率]和特征数据[序列]的聚类 无参聚类 有参聚类 半有参聚类 Reference 译者简介 猜你喜欢 ...

  9. QIIME 2用户文档. 22Python命令行模式(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

最新文章

  1. 【CoppeliaSim】远程 API 之 Python 控制,对比 V-rep 有些不同
  2. 中信国健临床通讯  2011年3月期 目 录
  3. redis复制原理和应用
  4. Docker学习总结(41)——Docker Compose 的两种安装方式总结
  5. 华为回应美新规:不涉及产品买卖;微软 GitHub 帐户疑被黑;GCC 10.1 发布 | 极客头条...
  6. React.js入门基础一
  7. java中web错误返回码,Java-Web3j Transfer.sendFunds()返回错误“天然气...
  8. 转 基于.NET平台的分层架构实战
  9. 软件工程系组织12级学生到工商学院参加比赛
  10. 上海嵌联自控供应车流量统计系统
  11. Excel添加下拉选项菜单的方法
  12. 实用工具篇--华为eNSP下载及安装
  13. ad元件定位孔放在哪一层_机械制造技术(1)——定位误差的计算
  14. 图解yarn的作业提交流程
  15. Python pywin32(一)
  16. Win10触摸板右键无法使用,解决办法
  17. MySQL 序号(排序)函数:row_number() 、rank() 、 dense_rank()、ntile()
  18. centos基本命令
  19. Cadence PCB仿真使用Allegro PCB SI生成振铃ringing仿真报告及报告导读图文教程
  20. 【计算机毕业设计】23.网上商城购物系统+vue

热门文章

  1. 10张图带你深入理解Docker容器和镜像--云平台技术栈07
  2. 基于机器学习的入侵检测系统
  3. 互联网公司面试官是如何360°无死角考察候选人的?(下篇)
  4. 阶段式(瀑布式)传统软件研发流程
  5. 简单了解SQL性能优化工具MySql Explain
  6. 数据结构与算法---稀疏数组
  7. python环境搭建需要装几个软件_python的发展前景及python环境搭建
  8. 无法启动python怎么办_解决python写的windows服务不能启动的问题
  9. 复习03统计学习方法(K近邻KNN)---图片版
  10. 从0到1:CTFer成长之路