鉴定和过滤嵌合体序列q2-vsearch

Identifying and filtering chimeric feature sequences with q2-vsearch

https://docs.qiime2.org/2021.2/tutorials/chimera/

注:最好按本教程顺序学习,想直接学习本章,至少完成本系列《1简介和安装》。

在QIIME 2中进行嵌合体检验基于FeatureTable[Frequency]FeatureData[Sequences]对象。QIIME 2内嵌了vsearch的Uchime无参(de novo)和有参(reference)去嵌合体流程。对于此过程的细节,详见Uchime的论文和vsearch的帮助文档。(推荐USEARCH软件主页有比较详细的教程,vsearch帮助读起来不方便)

本节使用《6沙漠土壤分析Atacama soil》中的特征表。

数据下载

Obtain the data

mkdir -p chimera
cd chimerawget -c https://data.qiime2.org/2021.2/tutorials/chimera/atacama-table.qza
wget -c https://data.qiime2.org/2021.2/tutorials/chimera/atacama-rep-seqs.qza

无参嵌合体鉴定

Run de novo chimera checking

# 4s/11s
time qiime vsearch uchime-denovo \--i-table atacama-table.qza \--i-sequences atacama-rep-seqs.qza \--output-dir uchime-dn-out

输出对象:

  • atacama-rep-seqs.qza: 代表序列。

    查看 | 下载

  • atacama-table.qza: 特征表。

    查看 | 下载

  • uchime-dn-out/nonchimeras.qza: 去嵌合序列。

    查看 | 下载

  • uchime-dn-out/chimeras.qza: 嵌合序列。

    查看 | 下载

  • uchime-dn-out/stats.qza: 统计。

    查看 | 下载

注:基于参考序列(有参,Reference-based)的嵌合体鉴定方法详见vsearch uchime-ref

可视化统计结果

Visualize summary stats

qiime metadata tabulate \--m-input-file uchime-dn-out/stats.qza \--o-visualization uchime-dn-out/stats.qzv

输出可视化:

  • uchime-dn-out/stats.qzv: 统计。

    查看 | 下载

过滤特征表和序列

Filter input tables and sequences

过滤嵌合体和可疑序列

Exclude chimeras and “borderline chimeras”

qiime feature-table filter-features \--i-table atacama-table.qza \--m-metadata-file uchime-dn-out/nonchimeras.qza \--o-filtered-table uchime-dn-out/table-nonchimeric-wo-borderline.qza
qiime feature-table filter-seqs \--i-data atacama-rep-seqs.qza \--m-metadata-file uchime-dn-out/nonchimeras.qza \--o-filtered-data uchime-dn-out/rep-seqs-nonchimeric-wo-borderline.qza
qiime feature-table summarize \--i-table uchime-dn-out/table-nonchimeric-wo-borderline.qza \--o-visualization uchime-dn-out/table-nonchimeric-wo-borderline.qzv

输出对象:

  • uchime-dn-out/rep-seqs-nonchimeric-wo-borderline.qza

    过滤嵌合体的序列。

    查看 | 下载

  • uchime-dn-out/table-nonchimeric-wo-borderline.qza

    过滤嵌合体的特征表。

    查看 | 下载

输出可视化结果:

  • uchime-dn-out/table-nonchimeric-wo-borderline.qzv

    特征表统计。

    查看 | 下载

过滤嵌合但保留可疑序列

Exclude chimeras but retain “borderline chimeras”

qiime feature-table filter-features \--i-table atacama-table.qza \--m-metadata-file uchime-dn-out/chimeras.qza \--p-exclude-ids \--o-filtered-table uchime-dn-out/table-nonchimeric-w-borderline.qza
qiime feature-table filter-seqs \--i-data atacama-rep-seqs.qza \--m-metadata-file uchime-dn-out/chimeras.qza \--p-exclude-ids \--o-filtered-data uchime-dn-out/rep-seqs-nonchimeric-w-borderline.qza
qiime feature-table summarize \--i-table uchime-dn-out/table-nonchimeric-w-borderline.qza \--o-visualization uchime-dn-out/table-nonchimeric-w-borderline.qzv

输出对象:

  • uchime-dn-out/table-nonchimeric-w-borderline.qza

    过滤嵌合体的序列。

    查看 | 下载

  • uchime-dn-out/rep-seqs-nonchimeric-w-borderline.qza

    过滤嵌合体的特征表。

    查看 | 下载

输出可视化结果:

  • uchime-dn-out/table-nonchimeric-w-borderline.qzv

    特征表统计。

    查看 | 下载

译者简介

刘永鑫,博士,高级工程师,中科院青促会会员,QIIME 2项目参与人。2008年毕业于东北农业大学微生物学专业,2014年于中国科学院大学获生物信息学博士,2016年遗传学博士后出站留所工作,任工程师,研究方向为宏基因组数据分析。目前在Science、Nature Biotechnology、Protein & Cell、Current Opinion in Microbiology等杂志发表论文30余篇,被引3千余次。2017年7月创办“宏基因组”公众号,分享宏基因组、扩增子研究相关文章2400余篇,代表作有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、 《微生物组实验手册》、《微生物组数据分析》等,关注人数11万+,累计阅读2100万+。

Reference

https://docs.qiime2.org/2021.2/

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

QIIME 2教程. 17鉴定和过滤嵌合体q2-vsearch(2021.2)相关推荐

  1. QIIME 2教程. 17鉴定和过滤嵌合体q2-vsearch(2020.11)

    文章目录 鉴定和过滤嵌合体序列`q2-vsearch` 数据下载 无参嵌合体鉴定 可视化统计结果 过滤特征表和序列 过滤嵌合体和可疑序列 过滤嵌合但保留可疑序列 译者简介 Reference 猜你喜欢 ...

  2. QIIME 2用户文档. 17鉴定和过滤嵌合体序列q2-vsearch(2019.7)

    前情提要 NBT:QIIME 2可重复.交互和扩展的微生物组数据分析平台 1简介和安装Introduction&Install 2插件工作流程概述Workflow 3老司机上路指南Experi ...

  3. QIIME 2用户文档. 16鉴定和过滤嵌合体序列q2-vsearch(2018.11)

    文章目录 前情提要 鉴定和过滤嵌合体序列`q2-vsearch` 数据下载 无参嵌合体鉴定 可视化统计结果 过滤特征表和序列 过滤嵌合体和可疑序列 过滤嵌合但保留可疑序列 Reference 译者简介 ...

  4. Elasticsearch教程(17) 返回结果过滤 _source_includes和_source_excludes使用

    ES返回结果过滤 _source_includes和_source_excludes 1. 造点测试数据 2. _source参数 2.1 根据id查询时,只返回_source 2.2 设置_sour ...

  5. QIIME 2教程. 25可用和开发中插件AvailableFuturePlugins(2021.2)

    可用插件 Available plugins https://docs.qiime2.org/2021.2/plugins/available/ 用户可以通过插件使用QIIME 2微生物组分析功能.Q ...

  6. QIIME 2教程. 19使用q2-vsearch聚类ASVs为OTUs(2021.2)

    使用q2-vsearch聚类序列为OTUs Clustering sequences into OTUs using q2-vsearch 目前QIIME2支持三个聚类方式:无参(De novo), ...

  7. QIIME 2教程. 07Cell帕金森小鼠Parkinson's Mouse(2021.2,最佳实战)

    QIIME 2用户文档. 7帕金森小鼠教程 Parkinson's Mouse Tutorial 原文地址:https://docs.qiime2.org/2021.2/tutorials/pd-mi ...

  8. QIIME 2教程. 32如何写方法和引用Citing(2021.2)

    引用QIIME 2 Citing QIIME 2 https://docs.qiime2.org/2021.2/citation/ 请注意,几乎所有QIIME 2插件都实现独立于QIIME 2框架开发 ...

  9. QIIME 2用户文档. 17序列双端合并read-joining(2018.11)

    文章目录 前情提要 序列双端合并的另一种方法`read-joining` 数据下载 序列合并 查看合并序列的数据质量和摘要 序列质控 Deblur 查看Deblur特征表 导入双端合并的序列 导入序列 ...

最新文章

  1. 排除hotnews主题内容页面上的热点图片推荐里的分类-hotnews主题top_hot.php
  2. 基于ESP32的竞赛裁判系统功能调试-硬件修改建议
  3. Linux部署禅道环境
  4. 知乎高赞回答:裁员、降薪、996...这项能力让你寒冬蓄能
  5. Java-异常处理练习
  6. Sql 08数据库还原数据库时一直提示数据库被占用
  7. vue+elementUI 添加多个可以全选的多选框
  8. 《关键对话——从“心”开始,如何确定目标》读书笔记(三)
  9. JavaScript文档对象模型document对象改变Html表单属性(4)
  10. C++ list 基础用法合集;list 增减元素 list删除某一个元素 遍历list
  11. java爬虫新闻网站_java爬虫 之 搜狐新闻爬虫(一)
  12. matlab产生大气湍流,一种大气湍流模拟装置的制造方法
  13. js 经纬度坐标转换
  14. Sloth演示程序及源代码发布
  15. 2的20次方怎么用计算机计算,2的20次方(2的20次方简便方法)
  16. python股票技术指标计算,python股票量化交易(3)---趋势类指标MACD
  17. 办公邮箱怎么选,邮箱选哪个更好用?
  18. Python一键更换证件照背景色
  19. 词法分析☞DFA语言识别
  20. Cortex-M4和Cortex-M7中的SIMD指令

热门文章

  1. 100% 展示 MySQL 语句执行的神器-Optimizer Trace
  2. 全新的深度模型在推荐系统中的应用
  3. 漫画:骚操作系列(灯泡开关的经典面试题)
  4. 惊讶!缓存刚Put再Get居然获取不到?
  5. Web开发的机器学习框架
  6. 5G最完整的PPT,朋友圈超火
  7. 每一次宕机都是新的开始
  8. oracle调整字段精度的四种方法
  9. visual studio 代码提示插件_程序员请收好:10个非常实用的 VS Code 插件
  10. 单链表-两个线性表的合并(不破坏原链表+尾插法)