语义类型

Semantic types

https://docs.qiime2.org/2021.2/semantic-types

所有的QIIME 2的对象(documentation)都定义了语义类型。此文介绍了如何使用这些语义类型,如何在QIIME 2插件中定义新的语义类型。

为什么定义语义类型

Why define semantic types?

定义语义类型可以帮助我们确保被传递到某个动作的数据是有意义的。例如,一个biom.Table可以含有0/1数据,其中0代表未观察到某OTU,1代表有某个OTU。不过,这种0/1数据无法用于计算定量的多样性指标。这种定量多样性指标(比如加权UniFrac)在计算时使用了丰度信息,虽然计算过程能够顺利完成,但是计算结果毫无意义。

QIIME 2定义的语义类型可让系统自动推断哪些文件可以进行哪种分析和可视化,从而避免这些功能使用上的错误。

常用的语义类型

Common semantic types

除非另有说明,否则以下语义类型由q2-types插件定义并可以从其中导入。还可以在任何插件中定义语义类型,因此可用的语义类型不限于q2-types中定义的那些。我们团队即将添加有关如何完成此类操作的说明。同时,您可以参考q2-dummy-types仓库以获取带注释的示例。

FeatureTable[Frequency]: 频率特征表(比如OTU表),表中为每个样品中对应OTU出现的频率,即每个物种的原始读长数。

FeatureTable[RelativeFrequency]: 相对频率特征表,也叫相对丰度特征表,OTU表标准化为百分比,即每个样品所有物种的合计数为1。

FeatureTable[PresenceAbsence]: 二元特征表,0/1代表在某个样本中是否检测到某个OTU。

FeatureTable[Composition]: 组成型特征表,或者叫构成比特征表,表中的数值>0。组成型特征表和FeatureTable[Frequency]有区别,前者是标准化后的数据,后者是原始数据。组成型特征表和FeatureTable[RelativeFrequency]也有区别,后者特别强调每个样品中物种合计数为1。

Phylogeny[Rooted]: 有根进化树。

Phylogeny[Unrooted]: 无根进化树。

DistanceMatrix: 距离矩阵。

PCoAResults: 主坐标分析结果。

SampleData[AlphaDiversity]: Alpha多样性结果,每个α多样性值与单个样本标识符关联。

SampleData[SequencesWithQuality]: 带质量数据的序列,要求有质量值,要求序列名称与样品存在对应关系,比如按样品拆分后的数据。

SampleData[PairedEndSequencesWithQuality]: 有质控信息的双端序列,要求序列ID与样品编号存在对应关系。

FeatureData[Taxonomy]: 有每一个OTU/Feature物种分类信息的数据。

FeatureData[Sequence]: 单个未比对的数据。

FeatureData[AlignedSequence]: 单个已经比对的序列。

FeatureData[PairedEndSequence]: 双端序列。

EMPSingleEndSequences: 采用地球微生物组计划标准实验方法产生的单端测序数据。

EMPPairedEndSequences: 采用地球微生物组计划标准实验方法产生的双端测序数据。

TaxonomicClassifier: 已经训练过的用于物种注释的“物种分类器”。这种类型的文件在q2-feature-classifier插件中定义。

译者简介

刘永鑫,博士,高级工程师,中科院青促会会员,QIIME 2项目参与人。2008年毕业于东北农业大学微生物学专业,2014年于中国科学院大学获生物信息学博士,2016年遗传学博士后出站留所工作,任工程师,研究方向为宏基因组数据分析。目前在Science、Nature Biotechnology、Protein & Cell、Current Opinion in Microbiology等杂志发表论文30余篇,被引3千余次。2017年7月创办“宏基因组”公众号,分享宏基因组、扩增子研究相关文章2400余篇,代表作有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、 《微生物组实验手册》、《微生物组数据分析》等,关注人数11万+,累计阅读2100万+。

Reference

https://docs.qiime2.org/2021.2

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

QIIME 2教程. 27语义类型Semantic(2021.2)相关推荐

  1. QIIME 2教程. 27语义类型Semantic(2020.11)

    文章目录 语义类型 为什么定义语义类型 常用的语义类型 译者简介 Reference 猜你喜欢 写在后面 语义类型 Semantic types https://docs.qiime2.org/202 ...

  2. QIIME 2教程. 23图形界面q2studio(2021.2)

    图形界面q2studio QIIME 2 Studio (q2studio) https://docs.qiime2.org/2021.2/interfaces/q2studio/ 注:最好按本教程顺 ...

  3. QIIME 2教程. 10数据导出ExportingData(2021.2)

    QIIME 2用户文档. 10数据导出 https://docs.qiime2.org/2021.2/tutorials/exporting/ Exporting data 注:最好按本教程顺序学习, ...

  4. QIIME 2教程. 29参考数据库DataResources(2021.2)

    数据资源 Data resources https://docs.qiime2.org/2021.2/data-resources/ q2-feature-classifie使用的分类学分类器 Tax ...

  5. QIIME 2教程. 30补充资源SupplementaryResources(2021.2)

    补充资源 Supplementary resources https://docs.qiime2.org/2020.11/supplementary-resources/ 教学内容 Education ...

  6. QIIME 2教程. 07Cell帕金森小鼠Parkinson's Mouse(2021.2,最佳实战)

    QIIME 2用户文档. 7帕金森小鼠教程 Parkinson's Mouse Tutorial 原文地址:https://docs.qiime2.org/2021.2/tutorials/pd-mi ...

  7. QIIME 2教程. 01简介和安装 Introduction Install(2020.11开始更新)

    写在前面 QIIME是微生物组领域最广泛使用的分析流程,10年来引用20000+次,2019年Nature杂志评为近70年来人体菌群研究的25个里程碑事件--里程碑16:生物信息学工具助力菌群测序数据 ...

  8. QIIME 2教程. 01简介和安装 Introduction Install(2020.11)

    文章目录 写在前面 QIIME 2的优势 QIIME 2用户文档(版本:2020.11) 视频:QIIME 2用户文档01.1 简介 入门指南 什么是QIIME 2? 核心概念 数据文件: QIIME ...

  9. QIIME 2教程. 04人体微生物组分析Moving Pictures(2020.11)

    文章目录 QIIME 2用户文档. 4人体各部位微生物组 本节视频视频教程 启动QIIME2运行环境 样本元数据 下载和导入数据 拆分样品 序列质控和生成特征表 方法1. DADA2 方法2. Deb ...

最新文章

  1. luogu P2596 [ZJOI2006]书架(平衡树、无旋treap(按排名分裂)一些更复杂的操作)
  2. jackson java反序列化_java – Jackson JSON强制反序列化为对象
  3. python的requests模块功能_python中requests模块的使用方法
  4. 编写一个函数func(),将此函数的输入参数(int型)逆序输出显示,如54321 – 12345,要求使用递归,并且函数体代码不超过8行...
  5. MySQL read-c_技术分享 | MySQL C API 参数 MYSQL_OPT_READ_TIMEOUT 的一些行为分析
  6. Flume-监控之Ganglia
  7. 如何在 Mac 上使用剪贴板?
  8. oracle学习-数据迁移
  9. opencms的安装
  10. 信息安全工程师真题1
  11. Java 导出 PDF之固定模板导出
  12. android实现记事本app
  13. html测试身高体重,【 身高体重测试】_如何测试_注意事项-大众养生网
  14. PEG 动态选股策略
  15. ITパスポート5天学习笔记④_Rx
  16. 虚拟网络的无损保证-zOVN
  17. Python按特定字符分列
  18. ‘\0’ ,‘0’, “0” ,0之间的区别
  19. 酷派android最新版本,酷派手机怎么升级系统 酷派手机系统升级操作方法介绍
  20. 微信h5图表组件制作教程

热门文章

  1. HashMap 的 7 种遍历方式与性能分析!(强烈推荐)
  2. Java 运行时数据区域,哪些是线程隔离的?哪些又是公有的?
  3. 重磅丨国资委下发通知,加快推进国有企业数字化转型
  4. 智办事2.0,第一个提出以“事情”为中心的企业管理方法落地软件
  5. 生成树的概念,最小生成树Prim算法 Kruskal算法
  6. shell中的数值判断
  7. 结婚和年龄有直接关系吗?
  8. 16Adapter(适配器)模式
  9. C++中的文件读写操作(1)
  10. matlab 天线设计 泰勒加权_微带天线设计尺寸MATLAB编程及其仿真验证