人类微生物组研究报告——规范流程
人类微生物组的变化与许多疾病和健康状况有关。然而,看懂人类微生物组研究结果的报告具有挑战性,因为它通常涉及微生物学、基因组学、生物医学、生物信息学、统计学、流行病学等领域的方法。
人类微生物组的研究与其他类型的分子流行病学研究具有许多共同特征,但它们也需要独特的考虑因素,具有自己的方法学最佳实践和报告标准。除了流行病学研究设计的标准要素外,独立于培养的微生物组研究还涉及生物标本的收集、处理和保存;不断发展的实验处理方法,具有更高的批次效应潜力;生物信息学处理;稀疏、异常分布、高维数据的统计分析;报告可能的数千种微生物特征的结果等。
由于微生物组研究没有公认的金标准方法,而且该领域还没有就这些方面形成共识,但是各个领域的人员共同努力逐渐形成适用于广泛的人类微生物组研究报告的规范流程是微生物领域快速发展的基础。
方 法
参 与 者
对研究参与者的描述中,应描述入组的人群,以及如何从人群中抽取参与者。
参与者的特征,例如环境、生活方式行为、饮食、生物医学干预、人口统计和地理都可能引起微生物组的显着差异,因此应该包含这些基本描述。
时间背景也很重要,因此应说明招聘、跟进和数据收集的开始和结束日期。
此外,还应包括用于评估潜在参与者是否符合研究资格的具体标准,包括纳入标准和排除标准的详细信息。纳入和排除标准是用于选择研究参与者的预先确定的特征,描述这些标准对于了解研究的目标人群至关重要。
应描述收集的有关可能影响微生物组的抗生素或其他治疗的任何信息,以及是否有任何排除标准包括最近使用抗生素或其他药物。
应说明最终的分析样本量,以及在招募、随访或实验室过程的任何步骤中排除参与者的原因。
建议使用流程图来显示参与者被排除在研究之外的时间和原因。例如如下流程说明。
Mirzayi C, et al., Nat Med. 2021
如果参与者在纵向研究中失访或未完成所有评估,则应说明如何进行随访的详细信息,并应报告特定时间点的样本量。
此外,将病例与对照进行匹配的研究应描述在匹配中使用了哪些变量。
实 验 方 法
应描述实验室样品的处理,包括样品采集、运输和储存的程序。
由于 DNA 提取可能是跨研究技术差异的主要来源,因此应描述 DNA 提取方法。如果进行了人类 DNA 去除和微生物 DNA 富集的描述,也应包括在内。同样,如果使用阳性对照、阴性对照或污染物减轻方法,则应对其进行识别和描述。
应描述报告与测序相关的方法。这包括引物选择和 DNA 扩增(包括16S rRNA 基因可变区,如果适用)。测序完成的主要单位(公司或者检测机构),例如鸟枪法或扩增子测序。最后,应解释用于确定相对丰度的方法。
批次效应应作为潜在的混杂来源进行讨论,包括为确保批次效应不与暴露或感兴趣的结果重叠而采取的步骤。如果进行宏转录组学、宏蛋白质组学或代谢组学,应提供这些方法的详细信息。
数 据 源 / 测 量
对于非微生物组数据(例如,健康结果、参与者的社会经济、行为、饮食和生物医学特征,包括疾病位置和活动以及环境变量),应描述每个变量的测量和定义。例如,参与者的性别和年龄可以从电子病历或分发给参与者的问卷中获得,那么应该清楚描述这个数据源的获得方式。还可以讨论测量的局限性,包括由于错误分类或丢失数据导致的潜在偏差,以及为解决这些测量问题所做的任何尝试。
因果推断的研究设计注意事项
在没有直接观察到假设的因果关系的情况下,观察数据通常用于测试旨在进行因果推断的关联。
方法包括,例如,使用多变量分析或匹配来调整假设暴露(例如微生物分类群的丰度)与研究中的疾病或病症之间的混杂变量。混杂因素可以被认为是暴露和研究结果的常见原因,可以导致暴露和结果之间的虚假关联。例如,年龄可能是一个常见的混杂因素,因为它会影响微生物组和大多数健康结果的风险。
如果不采取措施避免批次间条件的不平衡,实验室批次效应也可能混淆微生物组与感兴趣条件之间的关系。试图控制测量混杂的常用方法是调整或分层混杂。应为因果推断的回归模型中包含或排除的变量提供理由,因为对非混杂变量进行调整或分层会引入偏差。作为这一理论论证的一部分,作者应考虑包括一个有向无环图,显示假设的感兴趣的因果关系。
除了考虑本研究的理论动机外,还应讨论可能会扭曲微生物组与感兴趣变量之间观察到的关系的选择或生存偏差的可能性。例如,这种偏倚可能是由于失访(在纵向研究中)或由于疾病本身而没有将参与者纳入研究(例如,死于侵袭性结直肠癌和还没有幸存下来,无法参与结肠直肠癌微生物组的假设研究)。检查表中其他地方的其他项目可能与因果推断问题直接相关,包括假设、研究设计、匹配、偏倚和普遍性。鼓励调查因果问题的作者在因果推断的背景下考虑他们对这些项目的报告。
生物信息学和统计方法
对生物信息学和统计方法的充分描述对于生成严谨且可重复的研究报告至关重要。
应描述数据转换(例如标准化、稀疏和百分比)。应充分披露质量控制方法,包括过滤或删除读数或样本的标准。应说明用于分析数据的所有统计方法,包括如何选择感兴趣的结果(例如,使用P值、q值或其他阈值)。
应详细描述分类、功能分析或其他序列分析方法。为了重现性,所有用于数据预处理和分析的软件、软件包、数据库和库都应该被描述和引用,包括版本号。
可重复的研究
可重复的研究实践作为出版过程中的质量检查以及进一步的透明度和知识共享,如 Schloss 提出的标题中所详述。期刊越来越多地实施可重复的研究标准,包括数据和代码的发布,并且在可能的情况下应遵循这些指南。
如果可能,原始数据和处理过的数据,应存放在独立维护的公共存储库中,这些存储库可提供长期可用性,例如由 NCBI 或 EMBL-EBI 维护的公共存储库。Zenodo ( https://zenodo.org/ ) 或 Publisso (https://www.publisso.de/en/ ) 可用于为处理后的数据集提供 DOI。
如果数据或代码不公开或不能公开,即使在提供限制访问选项的存储库中,也应提供感兴趣的读者如何访问数据的描述。至少应描述任何受保护的信息,以及如何访问此类数据。
结 果
描 述 性 数 据
应报告关于研究人群的描述性统计数据。至少,应描述研究人群的年龄和性别,共享数据文件中应包括每位参与者的年龄和性别,但应尽可能报告其他重要的参与者特征,包括药物使用或生活方式因素,例如饮食。
作者应考虑在描述性统计表中如何报告这些数据。例如R 软件中的 table1 包等包,使创建这样的表不那么复杂。
结 果 数 据
研究的主要结果应该是详细的,包括描述性信息、感兴趣的发现和任何额外分析的结果。
应为每个组和每个时间点报告描述性微生物组分析(例如,降维如主坐标分析、多样性测量和总分类组成)。
这应为读者提供了差异丰度分析的结果。当报告差异丰度测试结果时,应明确说明每个可识别的标准化分类单元的差异丰度的大小和方向。其他类型分析的结果,如代谢功能、功能潜力、MAG 组装和 RNA-seq,也应在结果中描述。
附加结果(例如,非显著结果或完全差异丰度结果)可以包含在补充中,不应完全排除。
虽然这个问题已经存在了几十年,许多领域的期刊都认识到发表偏倚的问题,但在出版物中包含此类结果将有助于降低这种偏倚的严重程度,并改进未来的系统评价和荟萃分析。
讨 论
讨论应包括对本研究和相关方法的局限性的讨论。应讨论偏差的可能性以及它们将如何影响研究结果。
许多形式的偏倚,例如残差/未测量混杂、与成分分析相关的偏倚、测量偏倚或选择偏倚,都可能影响对研究结果的解释,在讨论中承认潜在的偏倚来源很重要。
还应考虑研究发现的普遍性,以及这些发现是否适用于目标人群或其他人群。如果不同形式的偏见没有被评估或假设,可以忽略不计,但应说明这一点。
主要参考文献
Mirzayi C, Renson A; Genomic Standards Consortium et al. Reporting guidelines for human microbiome research: the STORMS checklist. Nat Med. 2021 Nov;27(11):1885-1892. doi: 10.1038/s41591-021-01552-x.
Wirbel, J. et al. Meta-analysis of fecal metagenomes reveals global microbial signatures that are specific for colorectal cancer. Nat. Med. 25, 679–689 (2019).
Simoneau, J., Dumontier, S., Gosselin, R. & Scott, M. S. Current RNA-seq methodology reporting limits reproducibility. Brief. Bioinform. 22, 140–145 (2021).
Ten Hoopen, P. et al. The metagenomic data life-cycle: standards and best practices. Gigascience 6, 1–11 (2017). - PubMed - PMC
Yilmaz, P. et al. Minimum information about a marker gene sequence (MIMARKS) and minimum information about any (x) sequence (MIxS) specifications. Nat. Biotechnol. 29, 415–420 (2011). - PubMed - PMC
人类微生物组研究报告——规范流程相关推荐
- NBT:人类微生物组千万基因的参考基因集
文章目录 人类肠道中整合参考基因集 热心肠日报 摘要 要点 Main 结果Results 构建整合基因集 图1. IGC的构建 整合基因集的质量和完整度 图2. IGC覆盖度 IGC中的物种 图3. ...
- Cell子刊:人类微生物组参考基因集中的单体基因
文章目录 人类肠道和口腔微生物组中遗传基因全貌 热心肠日报 摘要 主要结果 表1. 文章中名词定义 图1. 综合分析口腔和肠道微生物组 图2.口腔和肠道微生物组的遗传多样性 图3. 口腔和肠道微生物组 ...
- 10篇Nature专题报导人类微生物组计划2(iHMP)成果及展望
本文来源于BioArt,有修改 2019年5月30日<自然>封面聚焦人类微生物组整合计划(iHMP) 编者按 人体微生物组计划(Human Microbiome Project, HMP) ...
- 环境对人类微生物组及其对非传染性疾病的影响
谷禾健康 看过往期文章的小伙伴都知道,人体微生物群维持体内的共生关系,促进新陈代谢功能,抵御病原体,训练和发展免疫系统,直接或间接影响我们的大部分生理功能. 每个人都拥有属于自己的独特的微生物组,人与 ...
- Cell综述:人类微生物组研究中的单细胞方法
信息 论文题目:Single-cell approaches in human microbiome research 期刊:Cell IF:66.850 发表时间:2022 摘要 微生物培养和宏组学 ...
- Protein Cell:基于R语言的微生物组数据挖掘最佳流程(大众评审截止14号晚6点)...
Protein & Cell综述:基于R语言的微生物组数据挖掘的最佳流程 近日,中国农业科学院刘永鑫组联合南京农业大学袁军组在国际期刊 Protein & Cell (IF = 15. ...
- iMeta | 易扩增子(EasyAmplicon):易用、可重复的微生物组扩增子分析流程
点击蓝字 关注我们 易扩增子(EasyAmplicon):微生物组研究中易用的扩增子分析流程 iMeta主页:http://www.imeta.science 研究论文 ● 原文链接DOI: http ...
- 慢性肾脏病中的人类微生物组:一把双刃剑
谷禾健康 慢性肾病 (CKD) 影响着全球约 13.4% 的人口,是一个日益严重的全球健康负担.成人中,高血压和糖尿病是慢性肾病的主要原因,而先天性肾脏和泌尿生殖道异常占儿童慢性肾病病因的大部分.慢性 ...
- HUMAnN2:人类微生物组统一代谢网络分析2
关于宏基因组常用的有参分析流程,主要是快速获得物种组成和功能组成,之前分享了 MetaPhlAn2一条命令获得宏基因组物种组成 今天再介绍来自同一作者的另一个软件,可以一步完成功能和代谢组成. HUM ...
最新文章
- 作为CTO,我为什么必须要求代码进行Code Review!
- LeetCode-73. Set Matrix Zeroes
- 华大 MCU 之一 HC32F460 替换 STM32F411 移植记录
- C#处理JSON 数据
- python读取文件数据堆栈溢出的原因_堆栈溢出一般是什么原因?
- (转)USB体系结构
- Building A New Barn(POJ-3269)
- Java快速入门学习笔记3 | Java语言中的表达式与操作符
- c语言输入输出重定向到串口,关于printf重定向到串口的问题分析 - 全文
- ubuntu 安装、配置、卸载Anaconda3
- 欢迎体验 | Android 12 开发者预览版 3
- X_mind思维导图应用以及Windows和安卓软件下载(Free)
- 最易理解的C语言教学 第一章
- 华为HCIE安全之常用的局域网攻击
- 三星被指盗取FinFET芯片专利技术 将被起诉
- 如何配合RestTemplate优雅的记录请求以及返回的信息
- 概率预测的评估方法简介
- virtualbox 安装iso镜像
- python识别12306验证码_Python 识别12306图片验证码物品的实现示例
- 【6月比赛合集】103场可报名的数据挖掘大奖赛,任君挑选!