内蒙古人肠道菌群高质量基因组集合

A high-quality genome compendium of the human gut microbiome of Inner Mongolians

Resource,2023年1月5日,Nature Microbiology,[IF 30.964]

DOI:https://doi.org/10.1038/s41564-022-01270-1

原文链接:https://www.nature.com/articles/s41564-022-01270-1

第一作者:Hao Jin(靳昊);Keyu Quan(全柯谕);Qiuwen He(何秋雯)

通讯作者:Heping Zhang(张和平);Zhihong Sun(孙志宏)

主要单位:

内蒙古农业大学内蒙古自治区乳品生物技术与工程重点实验室 (Inner Mongolia Key Laboratory of Dairy Biotechnology and Engineering, Inner Mongolia Agricultural University, Hohhot, Inner Mongolia, China.)

内蒙古农业大学农业农村部奶制品加工重点实验室(Key Laboratory of Dairy Products Processing, Ministry of Agriculture and Rural Affairs, Inner Mongolia Agricultural University, Hohhot, Inner Mongolia, China)

内蒙古农业大学乳品生物技术与工程教育部重点实验室(Key Laboratory of Dairy Biotechnology and Engineering, Ministry of Education, Inner Mongolia Agricultural University, Hohhot, Inner Mongolia, China)

- 摘要 -

基于宏基因组现有资源已经揭示了人类肠道微生物组的多样性和功能,但由于基因组质量不佳以及缺乏来自典型的未被研究人群的样本,导致对其更进一步的了解受到限制。本研究使用混合长读长PromethION和短读长HiSeq测序表征了60名内蒙古人(三个时间点取样,共计180个样本)的粪便微生物群,这些样本是乳双歧杆菌Probio-M8酸奶干预实验的一部分。本研究构建了内蒙古肠道基因组(Inner Mongolian Gut Genome catalogue;IMGG)数据库,包括802个环状和5927个高质量的宏基因组组装基因组(metagenome-assembled genomes;MAG)。该方法提高了基因组的组装连续性及基因组元件的分辨率,包括核糖体RNA操纵子(ribosomal RNA operons;rrns)、代谢基因簇(metabolic gene clusters;MGCs)、前噬菌体(prophages)和插入序列(insertion sequences;IS)。特别是,本研究报道了未培养物种的rrn拷贝数、超过12000个先前研究未发现的肠道前噬菌体以及IS在肠道细菌中的分布。总的来说,该数据为进一步研究人类肠道微生物群提供了高质量、大规模的资源。

- 引言 -

大量研究数据表明,肠道微生物菌群在人类健康的几乎所有方面都发挥着重要作用。然而,地球上大量的微生物是“uncultured”,是在常规的实验室培养条件下不能生长的,这对微生物组的研究来说是一个重大挑战。宏基因组分箱(Metagenomic binning)作为一种生物信息学分析方法,能够将宏基因组测序得到的混合了不同生物的序列或序列组装得到的contigs按物种起源和类别分开归类,提供了一种不依赖培养的方法来克服各种自然生态位中“未培养的大多数”缺乏参考基因组的问题。大量的宏基因组组装基因组(metagenome-assembled genomes;MAGs)近几年已被报道,这远远超过了从微生物分离物中获得的基因组总数,极大地扩展了人类肠道微生物组的可用参考基因组目录。尽管人类肠道基因组数据集的快速增长对加深理解人类肠道微生物菌群在影响人类健康中的生物学作用方面取得了重大进展,但缺乏典型研究人群(如内蒙古人)的样本,限制了其进一步的发展。此外,MAG数据库的质量和可靠性参差不齐也是一个需要克服的挑战。基因组标准联盟(Genomic Standards Consortium)提出了一整套报告细菌和古菌MAG的金标准,即高质量的宏基因组组装基因组的最低信息(High-quality Minimum Information about a Metagenome-Assembled Genome ;MIMAG),该标准定义了在发布MAG元数据时必须满足的最低要求。然而,该指南标准目前尚未被普遍采用,主要是因为大多数MAG数据是来自基于短读的宏基因组研究,限制了它们的组装连续性和质量,导致其难以达到其标准要求。

目前,测序和生物信息学技术的进展主要是集中在提高组装连续性或优化分箱性能以提高MAG的质量。最近的研究表明,通过应用长读长测序(long-read sequencing)技术分析人类和环境微生物群,成功地提高了基因组组装和分箱性能。并且通过结合高水平的生物信息学分析,甚至可以从高度复杂的宏基因组数据集直接组装完整的(circularized, no gaps)MAG(CMAG)。此外,长读长测序有望提高组装连续性和在全基因组范围内解决复杂区域拼接等其它问题的能力,包括在短读测序中通常被遗漏或中断的未开发区域,如代谢基因簇(metabolic gene clusters;MGC)、16S核糖体RNA (ribosomal RNA;rRNA)基因、前噬菌体序列、组合抗性基因和重复移动遗传元件。然而,长读长宏基因组测序在人类肠道样本中的应用仍然有限,这极大限制了我们对这些尚未开发和未鉴定的基因组区域的理解。此外,长读长测序数据组装数据集即使在多轮错误纠正之后仍存在错误,并最终影响下游分析。在这种情况下,可利用短读长的测序(short-read sequencing)数据对长度长测序数据进行矫正,因此具有较为全面的或至少有足够覆盖率的短读长测序仍是必要的。

当前宏基因组学研究的总体目标是应用超深度混合测序策略(通过结合PromethION和HiSeq测序)来对人类肠道宏基因组进行描绘,这种超深度混合测序的策略在解析有问题的测序和组装(但有趣的区域)方面具有强大的能力,这些区域包括容易错误组装的rRNA重复序列、插入序列(IS)元件和前噬菌体,以及需要高组装连续性的区域,如MGC。本研究通过生成60个内蒙古人的超深度覆盖的肠道微生物组数据集(包含来自180个粪便样本的3.7 Tbp长读长数据和20.1 Tbp短读长数据),这其中包含大量高质量的CMAG和MAG(分别为802个和5927个;内蒙古肠道基因组(IMGG)数据集),本研究极大扩展了目前的人类肠道基因组数据集。

- 结果 -

1. 超深度宏基因组混合测序与组装

Hybrid, ultra-deep metagenomic sequencing and assembly

本研究使用了先前进行的一项基于生物标记物的纵向人群实验,该实验研究了与普通酸奶相比,每天摄入益生菌酸奶(含有乳酸双歧杆菌Bifidobacterium lactis Probio-M8,Probio-M8)的有益效果。共计包含180份粪便样本(60名受试者;三个时间点:开始食用酸奶后0天、7天和28天)在PromethION和HiSeq平台上进行了超深度宏基因组测序,总共生成3.7 Tbps三代和20.1Tbps二代数据(即每个样本20.5±4.5 Gbps和111.8±8.65 Gbps)。三代数据的质量远远超过了大多数现有的人类肠道三代数据库,目前的三代数据库中平均N50长度为8千碱基对(kilobase pairs;Kbps);平均reads长度为6 Kbps;平均reads质量为9.5。而本研究中超深度混合基因组测序获得的平均N50长度为278 Kbps的基因组合集(116 Kbps~1420 Kbps,仅包括组装最小长度≥ 10 Kbps,即所有组装基因组的98.5%),对应的平均组装长度为314 Mbps(82~564 Mbps)。最大contig为6.77 Mbps,6688个contig大于1 Mbps(每个样本:平均值±标准差=37.16±12.64 contig,8~74个contig)。

为了评估组装流程的准确性,本研究基于三种测序和组装策略,直接从摄入益生菌酸奶的个体粪便样本中组装Probio-M8的基因组:即仅三代序列组装、二三代混合组装、仅二代序列组装。对于每个组装方法,分别重建了50个Probio-M8基因组,并与Probio-M8参考基因组进行比较。如预期一样,与单独使用二代或三代测序构建的基因组相比,二三代混合组装的基因组在包括组装连续性、碱基对和基因预测准确性、基因组完整性、全基因组相似性度量以及功能注释的精确度等多个基因组质量参数方面表现出了极大的提高 (补充图1)。此外,二三代混合组装的基因组组装错误率与二代数据覆盖率呈负相关,但与测序深度无关(补充图2)。因此,二三代混合组装是一种强有力的策略,可以直接从复杂的人类肠道宏基因组数据库组装环状和更加准确的基因组。

2. 高效组装大量种水平的CMAG

Effective assembly of a high number of species-level CMAGs

本研究由混合测序组装的高质量基因组共计802个CMAG。从复杂的微生物群中组装CMAG对于大多数宏基因组研究来说都是一个巨大的挑战,在作者撰写本手稿时,公共基因组数据库中只有225个CAMG。其中大多数(n=160)是从环境宏基因组中还原的;其中一些属于候选门级辐射类群,其成员通常为有一个约1 Mbp的小基因组。而本研究中组装的CMAG较大(1.0~5.5 Mbps,平均约2.4 Mbps);该范围涵盖了大多数已知肠道细菌的基因组大小。为了评估当前组装的CMAG代表性,以95%的ANI(average nucleotide identity)阈值进行物种水平基因组去冗余,然后将我们的数据库与人类胃肠基因组(Unified Human Gastrointestinal Genome; UHGG)数据库中的基因组(去冗余)进行比较。共有134物种水平的CMAG,涵盖11个门、14个纲、27个目、45个科和94个属(图1a;)。值得注意的是,131个物种水平的CMAGs是其物种下首个环状、完整和人类特有的代表性基因组(截至2021年7月),其中65个未培养物种的参考基因组质量得到了显著提升。例如,在UHGG数据库中,仅有15个高度碎片化的基因组Victivallis sp002998355,而在本研究中组装了该物种的完整及具有代表性的基因组,该基因组具有高分辨率的多拷贝区域,包含核糖体RNA操纵子(rrns)、IS和前噬菌体等元件(图1b)。本研究中组装的另一物种水平的CMAG是Bacteroides_A plebeius_A(一个已培养物种,图1c)。尽管有数百个公共数据库含有该物种的基因组和17个分离株,但其可用序列的N50长度从未超过150 Kbps。这些结果表明了当前工作流程在从复杂的宏基因组数据库和极具组装挑战的区域中组装完整基因组方面的能力和有效性。

图1 有效组装大量物种水平的完整(环状,无间隙)宏基因组组装基因组

a,从本研究中组装的134个具有代表性的物种水平完整(环状,无间隙)宏基因组组装基因组(CMAG)构建的系统发育树。门水平、已培养分离株的可用性、现有参考基因组的水平和测序类型由各自的颜色代码和符号表示。条形的高度加上外圆旁边的数字表示每个物种水平CMAG的组装基因组数量。b-c,两个CMAG的基因组示意图。最外面的圆(第1个):刻度(bps);第二圈:两个当前组装的CMAG,(b)B95.CMAG_8和(c)A135.CMAG_3;第三圈:最接近的基因组同源物,即Victivallis sp002998355Bacteroides_A plebeius_A。>90%的区域以蓝色显示。单个scaffold中的插入序列、核糖体RNA基因和前噬菌体的位置分别用黑色、绿色和红色表示。

3. 内蒙古人高质量肠道基因组数据库

A high-quality gut genome catalogue of Inner Mongolians

初始bins由两种binning方法(即MetaBAT、vamb)生成,然后通过DASTool和内部脚本进行整合和优化。加上上述提及的CMAG,本研究总共还原了12391个MAG符合MIMAG标准中的中等质量标准(>50%完整度和<5%污染率)。事实上,这其中6729个MAG符合MIMAG标准中列出的更严格的高质量定义(即,完整度>90%,污染率<5%,5S、16S和23S rRNA基因和至少18个tRNA基因;即IMGG数据库)。

随后,我们对IMGG数据库中的6729个MAG和从UHGG中检索到的147835个高质量基因组(完整度>90%,污染率<5%)进行聚类分析(图2a)。聚类过程产生了包含至少一个IMGG的485个宏基因组物种(metagenomic species;MGS)。还原的MGS在分类上分为11个门、14个纲、30个目、40个科,涵盖220个属(图2b)。这其中大多数属于厚壁菌(72.7%),其次是拟杆菌(14.9%)、放线菌(4.8%)和变形菌(3.9%)。在485个MGS中,469个是UHGG和IMGG数据库共有的。有趣的是,这469个普通MGS来源于UHGG数据库中75.6%的高质量MAG,尽管完整的UHGG数据库包含3000多个不同物种,表明它们是人类肠道中的高丰度物种。其余16个MGS是IMGG数据库特有的,在分类上被分为五个不同的门,其中一半属于梭菌目。

本研究的研究方法显著改善了MAG的连续性(图2c),IMGG数据库中的contig数量和N50长度均显著高于UHGG数据库(两种情况下均为P< 2×10−16)或代表性基因组(contig数量,P< 1.6 ×10−128;N50长度,P< 3×10−113)。此外,尽管UHGG数据库包含相当多的MAG (n=111744),但只有5053个符合MIMAG标准中规定的高质量标准,UHGG数据库中的大多数分离株(n=4058)都是已培养的,这都意味着基因组质量需要进一步改善。另一方面,本研究为288种物种提供了具有代表性的高质量MIMAG参考基因组,154种物种中可用的高质量MIMAG的数量增加了50%以上,包括UHGG数据库中一些高度代表的物种,如Agathobacter rectalisAlistipes putredinisBacteroides_B doreiLachnospira eligens_B(图2d;)。

图2 内蒙古人肠道基因组IMGG数据库是一个扩展的基因组资源

a,6729个IMGG (内蒙古人肠道基因组数据库)和147835个UHGG (统一人类胃肠道基因组数据库)的聚类分析结果概述,阈值为95%的平均核苷酸一致性(ANI)。75.6%的UHGG基因组与IMGG具有显著同源性(>95% ANI),其余24.4%的UHGG基因组与IMGG数据库具有独特的同源性。b,IMGG数据库在门、纲、目和科水平的分类学分布。在每个分类水平中只显示前五个,其余的被定义为“Others”。c,UHGG(共计147835个基因组,485个代表基因组)和IMGG(共计6729个基因组,485个代表性基因组)数据库的基因组组装性能(contig数量和N50长度)比较。统计学差异用Wilcoxon秩和检验(双侧)。方框表示四分位范围,方框内的线表示中位数,须表示1.5倍四分位范围内的最低值和最高值。d,IMGG数据库中50个最大的物种簇现有的高质量MIMAG(宏基因组组装基因组的最小信息)数量。

4. 增强复杂肠道基因组区域的分辨率

Enhanced resolution of complex gut genomic regions

为了揭示复杂的肠道基因组区域(包括rrn、MGC、前噬菌体和IS),本研究从IMGG数据库组装的485个MGS与UHGG数据库中的对应物进行了比较。首先,对rrn进行分析,因为它们是基于短读长组装的基因组中经常缺失的基因元件。特别是,16S rrn是未培养微生物生态学中不可缺少的分子标志物;然而,其可变的基因拷贝数常常导致微生物丰度分析中的严重偏差。正如预期一样,与UHGG相比,IMGG有着更多的rrn拷贝(包括16S、23S和5S rRNA;P<2×10-16)(图3a);并且,IMGG和NCBI基因组数据库中对应的完整分离基因组的rrn拷贝数基本一致,这表明UHGG数据库中MGS严重低估了的rrn基因拷贝数。此外,通过对最全面的基因拷贝数数据库(rrnDB)进行分类搜索,其中85%(413/485)当前组装的MGS是找不到的,包括一些16S基因拷贝数高的未培养MGS(例如,Romboutsia timonensisIntestinibacter bartlettiiClostridium sp.;)。这些结果表明,由于基因组质量不足,目前可用的基因拷贝数参考数据库在很大程度上仍然不完整。

其次,使用gutSMASH(一种专门用于分析肠道微生物群数据集的MGC预测工具)比较IMGG和UHGG中MGC的完整性。研究结果表明,在UHGG中发现的大部分MGC(56.5%)位于contig边缘,可能不完整,而在IMGG中的比例很低,只有4.5%(图3b)。此外,在IMGG和UHGG数据库中分别发现了每个基因组具有6个和3个完整的MGC,这表明在IMGG中对于识别全长的MGC有了实质性改善(图3b)。IMGG中包含MGC编码序列的基因组比例明显高于UHGG(P<7×10-18;图3c),特别是在几个MGC类别中,包括非蛋白源氨基酸、芳香族和其它短链脂肪酸(SCFA)(图3d)。值得注意的是,MGC区域的基因组比例仅与短读长基因组组装的N50长度相关,而与IMGG无关(IMGG和UHGG的重复测量相关性分别为R=0.03和0.19;图3e)。表明MGC识别和分配的有效性和解决方案受到短读长数据中组装连续性不足的限制。

第三,与UHGG数据库相比,IMGG数据库中前噬菌体基因组的分辨率有了很大提升。我们的方法在95%的IMGG中都能检测到前噬菌体序列(与UHGG(55%)相比)。IMGG和UHGG每个基因组编码前噬菌体的平均数量分别为4个和1个。IMGG中的前噬菌体序列的连续性也较高,N50长度为37974 bp(UHGG中为31064 bp;图3f);IMGG中前噬菌体编码区的基因组比例是UHGG的4.2倍(P<1e-77;图3g)。与UHGG相比,IMGG中的IS区域更加精确,反映在每个物种的IS区域总拷贝数(增加了三倍;P<1×10-51;图3h)和IS编码区域的基因组比例(增加了近四倍;P<9×10-57;图3i)。IS类别中改善程度最高的是IS1380(与UHGG相比,改善了5.6倍),其次是IS5、IS1634和ISAS1(分别是5.5倍、5.5倍和5.3倍;图3j)。

图3  内蒙古人肠道基因组增强遗传元件的基因组分辨率

内蒙古人肠道基因组(IMGGs;n=6729)和统一人类胃肠道基因组(UHGGs;N=147835)数据库。a,rRNA基因拷贝数。b-d,代谢基因簇(MGC)的恢复性能通过图b中MGC的完整水平和每个基因组中完整的MGC数量来评估;c,物种水平上MGC编码区在基因组中的比例(IMGG和UHGG数据库的数量分别为482和456);d,与UHGG相比,IMGGs各类MGC编码区比例的提高。MGC的预测由gutSMASH进行,根据产物将MGC分为不同的基因簇类:non-proteinogenic氨基酸(npAA);苯的硝基衍生物(Aromatic);SCFA与另一分子结合产生(SCFA-other);未知功能的基因簇(Putative);脂肪酸最多含有5个碳原子(SCFA);未分类的通路(Other);其中至少一个H被烷基取代基取代的氨衍生物(Aliphatic_amine);与能量捕获机制有关(E-MGC);e,IMGGs(左图)和UHGGs(右图)的MGC编码区比例与基因组组装N50长度之间的重复测量相关性(rmcorr)。灰色和红色虚线表示每个物种的相关性和所有物种的总体相关系数,通过R包(rmcorr)计算。IMGG和UHGG数据库中前噬菌体和插入序列IS的比较:f,前噬菌体载体的频率,每个基因组的前噬菌体数量和N50长度;g,在物种水平上,前噬菌体序列区域在基因组中的比例(IMGG和UHGG数据库分别为449和408);h,每个物种的IS数量;图i整体和图j单个IS在基因组中的区域比例(IMGG和UHGG数据库中n=485)。统计学差异用Wilcoxon秩和检验(双侧)。对于所有箱线图,框表示四分位区间,框内的线表示中位数,须表示1.5倍四分位区间内的最低值和最高值。

5. 人类肠道微生物中高度多样化和分化的MGC

Highly diverse and divergent MGCs in human gut microbes

深入研究可用高质量基因组中编码的代谢潜能。考虑到由于组装连续性有限,基于短读长的MGC分析的性能较低,本分析仅包括UHGG和IMGG数据库中的高连续性和高质量基因组(contig数<30)。共从15512个基因组中还原了97428个MGC区域,其中78675个是完整的,并被纳入进一步分析。大约一半的完整MGC(48%)与已知MGC没有同源性(70%的相似性阈值)。这些完整的MGC属于所有八个MGC类别,分布在58个MGC类型中(补充表11)。最常见的类别是SCFA(40.0%),其次是Putative(28.9%)和E-MGC(17.2%)。然后,门水平分布和聚类分析揭示了MGC类别的总体分布在门水平的显著差异(图4a),以及在十个主要的门之间,它们在不同门中的数量各不同(图4a)。此外,基于涵盖九个主要门的功能性MGC分类分布的特异性聚类表明,MGC概述和组成在门水平间存在显著差异(Adonis检验R=0.38,P<0.001)。富集/缺失分析均显示,优势门中某些功能类别的丰度存在显著差异(图4b)。SFCA代谢相关的MGC在较低分类学水平的分布分析发现:两个优势目,Lachnospirales和Oscillospirales,包含大多数SCFA生物合成通路(图4c);每个未培养物种都有3~6个SCFA生物合成MGC。这些未培养物种中的一些最近发现了以前未报告的Christensenellales和Oscillospirales分类群,突出了这些代表性不足的分类群在促进宿主健康方面的潜力(图4c)。

大约12%的MGC携带多个核心功能域(称为混合MGC)。混合MGC显著大于单功能域MGC(P<2×10-16)。最常见的混合MGC组合是琥珀酸-丙酸和红杆菌固氮(Rnf)复合物(扩展数据图4b)。最大的混合MGC大小为117 Kbps(B46.bin_5_Region10,由Flavoniflactor plautii物种携带;图4d)。它包含五个MGC功能域,其中两个属于E-MGC和SCFA其他类别(分别为Rnf复合物和乙醇胺利用[EUT]通路),占MGC总长度的80%以上;另外三个交错的功能域(焦磷酸硫胺素[氨基酸代谢]、未分类的脂肪酸和黄素酶脂质分解代谢)属于假定类。这些结果表明,肠道微生物组MGC编码广泛的代谢潜能,不同关键人类肠道分类群的代谢潜能差异很大。这项研究为系统揭示人类肠道代谢潜力提供了一个起点。

图4 人肠道菌群中代谢基因簇库的概述

a,不同种类的代谢基因簇在优势门水平的分布。MGC的预测由gutSMASH进行,根据产物将MGC分为不同的基因簇类:proteinogenic氨基酸(npAA);苯的硝基衍生物(Aromatic);SCFA与另一分子结合产生(SCFA-other);功能未知的基因簇(Putative);脂肪酸最多含有5个碳原子(SCFA);未分类的通路(Other);其中至少一个H被烷基取代基取代的氨衍生物(Aliphatic_amine);与能量捕获机制有关(E-MGC)。b,顶部图显示了完整MGC的数量。底部图为MGC型按门富集的热图;该门中某一特定MGC类型的显著富集用星号表示(P<0.05,Fisher检验)。比值表示特定MGC富集或短缺的程度,颜色强度越高表示富集越强,反之亦然。c,低分类学水平(优势目和未培养种)短链脂肪酸相关MGC的分布分析。d,gutSMASH预测的最大的混合型MGC(约117 Kbps)含有5个MGC功能域,可能编码不同的代谢通路。Rnf复合体,Rhodobacter固氮复合体;TPP AA代谢、硫胺素焦磷酸(氨基酸代谢);EUT通路,乙醇胺利用通路。

6. 12834个肠道前噬菌体的分类和功能注释

Taxonomic and functional annotation of 12,834 gut prophages

前噬菌体是另一类被低估的肠道微生物群。因此,本研究随后挖掘了IMGG数据库中未知的肠道前噬菌体。IMGG数据库中总共还原了21217个前噬菌体基因组,根据未培养病毒基因组(MIUViG)最低信息标准,将其进一步聚类为13437个物种水平的病毒操作分类学单位(vOTUs)。这些vOTU代表39839 Kbps的N50长度。接下来,使用科水平和物种水平的系统发育距离,通过与宏基因组肠道病毒(MGV)数据库进行比较,对vOTU进行分类。值得注意的是,95.5%(n=12834)的vOTU与MGV数据库在物种水平不具有同源性。除了那些可分类到物种水平(4.5%)的病毒外,90.9%的vOTU与MGV水平具有科水平的同源性,但只有46.7%的病毒被分类到已知的病毒科(图5a)。大多数已分类的前噬菌体属于SiphoviridaeMyoviridate科(分别为73.0%和24.2%;图5b)。进一步分析表明,最常见的细菌宿主是Firmicutes_A(71.4%),这也是先前未报告前噬菌体的主要宿主。SiphoviridaeMyoviridate都是人类肠道中的优势前噬菌体科,其宿主范围广泛,涵盖多个门(图5c);然而,Siphoviridae(Firmicutes_A [68.8%],Bacteroidota [15.58%],Actinobacteriota [5.3%])和Myoviridae [Firmicuters_A[83.0%])的主要细菌宿主在门水平的分布却有很大差异。如预期那样,crAssphage的宿主范围小且具有特异性,仅由拟杆菌属组成。

接下来,对IMGG数据库中的前噬菌体基因组进行深入分析,以探究其功能能力。从12834个物种水平的vOTU代表性基因组中鉴定出596193个蛋白质编码基因,并将这些假定基因与几个常见的功能和/或病毒注释数据库进行了比较。结果表明,仅有55.4%的前噬菌体基因在功能上能够被分类,而44.6%的基因与任何交叉比较的数据库都不具有同源性,被分配给了未知的功能(图5d)。而这些不匹配的基因代表了大量的病毒功能基因和代谢能力未被开发。大约8.88%的功能基因编码辅助代谢通路(排名前三的通路:氨基酸代谢,2.51%;辅因子和维生素代谢,1.81%;碳水化合物代谢,1.55%;图5e)。值得注意的是,辅助代谢通路在前噬菌体科之间的分布各不同(图5e)。CrAssphage具有较高比例的辅因子和维生素代谢基因,而微小病毒科具有较高水平的参与能量代谢和氨基酸代谢通路的基因(图5e)。多糖降解基因占所有酶的22%,它们主要属于未分类的前噬菌体、丝状病毒科和肌病毒科(图5f)。然后,预测IMGG数据库中的假定抗生素耐药基因(ARGs)。能检测到的ARGs占总预测基因的0.15%(n=916),远高于先前研究(0.0028%)。共有712个前噬菌体基因组携带ARGs;其中大多数与四环素、大环内酯和丁胺卡那霉素有关(图5g),分别占检测到的ARGs的43.1%、31.2%和9.7%。这些结果表明,尽管携带ARG的噬菌体很少存在于肠道微生物中,但这些噬菌体可能编码ARG(例如,A163.CMAG_1_1_7_59800编码假定的β-内酰胺酶基因;图5h),可能成为ARG转移的关键载体,并对人类健康造成严重威胁。这些结果表明,肠道前噬菌体在分类和功能上比先前我们所了解的更加多样化。

图5 肠道中前噬菌体和插入序列的概述

a,对13437个病毒操作分类单元(vOTU)与宏基因组肠道病毒(MGV)数据库进行同源性搜索,并根据国际病毒分类委员会(ICTV)的病毒分类概要进行分类。b,已知前噬菌体的科水平分类注释与分布。c,主要前噬菌体科在不同菌门中的分布。d,通过5个常见的功能和/或病毒基因数据库/软件注释的假定前噬菌体基因,包括蛋白质家族数据库(Pfam)、京都基因和基因组百科全书(KEGG)、病毒同源数据库(VOGdb)、碳水化合物活性酶(CAZY)和ABRicate(用于抗生素耐药基因的预测,ARGs)。搜索可发现55.36%的功能分类的前噬菌体基因,而剩下的44.64%是未知的。e,参与辅助代谢通路的基因比例及其在病毒科中的分布。f,不同底物的多糖降解基因在不同前噬菌体科水平的分布。g,ARGs数量。h,含有一个假定内酰胺酶基因的前噬菌体的例子。i,左图:插入序列(IS)在细菌门水平的分布。右图:每个门的总IS拷贝数。j,携带最多乘客基因的十大IS。k,通过UniProt数据库注释揭示了乘客基因最常见的生物学功能。

7. 肠道微生物组中IS的分布和作用

Distribution and role of IS elements in the gut microbiome

IS 是最常见的转座元件,它能够在宿主基因组内剪切和整合,在细菌适应和进化中发挥着难以置信的作用。然而,在基于短读长的MAG中,它们常被忽略。因此,我们从公共数据库和IMGG数据库中基于长读长的MAG中检索到的肠道细菌分离株的完整/染色体水平基因组,确定了IS元件的综合信息。共鉴定出140336个IS(属于26个IS家族)。最常见的IS是IS3(17.0%),其次是IS200/IS605(9.3%)和IS256(8.1%),而最不常见的是ISKRA4(仅0.02%;补充表14)。不同IS在多个门中分布不同(图5i)。例如,弯曲杆菌属和脱硫杆菌属的IS200/IS605比例都很高,但它在其他门中的普遍度较低。值得注意的是,在所有门中,变形菌门和弯曲杆菌门分别具有最多和最少的IS拷贝数(图5i)。此外,IS拷贝数的MAG内整体的高变异性(扩展数据图5)表明拷贝数变异在人类肠道微生物群中广泛存在。

转座元件携带转座酶编码基因,也可能携带非转座酶基因,即乘客基因。为了探索可转座元件的功能潜能,对乘客基因(位于IS边界内)和邻近基因(位于靠近IS,在5000 bp内)进行了分析和注释。我们的结果表明,20.2%的IS编码至少一个假定的功能基因,乘客基因总数为36308个,平均每个IS携带0.26个。IS21拥有最多的功能性乘客基因(占总乘客基因的17.3%),其次是IS3和IS66(分别为17.0%和12.4%;图5j)。UniProt数据库注释显示,这些乘客基因在DNA整合、细胞活性、转录调节、DNA重组和DNA复制中发挥作用(图5k),尽管其中大多数(48.4%)被分配为“非特征化蛋白质”(补充表15)。

使用KEGG数据库对IS区域附近的基因和通路进行注释发现,它们与广泛的功能相关,包括遗传信息处理、信号和细胞过程、代谢、碳水化合物代谢、信号转导、膜转运、细胞群落-原核生物、核苷酸代谢、翻译和氨基酸代谢。

- 讨论 -

在这项研究中,我们使用混合长读长PromethION和短读长HiSeq测序对60名内蒙古个体(三个时间点,180个样本)的粪便微生物菌群进行了表征。我们构建了IMGG数据库,包括802个环状的和5927个高质量的基因组,这些基因组符合MIMAG标准中规定的高质量基因组标准,极大地扩展了人类肠道高质量MIMAG的现有数据库(n=7492)。此外,据我们所知,这是迄今为止最大的CMAG基因组数据库,是目前可用CMAG的三倍多。因此,IMGG数据库是一个有价值的基因组资源。

基于该方法,实现了基因组连续性的提高,从而提升了复杂基因组区域中基因组元件的分辨率,包括rrns、MGC、原噬菌体和IS。尽管这些区域在细菌适应和进化中具有重要的功能,但由于缺乏高质量的参考基因组,尚未设计出针对性分析它们的系统和具体研究。IMGG数据库为在rrnDB中未发现的430种物种提供了相对准确的16S rRNA基因拷贝数信息,这表明目前可用的rRNA基因拷贝数数据库和基于16S rRNA的功能预测工具在很大程度上是不完整的,应该扩展到覆盖未描述和/或未培养的物种。

随后,在IMGG数据库中将MGC功能分配给肠道细菌发现,提高基因组的连续性大大提高了预测的MGC的完整性,揭示了人类肠道微生物群中MGC的多样性和差异性比以前想象的更广泛。基因组连续性的增加也有助于MGC的鉴定,特别是具有多个功能域的混合MGC。尽管MGC可以容易地组装到仅具有短读长的MAG中,但基因组连续性不足严重限制了对特定未充分探索人类肠道分类群中MGC功能的解读,特别是对于靠近边界的MGC。

IMGG数据库的病毒组分析显示,大量前噬菌体与目前已知的物种没有同源性/同源性低。这些肠道前噬菌体编码重要的功能基因,如辅因子和维生素代谢途径、多糖降解酶和ARGs,支持肠道病毒在人类健康和营养中的关键作用。事实上,前噬菌体被认为是肠道微生物之间基因转移的关键载体,这进一步表明了它们在肠道微生物群落中一些关键功能基因移动中的重要性。此外,对人类肠道病毒的彻底了解将是开发治疗方法(例如,基于噬菌体的微生物组策略)以对抗微生物失调相关的慢性和/或变性疾病的先决条件。

本研究强调了人类肠道微生物群相关IS中存在广泛的物种间多样性和拷贝数变异,但却很难参透,因为现有基因组中重复区域的分辨率有限。本研究中揭示的IS特征进一步表明它们参与了基因组结构的重塑,并对微生物群的适应性产生影响。有趣的是,少数IS甚至含有假定的功能基因。这些潜在的乘客基因可能在微生物之间迅速而广泛地传播,这可能会在暴露于环境选择力时影响微生物基因组的稳定性。除了IS元件中携带的乘客基因外,许多假定的功能基因也在IS附近富集。先前的研究表明,IS可以插入功能基因并影响其活性。因此,IS通过调节其相邻基因的功能和表达来影响微生物活性的潜在生理作用值得进一步研究。

长读长测序技术(即PacBio HiFi测序和新型牛津纳米孔测序技术)的持续进步可以减少容易出错的长读长并提高组装的精确度,有望避免或至少减少未来对深度互补短读长的需求。总的来说,我们的结果支持二三代混合组装是一种有效的策略,可以提高直接从复杂人类肠道宏基因组中组装的MAG的连续性、准确性和分辨率。使用当前的方法,本研究构建了IMGG数据库,这是一个高质量基因组的巨大集合,对代表性不足的基因组区域进行了细致观察。可以设想,该数据库和其他大规模的高质量基因组数据库可以在未来整合,为统一质量的基因组构建存储库,进一步实现基因组解析的宏基因组学。

- 方法 -

1. 干预试验设计和志愿者招募

Intervention trial design and participant recruitment

本实验共计从呼和浩特内蒙古农业大学共招募了160名居身体健康的志愿者。在得知具体的试验指南和细节后,这些志愿者被随机分配到益生菌酸奶组(n=80)和普通酸奶组(n=80)。试验开始前,所有参与者都签署了知情同意书。所有参与者每天摄入200克益生菌酸奶或普通酸奶,共计持续28天。酸奶由中国蒙牛乳业有限公司生产。普通酸奶用含有保加利亚乳杆菌和嗜热链球菌的商业发酵剂发酵,但益生菌酸奶是用商业发酵剂和已知有益菌株Probio-M8发酵。

在本实验开始的第0、7和28天收集参与者的粪便样本。随机选择60名参与者的粪便样本(30人食用普通酸奶,另30人食用益生菌酸奶)进行随后的宏基因组测序。研究队列包括40名汉族和20名蒙古族参与者;男性13名,女性47名。他们的年龄范围为18-38岁(平均值±标准差=24.45±4.79岁)。关于参与者特征(即吸烟、性别、年龄、抗生素使用、茶和酒精摄入量也均有记录;补充表1)。本研究没有向志愿者支付任何补偿。在样本收集、处理和测序过程中,研究人员对群体分组一无所知。分析中未排除任何数据。这项研究符合《赫尔辛基宣言》中概述的原则。内蒙古农业大学伦理委员会和内蒙古医科大学附属医院批准了这项研究(项目编号2020008)。

2. 纳米孔文库的制备和测序

Nanopore library preparation and sequencing

根据产品说明书,使用SPINSeasy DNA试剂盒(MP Biomedicals)从粪便样本中提取宏基因组DNA。分别使用Qubit 2.0荧光计(Thermo Fisher)、Nanodrop One分光光度计(Thermo-Fisher)和0.6%(w/v)琼脂糖凝胶电泳评估提取的DNA的浓度、纯度和片段大小分布。使用Covaris g-TUBE(产品说明书)装置将合格的DNA样品剪切至10 Kbps,然后按照使用说明利用AMPure XP珠(Beckmann Coulter Genomics)浓缩。根据Native Barcoding Genomic DNA protocol和1D Genomic DNA by Ligation protocol,One-pot Native Barcoding kit(EXP-NBD196,Oxford Nanopore Technologies)和连接测序试剂盒(SQK-LSK109,Oxford Nanopore Technologies)制备纳米孔测序文库。在Oxford Nanopore PromethION R9 FLO-PRO002 的flow cell上对最终文库进行了48-72小时的测序。如果样本的测序数据量在计划时间内未达到至少20 Gbps的预期输出,则重新进行测序,并将其合并为同一样本的运行数据。

3. Illumina文库制备和测序

Illumina library preparation and sequencing

Illumina测序的DNA文库使用NEBnext Ultra II DNA文库制备试剂盒(可供参考的该试剂盒的详细使用说明)(New England BioLabs)制备。然后使用Illumina HiSeq 2500测序平台(二代测序原理!边合成边测序)进行双端2×150 bp全基因组测序。

4. 纳米孔序列处理、宏基因组组装、纠错和质量评估

Nanopore read processing, metagenomic assembly, polishing and quality assessment

使用Guppy v.3.03(guppy进行碱基识别|guppy软件介绍)(https://pypi.org/project\/guppy3\/3.0.3\/)和默认推荐的参数设置对纳米孔测序数据进行快速读取和基础调用。然后,使用Filtlong v0.2.1软件(https://github.com/rrwick\/Filtlong\/releases)和命令行“-min_length 2000,-mean_q_weight 6和–trim”过滤低质量和污染的人体序列。使用NanoStat(NanoStat软件可参考的文章)对过滤后的序列进行质控。使用带有“-meta和–plasmas”参数的MetaFlye v2.8.3(宏基因组公众号|三代长读长宏基因组组装软件metaFlye)来组装预处理的长序列。使用Nextpolish v1.3.1(武汉未来组开发的三代基因组纠错软件Nextpolish)进行短读长序列纠错。使用CheckM v1.13(宏基因组| CheckM——国家微生物科学数据中心云工具)鉴定纠错的组装中嵌合体contigs,并用内部脚本重新组装和纠错检测到的嵌合体contigs。使用QUAST v5.00(宏基因组|MEGAHIT组装拼接及quast评估)( “-min contig 2000”)软件用于评估最终基因组组装的质量。CMAG由metaFlye识别,然后由自定义脚本验证(https://github.com/jinhao94/nanopore_script/tree/

main/CMAG_verification)。接下来,重建粪便宏基因组中生物标志物菌株(通过酸奶干预实验一半参与者的Probio-M8菌株)的基因组。共重建了150个Probio-M8基因组(每种组装方法n=50,即长读长纠错、长读和短读长纠错和短读长组装),使用QUAST将其与Probio-M9参考基因组(NCBI登录号,GCF_011770105.1)进行比较,以评估工作流程的准确性。使用CoverM v0.6.1(CoverM 相对丰度计算方法分析)(https://github.com/wwood\/CoverM\/releases\/tag\/v0.6.1)计算每个样本中Probio-M8基因组的覆盖率。使用EggNOG-mapper v2.1.6(宏基因组|EggNOG功能注释数据库在线和本地使用)默认参数对同源基因簇(COG)进行功能注释。

5. 宏基因组分箱

Metagenomic binning

基于contigs组成、覆盖率和同源性的完整宏基因组分箱方法被用于将来自相同基因组的序列聚类到分箱中。为了提高宏基因组分箱性能,下游分箱分析中只包括长度超过10 Kbps的contigs。简而言之,metabat2 v2.12.1和vamb v3.0.1用于生成每个样本的初始箱。然后,使用DASToolv1.12和内部脚本确定并选择最佳质量的分箱。最后,根据系统分类、GC含量、丰度和k-mer频率分布,将来自同一微生物种群的多个兼容分箱合并为单个箱。分箱工作流程的Python脚本可在https://github.com/jinhao94\/binning_script.git上获取。

6. UHGG和IMGG数据集中基因组的物种级聚类

Species-level clustering of genomes in UHGG and IMGG datasets

UHGG数据集中的高质量基因组(完整性>90%,污染<5%;147835个基因组)和IMGG在物种级别的聚类使用dRep v2.2.4(宏基因组| drep:微生物基因组快速去冗余)进行,参数设置如下:“-pa 0.9-sa 0.95-nc 0.30-cm大”。只有含有至少一种IMGG的MGS被纳入进一步的比较分析。MGS根据UHGG数据集中的信息进行分类。以前未报告的MGS的分类分配是根据参考文献进行。

7. 基因组质量与比较基因组学分析

Genome quality and comparative genomics

用CheckM的“lineage workflow”的评估候选箱的完整性和污染。rRNA基因使用barrnap(v.0.9,https://github.com/tsemann/barrnap)进行预测,参数设置为“-reject 0.01-evalue 1×10−3”,tRNA使用tRNAscan se v.1.3.162的默认参数进行识别。通过QUAST对基因组进行统计,包括N50长度、GC含量、基因组大小和contigs的数量。使用CompareM v0.1.2(https://github.com/dparks1134\/CompareM)计算基因组之间的成对的氨基酸同一性值。Prodigal v.2.6.3用于使用正常模式(“-p single”)预测蛋白质编码基因。系统发育树是使用文献中描述的PhylPhlAn中的400个通用标记进行构建。使用iTOL可视化对进化树进行美化(宏基因组|iTOL美化进化树实战:标签、枝修饰,分组着色)。为了最大限度地减少由每个物种基因组数量不均造成的偏好(例如,在UHGG数据集中,有6644个大肠杆菌基因组,但只有6个丝状霍尔德曼菌基因组),我们液计算了物种水平上的基因组暗物质百分比中值(dark matter percentages),并将其用于数据集之间的比较分析。

8. MGC的挖掘分析

Mining for MGCs

利用gutSMASH和BiG-SCAPE(默认设置)识别数据集中的MGC,并使用gggenes(https://github.com/wilkox/ggggenes)(gggenes功能强大|gggenes在基因组中画基因箭头图)可视化MGS。位于重叠边缘的MGC被认为是不完整的。

9. 前噬菌体的挖掘、聚类、分类以及功能注释

Prophage mining, clustering, taxonomic assignment and functional annotation

PhiSpy算法是一种通过整合基于相似性和组成的策略来检测细菌基因组中的前噬菌体。最近的一篇文章(Philympics文章链接)评估了PhiSpy以及其他九个预测工具,发现PhiSpy总体性能很高,特别是其最佳f1-score和运行时的性能优于其九个的预测工具。因此,本研究选择使用PhiSpy 2v4.20来识别前噬菌体区域,使用“-phmms”选项来过滤不含任何病毒基因的前噬菌体。如果候选的前噬菌体序列在VIBRANT和CheckV中被识别为具有默认参数的病毒,或者当与MGV数据库进行比较时显示科水平级的同源性,则将其视为前噬菌体。与MGV数据库中的基因组共享>20%氨基酸一致性和>10%共同基因的早期基因组被分配到同一科水平。按照MIUViG标准的建议,剩余的前噬菌体基因组与MGV基因组数据在种级别进行聚类。使用KofamScan v1.3.0将前噬菌体基因组的氨基酸序列与KEGG数据库比对,并使用dbCAN2的‘diamond’模式,使用HMMER包v.3.1b2中的hmmsearch程序,根据CAZYme数据库搜索Pfam-A和VOGdb。并使用ABRITE v1.0.0(https://github.com/tseeman\/ABRicate)鉴定抗微生物基因。

10. IS元件和IS元件连锁基因的检测与分析

Detection and analysis of IS elements and IS element-linked genes

利用ISEScan v17.2.3的使用参数“-removeShortIS”识别插入序列元件,并过滤出短的IS元件。位于IS元件边界内的基因被认为是乘客基因,并被功能注释。筛选转座酶编码基因。位于IS元件5000 bp内的基因被认为是IS连锁/相邻基因,并进行进一步分析。在进一步的分析中只注释的感兴趣基因。

11. 数据分析和重现

Statistics and reproducibility

使用R软件(v.4.0.2)进行数据统计分析。利用Wilcoxon检验评估各组之间各种变量的差异显著性。使用R语言vegan包进行主坐标分析(基于Bray-Curtis距离)。使用vegan包进行Adonis分析(9999个permutations)。Pearson的相关性是用R基包进行的。对于Pearson的相关性分析,数据分布假设为正态分布,但并未对其分布进行正式的检测。使用rmcorr R包进行重复相关性计算。MGCs的功能富集分析使用双侧的Fisher精确检验进行,P值通过Hochberg方法使用R base包进行调整。没有使用统计方法来预先确定样本量,但本研究的样本量和测序深度大于现有的基于长读长的人类肠道宏基因组研究。分析过程中未排除任何数据。该宏基因组分析的益生菌干预试验和样本选择是随机的。在干预试验和结果评估期间,研究人员对分配情况一无所知。

12. 可用代码

https://github.com/jinhao94/nanopore_script.git

https://github.com/jinhao94/binning_script.git

引用本文

Jin, H., Quan, K., He, Q. et al. A high-quality genome compendium of the human gut microbiome of Inner Mongolians. Nat Microbiol 8, 150–161 (2023). https://doi.org/10.1038/s41564-022-01270-1

- 通讯作者简介 -

内蒙古农业大学

乳业生物技术与工程重点实验室

张和平

教授,博士生导师

2010年国家杰出青年科学基金获得者;2012年入选“长江学者”奖励计划特聘教授;2013年入选“国家百千万人才工程”、并获“有突出贡献中青年专家称号”;2015年入选全国农业科研杰出人才;2016年入选国家“万人计划”科技创新领军人才。带领研究团队2009年入选教育部创新团队发展计划,2014年入选科技部重点领域创新团队,并荣获“全国专业技术人才先进集体”称号;2015年入选农业部科研杰出人才创新团队;获得农业部2017年度“神农中华农业科技奖—优秀创新团队奖”。至今已在国际主流刊物Nature microbiology、Nature Communication、The ISME Journal、Microbiome和Molecular and Cellular Proteomics等国际著名刊物发文。主编Lactic Acid Bacteria: Fundamentals and Practice (Springer出版社,2014)和《现代乳品工业手册》等论著8部;授权发明专利33项;起草食品安全地方标准10项。

内蒙古农业大学

乳业生物技术与工程重点实验室

孙志宏

研究员,博士生导师

2016年,入选内蒙古自治区“草原英才”工程。2017年,获内蒙古自治区“优秀科技工作者”称号。2012年,以第二完成人,获得内蒙古自治区科技进步一等奖。2017年,以第一完成人,获内蒙古自治区自然科学二等奖。2018年,以第七完成人,获湖北省科学技术进步二等奖。2019年,以第一完成人,获得教育部高等学校科技发明一等奖。至今已在国际主流刊物Nature microbiology、Nature Communication和ISME Journal等国际著名刊物发文。

猜你喜欢

iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索  Endnote

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

点击阅读原文,跳转最新文章目录阅读

Nat Microbiol | 内农大张和平团队新突破—高分辨率下的人类肠道微生物组相关推荐

  1. 内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...

    导读 人类肠道微生物群中已经发现了大量微生物基因组,但由于目前大多数研究中使用的测序深度相对较浅,在个体水平上了解低丰度物种的作用仍具有挑战.为了提高基因组的组装性能,本研究采用了Illumina H ...

  2. 肠道微生物组:肌肉骨骼研究的新领域

    骨质疏松--"沉默的杀手",是一种骨代谢异常的慢性病.别以为骨质疏松很遥远,骨质疏松正无声无息地向年轻人逼近. 肌肉骨骼系统是整个人类健康的重要决定因素.除了充当人体支架外,它还通 ...

  3. 陀螺专访 | 趣链科技张帅:新基建“风口”下,区块链产业有哪些发展机遇?...

    引言:在4月20日的国家发改委新闻发布会上,发改委首次明确区块链属于"新基建"范围,这无疑对于区块链产业的发展是重大的利好.联想到近期曝光的央行数字货币正在农行.中行等银行体系内部 ...

  4. 哈佛大学联合团队新突破:在计算过程中实现量子纠错

    实验室成员:左起依次为Dolev Bluvstein.Harry Levine(视频成员).Sepehr Ebadi.Mikhail Lukin (图片来源:哈佛大学) 试想一下,一边飞行一边制造飞机 ...

  5. iMeta | 宁波大学附属第一医院崔翰斌团队综述缺血性心脏病相关肠道微生物及菌群代谢物研究进展...

    点击蓝字 关注我们 缺血性心脏病相关肠道微生物及菌群代谢物研究进展 iMeta主页:http://www.imeta.science 综  述 ● 原文链接DOI: https://doi.org/1 ...

  6. 张和平:益生菌、肠道菌群与健康 |《科学通报》专辑

    本文转载自"科学通报" 2019年第3期 邀请内蒙古农业大学食品科学与工程学院张和平教授作为特邀编辑,组织出版专辑"益生菌.肠道菌群与健康",敬请关注! 教授, ...

  7. 内农大/南昌大学一院-补充植物乳杆菌改善慢性便秘(IF=10.3)

    点击蓝字↑↑↑"微生态",轻松关注不迷路 生科云网址:https://www.bioincloud.tech 编译:九卿臣,编辑:微科盟居居.江舜尧. 微科盟原创微文,欢迎转发转载 ...

  8. NBT:Rob Knight团队发表微生物组数据降维新方法

    上下文感知的降维解卷积肠道微生物群落动态 Context-aware dimensionality reduction deconvolutes gut microbial community dyn ...

  9. iMeta | 叶茂/时玉等综述环境微生物组中胞内与胞外基因的动态穿梭与生态功能...

    点击蓝字 关注我们 环境微生物组中胞内与胞外基因的动态穿梭与生态功能 https://doi.org/10.1002/imt2.34 REVIEW ARTICLE ●2022年6月20日,中国科学院南 ...

最新文章

  1. 第六篇:Feedforward Networks 前向网络
  2. php time相差12小时_优化你的PHP代码,从现在做起
  3. 迈克尔戴尔展望医疗愿景:信息驱动创新
  4. ssh开启root用户登录
  5. [PXE] Linux(centos6)中PXE 服务器搭建,PXE安装、启动及PXE理论详解
  6. FJUT OJ 2466 T^T的叛乱计划(组合数学)
  7. 使用 icon 字体图标出现小方块问题
  8. android 相机路径,android – 如何获取刚从相机捕获的图像路径
  9. DataSet 的 Merge 方法
  10. Web 开发中 Blob 与 FileAPI 使用简述
  11. LeetCode题解 343.Integer Break
  12. 百度统计:网站统计实时访客报告
  13. 嵌入式Linux系统编程学习之二十四消息队列
  14. 消息中间件Notify和MetaQ-阿里中间件
  15. Android入门笔记07
  16. Win32 Console Application、Win32 Application、MFC三者之间的联系和区别
  17. jetson nano使用python读取解析GPS数据(GPRMC,GPGGA)。
  18. Java图形用户界面
  19. 深度学习论文翻译解析(二十):YOLOv4: Optimal Speed and Accuracy of Object Detection
  20. linear-gradient 实现切角效果

热门文章

  1. 【SQL练习】 计算并填写学生获得的总学分 本题目要求编写UPDATE语句, 计算每位学生已获得的总学分并填写在stu表中的totalcredit字段。
  2. leaflet动态热力图分析(leaflet篇.16)
  3. Zeal下载文档慢无响应问题(详细操作流程-告别龟速下载)
  4. Excel 2010 VBA 入门 103 利用VBA批量插入图片
  5. 【机器学习】——白话入门及术语解释
  6. 耳下长包图片_耳锤下面长了个硬包是怎么回事
  7. 怎么进行SWOT分析法?
  8. java android 小游戏_Android开发基础知识及小游戏
  9. uni-app 点击图标控制音乐播放
  10. 神经网络学习-Adam算法