简介

https://www.ezbiocloud.net/ 是综合的细菌16S鉴定数据库,所有16S序列经人工校正,几乎全部为完整27F-1492R全长16S序列,而且全面覆盖NCBI、JGI的16S和细菌基因组,以及PacBio测序的16S全长序列。数据库每季度更新,近10年来被引用过万次。

由ChunLab维护的专门针对细菌、古菌16S rRNA基因的数据库,但与Greengenes数据库不同的是,该数据库以可培养的细菌、古菌16S rRNA基因序列为主,也包括了细菌基因组和宏基因组来源的16S序列。

我们可以通过EzBioCloud数据库的鉴定(Identify)功能确定某一微生物的近缘可培养/模式种。当然,如果我们想要查找某一个属的所有可培养种的16S序列,EzBioCloud也是很好的选择之一。

数据库有4类

16S数据库

EzBioCloud 16S 数据库:16S rRNA 基因为整个 EzBioCloud 数据库提供了分类框架。基本上,所有物种或亚种都由单个 16S 序列表示,通常来自类型菌株。分层分类基于 16S-最大似然系统发育分析 ,详见:https://help.ezbiocloud.net/ezbiocloud-16s-database/

基因组数据库

EzBioCloud 基因组数据库:EzBioCloud 中包含的所有基因组序列均由相同的注释流程处理,因此可以直接进行比较,不会出现不兼容的问题。基因组通过各种质量控制 流程进行验证,分类身份通过我们的 TrueBacTM ID 服务进行检查。该数据库中的所有基因组都标有 EzBioCloud 16S 数据库中始终存在的分类名称,详见:https://help.ezbiocloud.net/ezbiocloud-genome-database/

微生物组数据库

EzBioCloud微生物组数据库:MTP(Microbiome Taxonomic Profile)是含有宏基因组样品的分类学描述文件数据的一个单元。我们将公开可用的 16S 微生物组数据编译到该数据库中。要访问该数据库,您需要使用EzBioCloud系统。如果您有兴趣探索包含 8,048 个 MTP 的人类微生物组项目数据,请遵循本教程,详见:https://help.ezbiocloud.net/tutorial-how-to-browse-individual-human-microbiome-project-hmp-data/

QIIME和Mothur使用的16S数据库

https://www.ezbiocloud.net/resources/16s_download

下载数据库首先要注释,最好使用学校或研究所的邮箱注册,如我的单位邮箱为 yxliu@genetics.ac.cn 。然后申请,等人工审核后才会发你下载链接。

16S数据库

本次只介绍16S数据库的在线和本地化使用。其他数据库的使用有时间再分专题介绍。

https://help.ezbiocloud.net/ezbiocloud-16s-database/

EzBioCloud 16S数据库内容

EzBioCloud 16S 数据库包含以下信息:

  • 代表参考分类群的标准化 16S rRNA 基因序列

    • 所有序列都使用两个最流行的 PCR 引物 ( 27F-1492R )之间提取,因此可以始终如一地进行相似性计算。

    • 原则上,单个 16S 分配给单个参考分类单元。

  • 参考类群均值

    • 当前有效发布的分类名称

    • 一些无效名称(可能代表不同的物种)。

    • 候选分类群

    • 不属于上述的未命名系统发育型。

      这些包括 16S 扩增子和基因组序列。

  • 给出了所有 16S 序列(从物种到门)的完整分类等级

    层次结构基于 16S 的最大似然系统发育树,并考虑了当前接受的分类。

16S数据来源

由于我们已尝试确保 16S 序列的最佳质量,因此 16S 的来源可能会有所不同,并且是以下之一:

  • 有效发表的NCBI 16S扩增类群的序列:

    例如,AY692362为 Adiaceo aphidicola

  • 系统发育型(phylotypes)的 NCBI 16S 扩增子序列:

    例如,   AJ290038用于 AJ290038_s(系统发育型对应物种)

  • 从 NCBI 基因组组装中提取的 16S 序列:

    例如, 用于Baumannia cicadellinicola的 CP000238。

  • 从基因组JGI提取16S序列装配(这基因组数据可能无法在NCBI提供):

    例如 jgi.1096475在属种系型jgi.1096475_s  Geodermatophilus

  • 16S 序列由 Pacific Biosciences 微生物组样本的全长测序汇编而成。

    这些代表使用 PacBio 的循环共有测序 (ccs) 技术的高质量 16S 序列:

    例如,系统发育型PAC001304_s 的 PAC001304。

  • 来自基因组的 16S 序列(例如 CP014326_s)。

    这些是由全基因组序列支持的暂定新物种,详见 https://help.ezbiocloud.net/genomospecies/ 。

因此,并非所有数据都在 NCBI 数据库中可用。但是,所有数据都可以通过 www.ezbiocloud.net 免费访问。

为什么在 EzBioCloud 中使用来自基因组组装的 16S 序列,而不是 PCR

  • 基因组组装通常比 PCR 扩增子测序质量更好。

    典型的 NGS 测序导致 50X 或更高的测序覆盖深度。

  • 当我们将基因组序列衍生的 16S 包含到 EzBioCloud 数据库时,我们总是使用二级结构信息通过手动比对来检查质量。

    根据我们的经验,使用基因组序列可以提高 16S 数据库的质量以供参考。

单个序列物种注释

1.访问主页 https://www.ezbiocloud.net/

2.16S序列分析

点击“16S-based ID”

3.新序列鉴定

点击“Identify new sequences”

填写序列名,序列,再点“Next”,再点“Submit”

4.鉴定结果解读

显示鉴定结果如下,包括菌种,株,相似度,分类全称和输入序列完整度,点击“放大镜图标” 查看详细

同一性为 98.7% 作为物种级临界值,94.5% 和 86.5% 的临界值分别用于属和科(Zou, 2018)。更系统的知识,参见 网站帮助  https://help.ezbiocloud.net/truebac-id/#bacterial-identification-101 或作者的综述文章 https://www.microbiologyresearch.org/content/journal/ijsem/10.1099/ijsem.0.002516

点击菌名,可查看详细名称,数据来源类型

再点击 i 图标查看相关文献

返回上一页结果,点击编号(Accession)查看序列详细,

包括编号、序列、名称、菌株、方法、完整度、分类学。以及比对到Greengenes的相关近缘信息。

16S数据库的下载

详见:上面“QIIME和Mothur使用的16S数据库”段落。
申请下载QIIME格式的16S序列和物种注释压缩包,18M左右,更新时间为2018年6月1日。可用于QIIME 和 QIIME 2。也有Mothur的对齐格式数据库 89M,解压后有1.5G。这个数据库的物种注释种类较丰度,来源广泛,也可转换为常用的USEARCH/VSEARCH格式,代码如下:

格式化QIIME为USEARCH

cd db/EzBioCloud/
unzip EzBioCloud_16S_database_for_QIIME.zip
# 修改为usearch格式
sed 's/^/>/;s/\t/\ttax=d:/;s/;/,p:/;s/;/,c:/;s/;/,o:/;s/;/,f:/;s/;/,g:/;s/;/,s:/;' ezbiocloud_id_taxonomy.txt | less -S > ezbiocloud_id_taxonomy_usearch.txt
# 添加至序列文件中
awk 'BEGIN{FS=OFS="\t"} NR==FNR{a[$1]=$2} NR>FNR{print $1,a[$1]}' ezbiocloud_id_taxonomy_usearch.txt ezbiocloud_qiime_full.fasta | sed 's/\t$//;s/\t/;/' | less > ezbiocloud_usearch_full.fasta

参考资料

EzBioCloud官网帮助  https://help.ezbiocloud.net/user-guide/

Yuanqiang Zou, Wenbin Xue, Guangwen Luo, Ziqing Deng, Panpan Qin, Ruijin Guo, Haipeng Sun, Yan Xia, Suisha Liang, Ying Dai, Daiwei Wan, Rongrong Jiang, Lili Su, Qiang Feng, Zhuye Jie, Tongkun Guo, Zhongkui Xia, Chuan Liu, Jinghong Yu, Yuxiang Lin, Shanmei Tang, Guicheng Huo, Xun Xu, Yong Hou, Xin Liu, Jian Wang, Huanming Yang, Karsten Kristiansen, Junhua Li, Huijue Jia, Liang Xiao. (2019). 1,520 reference genomes from cultivated human gut bacteria enable functional microbiome analyses. Nature Biotechnology 37 179-185 doi: 10.1038/s41587-018-0008-8

从EzBioCloud自动下载16S序列 https://mp.weixin.qq.com/s/rECfcjPmB8bJkramJB-DRQ

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

EZBioCloud:16S和原核基因组物种注释和新种鉴定相关推荐

  1. GTDB:基因组分类数据库,物种注释和进化树构建工具GTDB-tk

    简介 基因组分类数据库:GENOME TAXONOMY DATABASE 网址:https://gtdb.ecogenomic.org/ 该数据库已经于2018/2020连续发表两篇Nature Bi ...

  2. Prokka:快速原核基因组、宏基因组基因注释

    文章目录 Prokka:快速原核基因组注释 热心肠日报 摘要 1 简介 2 描述 2.1 输入 2.2 注释 表1 Prokka使用的功能预测工具 2.3 输出 表2. 输出结果介绍 3 结果 表3. ...

  3. Kraken2:宏基因组快速物种注释神器

    简介 kraken是基于k-mer精确比对,并采用最LCA投票结果快速宏基因组DNA序列进行物种注释的软件. 图. Kraken2分类基本原理 该文章于2014年发表于Genome Biology,目 ...

  4. 使用Kaiju无组装计算宏基因组数据物种注释相对丰度

    关于Kaiju Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件.它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对,确认物种分类信息 ...

  5. 宏基因组单样品vamb分箱,gtdb物种注释与建树

    个人记录,其实很多文件夹的设置并不是那么合理. 存放已有序列的文件夹 ./qc 质控后的双端测序文件.fq.gz ./ 当前文件夹,放.fa后缀的contig文件 我的文件名编码是S1-1,S1-2这 ...

  6. 16S OTU物种注释

    ## 1 下载的greengene的参考序列和物种注释信息 ##下载地址 $wget -c ftp://greengenes.microbio.me/greengenes_release/gg_13_ ...

  7. Nature Methods:宏基因组物种组成分析工具MetaPhlAn2

    文章目录 宏基因组物种组成分析工具MetaPhlAn2 导读 主要结果 图1:MetaPhlAn2可以准确地重建鸟枪法宏基因组的分类组成 Reference 扩展阅读 猜你喜欢 写在后面 宏基因组物种 ...

  8. Nature子刊:宏基因组中挖掘原核基因组的分析流程

    宏基因组中挖掘原核基因组的分析流程 从宿主相关的短读长鸟枪宏基因组测序数据中恢复原核基因组 Recovering prokaryotic genomes from host-associated, s ...

  9. MPB:农科院牧医所赵圣国组-基于GraftM对功能基因进行物种注释

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

最新文章

  1. 端口基础常识大全+常用端口对照
  2. 用三个线程实现生产者消费者模型,其中一个线程作为生产者,二个线程作为消费者,生产者随机生产一个时间戳或者字符串,消费者消费这个时间戳,并不能重复消费,并将其打印出来
  3. 世界杯决赛不好看,有点像假球,被裁判黑了?
  4. 无人车时代:用深度学习辅助行人检测
  5. Java Collections API怪癖
  6. 是什么样的骚操作让应用上线节省90%的时间
  7. Windows2008|2003超出最大连接数
  8. 深度学习自学(十二):关键点数据集处理-300VW
  9. shiro权限架作战
  10. php 获取搜索引擎,php获取搜索引擎关键字来源(支持百度、谷歌等搜索引擎)的函数...
  11. c语言error函数的使用方法,IsError_Excel中iserror函数的使用方法
  12. 汇编之EBP的认识。
  13. 是时候转移百度网盘的文件了 MultCloud 来帮忙
  14. 甘超波:NLP检定语言模式
  15. VS册程序设计C#---问卷调查系统
  16. JAVA练习题17:文字版格斗游戏
  17. 给信号添加高斯白噪声
  18. C语言中各种基本数据类型所占空间大小(32位)
  19. mybatis从入门到精通(刘增辉著)-读书笔记第五章
  20. BZOJ.2161. 布娃娃【整体二分】

热门文章

  1. 再见,数据库!MySQL千亿数据分库分表架构,堪称惊艳!
  2. 千亿级数据量的Kafka深度实践
  3. JVM 发生内存溢出的 8 种原因、及解决办法
  4. 立足GitHub学编程:13个不容错过的Java项目
  5. 卓有成效的管理者应该借助哪些团队协作工具?
  6. perfect book
  7. Kinect 骨骼追踪数据的处理方法
  8. js空对象undefined
  9. Oracle Application R11i
  10. 算法笔记-桶排序代码与原理、非比较排序、计数排序、基数排序、C#代码