MicFunPred——最新16S rRNA扩增子数据功能预测数据库
近年来,基于扩增子测序进行物种的功能预测是研究微生物群落功能的主要方面,目前最常用的软件包括Tax4Fun以及PICRUSt2。关于这两款软件的使用方法详可参见凌波微课|扩增子研究第十六讲:扩增子测序结果中的物种功能预测。
Tax4Fun使用最近邻匹配方法,但只有在大量参考基因组可用时才能正常运行;而PICRUSt2依赖于系统发育树和祖先状态重建来预测基因功能,这一点一直存在争议。同时,由于基于部分区域测序的16S rRNA扩增子数据无法在属级之外实现准确分类,因此这些工具可能会输出大量假阳性的结果。
基于这些问题,2021年《Genomics》期刊最新发布了一款综合性的16S rRNA扩增子数据功能预测数据库——MicFunPred。
MicFunPred是一个独立且易于访问的网络服务器(http://micfunpred.microdm.net.in/),可仅使用一组核心基因在属级分类学中预测微生物群落的功能潜力,从而最大限度地减少假阳性预测。
MicFunPred的工作流程如下:
图1 MicFunPred功能预测工作流程
研究者从微生物基因组(IMG)数据库(https://img.jgi.doe.gov/faq.html)下载了人类、水生、植物、陆地和哺乳动物生态系统的共32,453个基因组数据。使用来自这些基因组的16S序列以及Greengenes (v13_5)、SILVA (v132)和EZBiocloud(v2018.05)数据库的序列开发了MicFunPred综合的16S rRNA基因数据库。MicFunPred能够预测KEGG Orthology(KO)、酶委员会(EC)、Pfam、TIGRFAM和COG方面的功能特征。
图2 MicFunPred数据库在线web服务器
研究者使用来自多个扩增子和宏基因组的项目数据来检测MicFunPred的性能,同时还在模拟数据集上进行了测试。在模拟数据集上,MicFunPred显示出比PICRUSt2、Piphillin和Tax4Fun2更高的相关性(Spearman=0.89)和最低的假阳性率。而在七个真实数据集上,MicFunPred平均相关性为0.75。与其他工具相比,MicFunPred速度更快,需要的计算能力较低,并且性能更好。
图3 MicFunPred和其他工具在模拟数据集上的性能比较
图4 MicFunPred和其他工具在真实数据集上的性能比较
MicFunPred网站地址如下:
http://micfunpred.microdm.net.in/
数据库下载地址如下:
https://github.com/microDM/MicFunPred
参考文献
MicFunPred: A conserved approach to predict functional profiles from 16S rRNA gene sequence data. Genomics, 2021.
MicFunPred——最新16S rRNA扩增子数据功能预测数据库相关推荐
- 如何用16s rRNA测序数据计算特定菌种的相对丰度并比较
计算特定菌种的相对丰度并比较的一般步骤如下: 序列数据处理: 对16S rRNA测序数据进行去噪.去除低质量.合并重复和去除污染的步骤. 比对和分类: 使用比对工具将序列数据与参考数据库中的基因组进行 ...
- NCBI数据库—上传16S rRNA测序数据
NCBI上传16S rRNA测序数据 1.登陆NCBI官网 NCBI官网链接 2.选择上传序列类型 上传16S rRNA测序数据,直接选16S rRNA就可以,然后弹出上传数据集的类型,选择SRA 3 ...
- 【R生态】基于16S的细菌群落的功能预测
- Microbiome: 再论扩增子功能预测分析(Picrust)的效果
Picrust作为扩增子测序功能预测的工具已经被广泛使用了.但是它会与真实情况存在较大的偏差,详见前文对Picrust局限性的介绍: PICRUSt不灵啦?别慌,它一直都不咋灵~ 此文中我推断预测的准 ...
- 16S+功能预测发Sciences:尸体降解过程中的微生物组
Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...
- 16S+功能预测也能发Sciences:尸体降解过程中的微生物组
Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...
- 16S的细菌群落功能预测工具PICRUSt2学习
2018年推出了全新版本的PICRUSt,即PICRUSt2(https://github.com/picrust/picrust2) PICRUSt2 (Phylogenetic Investiga ...
- RiboFR-Seq:将16S rRNA与宏基因组连接的方法
摘 要 16S rRNA扩增子分析和宏基因组测序是研究微生物群落的两种主要的独立方法.近年来,许多研究将这两种方法结合起来使用,但下游的数据分析是分开进行的,在分类和功能上总是产生不一致或冲突的结果 ...
- PICRUSt2功能预测分析
16S高通量测序的群落数据分析中,更深层次的数据挖掘是很重要的一环,但是微生物群落标记基因测序的一个局限性就在于它无法提供有关采样群落功能组成的信息.所以我们引入了功能预测分析. "功能&q ...
最新文章
- web浏览器_如何在iPhone和iPad上更改默认的Web浏览器
- C++运算符重载形式--成员函数or友元函数?
- RocketMQ主机磁盘空间有限,如何无限期延长消息存储?
- nfs failed, reason given by server: Permission denied的离奇解决
- 需要c语言,需要C语言的需要什么工具软件
- 华为云发布国内首个 AI 模型市场,加速企业 AI 应用落地
- 为什么很少人学汇编_要想精通C语言,必须先学习汇编吗
- php查询sql语句错误,Thinkphp3.2.3在SQL执行错误时查看SQL语句
- eplise怎么连接数据库_Eclipse怎么打开数据库?Eclipse连接oracle等数据库的教程
- C语言小游戏,游戏设计,500+行代码
- flashFxp连接不上服务器。
- 运维工作5年简历写成这样,谁敢要你
- 3个基于 Spring Boot 的图片识别处理系统
- 【Redis】Redis 哈希 Hash 键值对集合操作 ( 哈希 Hash 键值对集合简介 | 查询操作 | 增加操作 | 修改操作 )
- 大规模时间序列数据自动异常检测架构
- 常见的树形结构(一)
- [运算放大器]佛朗哥笔记 - 有源滤波器I - KRC滤波器
- 【ACWing】2135. 马步距离(配数学证明)
- python进行数据处理_用python进行数据分析(二:数据处理)
- 1.网络变成操作系统详解