2018年推出了全新版本的PICRUSt,即PICRUSt2(https://github.com/picrust/picrust2)

PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一款基于标记基因序列来预测功能丰度的软件。

“功能”通常指的是基因家族,如KEGG同源基因和酶分类号,但可以预测任何一个任意的特性。同样,预测通常基于16S rRNA基因测序数据,但也可以使用其他标记基因。

GitHub上的文档中,您可以找到脚本、安装说明和工作流的描述。有关详细信息,请参见github wiki的右侧栏。https://github.com/picrust/picrust2/wiki

PICRUSt2包括这些改进以及与原始版本相比的其他改进:

允许用户预测任何16S序列的功能。来自OTU或扩增序列变体(amplicon sequence variants,ASV,例如DADA2和Deblur输出)的代表性序列可通过序列放置方法用作输入。

用于预测的参考基因组数据库扩大了10倍以上。

从Castor R包中添加隐藏状态预测算法。

允许输出MetaCyc 本体预测,这将可与普通宏基因组学的结果比较。

通路丰度的推断现在依赖于MinPath,这使得这些预测更加严格

工作原理

1、安装

https://github.com/picrust/picrust2/wiki/Installation

仅支持Linux或Mac,且运行至少16G内存。

这里使用推荐的conda安装。

#使用 bioconda 安装 PICRUSt2 环境

conda create -n picrust2 -c bioconda -c conda-forge picrust2

#激活环境

source activate picrust2

#退出环境

source deactivate picrust2

2、准备数据

PICRUSt2无需再以GreenGene注释的OTU表为输入,可以直接读取OTU的代表序列自动完成物种注释,并进一步根据物种丰度组成预测群落功能。

文件“data/otu_table.txt”为OTU丰度表格,仅包含丰度组成信息即可,无需添加注释列。

文件“data/otu.fasta”中包含了OTU丰度表中各OTU的代表序列。

3、PICRUSt2预测群落功能

将上述两个文件作为PICRUSt2的输入。相比PICRUSt1,PICRUSt2的使用可以一键式完成,包括16S物种注释、拷贝数均一化、基因家族的隐藏状态预测、基因组功能推断、功能途径丰度预测等。

#比 picrust1 使用起来省事多了,直接输入原始 OTU 代表序列和丰度表即可

#一个整合多步的快捷命令

#picrust2_pipeline.py -h

picrust2_pipeline.py -s otu.fasta -i otu_table.txt -o picrust2_result -p 4

这是一个打包好多命令组合,傻瓜式运行后即可得到多步结果。根据文档建议,至少需要16GB内存支持(尽管大部分功能实现无需占用这么多内存,所以实际上小于16GB内存也可以使用,但可能要分步实现)。

如想分开运行各步骤,加深对PICRUSt2具体执行过程的理解,可参考:

https://github.com/picrust/picrust2/wiki/Workflow

4、结果说明

输出结果

out.tre,所有OTU代表序列构建的系统发育树文件。

KO_metagenome_out/,该结果路径中记录了细菌群落KO(KEGG Orthology)功能的丰度预测结果。

KO_metagenome_out/seqtab_norm.tsv.gz,对于很多细菌而言,一个个体可能包含多条16S(多拷贝16S),因此在原始OTU 16S rRNA丰度表的基础上,根据物种所含16S rRNA拷贝数对物种丰度进行标准化,得到校正16S rRNA拷贝数后的OTU丰度表。

KO_metagenome_out/pred_metagenome_unstrat.tsv.gz,该文件中即为预测得到的细菌群落功能丰度表,记录了各样本中所包含KO功能的丰度,丰度计算由上述校正16S rRNA拷贝数标准化后的OTU丰度表推断得到。功能以KO ID为名称,代表了特定的功能基因。

KO_metagenome_out/weighted_nsti.tsv.gz,各样本预测功能的加权NSTI值,由OTU的NSTI值通过标准化后的丰度加权所得。

EC_metagenome_out/,该结果路径中记录了细菌群落酶(EC)功能的丰度预测结果。文件结构同上述KO_metagenome_out/,不再展示。

pathways_out/path_abun_unstrat.tsv.gz,上述为预测得到的以KO ID为名称的KO功能,实则代表了特定的功能基因,将这些功能基因映射到具体的KEGG代谢途径(KEGG pathway)中,并统计各途径在各样本中的丰度,获得该表。

KO_predicted.tsv.gzEC_predicted.tsv.gz,两个矩阵文件中记录了OTU对预测功能丰度的贡献,即可以理解为每个OTU所代表的物种个体基因组中,分别有多少数量的基因与对应的KO功能或酶功能有关。如果期望关注哪些OTU是否对群落功能是重要的,这些表格(该表仅代表了单个物种个体基因组的特征,可能还需结合OTU的丰度信息)可以提供参考

marker_predicted_and_nsti.tsv.gz,记录了OTU代表物种基因组中,16SrRNA拷贝数以及功能预测的NSTI值信息。

Intermediate/,一些中间文件。

5、后续分析

获得群落功能丰度表后,就可以按照OTU丰度表的统计分析方法,去执行类似的分析了。这点可以找一些文献作参考,看别人是怎样做的。例如,首先计算特定功能丰度在组间的显著性,获得组间差异显著的功能,然后再从数据库官网上(例如KEGG数据库:https://www.kegg.jp)查询该功能的细节,解释生物学现象等。

16S的细菌群落功能预测工具PICRUSt2学习相关推荐

  1. 基于16S的细菌群落功能预测工具Tax4Fun2

    基于16S的细菌群落功能预测工具Tax4Fun2 回想第一次接触微生物组分析时是2017年,那会儿主流的两个基于16S的细菌群落功能预测工具就是PICRUSt和Tax4Fun,均可以获得类似于宏基因组 ...

  2. 微生物群落功能预测工具

    微生物群落研究主要有16S/ITS多样性测序.宏基因组测序还有宏转录组测序等研究手段.其中16S/ITS等多样性测序由于价格便宜,性价比高而经常使用. 利用16S/ITS多样性测序,我们可以准确知道群 ...

  3. 基因功能预测工具-HMMER的安装

    最近几天需要集中安装软件,尤其是不需要conda安装的,存在依赖的软件,尽量的自己去配置环境变量,针对个别在安装时报错的软件,简单记录一下,等过段时间有了数据后,会再具体的写一些这些软件的具体使用方法 ...

  4. PICRUSt2功能预测分析

    16S高通量测序的群落数据分析中,更深层次的数据挖掘是很重要的一环,但是微生物群落标记基因测序的一个局限性就在于它无法提供有关采样群落功能组成的信息.所以我们引入了功能预测分析. "功能&q ...

  5. 16S+功能预测发Sciences:尸体降解过程中的微生物组

    Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...

  6. MicFunPred——最新16S rRNA扩增子数据功能预测数据库

    近年来,基于扩增子测序进行物种的功能预测是研究微生物群落功能的主要方面,目前最常用的软件包括Tax4Fun以及PICRUSt2.关于这两款软件的使用方法详可参见凌波微课|扩增子研究第十六讲:扩增子测序 ...

  7. 16S+功能预测也能发Sciences:尸体降解过程中的微生物组

    Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...

  8. 文献解读|利用Biolog EcoPlates 和PICRUSt2分析后期虾池细菌群落功能多样性

    TITLE:Analysis of bacterial community functional diversity in late-stage shrimp (Litopenaeus vanname ...

  9. picrust2功能预测-从qiime2安装到数据分析

    记录一下跌跌撞撞地摸索过程 picrust2功能预测 参照公众号<宏基因组>刘永鑫的原创:<PICRUSt2:OTU或ASV等16S随便预测宏基因组且数据库增加10倍>http ...

最新文章

  1. 15 三明治集成方法和混合策略集成方法
  2. 独家 | 图片主题建模?为什么不呢?!
  3. 熟悉常用的HDFS操作
  4. linux中daemonize用法,daemonize Unix系统后台守护进程管理软件
  5. sdut 1730 数字三角形问题
  6. 路由销毁上一页_路由器原理(数据通信)
  7. 拖动滑块拼图背景图没显示_计划B? 那是计划N…没什么。 拼图于2015年问世
  8. Laravel 使用 Aliyun OSS 云存储
  9. 微软宣布明年停止支持已推出25年的IE浏览器
  10. 【LeetCode】15.Longest Common Prefix
  11. 昨天凌晨故宫网站崩了,被众多人“围攻”!留言亮了...
  12. 机器学习库线性回归代码_PyCaret回归:更好的机器学习库
  13. SHELL 脚本检测FTP连接
  14. steam,epic,origin限免游戏推送,持续更新
  15. 个人学习笔记——庄懂的技术美术入门课(美术向)06
  16. 程序员学习资料整理(1)
  17. 【HTTP】Fiddler(二) - 使用Fiddler做抓包分析
  18. Android 获取通话记录和短信内容
  19. 0.1.3-01 合宙CORE-ESP32-C3制作1.3寸ST7789驱动的简单相册
  20. 网络舆情风险评估工作有效做好的实施方案

热门文章

  1. Win11此站点的连接不安全解决教程
  2. EOS Platform产品培训视频
  3. spring-boot项目实例
  4. 2021-12-11 Leetcode 989.数组形式的整数加法
  5. TypeScript报错 Type ‘number‘ is not assignable to type ‘never‘
  6. Spring boot 提示“Whitelabel Error Page”
  7. 计算机网络综合布线通常使用电缆,计算机网络综合布线系统的测试
  8. python replace函数的使用
  9. 经验——从普通一本跨考东北大学计算机研究生
  10. SQL Server2014找不到SQL Server配置管理器解决办法