主要参考这个网站,是由CoNet的作者写的(点阅读原文直达)。

http://psbweb05.psb.ugent.be/conet/microbialnetworks/index.php

Microbial association network construction tutorial

宏基因组公众号之前对该网站进行了翻译整理:

微生物相关网络构建教程:MENA, LSA,SparCC和CoNet

但是后来网站又增加了新的方法SPIEC-EASI。

另外他们还做了一个介绍网络方法的PPT,可以在网站上直接下载。也可以在我公众号里回复“网络”获取pdf链接。

在网站的Resources中有所有方法的参考文献,可根据需要自行阅读。

下面对PPT的内容进行简单介绍。核心内容如下:

Begin

背景

微生物之间的共现(Co-occurrence)可能有以下几种原因,他们可能具有一定的生态关系,或者在生态位上有重叠。

物种的关系可能是此消彼长、或者共增共减。

实现网络的技术及存在的问题

目前有两种实现网络的技术,第一种是基于相似性。

不管是基于abundance还是incidence的数据,都可以计算成对物种之间的相似度矩阵,并随机化数据反复计算。

考察实际相似度与打乱后相似度的显著性差异。

最后保留具有意义的相似度并可视化。

其存在的问题包括:

1.双零问题(double zeros):

微生物数据存在很多的0值。但是我们不知道该物种是低于检测限还是真的不存在。

因此当存在很多0,就会得到很高的相似度。

如下表所示,增加了0值后相似度显著的升高了。

因此对于双零值,算法中要避免得到很高的相似度。

2. 群落组成的问题:

由于每个样本测序深度不同,因此即使物种个数相同,所占比例也不同。因此需要标准化,可以用每个样本物种的个数除以总样本物种的个数;或者重抽到相同深度。

另外pearson和 spearman考虑的是绝对值,因此标准化后会带来很大的偏差。而基于比例或者对数比例(log-ratio)的方法不受数据组成的影响,因为标准化后数据之间的比例不会变。具体如下图所示,标准化后pearson相关性改变了。

第二种实现网络的技术是基于回归。将物种划分为source和target,使用多元回归计算物种之间的关系。

也是要随机化数据重复计算。根据实际回归系数与随机得到的回归系数的关系进行判定。

其优点在于可以检测多个物种的关系;并可以预测不对称的关系(如偏利共生)。

缺点在于会出现假阳性、过拟合,且难以可视化。

实现网络的工具

SparCC

SparCC使用对数比例的方差来计算物种之间的相关性。

SparCC 对观测到的数据拟合狄利克雷分布,对物种的比例及相关性计算迭代计算多次。最后得到的相关性为分布的中位数。P值采用bootstrap方法计算。

SparCC是基于Python的软件,详见

https://bitbucket.org/yonatanf/sparcc/src/default/

MENA

Molecular ecological network analysis pipeline

其核心在于随机矩阵理论(Random matrix theory, RMT)。

计算给定阈值的pearson相关矩阵的特征值间距分布;

对于整个阈值范围都进行计算;

保留分布由高斯分布变为泊松分布的阈值;

保留阈值以上的所有相关性。

LSA

Local similarity analysis

计算时间序列之间的相似性。由于考虑了滞后效应,可以得到直接连接和不直接连接的边。这种方法在海洋和湖泊宏基因组中很受欢迎。基本计算原理和基于相似性的网络相同,只是将相似性按照时间进行了分割。

CoNet

基于组合效应(Ensemble-based)的网络

不同相关性计算方法(pearson,spearman,bray-curtis)可表达不同的关系,但是随着阈值的增加彼此的结果会趋同。

不同方法也会存在不同的错误,但是对于正确的结果却是一致的。

因此可将不同方法结合起来。

对于每条边和每种方法,分别计算permutation和bootstrap分布。两者相比较得到最终的P值。

最后总结一下,四种方法各有特色:

MENA强项在于阈值的算法,且不需要人为设定阈值。

Sparcc特色在于相关性的计算方法。

LSA引入了时间序列。

CoNet将多种相关性综合考量。

微生物网络构建原理: SparCC, MENA, LSA, CoNet相关推荐

  1. 【生物信息学】基于SparCC, MENA, LSA, CoNet构建微生物相互作用网络

    基于SparCC, MENA, LSA, CoNet构建微生物相互作用网络 背景介绍 网络推断技术用于宏基因组学及其存在的问题 实现方法和工具 SparCC MENA LSA CoNet SPIEC- ...

  2. 微生物相关网络构建教程:MENA, LSA, SparCC和CoNet

    点击上方蓝色「宏基因组」关注我们!专业干货每日推送! 原文为自自Microbial association network construction tutorial http://psbweb05. ...

  3. SparCC的微生物网络构建示例

    SparCC的微生物网络构建示例 续前文"微生物共发生网络",本篇继续简介SparCC的网络构建方法. 基于高通量测序的技术,例如16S rRNA分析,为阐明天然微生物群落的复杂结 ...

  4. SPIEC-EASI的微生物网络构建示例

    SPIEC-EASI的微生物网络构建示例 续前文"微生物网络",本篇继续简介SPIEC-EASI的网络构建方法. 16S rRNA测序技术为揭示了微生态系统中的系统发育和微生物种群 ...

  5. ISME:微生物网络构建与分析面临的挑战

    关注我们 一起探索微生物领域的奥妙 摘要 微生物网络作为当下一种流行的数据分析方法被广泛应用于微生物群落研究.虽然目前已有许多并不断有新的微生物网络构建方法被开发出来,但与数据预处理.混杂因素.网络评 ...

  6. 微生物相关网络构建教程中文Microbial association network construction tutorial

    原文为自Microbial association network construction tutorial http://psbweb05.psb.ugent.be/conet/microbial ...

  7. rda冗余分析步骤_分子生态网络分析(MENA)构建微生物网络示例

    分子生态网络分析(MENA)构建微生物网络示例续前文"微生物共发生网络",本篇继续简介分子生态网络分析(Molecular Ecological Network Analysis, ...

  8. 生成式对抗网络(GAN)原理推导与网络构建思路

    0 引言 设想这样的场景:你是一个工作室的老板,你的工作室主要用来生产名画的赝品:而真正的名画则为前人所创造,存放在收藏室中.你的赝品画会和真品画一起被鉴定家鉴定,而你的终极目标是成为一个以假乱真的工 ...

  9. FEMS综述: 如何从微生物网络中的“毛线球”理出头绪(3万字长文带你系统学习网络)...

    如何从微生物网络中的"毛线球"理出头绪 From hairballs to hypotheses–biological insights from microbial Lisa R ...

最新文章

  1. 网络工程师中级2018 2019 2004-2017年真题+答案【结构介绍】
  2. ASP.NET开发要抛弃ASP旧习和破烂
  3. 从运营角度看待UE设计
  4. 母板页中的图片路径及页面链接路径设置
  5. CCNA课堂精简笔记
  6. 人脸识别时一定要穿衣服!小心被看光光......
  7. Swift项目中不能定义OC类继承Swift类
  8. Python 基础——tuple与list、append与extend
  9. 易语言模拟按键 c打不出,易语言怎么编写模拟按键
  10. 组件实例对象与Vue实例对象
  11. TI Sitara系列AM3352/AM3354/AM3359 ARM Cortex-A8方案分享
  12. ServiceMesh实战-服务网格是什么?
  13. 大环境之下软件测试行业趋势能否上升?
  14. android 帧动画监听,Android 动画(View动画,帧动画,属性动画)详细介绍
  15. FPGA烧录程序遇到的问题
  16. BlumNet: Graph Component Detection for Object Skeleton Extraction阅读笔记
  17. 书论57 陈绎曾《翰林要诀》
  18. 《A Comprehensive Study on Waste Segregation Techniques》论文笔记
  19. 53 张图详解防火墙的 55 个知识点
  20. 19张动作速写参考,人物灵活就靠这些!

热门文章

  1. 学习Linux命令(28)
  2. 电大计算机专业英语形成性考试,《计算机专业英语》形成性考核册答案
  3. leetcode系列-617.合并二叉树
  4. 两会2023农业划重点 农民丰收节-万祥军:议案提案农业声音
  5. 宽带放大器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  6. 【备注】【C24】《Android 3D游戏开发技术详解与典型案例》PDF 下载
  7. win10 设备管理器中的黄色感叹号(华硕)
  8. matlab误差分析报告,误差理论与数据处理实验报告
  9. 基于PDM的 标准件库管理
  10. 深度学习基础--不同网络种类--尖峰神经网络/脉冲神经网络(spiking neural network, snn)