阅文笔记:Predicting microbial interactions through computational approaches

1.Abstract:

背景:微生物在复杂的生态环境中扮演着越来越重要的角色。了解微生物间的关系是理解微生物组织和社群的功能的基础。而通过计算方法进行研究微生物间的关系已变为一种广泛使用的方法。目的:对当前存在主流的计算方法通过研究角度的不同分别进行论述:宏基因组学,代谢网络,文本挖掘意义:突出强调文本挖掘在微生物交互领域的前景巨大

2.Introduction

 在自然界中,微生物之间并不是孤立存在,而是不同类型的微生物有机结合构成一个微生物社群,而构成的这个微生物社群成为microbiome。微生物社群在宏观层面上表现出它的自然属性和功能,这些显性的表达式微生物间互相作用的集中体现。了解微生物间的关系作用就显得格外的重要,特别是在加深组织群落的结构功能、生物工程以及工业应用方面等。其中成对(pair-wise)的微生物关系是微生物关系网络的基础。单对的微生物关系可以宏观分为三种:positive,negative,neutral而现存主要的六种关系:mutualism (positive-positive), competition (negative-negative),antagonism (positive-negative), commensalism (positive-neutral),amensalism (negative-neutral) and neutralism (neutral-neutral).传统的研究微生物间的关系是通过生物学上的共培养来进行研究,但是这种方法不适合大规模的应用。通过计算性的方法能够大规模的预测微生物间的关系,找出潜在的微生物关系来进行后期的针对性研究,这样省时省力。按照计算方法利用数据类型的不同,将现主流的计算方法分为了三类:1.基于高通量测序获得的物种丰度数据2.重建微生物的代谢网络3.现有文献进行文本挖掘

3.Inferring interactions from metagenomic survey data

高通量测序就是将一个微生物社群的所有DNA数据以相对公正的方式进行进行测序,以样本计数的方式记录到数据矩阵中进行分析。高通量测序可以通过同一地区的不同时间或者不同地区测序,分为两类。

3.1 Microbial interaction inference with spatial metagenomic survey data

该方法就是测量不同地区的高通量测序。例如:测序人体不同部位的微生物社群的基因丰度。通过这些数据方法出来的模式按粗粒度分为:co-occurrence or co-exclusion and correlation(1对1),more complex associations such as limited cycles in predator-prey systems(1对多)。1.Using co-occurrence or co-exclusion patterns衡量两个物种在一个微生物社群中的依赖强度,通过比较其中一个物种和随机物种之间的依赖度。这种依赖度表现为生态距离(相似度)2.Using correlated abundances判断一个微生物社群中两个物种的相关度,常用指标有Pearson和Spearman系数。但是存在一个compositional effect需要解决。由于,微生物社群中所有物种的丰度数据抖都制约于权重,其总和为1。在一种物种的丰度变高时,必然有一种或者多种物种的丰度变低,这就产生了两个变量,一个是真实存在的物种相关性,一个是权重为1而导致的物种相关性。显然,后者是无关变量。如何控制这个变量‘恒定’,这就是compositional effect。以下是常用的几种方法。

3.Predicting complex associations4.Benchmarking and integrating different methods衡量不同方法的标准

3.2 Interaction inference with temporal metagenomic survey data

目前,缺乏时间序列的高通量数据,相对于空间上的高通量数据而言,时间序列数据是动态的,更能直接的推断出微生物间的关系。方法:1.LSA(local similarity analysis)2.gLV

4.Predicting interactions from genomic information

由于研究方向的原因,这块内容只做简单的概念介绍。

4.1 Microbial interaction inference using metabolic network topology

通过生物体和环境的代谢产物循环来进行微生物间关系分析和预测。

4.2 Predicting interactions with community constraint based models

基于单一生物约束的扩展建模(CBM)进行代谢作用分析。

5.Mining interactions from scientific literature

利用现有文献,从现用文献中挖掘已有的微生物关系。人工检阅和校验已有的文献显然是不可行的。(数据量大,人工的耗时性,人工的专业水平权威性和差异性等一系列不可控因素)。文本挖掘技术在生物医学领域得到了广泛的应用。例如:蛋白质-蛋白质之间的关系等。早在2010年Freilich et al.就基于文本挖掘技术在pubmed的摘要级上以实体共现的技术进行细菌间的关系挖掘。技术:1.Rule-based :基于规则的方法是通过已有文献中的实体信息抽取出来的特征,以召回率为代价提高精确度。这一方面优于机器学习方法。缺点:找出的特征只适应于已有的实体结构,当文献更新和有新的实体出现时,该方法就不适应了。该方法在大的数据集中,需要特征也需要大量的专业人员进行人工干预。2.Machine Learning:有一批标记好的数据作为训练集对模型进行训练,将训练好的最终模型来对已有文本进行预测。优点:特征自动学习,不需要人工干预。学习速度快,适应新的信息结构。缺点:需要大量的,质量高的标注数据来训练模型结构,而在微生物领域中,还没有丰富质量高的标注好的数据集和评判标准。已有的微生物文献库对实体的命名也各有不同。

6. Conclusion

就文本挖掘角度而言,该方法兴起不久且研究意义巨大。但由于兴起不久,导致在该研究领域数据集上没有统一标准。
故从数据的可靠性和质量上,需要做的工作还很多。特别是近几年深度学习如日中天,对微生物关系利用深度学习进
行文本挖掘前景巨大。此前,首先要做的就是获得一个质量高且公信力强的数据集,做好数据预处理一块。
在如何评判数据集制作的好坏,由于现在还没有统一的评判标准,就需要将数据集和已有的通用领域或其他领域数据集
进行对比,在其他标准数据集上根据领域特殊性进行适当的调整和修改,进行完善。将不同方式标注和不同大小的数据
集应用于不同的模型中进行比较、归纳。选取‘最优’的数据集和模型组合。

Predicting microbial interactions through computational approaches相关推荐

  1. Graph Convolutional Neural Networks for Predicting Drug-Target Interactions

    1. 摘要 2. 数据集 DUDE数据集改进 DUDE-chemBl负样本数据集 最大无偏数据集(MUV) 3. 图构建 pocket graph molecuar graph 4. 口袋pretra ...

  2. 「论文翻译」Predicting Drug-Target Interactions Using Weisfeiler-Lehman Neural Network

    IEEE EMBS International Conference on Biomedical & Health Informatics ICBHI 2019(应该是B类) 文章目录 Abs ...

  3. 【微生物研究】微生物交互关系研究论文摘要集锦

    微生物交互关系研究论文摘要集锦 296. A computational exploration of bacterial metabolic diversity identifying metabo ...

  4. Paper reading (二十二):Integrated omics: tools, advances and future approaches

    论文题目:Integrated omics: tools, advances and future approaches scholar 引用:12 页数:25 发表时间:2018.07 发表刊物:J ...

  5. 想要出国读博作博后的看过来:德国马普育种所植物与微生物互作方向招收3名博士1名博后

    植物微生物组方向招生招聘 4 DFG-funded positions to study the plant microbiota 德国科隆马克思普朗克植物育种研究所植物与微生物互作中心现向海内外招收 ...

  6. Accurate prediction of molecular targets using a self-supervised image rep...(论文解读)

    Accurate prediction of molecular targets using a self-supervised image representation learning frame ...

  7. Soil Ecology Letters被ESCI收录

    2021年5月5日,Soil Ecology Letters 被Emerging Source Citation Index(ESCI)数据库正式收录.这是创刊1年多之后,本刊入选的又一国际重要数据库 ...

  8. MMinte:预测微生物群体内代谢物互作

    科学问题:我们仍然无法直接确定生态系统的边界.微生物间互作.微生物与环境的互作. 结果:MMinte评估群体中成对物种的代谢物对相对成长速率的影响,判断对其生长的正.负相关效应. 结论:MMinte可 ...

  9. 用少于10行代码训练前沿深度学习新药研发模型

    ©PaperWeekly · 作者|黄柯鑫 学校|哈佛大学硕士生 研究方向|图学习和生物医疗 深度学习正在革新药研发行业.在本文中,我们将展示如何使用 DeepPurpose,一个基于 PyTorch ...

  10. 【论文阅读】时间序列中的变量是一张知识图谱

    论文标题: Recurrent Event Network: Autoregressive Structure Inference over Temporal Knowledge Graphs 中文标 ...

最新文章

  1. 自然语言处理NLP之文本摘要、机器翻译、OCR、信息检索、信息抽取、校对纠错
  2. 把二叉搜索树转换为累加树
  3. java学习笔记9--内部类总结
  4. github 运行python_Github Actions教程:运行python代码并Push到远端仓库
  5. LINUX/UNIX 一些目录名称术语解释
  6. [组件] TopN 排行榜
  7. mysql8审计_审计对存储在MySQL 8.0中的分类数据的更改
  8. Oracle sqlplus使用总结
  9. vue引入如何使用不同字体
  10. postgresql 索引状态_PostgreSQL中的锁:3.其他锁
  11. 55欧式空间02——标椎正交基、Schmidt 正交化、正交矩阵、欧氏空间的同构、QR分解
  12. Asp.Net MVC 控制器
  13. Extjs4循序渐进(一)——开始Ext
  14. 微型计算机控制技术第二版答案第四章,微型计算机控制技术答案第四章2.pdf
  15. 手机运动测试软件,手机运动软件哪个好?手机运动app排行榜
  16. bldc 原理 方波控制_浅析无刷直流电机FOC、方波、正弦波控制!
  17. sdcc和C51中断程序
  18. 罗振宇2021跨年演讲5:为什么你要建成自己的“黄鹤楼”?
  19. 社区团购怎么做_分享有哪些方法可以做社区团购小程序
  20. RAS--远程访问服务

热门文章

  1. 流式处理术语解释:Exactly-once与Effectively-once
  2. Partial Multi-Label Learning with Label Distribution-(PML-LD)-文献翻译
  3. 大数据核心技术之分布式基础入门
  4. win10办公局域网共享文件夹方法
  5. win10九月十五更新补丁导致共享打印机无法连接
  6. linux查看压缩文件的大小,Linux下不解压压缩文件如何直接查看某个文件大小
  7. #定位系统性能瓶颈# sysdig
  8. Android系统10 RK3399 init进程启动(十七) Verbose日志级别打开方式
  9. 传奇私服服务器修改沙巴克时间,新手教程:如何修改沙巴克名称
  10. 百度地图-将经纬度转化为地址