谷禾健康

为了使研究更系统更全面,越来越多的研究人员追求在多组学背景下解释分子数据。

OmicsNet (www.omicsnet.ca) 顺应而生,这是一个在线平台,允许用户轻松地构建、可视化和分析多组学网络

OmicsNet 2.0在原有基础上进行了升级,主要改进了三个方面:

(1) 可视化分析中2D图形布局选项增加了11个,以及一个新颖的3D模块

(2) 支持三种新的组学类型:

  • 来自遗传变异研究SNP列表
  • 来自微生物组分析的物种丰度矩阵
  • 来自非靶向代谢组学的液相色谱-质谱峰(LC-MS)

(3) 分析时将同时输出使用的R包OmicsNetR和历史命令,并生成共享链接可在网页查看和交互操作,从而提高研究的可重复性。

研究中使用OmicsNet 2.0对炎症性肠病(IBD)的数据进行多组学分析。

OmicsNet 2.0工作流程

如图,主要为4个步骤:

  • 上传数据(支持8种类型的数据)
  • 选择数据库(根据数据类型选择)
  • 构建网络
  • 可视化

OmicsNet 2.0 的改进

1、更新了分子相互作用数据库

包括PPI数据库(STRING,InnateDB和IntAct),TF-target数据库(TRRUST和JASPAR), miRNA-target数据库(TarBase和miRTarBase),代谢数据库(KEGG, Recon3和AGORA)。

2、支持三种新的组学类型

可支持来自遗传变异研究的SNP矩阵、来自非靶向代谢组学的 LC-MS 峰和来自微生物组分析的物种丰度矩阵数据的输入及互作分析。

对于那些对影响基因调控的变异感兴趣的用户,可以分别基于ADmiRE和SNP2TFBS将SNPs映射到miRNAs或TF结合位点。由此产生的网络可以通过proteins、miRNAs或TFs进一步扩展,以了解潜在的影响

对于代谢组学分析,使用最近发布的NetID算法对LC-MS峰(m/z, retention time, intensity和p-value)进行数据处理,可选三种数据库(KEGG, PubChemLite_BioPathway和HMDB)进行注释

使用Rcpp/C++ 引擎重新编写了核心算法,使其速度提高了10 倍以上。使用 lpsymphony 包进一步优化了整数线性规划。

直接上传物种丰度矩阵,可以使用贝叶斯逻辑模型预测潜在代谢物,该模型使用超过 6000 个高质量基因组规模的代谢模型进行训练。

3、代码开源

开放R包OmicsNetR(https://github.com/xia-lab/OmicsNetR),显示分析期间所执行的R命令。结果可输出为网页链接,有效期一个月

4、减少假阳性

对于来自人类和小鼠的数据,提供了一个基于ENCODE、基因型-组织表达(GTEx)或人类蛋白图谱(HPA)的基因表达数据的过滤器,这些过滤器帮助研究人员专注于与生物相关的相互作用,并减少假阳性。

5、支持 2D 和 3D 网络可视化

2D模块可支持11种图形布局3D模块可支持交互。图形化主要基于 igraph 包和 graphlayouts 包。

使用OmicsNet 2.0进行的IBD多组学研究

图A为2D视图,图B为3D视图

将获得的物种丰度矩阵,SNP矩阵和LC-MS峰数据上传至OmicsNet 2.0平台。

利用AGORA数据库预测潜在的微生物代谢物(potential score:0.9)。

利用PhenoScanner对基于eQTLs的基因进行SNP定位

利用KEGG数据库对LC-MS峰进行注释。

通过添加代谢物-蛋白质相互作用,从SNPs和LC-MS峰生成的个体网络进一步扩大,这样三个网络可以在代谢组学层合并

p-value过滤:(cut-off: 0.2)来排除p值较大的LC-MS峰值所贡献的节点。其网络连接基于其相关代谢物、基因或蛋白质。

如图A,生成的子网络1包含六种类型的节点(物种、SNPs、代谢物、SNPs或代谢物相关的基因/蛋白质),结果显示出glutathione是宿主-微生物相互作用中的重要交互作用点

由此推测包括大肠杆菌在内的几种微生物会产生glutathione,两个SNPs(rs3197999和rs1428554)通过编码谷胱甘肽过氧化物酶(GPx)的基因GPX1和GPX3与代谢产物相关

与此呼应的是,在以往的研究中证明大肠杆菌和相关物种在IBD中的过度表达可能是由于它们能更好地产生glutathione以抵抗氧化应激。

图B的3D分层网络提供了一个直观的多组学整合视角,突出显示了连接微生物组和宿主遗传的glutathione的流动路径。

OmicsNet 2.0与其它工具的比较

如下表,比较OmicsNet 2.0与其他基于web的多组学集成工具的关键特性

‘√’表示支持,‘-’ 表示缺失,“+”表示定量评估(“+”越多表示更好的支持)

附带各工具的官网及主要特点描述:

PaintOmics

(http://www.paintomics.org)

专注于在视觉上呈现多组学数据的探索分析,包括转录组学,代谢组学,表观基因组学,miRNA和转录因子,将其映射到KEGG通路联合分析。

MergeOmics

(http://mergeomics.research.idre.ucla.edu)

整合了来自单个组学层面的关联研究的汇总统计数据,以及不同功能基因组学数据,以获得机理上的见解,最近还加入了多组学信息的药物重新定位(drug repositioning)。

OmicsAnalyst

(https://www.omicsanalyst.ca)

基于输入的数据,利用多元统计、相关性分析和聚类方法,结合网络、热图和散点图进行多组学分析。

Arena3D

(https://www.arena3d.org)

擅长使用基于3D的分层布局对多层网络进行交互式可视化,适用于多组学网络数据。

NedRex

(https://nedrex.net)

是一个Cytoscape插件,专注于疾病模块识别药物再利用,使用各种模块识别和优先排序算法。

MetScape

(http://metscape.ncibi.org)

是一个Cytoscape插件,通过构建和分析不同类型的含有酶、代谢物和/或反应的网络,专注于基因表达和代谢组学数据的集成和可视化

OmicsNet

(https://www.omicsnet.ca)

通过将多个分子互作数据库与强大的2D/3D可视化网络分析相结合,对于多组学集成分析结果解释更好的理论基础,对以上工具的不足做了补充

结 语

OmicsNet 2.0是一个基于网络的多组学分析平台,支持2D和3D网络可视化探索

1.0版本中强调基于web的3D网络可视化

2.0版本中,进一步改进了其可视化分析系统,添加了一个功能完整的2D网络可视化系统,并支持三种新的组学数据输入(SNPs、微生物分类单元和LC-MS峰),目前的生物信息学工具无法很好地支持这些数据。

除了富集分析、搜寻模块和最短路径分析,用户还可以使用重启随机游走算法(Random Walk with Restart)搜索候选疾病标记物。最后,2.0版本通过发布底层的R代码和共享链接,改进了工具的可再现性和透明度

使用IBD多组学数据的案例研究表明,OmicsNet 2.0可以揭示与原始出版物和后续出版物以及IBD文献一致的有意义的模式、关系和功能。总之,OmicsNet 2.0解决了对多组学数据进行分析的一些需求。

参考文献:

Zhou G, Pang Z, Lu Y, Ewald J, Xia J. OmicsNet 2.0: a web-based platform for multi-omics integration and network visual analytics. Nucleic Acids Res. 2022 May 26:gkac376. doi: 10.1093/nar/gkac376. Epub ahead of print. PMID: 35639733.

介绍一款|用于多组学整合和网络可视化分析的在线平台相关推荐

  1. 利用多组学整合鉴定人类疾病共享的和疾病特异性的宿主基因-微生物组关联

    利用多组学整合鉴定人类疾病共享的和疾病特异性的宿主基因-微生物组关联 2022-05-23 本文系谷歌翻译 原文:Identification of shared and disease-specif ...

  2. 百趣代谢组学文献分享:三组学整合分析在中医药研究中的应用

    组学研究中经常会涉及到转录组-代谢组.代谢组-蛋白组等两个组学之间的关联分析,但小伙伴们有碰到过代谢组.转录组.蛋白组3个组学的整合研究吗?百趣生物小趣和大家分享一篇代谢组.转录组和蛋白组3组学整合分 ...

  3. 生信多组学整合工具的比较研究

    今天给大家要分享是昆士兰科技大学Sathyanarayanan在Briefings in Bioinformatics(IF: 8.990)杂志上发表的论文.作者比较了九种不同的多组学数据整合工具,对 ...

  4. Top7大网络可视化分析工具介绍

    目前,我们可以在市场上找到很多用于网络分析和数据可视化的开源工具,例如NetworkX,R和Gephi中的iGraph包等.在所有工具中,Gephi一直以来被认为是最值得推荐的,它可以帮助用户轻松实现 ...

  5. iNetModels 2.0多组学整合网站的使用

    揭示各种omics数据之间的关联对于全面了解 在人类健康和疾病中改变的生物过程和疾病的改变至关重要.到目前为止,很少有研究集中在单一数据库中收集和展示多组学关联 .在此,我们提出了iNetModels ...

  6. 代谢组学数据分析及网络药理学研究技术与实践

    一.代谢组学研究技术与实践 1.代谢组学简介及样本的采集与制备关键问题探讨 1.1 代谢组学概述 1.2 代谢组学操作流程 1.3 样本的采集.储存与制备关键问题 2.代谢组学数据采集与预处理,决定数 ...

  7. 「nature protocols」组学数据的通路富集分析和可视化: g:Profiler, GSEA, Cytoscape 和 EnrichmentMap...

    nature protocols上发了一篇文章,题目为"Pathway enrichment analysis and visualization of omics data using g ...

  8. 多组学整合2连发,肠道研究新突破:人参残渣有大用

    最近,派森诺与中国农业科学院特产研究所合作,在<Food Chemistry>和<Journal of Functional Foods>相继发表论文,通过高通量测序.代谢组检 ...

  9. 单细胞多组学数据介绍①——甲基化数据

    单细胞多组学数据介绍①--单细胞甲基化数据 一.甲基化数据格式介绍 1.cpg level data 2.feature level data 3. loading data 二.分析方法 1./QC ...

最新文章

  1. linux vim project,vim插件project的用法
  2. VirtualDOM与diff(Vue实现)
  3. hdu 5317 RGCDQ (2015多校第三场第2题)素数打表+前缀和相减求后缀(DP)
  4. Eclipse中将java类打成jar包形式运行
  5. caffe专题五——回归中——检测框架
  6. java 判断日期连续_如何在Java中检查日期是否大于另一个日期?[重复]
  7. Spring Cloud 入门 之 Config 篇(六)
  8. presto是如何保证作业内存不会发生冲突和溢出
  9. 干的漂亮!一夜之间GPS在南海信号全无,美军只能干瞪眼
  10. AngularJS开发指南
  11. oracle 设置会话的编码,在Oracle中使用登录触发器初始化用户会话
  12. vscode-代码文件对比
  13. t-SNE 高维数据可视化
  14. 2016.8.14安装myplayer心得
  15. chm 已取消到该网页的导航,打不开
  16. 本地搭建Git服务器,两台电脑共享代码如此简单
  17. javacv 人脸追踪_基于JavaCV的人脸识别程序
  18. 报错:跨域问题解决 No ‘Access-Control-Allow-Origin‘ header is present on the requested resource.
  19. seo文案策划的一些日常工作内容
  20. 【视频处理】视频拼接视频缝合手把手教你

热门文章

  1. 如果QIR能够换回项目成功,我愿用一生敏捷
  2. Redis(16) -- Redis集群
  3. Ubuntu下android-4.0.3_r1源码下载,阅读工具安装配置,源码编译详解
  4. Linux解决tar:它似乎不像是一个tar归档文件
  5. Cloudcompare点云渲染的多种方式
  6. 远程监控系统项目总结
  7. 正弦波,三角函数,波形
  8. QT 杀毒软件(课设)
  9. 多人在线屏幕分享工具-join me
  10. linux目录改为英文