介绍一款|用于多组学整合和网络可视化分析的在线平台
谷禾健康
为了使研究更系统更全面,越来越多的研究人员追求在多组学背景下解释分子数据。
OmicsNet (www.omicsnet.ca) 顺应而生,这是一个在线平台,允许用户轻松地构建、可视化和分析多组学网络。
OmicsNet 2.0在原有基础上进行了升级,主要改进了三个方面:
(1) 可视化分析中2D图形布局选项增加了11个,以及一个新颖的3D模块。
(2) 支持三种新的组学类型:
- 来自遗传变异研究SNP列表
- 来自微生物组分析的物种丰度矩阵
- 来自非靶向代谢组学的液相色谱-质谱峰(LC-MS)
(3) 分析时将同时输出使用的R包OmicsNetR和历史命令,并生成共享链接可在网页查看和交互操作,从而提高研究的可重复性。
研究中使用OmicsNet 2.0对炎症性肠病(IBD)的数据进行多组学分析。
OmicsNet 2.0工作流程
如图,主要为4个步骤:
- 上传数据(支持8种类型的数据)
- 选择数据库(根据数据类型选择)
- 构建网络
- 可视化
OmicsNet 2.0 的改进
1、更新了分子相互作用数据库
包括PPI数据库(STRING,InnateDB和IntAct),TF-target数据库(TRRUST和JASPAR), miRNA-target数据库(TarBase和miRTarBase),代谢数据库(KEGG, Recon3和AGORA)。
2、支持三种新的组学类型
可支持来自遗传变异研究的SNP矩阵、来自非靶向代谢组学的 LC-MS 峰和来自微生物组分析的物种丰度矩阵数据的输入及互作分析。
对于那些对影响基因调控的变异感兴趣的用户,可以分别基于ADmiRE和SNP2TFBS将SNPs映射到miRNAs或TF结合位点。由此产生的网络可以通过proteins、miRNAs或TFs进一步扩展,以了解潜在的影响。
对于代谢组学分析,使用最近发布的NetID算法对LC-MS峰(m/z, retention time, intensity和p-value)进行数据处理,可选三种数据库(KEGG, PubChemLite_BioPathway和HMDB)进行注释。
使用Rcpp/C++ 引擎重新编写了核心算法,使其速度提高了10 倍以上。使用 lpsymphony 包进一步优化了整数线性规划。
直接上传物种丰度矩阵,可以使用贝叶斯逻辑模型预测潜在代谢物,该模型使用超过 6000 个高质量基因组规模的代谢模型进行训练。
3、代码开源
开放R包OmicsNetR(https://github.com/xia-lab/OmicsNetR),显示分析期间所执行的R命令。结果可输出为网页链接,有效期一个月。
4、减少假阳性
对于来自人类和小鼠的数据,提供了一个基于ENCODE、基因型-组织表达(GTEx)或人类蛋白图谱(HPA)的基因表达数据的过滤器,这些过滤器帮助研究人员专注于与生物相关的相互作用,并减少假阳性。
5、支持 2D 和 3D 网络可视化
2D模块可支持11种图形布局,3D模块可支持交互。图形化主要基于 igraph 包和 graphlayouts 包。
使用OmicsNet 2.0进行的IBD多组学研究
图A为2D视图,图B为3D视图
将获得的物种丰度矩阵,SNP矩阵和LC-MS峰数据上传至OmicsNet 2.0平台。
利用AGORA数据库预测潜在的微生物代谢物(potential score:0.9)。
利用PhenoScanner对基于eQTLs的基因进行SNP定位。
利用KEGG数据库对LC-MS峰进行注释。
通过添加代谢物-蛋白质相互作用,从SNPs和LC-MS峰生成的个体网络进一步扩大,这样三个网络可以在代谢组学层合并。
p-value过滤:(cut-off: 0.2)来排除p值较大的LC-MS峰值所贡献的节点。其网络连接基于其相关代谢物、基因或蛋白质。
如图A,生成的子网络1包含六种类型的节点(物种、SNPs、代谢物、SNPs或代谢物相关的基因/蛋白质),结果显示出glutathione是宿主-微生物相互作用中的重要交互作用点。
由此推测包括大肠杆菌在内的几种微生物会产生glutathione,两个SNPs(rs3197999和rs1428554)通过编码谷胱甘肽过氧化物酶(GPx)的基因GPX1和GPX3与代谢产物相关。
与此呼应的是,在以往的研究中证明大肠杆菌和相关物种在IBD中的过度表达可能是由于它们能更好地产生glutathione以抵抗氧化应激。
图B的3D分层网络提供了一个直观的多组学整合视角,突出显示了连接微生物组和宿主遗传的glutathione的流动路径。
OmicsNet 2.0与其它工具的比较
如下表,比较OmicsNet 2.0与其他基于web的多组学集成工具的关键特性。
‘√’表示支持,‘-’ 表示缺失,“+”表示定量评估(“+”越多表示更好的支持)
附带各工具的官网及主要特点描述:
PaintOmics
(http://www.paintomics.org)
专注于在视觉上呈现多组学数据的探索分析,包括转录组学,代谢组学,表观基因组学,miRNA和转录因子,将其映射到KEGG通路联合分析。
MergeOmics
(http://mergeomics.research.idre.ucla.edu)
整合了来自单个组学层面的关联研究的汇总统计数据,以及不同功能基因组学数据,以获得机理上的见解,最近还加入了多组学信息的药物重新定位(drug repositioning)。
OmicsAnalyst
(https://www.omicsanalyst.ca)
基于输入的数据,利用多元统计、相关性分析和聚类方法,结合网络、热图和散点图进行多组学分析。
Arena3D
(https://www.arena3d.org)
擅长使用基于3D的分层布局对多层网络进行交互式可视化,适用于多组学网络数据。
NedRex
(https://nedrex.net)
是一个Cytoscape插件,专注于疾病模块识别和药物再利用,使用各种模块识别和优先排序算法。
MetScape
(http://metscape.ncibi.org)
是一个Cytoscape插件,通过构建和分析不同类型的含有酶、代谢物和/或反应的网络,专注于基因表达和代谢组学数据的集成和可视化。
OmicsNet
(https://www.omicsnet.ca)
通过将多个分子互作数据库与强大的2D/3D可视化网络分析相结合,对于多组学集成分析和结果解释有更好的理论基础,对以上工具的不足做了补充。
结 语
OmicsNet 2.0是一个基于网络的多组学分析平台,支持2D和3D网络可视化探索。
在1.0版本中强调基于web的3D网络可视化。
在2.0版本中,进一步改进了其可视化分析系统,添加了一个功能完整的2D网络可视化系统,并支持三种新的组学数据输入(SNPs、微生物分类单元和LC-MS峰),目前的生物信息学工具无法很好地支持这些数据。
除了富集分析、搜寻模块和最短路径分析,用户还可以使用重启随机游走算法(Random Walk with Restart)搜索候选疾病标记物。最后,2.0版本通过发布底层的R代码和共享链接,改进了工具的可再现性和透明度。
使用IBD多组学数据的案例研究表明,OmicsNet 2.0可以揭示与原始出版物和后续出版物以及IBD文献一致的有意义的模式、关系和功能。总之,OmicsNet 2.0解决了对多组学数据进行分析的一些需求。
参考文献:
Zhou G, Pang Z, Lu Y, Ewald J, Xia J. OmicsNet 2.0: a web-based platform for multi-omics integration and network visual analytics. Nucleic Acids Res. 2022 May 26:gkac376. doi: 10.1093/nar/gkac376. Epub ahead of print. PMID: 35639733.
介绍一款|用于多组学整合和网络可视化分析的在线平台相关推荐
- 利用多组学整合鉴定人类疾病共享的和疾病特异性的宿主基因-微生物组关联
利用多组学整合鉴定人类疾病共享的和疾病特异性的宿主基因-微生物组关联 2022-05-23 本文系谷歌翻译 原文:Identification of shared and disease-specif ...
- 百趣代谢组学文献分享:三组学整合分析在中医药研究中的应用
组学研究中经常会涉及到转录组-代谢组.代谢组-蛋白组等两个组学之间的关联分析,但小伙伴们有碰到过代谢组.转录组.蛋白组3个组学的整合研究吗?百趣生物小趣和大家分享一篇代谢组.转录组和蛋白组3组学整合分 ...
- 生信多组学整合工具的比较研究
今天给大家要分享是昆士兰科技大学Sathyanarayanan在Briefings in Bioinformatics(IF: 8.990)杂志上发表的论文.作者比较了九种不同的多组学数据整合工具,对 ...
- Top7大网络可视化分析工具介绍
目前,我们可以在市场上找到很多用于网络分析和数据可视化的开源工具,例如NetworkX,R和Gephi中的iGraph包等.在所有工具中,Gephi一直以来被认为是最值得推荐的,它可以帮助用户轻松实现 ...
- iNetModels 2.0多组学整合网站的使用
揭示各种omics数据之间的关联对于全面了解 在人类健康和疾病中改变的生物过程和疾病的改变至关重要.到目前为止,很少有研究集中在单一数据库中收集和展示多组学关联 .在此,我们提出了iNetModels ...
- 代谢组学数据分析及网络药理学研究技术与实践
一.代谢组学研究技术与实践 1.代谢组学简介及样本的采集与制备关键问题探讨 1.1 代谢组学概述 1.2 代谢组学操作流程 1.3 样本的采集.储存与制备关键问题 2.代谢组学数据采集与预处理,决定数 ...
- 「nature protocols」组学数据的通路富集分析和可视化: g:Profiler, GSEA, Cytoscape 和 EnrichmentMap...
nature protocols上发了一篇文章,题目为"Pathway enrichment analysis and visualization of omics data using g ...
- 多组学整合2连发,肠道研究新突破:人参残渣有大用
最近,派森诺与中国农业科学院特产研究所合作,在<Food Chemistry>和<Journal of Functional Foods>相继发表论文,通过高通量测序.代谢组检 ...
- 单细胞多组学数据介绍①——甲基化数据
单细胞多组学数据介绍①--单细胞甲基化数据 一.甲基化数据格式介绍 1.cpg level data 2.feature level data 3. loading data 二.分析方法 1./QC ...
最新文章
- linux vim project,vim插件project的用法
- VirtualDOM与diff(Vue实现)
- hdu 5317 RGCDQ (2015多校第三场第2题)素数打表+前缀和相减求后缀(DP)
- Eclipse中将java类打成jar包形式运行
- caffe专题五——回归中——检测框架
- java 判断日期连续_如何在Java中检查日期是否大于另一个日期?[重复]
- Spring Cloud 入门 之 Config 篇(六)
- presto是如何保证作业内存不会发生冲突和溢出
- 干的漂亮!一夜之间GPS在南海信号全无,美军只能干瞪眼
- AngularJS开发指南
- oracle 设置会话的编码,在Oracle中使用登录触发器初始化用户会话
- vscode-代码文件对比
- t-SNE 高维数据可视化
- 2016.8.14安装myplayer心得
- chm 已取消到该网页的导航,打不开
- 本地搭建Git服务器,两台电脑共享代码如此简单
- javacv 人脸追踪_基于JavaCV的人脸识别程序
- 报错:跨域问题解决 No ‘Access-Control-Allow-Origin‘ header is present on the requested resource.
- seo文案策划的一些日常工作内容
- 【视频处理】视频拼接视频缝合手把手教你