欢迎关注”生信修炼手册”!

GEPIA整合了来自TCGA和GTEx项目中的基因表达谱数据,提供了多种数据分析和可视化功能,操作简单,方便广大科研人员对肿瘤的表达谱数据进行挖掘,对应的文章发表在Nucleic Acids Research,链接如下

https://academic.oup.com/nar/article/45/W1/W98/3605636

该web平台的网址如下

http://gepia.cancer-pku.cn/index.html

通过首页的检索框,可以快速检索单个基因的相关结果

TP53为例,结果如下

1. General

这部分对基因的功能进行了简单描述,同时给出相关数据库的链接,示意如下


右侧的body map中红色代表肿瘤患者, 绿色代表正常个体,给出了在不同组织中的表达量,颜色越深,对应的表达量越高,鼠标点击可以看到具体的表达量。

还给出了不同肿瘤中正常样本和肿瘤样本中表达量的对比图,每个点代表一个样本,如下所示

还有柱状图,取了所有样本的平均值,示意如下

无论是哪种可视化方式,都是用于直观的查看肿瘤和正常个体间该基因表达量的差异。

2. Differential Genes

该部分分析在特定肿瘤中正常样本和肿瘤样本中的差异表达基因,可以自己定义差异基因分析的算法和对应的阈值,示意如下

点击List查看差异基因对应的表格数据,示意如下

点击Plot显示差异基因在各个染色体上的分布,示意如下

3. Expression DIY

这部分自己选择感兴趣的肿瘤,查看该基因的表达量在多种肿瘤中的分布,提供了dotplot, boxplot, viovlin plot等展现形式,示意如下


如果输入多个基因列表,还可以以热图的形式进行可视化,示意如下

T代表tumor, N代表normal, 对多种肿瘤中肿瘤患者和正常样本的表达量进行了可视化。

4. Survival

这部分进行生存分析,可以绘制如下所示的生存曲线

还可以分析与生存状态相关的差异基因,结果如下所示

5. Correlation

这部分用于分析两个基因间的相关性,可以自己挑选样本,指定相关系数的算法,结果如下所示

6. PCA

这部分进行PCA分析,指定多组样本,然后根据输入的基因的表达量进行PCA分析,可以生成2D和3D PCA的图,结果如下所示



其核心的差异分析和生存分析等功能,已经可以满足绝大多数TCGA数据挖掘的需求,多种可视化结果更是锦上提花。如果只是对肿瘤的表达谱数据进行挖掘,GEPIA可以称得上是最简便的平台。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

GEPIA:TCGA和GTEx表达谱数据分析平台相关推荐

  1. RNA 30. SCI文章中基于TCGA和GTEx数据挖掘神器(GEPIA2)

    这期介绍一个基于TCGA和GTEx数据挖掘神器(GEPIA2),个人觉得如果没有编程基础的可以直接利用这个在线小工具分析自己的研究的单个基因或者多个基因,效果还是蛮好的! 桓峰基因公众号推出转录组分析 ...

  2. 流数据分析平台Storm简介

    流数据分析平台Storm简介 Storm是一个分布式的.容错的实时流计算系统,可以方便地在一个计算机集群中编写与扩展复杂的实时计算,Storm之于实时处理,就好比Hadoop之于批处理.Storm保证 ...

  3. 工业大数据分析平台的应用价值探讨

    大数据经过多年的潜心发展,在当今可以说是进入到了一个快速发展期.各种围绕大数据的应用开发也迅速火热起来了.政务大数据解决方案.企业级大数据解决方案.智慧城市停车大数据解决方案等已经开始被应用.5月份一 ...

  4. clickhouse 航空数据_趣头条基于Flink+ClickHouse的实时数据分析平台

    原标题:趣头条基于Flink+ClickHouse的实时数据分析平台 分享嘉宾:王金海 趣头条 编辑整理:王彦 内容来源:Flink Forward Asia 出品平台:DataFunTalk 导读: ...

  5. 达观数据分析平台架构和Hive实践——TODO

    转自: http://www.infoq.com/cn/articles/hadoop-ten-years-part03 编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对 ...

  6. 基于Hadoop的数据分析平台搭建

    企业发展到一定规模都会搭建单独的BI平台来做数据分析,即OLAP(联机分析处理),一般都是基于数据库技术来构建,基本都是单机产品.除了业务数据的相关分析外,互联网企业还会对用户行为进行分析,进一步挖掘 ...

  7. Flink从入门到精通100篇(十九)-基于 Flink 的大规模准实时数据分析平台的建设实践

    前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基 ...

  8. 达观数据分析平台架构和Hive实践

    http://www.infoq.com/cn/articles/hadoop-ten-years-part03 编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存 ...

  9. mmTrix大数据分析平台构建实录--转

    在数据分析中,有超过90%数据都是来自于非结构化数据,其中大部分的是日志,如运维.安全审计.用户访问数据以及业务数据等,但随着互联网快速的发展,数据规模也是水涨船高,从早前的GB级到现在的TB级,甚至 ...

最新文章

  1. 卓越性能代码_开启win10隐藏的“超级性能模式”
  2. 数据结构C语言实现课后习题答案第6-9章
  3. VTK:Filtering之ProgrammableSource
  4. 机器学习笔记(八):神经网络:学习
  5. Android知识体系
  6. 一个肉夹馍引起的思考
  7. python网络爬虫系列教程——python中lxml库应用全解(xpath表达式)
  8. 没有什么内存问题,是一行Python代码解决不了的
  9. 用cmd命令下载百度云的资源
  10. 圆通电子面单接口对接
  11. Access与Trunk
  12. python 正则匹配 条件太多怎么办_python正则中re.findall匹配多个条件
  13. Clouda安装和使用过程详解
  14. SCCM 2012 R2部署,SCCM配置(五)
  15. Laya 微信小游戏登录问题
  16. 基于 SpringBoot 的人事管理系统的设计与实现
  17. Cursor——ChatGPT的替代品【笔记】
  18. 如何在Windows资源管理器中自定义文件夹背景和图标
  19. 400字教学:发布会的新闻稿怎么写
  20. OFDM系统仿真【matlab代码】

热门文章

  1. 翻译软件怎么实现的?我用Java教你实现私人自用翻译软件
  2. 取消word里面所有超链接
  3. GAN Inversion: A Survey
  4. excel首行固定_EXCEL 一个工作表如何快速拆分多个工作表的方法
  5. 【阅读笔记】联邦学习实战——构建公平的大数据交易市场
  6. 有源器件和无源器件基础概念及区别
  7. uni-app 高德地图报 INVALID_USER_SCODE
  8. 《大话设计模式》第29章-OOTV杯超级模式大赛—模式总结(三)
  9. 用C++写洛谷p1304哥德巴赫猜想
  10. 深度学习入门(二十四)卷积神经网络——填充和步幅