这期介绍一个基于TCGA和GTEx数据挖掘神器(GEPIA2),个人觉得如果没有编程基础的可以直接利用这个在线小工具分析自己的研究的单个基因或者多个基因,效果还是蛮好的!

桓峰基因公众号推出转录组分析教程,有需要生信的老师可以联系我们!转录分析教程整理如下:

RNA 1. 基因表达那些事--基于 GEO

RNA 2. SCI文章中基于GEO的差异表达基因之 limma

RNA 3. SCI 文章中基于T CGA 差异表达基因之 DESeq2

RNA 4. SCI 文章中基于TCGA 差异表达之 edgeR

RNA 5. SCI 文章中差异基因表达之 MA 图

RNA 6. 差异基因表达之-- 火山图 (volcano)

RNA 7. SCI 文章中的基因表达——主成分分析 (PCA)

RNA 8. SCI文章中差异基因表达--热图 (heatmap)

RNA 9. SCI 文章中基因表达之 GO 注释

RNA 10. SCI 文章中基因表达富集之--KEGG

RNA 11. SCI 文章中基因表达富集之 GSEA

RNA 12. SCI 文章中肿瘤免疫浸润计算方法之 CIBERSORT

RNA 13. SCI 文章中差异表达基因之 WGCNA

RNA 14. SCI 文章中差异表达基因之 蛋白互作网络 (PPI)

RNA 15. SCI 文章中的融合基因之 FusionGDB2

RNA 16. SCI 文章中的融合基因之可视化

RNA 17. SCI 文章中的筛选 Hub 基因 (Hub genes)

RNA 18. SCI 文章中基因集变异分析 GSVA

RNA 19. SCI 文章中无监督聚类法 (ConsensusClusterPlus)

RNA 20. SCI 文章中单样本免疫浸润分析 (ssGSEA)

RNA 21. SCI 文章中单基因富集分析

RNA 22. SCI 文章中基于表达估计恶性肿瘤组织的基质细胞和免疫细胞(ESTIMATE)

RNA 23. SCI文章中表达基因模型的风险因子关联图(ggrisk)

RNA 24. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER)

RNA 25. SCI文章中估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter)

RNA 26. SCI文章中基于转录组数据的基因调控网络推断 (GENIE3)

RNA 27 SCI文章中转录因子结合motif富集到调控网络 (RcisTarget)

FigDraw 28. SCI文章中绘制雷达图/蛛网图 (RadarChart)

RNA 29. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER2.0)

GEPIA2是GEPIA的更新版本,用于分析TCGA和GTEx项目中9736个肿瘤和8587个正常样本的RNA测序表达数据,使用标准处理管道。GEPIA2提供可定制的功能,如肿瘤/正常差异表达分析、根据癌症类型或病理分期进行分析、患者生存分析、相似基因检测、相关性分析和降维分析。(http://gepia2.cancer-pku.cn/)

GEPIA2使用的RNA-Seq数据集基于UCSC Xena项目(http://xena.ucsc.edu),通过标准管道计算。

GEPIA有四个模块,都可以处理数据:

  • Single Gene Analysis

  • Cancer Type Analysis

  • Custom Data Analysis

  • Multiple Gene Analysis

这个在线工具特别适合做单基因研究想发文章的需求,简单好用,输入一个基因就可以看到泛癌中的变化情况!

我们就看下给出来的例子,都能做哪些分析以及最后得到哪些结果:

Examples for GEPIA2 Usage

By using GEPIA2, experimental biologists can easily explore the large TCGA and GTEx datasets, ask specific questions, and test their hypotheses in a higher resolution.

For the isoform analysis in boxplot and survival analyses, users can easily get the result that POMT1-003 isoform in ACC cancer type was over expressed compared with the normal tissue. Meanwhile, given the high expression of POMT1-003 isoform, the patients in ACC had a worse prognostic outcome.


In addition, based on the Isoform Usage, users can find that SLC7A2-202 in SLC7A2 gene has a isoform switch event in LIHC compared with other cancer types.


Users also can use Isoform Structure find that 3 isoforms in ERCC1 have different isoform structures.


For Survival Map, users can get the survival significance map of gene HSPB6, which have significant results in BLCA, KIRP, LGG and SARC.


For gene signature analysis in similar genes detection, users can find that MIR155HG, CD8A, IL21R, CD27 and PTPN7 have highest correlation with T-cell exhausted signature in LIHC cancer type.


For the combination of signature and subtype analysis in boxplot, GEPIA2 provides the expression distribution of Th-1 like signature in the 3 COAD subtypes.


For analyzing the user-upload data, the features in custom data analysis enables users classify their uploaded data into cancer subtype or compare their own data with TCGA and GTEx data.


For doing the analyses in the local machine, GEPIA2 provides the python package gepia in API. Users can get the batch of analysis results using this package.


GEPIA2 also retained the original features of GEPIA:

In differential analysis and expression profile, users can easily discover differentially expressed genes, such as MPO in leukemia and UPK2 in bladder cancer.

MPO specifically expressed in leukemia:



UPK2 specifically expressed in bladder cancer:



The chromosomal distribution of over- or under- expressed genes can be plotted in Differential Genes.

Over-expressed genes:


Under-expressed genes:


Both over-expressed and under-expressed genes:


In Survival analysis, genes with the most significant association with patient survival can be identified, such as MCTS1 in breast cancer and HILPDA in liver cancer. Code

MCTS1 in breast cancer


HILPDA in liver cancer:


Gene expression is visualized by both a bodymap and a bar plot in General.



Gene expression by pathological stage is plotted in Stage plot. Code


Users can compare the expression of one gene in multiple cancers by Boxplot, or compare multiple genes by a matrix plot in Multiple gene comparison. Code

Boxplot:


Matrix plot:


GEPIA provides pair-wise gene correlation analysis of a given set of TCGA and/or GTEx expression data. Normalization is optional and customizable. Code


GEPIA provides Principal Component Analysis of multiple genes and cancer types in PCA, and presents results by 2D or 3D plots.

2D plots:


3D plots:


Variances distribution:


Genes with similar expression pattern can be identified in Similar Genes, for example, PGAP3 and GRB7 are similar to ERBB2.


ERBB2:


PGAP3:


GRB7:

使用起来还是非常方便,避免了自己写代码,又找数据又作图,有需要的老师可以参考使用!

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出转录组系列生信分析教程,

敬请期待!!

有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!

References:

1. Chenwei Li, Zefang Tang, Wenjie Zhang, Zhaochen Ye, Fenglin Liu, GEPIA2021: integrating multiple deconvolution-based analysis into GEPIA, Nucleic Acids Research, Volume 49, Issue W1, 2 July 2021, Pages W242–W246, https://doi.org/10.1093/nar/gkab418

2. Tang, Z. et al. (2019) GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis. Nucleic Acids Res, 10.1093/nar/gkz430.

RNA 30. SCI文章中基于TCGA和GTEx数据挖掘神器(GEPIA2)相关推荐

  1. RNA 24. SCI文章中基于TCGA的免疫浸润细胞分析的在线小工具——TIMER

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 135篇原创内容 公众号 今天来介绍一个使 ...

  2. RNA 29. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER2.0)

    桓峰基因公众号推出转录组分析教程,有需要生信的老师可以联系我们!转录分析教程整理如下: RNA 1. 基因表达那些事--基于 GEO RNA 2. SCI文章中基于GEO的差异表达基因之 limma ...

  3. RNA 4. SCI 文章中基于TCGA 差异表达之 edgeR

    01. 前言 在不久的将来,预计新兴的数字基因表达(DGE) 技术在许多功能基因组学应用方面将超越微阵列技术.其中的一个基础数据分析任务,尤其是基因表达研究,涉及确定是否有证据表明对于转录本或外显子在 ...

  4. RNA 2. SCI文章中基于GEO的差异表达基因之 limma

    01. 前言 目前随着测序成本的降低,越来越多的文章中都将使用基因的表达数据,那么就会涉及到差异基因,最基础的思路就是获得表达数据,根据临床信息进行分组,利用各种软件计算出差异表达基因,这里主要基于G ...

  5. RNA 27 SCI文章中转录因子结合motif富集到调控网络 (RcisTarget)

    点击关注,桓峰基因 桓峰基因公众号推出转录组分析和临床预测模型教程,有需要生信的老师可以联系我们!首选看下转录分析教程整理如下: RNA 1. 基因表达那些事–基于 GEO RNA 2. SCI文章中 ...

  6. RNA 25. SCI文章中只有生信没有实验该怎么办?

    今天来介绍一个使用非常方便的在线免疫组化分析工具--PHA (The Human atlas),免疫组化时单基因干湿结合生信中最常见的补充实验的方法之一,性价比较高.但是如果没有条件进行自己样本的免疫 ...

  7. RNA 25. SCI文章中估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter)

    点击关注,桓峰基因 今天来介绍一个利用基因表达估计组织浸润免疫细胞和基质细胞群的群体丰度的软件包--MCP-counter,亲试,非常好用. 桓峰基因的教程不但教您怎么使用,还会定期分析一些相关的文章 ...

  8. RNA 15. SCI 文章中的融合基因之 FusionGDB2

    基于 RNA 数据分析1-13期基本介绍完成,而基因融合同样也是转录组测序中能够获得的对于临床上非常有意义的数据,这期就看看融合基因该怎么分析,增添文章的内容. 一. 融合基因 融合基因就是两个基因& ...

  9. RNA 5. SCI 文章中差异基因表达之 MA 图

    基于 RNA 数据的分析还有很多展示形成,我这里都会一次介绍,以及最后的 SCI 文章中的组图,完成所有分析流程,首先讲下 MA 图形的绘制流程,这里还是非常全面的,仅供参考! MA plot MA- ...

最新文章

  1. R语言data.table进行滚动数据连接,滚动联接通常用于分析涉及时间的数据实战(动画说明滚动数据连接的形式):rolling joins data.table in R
  2. 2020人工神经网络第一次作业-参考答案第六部分
  3. switch case 中定义变量
  4. 数据库自增主键可能产生的问题
  5. 一个应用程序和另一个应用程序apk文件信息
  6. 工业视觉智能实战经验之IVI算法框架2.0
  7. 转 Grand Central Dispatch 基础教程:Part 1/2 -swift
  8. 关于js中的判断数组为空的问题
  9. 前端 -- jQuery
  10. Duilib初级控件扩展一例: 具有鼠标滚动消息的OptionUI
  11. iphone个人热点无法开启_无法在 iPhone 上正常使用“个人热点”怎么办?
  12. 修改mysql数据库默认字符集_MySQL数据库之修改mysql默认字符集的两种方法详细解析...
  13. 利用自定义注解,AOP + redis限制ip访问接口次数
  14. 在ArcMap中直接加载谷歌地球影像的方法
  15. 用Hadoop构建电影推荐系统
  16. 牛客网刷题:Q3禁忌雷炎(一般)
  17. flutter微信分享,qq分享
  18. win10语言包在c盘哪里,win10系统通过卸载语言包释放c盘空间的操作方法
  19. Java时间轮算法的实现
  20. 现在个人博客网站还能够备案吗?是否需要企业身份才能备案?

热门文章

  1. 达内linux考试题,达内Linux工程师.doc
  2. 自考计算机专业考试科目有哪些 主要学什么
  3. 【6】网店模板目录及文件介绍
  4. 将搜狗浏览器的收藏夹导入到IE
  5. 索尼手机通用刷机工具Flashtool教程
  6. Matlab\Simulink仿真中遇到的代数环问题
  7. html5微信预约挂号源码,微信大转盘html5代码
  8. Repeater和控件的runat=server分析
  9. 基于SSM实现房屋租赁管理系统-毕业设计【附源码】
  10. oprn/read/write/close系统函数