分享分析TCGA的数据库——GEPIA(一)
上回提到TCGA的一个下载数据库UCSC Xena数据库:
分享一个TCGA数据库_李京弦的博客-CSDN博客
今天分享一个TCGA分析的数据库——GEPIA,网址是:GEPIA (Gene Expression Profiling Interactive Analysis)
下面我们以一个基因——AURKA为例子,看看这个数据库如何使用。
1. 先看看这个基因的表达谱
选择感兴趣的癌症:
这里我们选择所有癌症:
GEPIA可以TCGA数据库自己的肿瘤组织和正常组织进行比较,也可以匹配GTEX数据库进行比较,关于GTEX的介绍和下载,下次再说。点击plot,来看看结果:
可以看到,AURKA这个基因在多种癌症中是高表达的,高表达且有意义的癌症,会标为红色,低表达的标位绿色。如果研究泛癌的话,这张图就可以放文章里面。
下面再看单个癌症中AURKA的表达:
选择BLCA膀胱癌看看:
左下角可以设置阈值,即logFC和P值,这里选择logFC是1,即如果肿瘤组和正常组中,AURKA的表达变化数超过两倍,就有意义。当然这个条件也可以放宽,比如设置logFC为0.5.
可以看到,AURKA在膀胱癌中是高表达的。
下面看一下AURKA表达和肿瘤分期的情况:
点击Stage plot:
结果没有意义,说明AURKA表达与膀胱癌进展无关。
当然,这只是数据库的结果,如果有自己的数据支持,或者别的数据支持,非要研究这个基因也未尝不可。
下面是多个基因的表达进行比较:
不过这个图不是这么好看。
2. 看预后
左下角可以选择无复发生存和总体生存,还可以选择合适的cutoff值,不过合格cut-off值会删除样本,不太可靠。
选择quatile以后,可以看到,他删除了中间一半的样本。
所以我一般不会选这个确定cut-off值,确定基因最适的cut-off值,请看之前的一篇文章:
选择最适cut-off值的原因及X-tile的使用_李京弦的博客-CSDN博客_xtile怎么得到cutoff值
此外,可以选择某个癌症中与生存有关的所有基因:
3. 看差异表达基因在染色体上的分布
不过这张图没有什么太大的价值,毕竟不知道这些差异表达基因是谁。
分享分析TCGA的数据库——GEPIA(一)相关推荐
- 分享分析TCGA的数据库——GEPIA(二)
书接上回:分享分析TCGA的数据库--GEPIA(一)_李京弦的博客-CSDN博客GEPIA--国产TCGA可视化网站https://blog.csdn.net/weixin_465000 ...
- 生信工具 | TCGA数据分析工具GEPIA最新更新,用于免疫细胞浸润分析
GEPIA(http://gepia.cancer-pku.cn/index.html)这个工具可以说是分析TCGA数据库数据分析工具中比较简单好用的工具了,包括生存分析,表达差异分析,相关性分析等, ...
- 学计算机的怎样分析TCGA数据库,开启数据挖掘之门:TCGA数据库入门必看!
原标题:开启数据挖掘之门:TCGA数据库入门必看! 喜欢我的都关注我了~ 在肿瘤研究领域,相信没有人不知道The Cancer Genome Atlas (TCGA). TCGA是美国国家癌症研究所( ...
- java计算机毕业设计信息学院网站分析源码+数据库+系统+lw文档+部署
java计算机毕业设计信息学院网站分析源码+数据库+系统+lw文档+部署 java计算机毕业设计信息学院网站分析源码+数据库+系统+lw文档+部署 本源码技术栈: 项目架构:B/S架构 开发语言:Ja ...
- 癌症基因图谱( TCGA)数据库(二)数据前处理
文章目录 1.分类 2.数据整理 2.1 换ID名 2.2矩阵整理 1.分类 数据:癌症基因图谱( TCGA)数据库中 5 种不同类型癌症(包括BRCA, BLCA, LGG, LUAD 和 LUSC ...
- oracle11g ora 29927,【案例】Oracle内存泄漏 进行10046跟踪分析07445导致数据库宕机
天萃荷净 在一次ORA-7445导致oracle数据库down掉故障分析中,发现sql因某种原因导致大量的sql area中很多内存泄露,最终导致数据库down掉.通过实验找出类此奇怪SQL. SEL ...
- TCGAbiolinks包分析TCGA数据
TCGAbiolinks包不仅可以下载GDC数据,还能分析数据 (differential expression analysis, identifying differentially methyl ...
- 从架构特点到功能缺陷,重新认识分析型分布式数据库
写在前面 本文是分布式数据库的总纲文章的第一部分,主要探讨分析性分布式数据库的发展和技术差异:第二部分则是交易性数据库的一些关键特性分析.Ivan开始计划的分布式数据库是不含分析场景的,所以严格来说本 ...
- dm7和mysql_【干货分享】达梦数据库DM7的新特性发布啦
原标题:[干货分享]达梦数据库DM7的新特性发布啦 近日,DM7正式发布新特性.作为一款广受业内人士认可的国产数据库产品,最突出的特征就是它良好的兼容性,完善的功能以及超出客户期望的优秀性能表现:本次 ...
最新文章
- netapp存储服务器文档,NetApp秘密开发服务器闪存?
- 通过实例学习如何使用telerik:RadListView控件
- 报错记录:SprintBoot---Unable to start embedded container; nested exception is java.lang……
- docker安装配置分布式elasticsearch、kibana、head、cerebro
- Python 多进程向同一个文件写数据
- mac 无法识别android,mac 无法识别android真机
- ListView 条目加载上滑下滑首尾缩放动画实现
- 大公司还是小公司[zz]
- 扬州市 工程师职称计算机考试,扬州市建筑专业工程师专业技术资格条件
- 2022-2028年全球一次性视频内窥镜行业收入年复合增长率CAGR为 42.6%
- Three.js和其它webgl框架
- 云计算和大数据时代网络技术揭秘(十三)VXLAN
- 初识mapbox GL
- 苹果开放降级_苹果降级对手机有什么坏处
- [搜索算法]三分搜索初步
- 基于OFBiz的E-TICKET(在线咨询管理)模块
- [LeetCode Python3]77. Combinations回溯
- 基于php的老年医疗保健管理系统
- 实验一计算机基础和网络知识竞赛,1、计算机知识竞赛活动方案
- SSVEP干电极介绍及其分类算法研究
热门文章
- 网络银行转帐落到后台的交易有哪些
- 与网络相连的计算机称为什么,网络把许多计算机连接在一起,而互联网则把许多( )通过路由器连接在一起。与网络相连的计算机常称为( )。...
- 反跟单讲解1:重新认识期货反向跟单
- 爬虫js逆向获取信息,有道翻译逆向{‘errorCode‘: 50}及UA错误
- ASEMI代理TW6869-TA1-CRH瑞萨TW6869-TA1-CRH车规级
- 码教授|信息流的那点事:为什么信息流如此流行
- 10、乐趣国学—践行《弟子规》的“谨”懂得从容之道(下篇)
- 被VMP蹂躏了。。。
- 从JDBC到手撸极简版Mybaties(3)JDBC自动解析配置文件
- python导入包时有下划红线