下载的长数据怎么分开R语言_TCGA数据库单基因gsea作业之COAD-READ
我前面写过 单基因GSEA分析策略(数据分析免费做活动继续) ,然后马上就碰到了一个求助,复现下面的图表!
发表在Cancer Management and Research的简单数据挖掘杂志:Apolipoprotein C1 (APOC1) promotes tumor progression via MAPK signaling pathways in colorectal cancer,仔细下载文献学习。
数据下载
关于TCGA数据下载,我挑选了部分,写了6个数据下载系列教程:
- TCGA的28篇教程- 使用R语言的cgdsr包获取TCGA数据(cBioPortal)
- TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
- TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据(FireBrowse portal)
- TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)
- TCGA的28篇教程-数据下载就到此为止吧
- TCGA的28篇教程-整理GDC下载的xml格式的临床资料
但是,建议你选择UCSC的xena数据库下载方式。
首先看表达差异
(A) APOC1 was highly expressed in CRC (n=380) samples compared to adjacent normal (n=50) samples based on The Cancer Genome Atlas (TCGA) database (unpaired t-test, P=0.012). (B) APOC1 was highly expressed in colorectal cancer samples compared to the adjacent normal samples of a matched paired group (n=25) based on The Cancer Genome Atlas (TCGA) database (paired t-test, P=0.002).
然后看生存效果
我已经在生信技能树多次介绍过生存分析:
- 集思广益-生存分析可以随心所欲根据表达量分组吗
- 生存分析时间点问题
- 寻找生存分析的最佳基因表达分组阈值
- apply家族函数和for循环还是有区别的(批量生存分析出图bug)
- TCGA数据库生存分析的网页工具哪家强
而且使用TCGA数据库来看感兴趣基因的生存情况非常简单,一个网页工具即可,都无需R语言了
(F) and (G) Kaplan– Meier survival analysis according to APOC1 expression in 140 patients with CRC. The overall survival (OS) and disease-free survival (DFS) for patients with high versus low APOC1 expression. The difference is statistically significant based on the log-rank test (both P<0.001).
单基因的GSEA
首先需要根据感兴趣的基因表达量高低,对病人进行分组。
(A) GSEA-generated heatmap for highly enriched genes in the MAPK signaling pathway in the APOC1-higher expression group compared to the APOC1-lower expression group from the TCGA COAD-READ dataset.
运行GSEA,需要指定感兴趣的通路进行可视化
(B) GSEA on the TCGA COAD-READ dataset identified MAPK signaling pathways as a regulatory target of APOC1. The GSEA enrichment plot shows values for normalized enrichment score (NES) =1.87 and nominal P-value =0.004.
如果大家感兴趣GSEA分析原理和用法,看合辑
- GSEA的统计学原理试讲
- 用GSEA来做基因集富集分析
- 批量运行GSEA,命令行版本
- 费九牛二虎之力也无法重现的GSEA图
- GSEA分析合理性讨论
- 做GSEA分析你的基因到底该如何排序
- 重复不出来我费九牛二虎之力重复不出来的GSEA文章?
- 数据挖掘任务-根据前面教程复现ssGSEA热图
下载的长数据怎么分开R语言_TCGA数据库单基因gsea作业之COAD-READ相关推荐
- 下载的长数据怎么分开R语言_R语言学习笔记(一):学代码,我们从最基础的开始...
*本文是本人在学习 res method 课程中反复学不会被自己蠢到的笔记作品,仅供本人娱乐使用,如果恰好里面的内容也能帮到你,那可真是太好了. 同学们,我们这节课来学习R语言,那么我们为什么要学习R ...
- R语言可以直接从数据库读取数据么?R语言读取数据库数据示例
R语言可以直接从数据库读取数据么?R语言读取数据库数据示例 目录 R语言可以直接从数据库读取数据么?R语言读取数据库数据示例 R语言是解决什么问题的? R语言可以直接从数据库读取数据么?R语言读取数据 ...
- r语言 读服务器数据,R语言数据实战 | 安装R语言
原标题:R语言数据实战 | 安装R语言 1.R的获取和安装 获取和安装R很容易(这也是它"亲民"的地方),具体步骤如下: Step 1: 登陆R语言官方网站https://www. ...
- 《数据科学:R语言实现》——2.7 爬取网络数据
本节书摘来自华章计算机<数据科学:R语言实现>一书中的第2章,第2.7节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区"华章计算机"公众号查看. ...
- 《数据科学:R语言实现》——2.5 使用Excel文件
本节书摘来自华章计算机<数据科学:R语言实现>一书中的第2章,第2.5节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区"华章计算机"公众号查看. ...
- 《数据科学:R语言实现》——第1章 R中的函数
本节书摘来自华章出版社<数据科学:R语言实现>一 书中的第1章,第1.1节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访 ...
- 《数据科学:R语言实现》——3.9 排列数据
本节书摘来自华章计算机<数据科学:R语言实现>一书中的第3章,第3.9节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区"华章计算机"公众号查看. ...
- 《数据科学:R语言实现》——3.12 估计缺失数据
本节书摘来自华章出版社<数据科学:R语言实现>一 书中的第3章,第3.12节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以 ...
- 玩转数据可视化之R语言ggplot2:(六)统计变换绘图:包括加权绘图、数据分布图、曲面图、图形重叠处理等
玩转数据可视化之R语言ggplot2
最新文章
- 统计java文件中的代码行数
- linux c 运行报错 killed
- windows内核中杀任意进程,可杀360!
- Win 7 RC版即将发布 新功能提前爆料
- 26 行 ABAP 代码使用 HTTP_GET 函数下载百度网站的首页数据
- 华强北AirPods洛达1562A固件升级教程,带空间音频(艾创力+东莞豪锐)
- 【文章收藏】阿里云破了四个世界纪录
- 【Java】图解 Spring 循环依赖,写得太好了
- 巴士电台开放接口API
- 辞职前一定要三思的八个问题
- spriteatlas 白屏的问题_Discuz白屏问题解决思路
- 人像处理:不要用减淡工具了!用柔光叠加去擦!加深也不如正片叠底
- spring boot介绍及使用详解
- 数学建模系列--拟合算法
- Linux&Windows系统双系统
- 钨极惰性气体保护焊(TIG or GTAW)
- 【CZY选讲·吃东西】
- WinCC控件之ShockwaveFlash
- 离散小波变换(DWT)
- 模拟生成验证码,有相应次数限制(个人学习记录)
热门文章
- git版本库--常用命令
- Linux容器间共享内存,C++容器模板在共享内存中的使用
- 查询中接受的主体参数_Apollo入门引导(三):编写查询解析器
- raspberry pi_如何进行Raspberry Pi聚会
- 用一个案例介绍jQuery插件的使用和写法
- HTML5 绘制动画
- Mysql的数据库引擎 区别特点_mysql数据库存储引擎及区别
- koa2 mysql 事务_mysqljs在koa2中的正确姿势
- python中plot函数的属性_Python matplotlib 学习-绘图函数
- 索引超出矩阵维度怎么修改程序_seo怎么学?seo自己能学会吗?