提取TCGA 中体细胞突变数据的表达矩阵
#因为之前的命令调用GDCquery_Maf 发现用不了
#故找到了一些其他的方法,并且自己试着将其弄成了一个表达矩阵。
#代码如下
#1、下载加载相应的包
install.packages("pacman")
library(pacman)
p_load(TCGAbiolinks,DT,tidyverse)
BiocManager::install("TCGAbiolinks")
library(TCGAbiolinks)
library(tidyverse)
BiocManager::install("maftools")
library(maftools)
library(dplyr)
#
TCGAbiolinks:::getProjectSummary("TCGA-STAD")
#建立查询
raw<-GDCquery(
project= "TCGA-STAD",
data.category = "Simple Nucleotide Variation",
access = "open",
legacy = FALSE,
data.type= "Masked Somatic Mutation",
workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking"
)
#下载数据
GDCdownload(raw)
#获取数据
maf<- GDCprepare(raw)
#读取数据
maf<-maf %>% maftools::read.maf()
#表格化数据,数据会以表格形式出现在右下角viewer里
datatable(getSampleSummary(maf),
filter = 'top',
options = list(scrollX = TRUE , keys = TRUE,
pageLength = 5),
rownames = FALSE)
#(以上代码是看b站一个视频来的,但是我需要这个表格,根据自己需求绘制相应的样本的TMB瀑布图,比较两个组之间的差异情况)
#把突变数据提取成为一个表达矩阵
a<-datatable(getSampleSummary(maf),
filter = 'top',
options = list(scrollX = TRUE , keys = TRUE,
pageLength = 5),
rownames = FALSE)
#观察列表a的结构,发现突变数据表达矩阵在a的x中的data中,提取出来。
STADTMB<-a$x$data
View(STADTMB)
#这样就生成了一个和GDCquery_Maf提取出来的合并了的体细胞突变数据了(应该是,自己也没用GDCquery_Maf 提取出来过。总之可以用来做后续的分析:比如比较TCGA中构建出来的风险模型,高低风险组之间的TMB情况)
提取TCGA 中体细胞突变数据的表达矩阵相关推荐
- 【论文党福利】如何提取图像中的数据
[论文党福利]如何提取图像中的数据 从事科研的老师和同学们在撰写论文时,经常需要将文献中的曲线与自己的结果进行对比,为获取原始数据,最靠谱的方法当然是找原作者要.如果没有要到呢?本文将成为论文党的福利 ...
- Flask 提取数据库中的数据
近日有需求,想查询和 flask 连接的数据库,并且把数据读出来 查询数据很好处理,但是想要提取数据就感觉有点无从下手 直接百度 "flask提取数据库中的数据" 找到的也是基于 ...
- 如何将cell元胞中的数据转化为矩阵中的数据
将cell中的数据转化成为矩阵中的数据只需用cell2mat函数即可 运行后得到的结果如下:
- 通过Python的pdfplumber库提取pdf中表格数据
文章目录 前言 一.pdfplumber库是什么? 二.安装pdfplumber库 三.查看pdfplumber库版本 四.提取pdf中表格数据 1.引入库 2.定义pdf文件路径 3.打开pdf文件 ...
- 使用python批量提取txt中的数据并写入excel
本人是编程小白,同时也是一名准毕业研究生,在处理众多数据时总是要花很多时间来做重复的工作以提取出需要的数据,让我十分头疼.我无法忍受这种低效的工作,于是便开始尝试使用Python进行编程来批量处理数据 ...
- iText如何提取PDF中的数据——1. 总览
作者:CuteXiaoKe 微信公众号:CuteXiaoKe | 原文 最近收到大家很多的私信提问,也是大家比较关心的问题:如果我有一个PDF,我该如何使用iText获取PDF里面的内容呢,比如文 ...
- 用Engauge Digitizer软件提取文献中的数据
在做实验的时候需要与sota方法作比较.无奈很多代码都没开源,因此想办法从文章中的图表中扣数据来画图.engauge digitizer是一款可实现该功能的开源软件.其可用于从文献曲线图或地图中提取数 ...
- python分析pdf年报 货币现金_如何用Python从大量pdf 中提取表格中的数据进行分析?...
根据一楼答案@森林的建议 说说我的处理经验 我也是借助开源项目tabula,不得不说tabula的功能确实很强大. 我是用Python来处理数据,但是没有用tabula-py,因为表格跨列跨行等情况比 ...
- python提取网页中表格数据_Python2 BeautifulSoup 提取网页中的表格数据及连接
网址:http://quote.eastmoney.com/ce- 要做的是提取网页中的表格数据(如:板块名称,及相应链接下的所有个股,依然是个表格) 暂时只写了这些代码: import urllib ...
最新文章
- python Class:获取对象类型
- [转] 前端实现文件的断点续传
- (转载)linux下的find文件查找命令与grep文件内容查找命令
- [iphone-tabbar]如何自定义TabBarController
- android Notification的使用
- IOS 5 中@synthesize window = _window是什么意思呢
- 跳跃表(Skip list)原理与java实现
- npm eject 暴露webpack报错,less或sass添加报错
- jQuery插件实现网页底部自动加载-类似新浪微博
- 2017.9.21 problem a 失败总结
- C#常用正则表达式收藏
- Python基础——元组与列表
- [软件更新]影拓三代 PTZ系列 系列 驱动程序 V6.1.1-3{链接已修复}
- IRQL的理解和认识
- Nik插件滤镜套装Nik Collection 3 Mac
- python中oserror winerror_python – OSError:[WinError87]参数不正确
- java计算两个时间为天数_java计算两个时间相差天数的方法汇总
- 易语言超人气教程第一课(放弃语言之争)
- 周志华-机器学习(线性模型)
- Python——决策树分类模型剪枝