tcga数据下载_使用R下载TCGA数据
除了之前提到的,使用GDC 官方提供的gdc-client.exe对TCGA数据进行下载外(TCGA数据分析(1)),还可以使用R包对TCGA数据进行下载,这个神奇的R包叫做TCGAbiolinks。
注: 它下载数据成功率非常低,官方API中也未推荐,所以这也是我没用它的原因,但是做出的分析结果相当丰富
01 TCGAbiolinks 安装与加载
运行如下命令即可
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("TCGAbiolinks")library(TCGAbiolinks)
02 TCGA数据下载
以下载TCGA-GBM数据为例,完全不需要gdc-client.exe的命令行操作,数据下载如下
proj "TCGA-GBM"query project = proj,data.category = "Transcriptome Profiling", data.type = "Gene Expression Quantification", workflow.type = "HTSeq - Counts")GDCdownload(query)data
在这一步,你极有可能会出现以下几种情况:
2.1 网络链接超时
--------------------------------------o GDCquery: Searching in GDC database--------------------------------------Genome of reference: hg38Error in is.response(x) : Timeout was reached: Operation timed out after 10000 milliseconds with 0 out of 0 bytes received
或者这种
2.2 Server down
Error in value[[3L]](cond) : GDC server down, try to use this package later
2.3 下载成功
也有可能很幸运,出现了这种,这个时候就说明数据开始下载了。
--------------------------------------o GDCquery: Searching in GDC database--------------------------------------Genome of reference: hg38--------------------------------------------oo Accessing GDC. This might take a while...--------------------------------------------ooo Project: TCGA-GBM--------------------oo Filtering results--------------------ooo By data.typeooo By workflow.type----------------oo Checking data----------------ooo Check if there are duplicated casesooo Check if there results for the query-------------------o Preparing output-------------------Downloading data for project TCGA-GBMOf the 174 files for download 2 already exist.We will download only those that are missing ones.GDCdownload will download 172 files. A total of 43.787024 MBDownloading as: Fri_Apr_17_22_27_19_2020.tar.gzDownloading: 44 MB
03 数据下载结果
下载数据的速度还可以,一共有174套数据,会下载到当前工作目录下的,这个文件夹。
TCGA-GBM\harmonized\Transcriptome_Profiling\Gene_Expression_Quantification
如果你出现2.1,2.2 的情况怎么办呢?采用之前gdc-client.exe进行下载喽。为什么会出现2.1,2.2 的错误,一方面是自己本身网络的问题,可能需要设置代理才可以访问并下载数据,另一方面可能是数据库不稳定。关于2.2 网上给出了这个解决方案
devtools::install_github("BioinformaticsFMRP/TCGAbiolinks")
注:我试了,依然不行
tcga数据下载_使用R下载TCGA数据相关推荐
- tcga数据下载_从GDC下载最新的TCGA临床数据
本文从GDC直接获取TCGA数据,不同于cbioportal.Xeon等TCGA下载工具,GDC数据是实时更新的最原始的数据. 下载数据 GDC的综合数据下载页面为https://portal.gdc ...
- 千牛包表包下载_探索R中表包的gt语法
千牛包表包下载 I love migrittr's forward-pipe %>% operator. IMO, it is just the one of the most fitting, ...
- 漫画算法python版下载_用 Python 下载漫画
ReLIFE 1. 开篇 前一阵子看了 Relife 这部七月番动画,短短 13 集很快就看完,深深无法自拔,然后去查了下,发现原来是改编自漫画的,于是立马去找漫画的资源,但是搜来搜去都没有找到资源下 ...
- 看漫画学python下载_用 Python 下载漫画
ReLIFE 1. 开篇 前一阵子看了 Relife 这部七月番动画,短短 13 集很快就看完,深深无法自拔,然后去查了下,发现原来是改编自漫画的,于是立马去找漫画的资源,但是搜来搜去都没有找到资源下 ...
- uber 数据可视化_使用R探索您在Uber上的活动:如何分析和可视化您的个人数据历史记录
uber 数据可视化 Perhaps, dear reader, you are too young to remember that before, the only way to request ...
- r语言 清空mysql表_用R语言做数据清理(详细教程)
数据的清理 如同列夫托尔斯泰所说的那样:"幸福的家庭都是相似的,不幸的家庭各有各的不幸",糟糕的恶心的数据各有各的糟糕之处,好的数据集都是相似的.一份好的,干净而整洁的数据至少包括 ...
- java编程有一筐鸡蛋_一筐鸡蛋数学题标准答案公式-一筐鸡蛋标准答案图片详细解答版下载_东坡手机下载...
最近有许多网友被"一筐鸡蛋1个1个拿,9个9个拿正好拿完"这道数学给难住,其实这是一道数学题,小编为你带来一筐鸡蛋一个一个拿正好拿完答案,还有完整解答公式,感兴趣的话就来下载看看吧 ...
- 原创力文档怎么免费下载_哪里可以下载免费的PDF文档转换器?
在我们使用电脑的过程中,经常会使用到各种类型的文档,其中PDF文档也非常受欢迎,尤其对PDF文档转换器工具的需求非常广,由此PDF文档转换器也成为了众多技术人员研究的对象,以满足众多使用者的需求. 本 ...
- r语言数据变量分段_使用R语言实现数据分段
使用R语言实现数据分段 今天跟大家讲讲我工作中用到的数据分段,数据分段一般在什么地方会使用到呢?评分.之前写过一篇<实战: RFM>模型使用,那篇文章就详细介绍了CRM(客户关系管理)分析 ...
最新文章
- 实现SSTab单个选项卡代码
- 为什么yamlp中没有cplex_在《英雄联盟》中,为什么有些T1英雄并没有我们想象中那么强势?...
- iOS7修改UISearchBar的Cancel按钮的颜色和文字
- codeforce 606A - Magic Spheres
- eclipse的java帮助文档_java在Eclipse中文apidoc帮助文档导入.doc
- Java 面向对象:构造器详解
- Uva 247 - Calling Circles(传递闭包 / 强连通分量)
- Python模块-decimal
- flAbsPath on /var/lib/dpkg/status failed 解决 Cydia 红字
- impress.js学习总结
- 最全Spring常用注解详解
- 第五届山东理工大学ACM网络编程擂台赛
- mac重置显示器设置
- 鸿蒙手机隐藏应用,手机里羞羞的App ,终于可以一键藏起来了!
- java 对齐文本框_如何对齐文本框和旁边的图像按钮
- java时间戳 时间格式转换与时差
- mye连接mysql数据库_myeclipse连接数据库
- 人物访谈|扎根社区的工程师,月影的前端人生
- 给mongodb设置密码
- 操作系统实验六:Linux下的C语言编程
热门文章
- 权重随机抽奖, 拉马努金数
- wav C语言音频切割器 非常详细、400行代码搞定!!
- 毕业设计(二十三)- 以前在金堆里淘金,现在却只能在垃圾堆里寻“宝”了!
- The 2022 ICPC Asia Regionals Online Contest (II) 2022ICPC第二场网络赛 ABEFGJKL题解
- ERROR: Model Parsing the xml failed
- 2021计算机技术考研国家线,2021考研国家线是怎么定的?
- python 百度搜索页抽取
- Neo4j原生语句cc
- Java排序修真:从入门到进阶,从后天生灵到祖神祖仙
- 揭秘360背后不为人知的产品文化