在 RedHat 使用 gdc-client 下载 TCGA 数据
今天,只聊一下 RedHat/CentOS 下 gdc-client 安装的那些事。
gdc-client,官网地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool,是由 GDC 官方提供的一个可以在命令行下批量下载 TCGA 数据的客户端工具。
在 gdc-client 官网可以看到 Mac、Windows 和 Ubuntu 的二进制版本下载,却唯独没看到 CentOS/RedHat 版本的!而且还给了我们一个提示说,如果你想要安装 RedHat Enterprise Release 6 版本的 gdc-client 需要跟 GDC 进行联系!!
如果你用 "gdc-client" + "centos6" 的关键字去谷歌,会发现大部分的答案都是教你用 Python2 的虚拟环境去安装 gdc-client。
其实,这些大部分都存在误导的成分,虽然 gdc-client 官网虽然没有提供 CentOS 6 的二进制程序包,但它托管在 GitHub 的源码我们是可以直接安装的,而且是只支持 Python 3!!
坑一:Python 2 引发 parse 模块异常
使用 Python 2 安装:
conda create -n Python2 python=2.7source activate Python2git clone https://github.com/NCI-GDC/gdc-clientcd gdc-clientpython setup.py install 2>&1 | tee -a install.log
这种方法虽然看起来没什么问题,却会执行 gdc-client -h
提示parse
模块异常。其原因是 build/bdist.linux-x86_64/egg/gdc_client/download/parser.py 的第三行 from urllib import parse as urlparse
是 py3 的语法:在 python 2.x 中的 urlparse
模块在 Python 3 中已经重命名为 urllib.parse
。
# Python 2 正确语法from urlparse import urlparse
# Python 3 正确语法from urllib import parse as urlparse
坑二:conda 安装无法响应
bioconda 虽然也提供了 gdc-client,但是本人 一直没法安装成功,可能是我的运气不太好!
最后,CentOS 6 的正确解锁姿势
在 CentOS 6 中使用源码方式安装:
conda create -n gdc python=3.7source activate gdc
git clone https://github.com/NCI-GDC/gdc-clientcd gdc-clientpip install -r requirements.txtpython setup.py install 2>&1 | tee -a install.log
最后,打开 GDC 的官方《Data Transfer Tool Command Line Documentation》文档,查看在命令下怎么使用 gdc-client 下载你想要的 TCGA 数据吧!
猜您喜欢 往期精选▼
1. Conda 为什么越来越慢?
2. 如何卸载 python setup.py install 安装的包?
3. Anaconda 使用的一些体验与困惑
4. 让你的 conda “回滚”到以前版本的环境
5. 微生物组分析软件 QIIME 2 安装小记
6. Anaconda 环境下 R 包 ggraph_1.0.2 安装小记
7. 拒绝conda, 用virtualenv构建多版本的python开发环境
8. 癌症中克隆种群结构统计推断分析软件PyClone安装小记
本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
在 RedHat 使用 gdc-client 下载 TCGA 数据相关推荐
- linux下载TCGA数据,如何下载TCGA数据/TCGA数据下载小教程
1. 什么是TCGA?TCGA中有哪些数据? TCGA的全称是The Cancer Genome Atlas, 这个项目始于2005年,它旨在使用基因测序和生物信息学编目与癌症有关的基因突变.TCGA ...
- linux下TCGA数据下载,TCGA数据下载方式小结
之前对TCGA做了简单的了解,粗略了解了什么是TCGA,TCGA是做什么的等,接下来肯定是要学会如何下载TCGA数据,毕竟只有下载了数据才能继续学习 官网常规下载 TCGA自2016年改版后,下载方式 ...
- oracle中prad函数_R中用GDCRNATools包下载TCGA数据
用GDCRNATools下载TCGA数据,以TCGA-STAD为例下载RNAseq 1)数据下载,gdcRNADownload()函数 ###########用GDCRNATools下载TCGA数据# ...
- R语言---使用cgdsr包下载TCGA数据---笔记整理
原文链接:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247486492&idx=1&sn=3a7251244 ...
- TCGAbiolinks包下载TCGA数据
Bioconductor的TCGAbiolinks包用于GDC数据综合分析的R/Bioconductor软件包,本文主要展示下载数据集和代码. 1. 包的加载 # if (!requi ...
- linux下载TCGA数据,好用的新版TCGA数据下载方法
1,摸索篇: 前几天开始了解TCGA数据库,想挖掘一下数据,先根据网上各种教程把你要下载的数据加入"购物车",然后下载"manifest",然后用官网推荐的GD ...
- tcga数据下载_使用R下载TCGA数据
除了之前提到的,使用GDC 官方提供的gdc-client.exe对TCGA数据进行下载外(TCGA数据分析(1)),还可以使用R包对TCGA数据进行下载,这个神奇的R包叫做TCGAbiolinks. ...
- linux下载TCGA数据,使用gdc-client批量下载TCGA数据
欢迎关注"生信修炼手册"! GDC的在线下载功能只适用于下载小的数据集,当需要下载数据量较大的TCGA数据时,必须借助于GDC官方提供的客户端工具gdc-client.网址如下 h ...
- linux下载TCGA数据,TCGA数据库讲解与数据下载
原标题:TCGA数据库讲解与数据下载 前几期,生信草堂和大家分享了一篇TCGA数据下载的文章,有小白表示TCGA还是好深奥,找不到下载地址的,看不懂数据格式.今天小编就从头开始,娓娓道来,再给大家介绍 ...
最新文章
- Java基础学习总结(18)——网络编程
- Nature科学报告:这项研究,有助于截肢患者可以恢复痛觉感知
- Eclipse.自动提示--编写HTML/CSS/JS/JSP代码时自动提示的解决办法
- 初学Ajax相关知识
- 数据结构——图-有向图和无向图的邻接表基础
- 带命名空间的XML的dom4j应用转
- golangd 报错信息梳理
- JDK绘制文字的流程与代码分析
- 生产环境sql语句调优实战第三篇
- RN开发模型,供参考
- 如何在MacOS中进行声音内录
- 数字化营销转型,你的企业准备好了吗?
- 电阻应用电路之运放如何消除偏置电流的影响
- 跳楼机[DP+spfa]
- 码市coding不能下载
- win7记事本如何转换html,Win7把记事本文件格式变成PDF格式的方法
- TF实战丨使用Vagrant安装Tungsten Fabric
- sqlserver语法
- 课程笔记之《论文写作》
- 案例:SOA成就最佳电子政务平台