今天,只聊一下 RedHat/CentOS 下 gdc-client 安装的那些事。

gdc-client,官网地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool,是由 GDC 官方提供的一个可以在命令行下批量下载 TCGA 数据的客户端工具。

在 gdc-client 官网可以看到 Mac、Windows 和 Ubuntu 的二进制版本下载,却唯独没看到 CentOS/RedHat 版本的!而且还给了我们一个提示说,如果你想要安装 RedHat Enterprise Release 6 版本的 gdc-client 需要跟 GDC 进行联系!!


如果你用 "gdc-client" + "centos6" 的关键字去谷歌,会发现大部分的答案都是教你用 Python2 的虚拟环境去安装 gdc-client。


其实,这些大部分都存在误导的成分,虽然 gdc-client 官网虽然没有提供 CentOS 6 的二进制程序包,但它托管在 GitHub 的源码我们是可以直接安装的,而且是只支持 Python 3!!

坑一:Python 2 引发 parse 模块异常

使用 Python 2 安装:

conda create -n Python2 python=2.7source activate Python2git clone https://github.com/NCI-GDC/gdc-clientcd gdc-clientpython setup.py install 2>&1 | tee -a install.log

这种方法虽然看起来没什么问题,却会执行 gdc-client -h 提示parse模块异常。其原因是 build/bdist.linux-x86_64/egg/gdc_client/download/parser.py 的第三行 from urllib import parse as urlparse 是 py3 的语法:在 python 2.x 中的 urlparse 模块在 Python 3 中已经重命名为 urllib.parse

# Python 2 正确语法from urlparse import urlparse

# Python 3 正确语法from urllib import parse as urlparse


坑二:conda 安装无法响应

bioconda 虽然也提供了 gdc-client,但是本人 一直没法安装成功,可能是我的运气不太好!


最后,CentOS 6 的正确解锁姿势

在 CentOS 6 中使用源码方式安装:

conda create -n gdc python=3.7source activate gdc

git clone https://github.com/NCI-GDC/gdc-clientcd gdc-clientpip install -r requirements.txtpython setup.py install 2>&1 | tee -a install.log

最后,打开 GDC 的官方《Data Transfer Tool Command Line Documentation》文档,查看在命令下怎么使用 gdc-client 下载你想要的 TCGA 数据吧!

猜您喜欢 往期精选▼

1. Conda 为什么越来越慢?

2. 如何卸载 python setup.py install 安装的包?

3. Anaconda 使用的一些体验与困惑

4. 让你的 conda “回滚”到以前版本的环境

5. 微生物组分析软件 QIIME 2 安装小记

6. Anaconda 环境下 R 包 ggraph_1.0.2 安装小记

7. 拒绝conda, 用virtualenv构建多版本的python开发环境

8. 癌症中克隆种群结构统计推断分析软件PyClone安装小记

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

在 RedHat 使用 gdc-client 下载 TCGA 数据相关推荐

  1. linux下载TCGA数据,如何下载TCGA数据/TCGA数据下载小教程

    1. 什么是TCGA?TCGA中有哪些数据? TCGA的全称是The Cancer Genome Atlas, 这个项目始于2005年,它旨在使用基因测序和生物信息学编目与癌症有关的基因突变.TCGA ...

  2. linux下TCGA数据下载,TCGA数据下载方式小结

    之前对TCGA做了简单的了解,粗略了解了什么是TCGA,TCGA是做什么的等,接下来肯定是要学会如何下载TCGA数据,毕竟只有下载了数据才能继续学习 官网常规下载 TCGA自2016年改版后,下载方式 ...

  3. oracle中prad函数_R中用GDCRNATools包下载TCGA数据

    用GDCRNATools下载TCGA数据,以TCGA-STAD为例下载RNAseq 1)数据下载,gdcRNADownload()函数 ###########用GDCRNATools下载TCGA数据# ...

  4. R语言---使用cgdsr包下载TCGA数据---笔记整理

    原文链接:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247486492&idx=1&sn=3a7251244 ...

  5. TCGAbiolinks包下载TCGA数据

    ​​​​​​Bioconductor的TCGAbiolinks包用于GDC数据综合分析的R/Bioconductor软件包,本文主要展示下载数据集和代码. 1.   包的加载 # if (!requi ...

  6. linux下载TCGA数据,好用的新版TCGA数据下载方法

    1,摸索篇: 前几天开始了解TCGA数据库,想挖掘一下数据,先根据网上各种教程把你要下载的数据加入"购物车",然后下载"manifest",然后用官网推荐的GD ...

  7. tcga数据下载_使用R下载TCGA数据

    除了之前提到的,使用GDC 官方提供的gdc-client.exe对TCGA数据进行下载外(TCGA数据分析(1)),还可以使用R包对TCGA数据进行下载,这个神奇的R包叫做TCGAbiolinks. ...

  8. linux下载TCGA数据,使用gdc-client批量下载TCGA数据

    欢迎关注"生信修炼手册"! GDC的在线下载功能只适用于下载小的数据集,当需要下载数据量较大的TCGA数据时,必须借助于GDC官方提供的客户端工具gdc-client.网址如下 h ...

  9. linux下载TCGA数据,TCGA数据库讲解与数据下载

    原标题:TCGA数据库讲解与数据下载 前几期,生信草堂和大家分享了一篇TCGA数据下载的文章,有小白表示TCGA还是好深奥,找不到下载地址的,看不懂数据格式.今天小编就从头开始,娓娓道来,再给大家介绍 ...

最新文章

  1. Java基础学习总结(18)——网络编程
  2. Nature科学报告:这项研究,有助于截肢患者可以恢复痛觉感知
  3. Eclipse.自动提示--编写HTML/CSS/JS/JSP代码时自动提示的解决办法
  4. 初学Ajax相关知识
  5. 数据结构——图-有向图和无向图的邻接表基础
  6. 带命名空间的XML的dom4j应用转
  7. golangd 报错信息梳理
  8. JDK绘制文字的流程与代码分析
  9. 生产环境sql语句调优实战第三篇
  10. RN开发模型,供参考
  11. 如何在MacOS中进行声音内录
  12. 数字化营销转型,你的企业准备好了吗?
  13. 电阻应用电路之运放如何消除偏置电流的影响
  14. 跳楼机[DP+spfa]
  15. 码市coding不能下载
  16. win7记事本如何转换html,Win7把记事本文件格式变成PDF格式的方法
  17. TF实战丨使用Vagrant安装Tungsten Fabric
  18. sqlserver语法
  19. 课程笔记之《论文写作》
  20. 案例:SOA成就最佳电子政务平台

热门文章

  1. MacBook Air写代码真香!包邮送一台!
  2. 为什么你老是讲不清楚js的继承模式
  3. 你居然还不知道Mysql存储引擎InnoDB分为内存架构、磁盘架构?
  4. 企业该如何实现数字化转型?
  5. andriod studio中的显式跳转和隐式跳转
  6. sqlserver清除日志
  7. eclipse中的git安装与使用
  8. 13JavaScript中的简单数据类型与复杂数据类型
  9. C++中的内联函数inline
  10. AutoShape:实时形状感知的单目3D目标检测(ICCV2021)