刚开始学习TCGA数据处理和分析,记下来方便以后查看

setwd("E:/MyData/luadRNA-SEQ-20201028") #把工作目录定位到manifest文件所在的位置
manifest= "gdc_manifest.2020-10-28.txt"
x=read.table(manifest,header = T) #header为TRUE表示读取第一行作为变量名

表格已经建好了,可以view(x),发现长这样

接下来定义两个变量,一会儿要用:

manifest_length= nrow(x) #行数
id= toString(sprintf('"%s"', x$id))

接下来运行脚本:(提取自https://docs.gdc.cancer.gov/API/Users_Guide/Search_and_Retrieval/)

Part1= '{"filters":{"op":"in","content":{"field":"files.file_id","value":[ 'Part2= '] }},"format":"TSV","fields":"file_id,file_name,cases.submitter_id,cases.case_id,data_category,data_type,cases.samples.tumor_descriptor,cases.samples.tissue_type,cases.samples.sample_type,cases.samples.submitter_id,cases.samples.sample_id,cases.samples.portions.analytes.aliquots.aliquot_id,cases.samples.portions.analytes.aliquots.submitter_id","size":'Part3= paste(shQuote(manifest_length),"}",sep="")Sentence= paste(Part1,id,Part2,Part3, collapse=" ")write.table(Sentence,"Payload.txt",quote=F,col.names=F,row.names=F)

得到了payload文件:

最后在RSTUDIO的terminal里面输入(需要安装cURL)一般在你的C:\Windows\system32目录下有curl.exe就是安装了,详细信息请参考https://stackoverflow.com/questions/9507353/how-do-i-install-and-use-curl-on-windows :

cd E:\MyData\luadRNA-SEQ-20201028
curl --request POST --header "Content-Type: application/json" --data @Payload.txt "https://api.gdc.cancer.gov/files" > File_metadata.txt

这样我们就得到了包含RNA-SEQ与CLINICAL对应关联的文件

R语言 关联TCGA数据库下载的RNA-SEQ数据和临床信息相关推荐

  1. R语言 2022 TCGA数据库转录组提取 新版TCGA 表格提取 一键精灵

    一键生成版本 (找工作去了,不改了) # 1. 下载数据与json文件# 2. 不同文件夹文件提取 # 将次级目录的文件夹里面的文件提取到同一个文件夹下# 一些基础操作 list.files(patt ...

  2. R语言---使用cgdsr包下载TCGA数据---笔记整理

    原文链接:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247486492&idx=1&sn=3a7251244 ...

  3. R语言之MYSQL数据库获取及输出

    R语言之MYSQL数据库获取及输出 在这里我们使用ODBC连接,连接之前请先配置ODBC MYSQL  ODBC下载地址:http://dev.mysql.com/downloads/connecto ...

  4. r 连oracle数据库,R语言—连接Oracle数据库

    R语言-连接Oracle数据库 本教程会讲解两种方法,第一种方法较为简单,且中文不容易出现乱码.第二种方法,较为复杂,和java的jdbc连接数据库操作类似. 操作环境: 系统:windows10 6 ...

  5. R语言构建仿真数据库(sqlite)并使用dplyr语法和SQL语法查询数据库、将dplyr语法查询语句翻译为SQL查询语句

    R语言构建仿真数据库(sqlite)并使用dplyr语法和SQL语法查询数据库.将dplyr语法查询语句翻译为SQL查询语句 目录

  6. R语言入门系列-软件下载,环境搭建,数据导入导出

    1. 为什么是R? 现在数据科学,深度学习领域最受欢迎的是Python, 那么为什么要学习R语言,Python 和 R 的优势分别在哪儿? 简单来说,R语言更适用与研究,偏数理统计,小而精,适合将来做 ...

  7. 使用R语言解析kegg数据库get请求

    使用R语言解析kegg数据库get请求 1. kegg数据库get请求 虽然kegg数据库提供了相关的Restful API来请求数据,但使用get请求查询出的数据是没有格式的字符串,如下: 要得到具 ...

  8. R语言使用na.omit函数删除矩阵matrix数据中的缺失值(NA值)

    R语言使用na.omit函数删除矩阵matrix数据中的缺失值(NA值) 目录 R语言使用na.omit函数删除矩阵matrix数据中的缺失值(NA值) R 语言特点 R语言使用na.omit函数删除 ...

  9. R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行SpatialSign变换(将数据投影到单位圆之内)、设置method参数为spatialSign

    R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行SpatialSign变换(将数据投影到单位圆之内).设置method参数为spatialSign 目录

最新文章

  1. qlabel 边加载边更新_王者荣耀:9月版本更新,九位英雄调整,三大战边回归,飞牛笑了...
  2. python爬虫教程i-Python 爬虫速成教程,还有35个实战项目送给你!
  3. Cassandra 常见错误索引
  4. 怎样使用SetTimer MFC 够具体
  5. python正则表达式指南_Python正则表达式指南(转)
  6. ansys命令流_ANSYS命令流建模3之划分单元+施加弹簧
  7. 如何查看服务器gpu性能,ubuntu服务器查看GPU和CPU实时使用情况
  8. mybatis No enum const class org.apache.ibatis.type.JdbcType.Integer
  9. python3打印不换行
  10. es java match_java操作elasticsearch实现条件查询(match、multiMatch、term、terms、reange)...
  11. 微服务Eureka使用详解
  12. 使用DotNet以来一直都有出现这样的问题
  13. 初中会考计算机flash,初中信息技术考试flash.doc
  14. C语言题库 part.1
  15. MC(monitorcat) 监控军刀
  16. 【华为机试真题 Python实现】查找众数及中位数
  17. 消息重试框架 Spring-Retry 和 Guava-Retry,这个框架有点意思
  18. 存储系统测试工具学习之vdbench
  19. uni-app图片显示
  20. grub2命令 linux启动盘,使用grub2制作多重启动盘(下)

热门文章

  1. Can not lock the registry cache file C:\Users\username.dubbo\dubbo-registry-1*.2*.2*.1*.cache
  2. PHP实现将网页转为图片:html-pdf-png
  3. 【Roofline 推理速度】影响深度学习模型推理速度的因素及相关基础知识
  4. 什么软件可以测试色卡颜色,Munsell24色卡-色彩测试标板
  5. 计算机sd模式怎么打游戏,绝地求生提升fps方法,绝地求生吃鸡游戏提高帧数优化教程(图文)...
  6. (转)编程的三层境界——器、术、道
  7. 保姆级人工智能学习成长路径
  8. 关闭 Windows 安全中心警报 及 用户账户允许此应用对你的设备进行更改 通知 及 打开文件 - 安全警告 通知
  9. 服务器显示na什么意思,游戏服务器na是什么意思
  10. 2021-3-31 git提交代码的命令及流程