TCGA临床数据的整理是一个基本的操作

我们选择临床数据在Data category 中选择clinical 最重要的在Data format 中一定要选择XML的]格式
选择自己研究的TCGA肿瘤类型,添加到cart里面下载数据

点击download 下载 cart的内容 保存你们自己喜欢的位置。下面一步是个小技巧 ,使用Windows 的小伙伴
在右侧工具栏搜索XML格式 会把每个文件夹内的XML文件显示出来,最后复制的一个文件夹内最后整理完之后我们导入到RStudio

library("XML")
library("methods")
setwd("H:/gdc-client_v1.4.0_Windows_x64/1")##设置工作路径
dir="H:/gdc-client_v1.4.0_Windows_x64/1"
all_fiels=list.files(path = dir ,pattern='*.xml$',recursive=T)##导入文件
cl = lapply(all_fiels, function(x){result <- xmlParse(file = file.path(dir,x)) rootnode <- xmlRoot(result)  xmldataframe <- xmlToDataFrame( rootnode[2] ) return(t(xmldataframe)) })
clinical <- t(do.call(cbind,cl))
write.table(clinical,file="clinical.txt",sep="\t",quote=F,row.names = F)

TCGA临床数据整理相关推荐

  1. tcga数据下载_从GDC下载最新的TCGA临床数据

    本文从GDC直接获取TCGA数据,不同于cbioportal.Xeon等TCGA下载工具,GDC数据是实时更新的最原始的数据. 下载数据 GDC的综合数据下载页面为https://portal.gdc ...

  2. TCGA 临床数据 表型 phenotype 各列的含义

    原文链接:http://www.cnblogs.com/emanlee/p/7635951.html Property name Description kind The resource type. ...

  3. tcga样本编号_数据挖掘专题 | 一文搞懂TCGA数据整理

    原标题:数据挖掘专题 | 一文搞懂TCGA数据整理 本文经授权转载自生信控 我们已经通过前两期数据下载(一)和数据下载(二)介绍了TCGA数据下载方法,并最终得到每个样本一个独立文件夹形式的数据,整理 ...

  4. TCGAbiolinks整理表达数据和临床数据

    新版TCGAbiolinks的整理表达数据和临床数据 没有废话直接干 ##加载包 rm(list = ls()) options(stringsAsFactors = F) gc() library( ...

  5. TCGA甲基化数据(.idat)champ.load文件导入Sample Sheet构建

    最近在学习对甲基化数据的分析,大部分甲基化数据都有已经处理好的beta值矩阵,少部分需要用原始的.idat文件去分析,本篇主要讲如何用champ包中的champ.load函数导入.idat文件. my ...

  6. TCGA新版数据count的下载及转换为tpm

    最近想重新进行免疫浸润计算,用的是TCGA的数据.然后注意到cibersort算法对于测序数据用的是tpm值. 我以前是直接下载小洁老师存在网盘中的tpm的Rdata,然后我发现我分析的LAML数据总 ...

  7. Keras图像分割实战:数据整理分割、自定义数据生成器、模型训练

    Keras图像分割实战:数据整理分割.自定义数据生成器.模型训练 目录 Keras图像分割实战:数据整理分割.自定义数据生成器.模型训练

  8. 《数据分析实战:基于EXCEL和SPSS系列工具的实践》——3.3 耗时耗力的数据整理过程...

    本节书摘来自华章计算机<数据分析实战:基于EXCEL和SPSS系列工具的实践>一书中的第3章,第3.3节,作者 纪贺元,更多章节内容可以访问云栖社区"华章计算机"公众号 ...

  9. 多波次导弹发射中的规划问题(一) 网络图绘制及数据整理

    前言 2017年研究生数学建模E题目 多波次导弹发射中的规划问题 ,题目围绕着导弹发射的位置选取问题展开.首先讲述了一大堆有关导弹发射的机动策略,以及导弹发射车的运行参数,地图点位分布等等.然后就丢出 ...

  10. Pandas数据处理实战:福布斯全球上市企业排行榜数据整理

    手头现在有一份福布斯2016年全球上市企业2000强排行榜的数据,但原始数据并不规范,需要处理后才能进一步使用. 本文通过实例操作来介绍用pandas进行数据整理. 照例先说下我的运行环境,如下: w ...

最新文章

  1. 关于ie,火狐,谷歌浏览器滚动条的隐藏以及自定义样式
  2. mysql内部安装workb_centOS系统中下安装mysql workbench图文详细步骤
  3. visual studio安装python插件_Visual Studio 2012 Ultimate 上安装 Python 开发插件 PTVS
  4. 光流 | OpenCV中的光流有关函数
  5. 鼠标移入时闪闪发光的效果
  6. 使用scrapy报错:attrs() got an unexpected keyword argument 'eq'解决办法
  7. java 递增 实现_Java编程实现递增排序链表的合并
  8. Microsoft Visual Studio Web 创作组件安装失败的解决方法
  9. 多目标最优化模型及算法应用(NSGA-II)
  10. DeepFaceLab AI换脸使用教程(1.安装及分解视频)
  11. MySQL的连接字符串 concat、concat_ws、group_concat、repeat()函数用法
  12. 贪吃蛇c语言代码vc,纯C语言实现贪吃蛇游戏(VC6.0)
  13. MUI框架学习——了解MUI
  14. ckplayer6.8 php播放,ckplayer超酷网页视频播放器 6.8
  15. PPT2010无法从所选的文件中插入视频
  16. 揭秘java虚拟机 kindle_Kindle有一个java虚拟机
  17. 摩托罗拉Android系统,摩托罗拉Droid官方Android 2.2系统详细功能展示
  18. 查看安卓系统的外接USB声卡
  19. 数据结构与算法—堆(heap)
  20. 小程序 正整数与char(character)的相互转换,十六进制与十进制相互转换

热门文章

  1. 如何辩证看待技术与业务的关系
  2. Python课程总结
  3. python分号_python分号_python 分号_python加分号 - 云+社区 - 腾讯云
  4. itest(爱测试) 4.1.1 发布,开源BUG 跟踪管理 敏捷测试管理软件
  5. 男神程序员对准男神程序员们的忠告
  6. css实现分割线功能,各种各样的分割线(附效果图)
  7. 大招:召唤最优的多因素cox模型
  8. java protected 构造方法_java中子类调用父类构造方法注意事项
  9. PTA 数据结构与算法 7-8 哈利·波特的考试
  10. 显微镜基本知识【1】