配合视频教程使用更佳:【1行代码提取6种TCGA表达矩阵和临床信息】 https://www.bilibili.com/video/BV12R4y197Ne/?share_source=copy_web&vd_source=abc21f68a9e2a784892483fd768dbafa

之前写了一个脚本,可以让大家1行代码提取6种类型的表达矩阵以及对应的临床信息。但是很多人完全看不见注意事项或者根本看不懂,所以我决定改动一下。

上一版的脚本主要报错是这个:

Error in GDCprepare(query, save = T, save.filename = "tcga_read.rdata") : I couldn't find all the files from the query. Please check if the directory parameter is right or `GDCdownload` downloaded the samples.

原因无非就是3种可能:

  • TCGAbiolinks的版本不是2.25.1以上
  • 路径不对
  • 下载的方式不正确

首先解决R包版本的问题

你可以用以下代码检查自己的TCGAbiolinks包的版本:

packageVersion("TCGAbiolinks")
## [1] '2.25.2'

如果是在2.25.1以下,需要安装开发版本的TCGAbiolinks包,安装方法如下:

if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")
BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")
BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")

安装完成后,重新使用packageVersion("TCGAbiolinks")查看版本。

如果你用上面的安装代码报错,那么你的R语言基础可能不过关,你需要参考以下教程:可能是最好用的R包安装教程!

然后是路径问题

**路径必须要正确,你位置都搞错了,代码找不到你放文件的位置,那肯定是报错!**路径设置可以参考这篇推文:手动下载的TCGA也是可以用TCGAbiolinks整理的。

我在里面说的非常清楚,你的文件路径必须是在GDCdata\TCGA-COAD\harmonized\Transcriptome_Profiling\Gene_Expression_Quantification这个路径下,而且脚本getTCGAexpr.r必须和GDCdata在同一个文件夹下!!!!

下载方式问题

如果你是直接用TCGAbiolinks下载的数据,那么路径一般不会有大问题,只要你把脚本和GDCdata放在同一个文件夹下就行了。

如果你是在官网下载的,或者用gdc_clinet下载的,就必须按照这篇推文介绍的方法进行选择:可能是最适合初学者的TCGA数据下载教程,**命令行或者图形界面都可以,关键是选择的时候一定要选对!!**如果没选对,就会出现开头所示的报错!!


以上3个问题,我在脚本使用注意里都明确说明了,实在是不懂为什么还有那么多问题!!!

2.0版本

我觉得有一部分是我的原因,作为一个已经学会的人,我已经忘记了自己不会的时候是什么样子,现在也无法理解初学者为什么会遇到那么多报错。

所以我改了一下脚本,1行代码下载并整理6种类型的TCGA表达矩阵和临床信息!!

主要是以下改进:

  • 在任何位置都可以运行,不需要构建路径!
  • 会自动下载数据,不需要手动下载

2.0版本的脚本我也放在了QQ群里,需要的加群下载即可。

使用方法和之前一模一样!!

但我还是建议你先看一下使用注意!!

  • 需要良好的网络
  • TCGAbiolinks包的版本必须要在2.25.1以上

下面是使用方法:

加载需要的R包:

library(TCGAbiolinks)
library(SummarizedExperiment)
library(tidyverse)

加载脚本"getTCGAexpr.r":

source("getTCGAexpr.r")

使用函数,需要提供TCGA的癌症简称,比如:TCGA-LUSC。

getTCGAexpr(project = "TCGA-LUSC")

这个脚本会自动从GDC官网下载最新的数据,所以需要联网,如果你的网络不好,可以手动下载,按照这篇推文自己构建合适的路径:xxxxxxx,它也可以成功!

完成后会在当前目录多出一个output_expr文件夹,里面就是6个表达矩阵和临床信息

  • TCGA-LUSC_expr.rdata:原始的se对象,所有信息都是从这里面提取的;
  • TCGA-LUSC_clinical.rdata:TCGA-LUSC的临床信息;
  • TCGA-LUSC_lncRNA_expr_counts.rdata:lncRNA的counts矩阵;
  • TCGA-LUSC_lncRNA_expr_fpkm.rdata:lncRNA的fpkm矩阵;
  • TCGA-LUSC_lncRNA_expr_tpm.rdata:lncRNA的tpm矩阵;
  • TCGA-LUSC_mRNA_expr_counts.rdata:mRNA的counts矩阵;
  • TCGA-LUSC_mRNA_expr_fpkm.rdata:mRNA的fpkm矩阵;
  • TCGA-LUSC_mRNA_expr_tpm.rdata:mRNA的tpm矩阵;

新版TCGA表达矩阵1行代码提取2.0版相关推荐

  1. 新版TCGA表达矩阵提取简单版

    很多人因为网络原因不能使用TCGAbiolinks这个神包下载TCGA的RNA-seq数据,只能通过浏览器访问GDC TCGA的官网进行下载,而下载后得到的是一个个文件夹,对于如何整理成一个表达矩阵也 ...

  2. 新版TCGA数据库学习:提取新版TCGA表达矩阵(tpm/count/fpkm)

    现在使用TCGAbiolinks下载转录组数据后,直接是一个SummarizedExperiment对象,这个对象非常重要且好用.因为里面直接包含了表达矩阵.样本信息.基因信息,可以非常方便的通过内置 ...

  3. 10 行代码提取复杂 Excel 数据

    [摘要] 把 Excel 文件导入关系数据库是数据分析业务中经常要做的事情,但许多 Excel 文件的格式并不规整,需要事先将其中的数据结构化后再用 SQL 语句写入数据库.而一般情况下,结构化的工作 ...

  4. 《第一行代码 Android 第2版》下载

    <第一行代码 Android 第2版> https://pan.baidu.com/s/1B718h7h3601iEe8gIN9oAQ

  5. 保存blob到本地_用12行代码提取浏览器自动保存的密码

    在本文中,我将演示如何轻松提取Chrome配置文件中保存的用户名和密码.有人可能会认为Chrome会加密自动保存的密码,但并非如此.当你在使用Chrome时,往往需要输入某个密码才能同步自动保存的密码 ...

  6. 第一行代码 Android 第2版 书评

    从来没有写书评的习惯,但书实在太差,还让我花了不少时间去阅读,所以必须写一下(本人已阅读:1,2,3,4,9章). 写之前我还去看过作者的博客,单一问题的描述能力不错,但组织并写好一本书的能力基本为零 ...

  7. 干货干货~C语言版学生成绩管理系统【数据结构课程设计,百行代码实现功能强化版(内附源码)】

    前言 关于这个系统是我们专业要求做的一个课程设计,本来是上个学期交的,我也是上个学期弄好的,打算发出来,但是一直没交上去(怕交上去之前发出来老师说我作弊...),今天就把我做的这个系统分享给大家,不足 ...

  8. Kotlin 基础语法(《第一行代码(第三版)》第二章读书笔记)

    资源来自<第一行代码>(第三版)第二章 网络试读: https://www.ituring.com.cn/book/tupubarticle/30209 以下为笔记 转存失败重新上传取消正 ...

  9. 第一行代码:Android(第三版)

    阿里云盘链接:「第一行代码 - 第三版.pdf」https://www.aliyundrive.com/s/E7nKMMjfKmT 提取码: x3y3

最新文章

  1. java 十亿数据量运行速度慢_Java学习进阶之数据结构知识梳理
  2. 【转】DOS下文件传输---初识TCP网络编程改版
  3. Dubbo简单介绍及实例
  4. php 获取字符串中的url,php使用正则表达式获取字符串中的URL
  5. c语言 嵌入式开发环境搭建,嵌入式C语言环境的搭建
  6. Eclipse 安装插件报错:An error occurred while collecting items to be installed session context was...解决方法汇总
  7. 在shell中全局变量与局部变量的区别及其举例
  8. vue各种组件(不断增加中...)
  9. 得具备点靠钱赚钱的能力
  10. tp3.2 多字段模糊查询
  11. EditorUtility.SetDirty 设置已改变
  12. 关于x64dbg里面的Assemble
  13. 从零开始学JAVA:一、Java语言概述
  14. Java-图片处理 Gif转Jpg
  15. Hyperledger04
  16. 门面担当——外观模式
  17. 抑郁症自我测试皮肤软件,皮肤瘙痒像虫子爬竟是抑郁症
  18. 利用点赞功能提升Linkedin账号曝光率和活跃度
  19. 商务谈判中如何表示同意Agreement
  20. 解决 Java poi 3.8 等版本 操作 word 插入 图片 不成功的问题

热门文章

  1. 微信扫描二维码安卓弹出默认浏览器(苹果打开App Store)打开下载链接
  2. MNS(非极大值抑制)python实现
  3. jdk,neo4j社区版本下载与安装
  4. 解决PYTHON爬取:RESPONSE.STATUS_CODE为418、403 问题
  5. 小程序源码:云开发表情包制作神器微信小程序
  6. Cocos Creator 判断Touch位置在节点(Node)内
  7. 小区公共广播系统设备接线_广播系统常见四种故障分析
  8. 当Kali Rolling作为笔记本唯一一个系统
  9. jQuery库是什么
  10. (手写识别) Zinnia库及其实现方法研究