新版TCGA表达矩阵1行代码提取2.0版
配合视频教程使用更佳:【1行代码提取6种TCGA表达矩阵和临床信息】 https://www.bilibili.com/video/BV12R4y197Ne/?share_source=copy_web&vd_source=abc21f68a9e2a784892483fd768dbafa
之前写了一个脚本,可以让大家1行代码提取6种类型的表达矩阵以及对应的临床信息。但是很多人完全看不见注意事项或者根本看不懂,所以我决定改动一下。
上一版的脚本主要报错是这个:
Error in GDCprepare(query, save = T, save.filename = "tcga_read.rdata") : I couldn't find all the files from the query. Please check if the directory parameter is right or `GDCdownload` downloaded the samples.
原因无非就是3种可能:
TCGAbiolinks
的版本不是2.25.1以上- 路径不对
- 下载的方式不正确
首先解决R包版本的问题
你可以用以下代码检查自己的TCGAbiolinks
包的版本:
packageVersion("TCGAbiolinks")
## [1] '2.25.2'
如果是在2.25.1以下,需要安装开发版本的TCGAbiolinks
包,安装方法如下:
if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")
BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")
BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")
安装完成后,重新使用packageVersion("TCGAbiolinks")
查看版本。
如果你用上面的安装代码报错,那么你的R语言基础可能不过关,你需要参考以下教程:可能是最好用的R包安装教程!
然后是路径问题
**路径必须要正确,你位置都搞错了,代码找不到你放文件的位置,那肯定是报错!**路径设置可以参考这篇推文:手动下载的TCGA也是可以用TCGAbiolinks整理的。
我在里面说的非常清楚,你的文件路径必须是在GDCdata\TCGA-COAD\harmonized\Transcriptome_Profiling\Gene_Expression_Quantification这个路径下,而且脚本getTCGAexpr.r
必须和GDCdata
在同一个文件夹下!!!!
下载方式问题
如果你是直接用TCGAbiolinks
下载的数据,那么路径一般不会有大问题,只要你把脚本和GDCdata放在同一个文件夹下就行了。
如果你是在官网下载的,或者用gdc_clinet下载的,就必须按照这篇推文介绍的方法进行选择:可能是最适合初学者的TCGA数据下载教程,**命令行或者图形界面都可以,关键是选择的时候一定要选对!!**如果没选对,就会出现开头所示的报错!!
以上3个问题,我在脚本使用注意里都明确说明了,实在是不懂为什么还有那么多问题!!!
2.0版本
我觉得有一部分是我的原因,作为一个已经学会的人,我已经忘记了自己不会的时候是什么样子,现在也无法理解初学者为什么会遇到那么多报错。
所以我改了一下脚本,1行代码下载并整理6种类型的TCGA表达矩阵和临床信息!!
主要是以下改进:
- 在任何位置都可以运行,不需要构建路径!
- 会自动下载数据,不需要手动下载
2.0版本的脚本我也放在了QQ群里,需要的加群下载即可。
使用方法和之前一模一样!!
但我还是建议你先看一下使用注意!!
- 需要良好的网络
TCGAbiolinks
包的版本必须要在2.25.1以上
下面是使用方法:
加载需要的R包:
library(TCGAbiolinks)
library(SummarizedExperiment)
library(tidyverse)
加载脚本"getTCGAexpr.r":
source("getTCGAexpr.r")
使用函数,需要提供TCGA的癌症简称,比如:TCGA-LUSC。
getTCGAexpr(project = "TCGA-LUSC")
这个脚本会自动从GDC官网下载最新的数据,所以需要联网,如果你的网络不好,可以手动下载,按照这篇推文自己构建合适的路径:xxxxxxx,它也可以成功!
完成后会在当前目录多出一个output_expr文件夹,里面就是6个表达矩阵和临床信息
- TCGA-LUSC_expr.rdata:原始的se对象,所有信息都是从这里面提取的;
- TCGA-LUSC_clinical.rdata:TCGA-LUSC的临床信息;
- TCGA-LUSC_lncRNA_expr_counts.rdata:lncRNA的counts矩阵;
- TCGA-LUSC_lncRNA_expr_fpkm.rdata:lncRNA的fpkm矩阵;
- TCGA-LUSC_lncRNA_expr_tpm.rdata:lncRNA的tpm矩阵;
- TCGA-LUSC_mRNA_expr_counts.rdata:mRNA的counts矩阵;
- TCGA-LUSC_mRNA_expr_fpkm.rdata:mRNA的fpkm矩阵;
- TCGA-LUSC_mRNA_expr_tpm.rdata:mRNA的tpm矩阵;
新版TCGA表达矩阵1行代码提取2.0版相关推荐
- 新版TCGA表达矩阵提取简单版
很多人因为网络原因不能使用TCGAbiolinks这个神包下载TCGA的RNA-seq数据,只能通过浏览器访问GDC TCGA的官网进行下载,而下载后得到的是一个个文件夹,对于如何整理成一个表达矩阵也 ...
- 新版TCGA数据库学习:提取新版TCGA表达矩阵(tpm/count/fpkm)
现在使用TCGAbiolinks下载转录组数据后,直接是一个SummarizedExperiment对象,这个对象非常重要且好用.因为里面直接包含了表达矩阵.样本信息.基因信息,可以非常方便的通过内置 ...
- 10 行代码提取复杂 Excel 数据
[摘要] 把 Excel 文件导入关系数据库是数据分析业务中经常要做的事情,但许多 Excel 文件的格式并不规整,需要事先将其中的数据结构化后再用 SQL 语句写入数据库.而一般情况下,结构化的工作 ...
- 《第一行代码 Android 第2版》下载
<第一行代码 Android 第2版> https://pan.baidu.com/s/1B718h7h3601iEe8gIN9oAQ
- 保存blob到本地_用12行代码提取浏览器自动保存的密码
在本文中,我将演示如何轻松提取Chrome配置文件中保存的用户名和密码.有人可能会认为Chrome会加密自动保存的密码,但并非如此.当你在使用Chrome时,往往需要输入某个密码才能同步自动保存的密码 ...
- 第一行代码 Android 第2版 书评
从来没有写书评的习惯,但书实在太差,还让我花了不少时间去阅读,所以必须写一下(本人已阅读:1,2,3,4,9章). 写之前我还去看过作者的博客,单一问题的描述能力不错,但组织并写好一本书的能力基本为零 ...
- 干货干货~C语言版学生成绩管理系统【数据结构课程设计,百行代码实现功能强化版(内附源码)】
前言 关于这个系统是我们专业要求做的一个课程设计,本来是上个学期交的,我也是上个学期弄好的,打算发出来,但是一直没交上去(怕交上去之前发出来老师说我作弊...),今天就把我做的这个系统分享给大家,不足 ...
- Kotlin 基础语法(《第一行代码(第三版)》第二章读书笔记)
资源来自<第一行代码>(第三版)第二章 网络试读: https://www.ituring.com.cn/book/tupubarticle/30209 以下为笔记 转存失败重新上传取消正 ...
- 第一行代码:Android(第三版)
阿里云盘链接:「第一行代码 - 第三版.pdf」https://www.aliyundrive.com/s/E7nKMMjfKmT 提取码: x3y3
最新文章
- java 十亿数据量运行速度慢_Java学习进阶之数据结构知识梳理
- 【转】DOS下文件传输---初识TCP网络编程改版
- Dubbo简单介绍及实例
- php 获取字符串中的url,php使用正则表达式获取字符串中的URL
- c语言 嵌入式开发环境搭建,嵌入式C语言环境的搭建
- Eclipse 安装插件报错:An error occurred while collecting items to be installed session context was...解决方法汇总
- 在shell中全局变量与局部变量的区别及其举例
- vue各种组件(不断增加中...)
- 得具备点靠钱赚钱的能力
- tp3.2 多字段模糊查询
- EditorUtility.SetDirty 设置已改变
- 关于x64dbg里面的Assemble
- 从零开始学JAVA:一、Java语言概述
- Java-图片处理 Gif转Jpg
- Hyperledger04
- 门面担当——外观模式
- 抑郁症自我测试皮肤软件,皮肤瘙痒像虫子爬竟是抑郁症
- 利用点赞功能提升Linkedin账号曝光率和活跃度
- 商务谈判中如何表示同意Agreement
- 解决 Java poi 3.8 等版本 操作 word 插入 图片 不成功的问题
热门文章
- 微信扫描二维码安卓弹出默认浏览器(苹果打开App Store)打开下载链接
- MNS(非极大值抑制)python实现
- jdk,neo4j社区版本下载与安装
- 解决PYTHON爬取:RESPONSE.STATUS_CODE为418、403 问题
- 小程序源码:云开发表情包制作神器微信小程序
- Cocos Creator 判断Touch位置在节点(Node)内
- 小区公共广播系统设备接线_广播系统常见四种故障分析
- 当Kali Rolling作为笔记本唯一一个系统
- jQuery库是什么
- (手写识别) Zinnia库及其实现方法研究