linux下载ccle数据,TCGA数据库下载,挖掘,Xena Browser可视化
1.数据库简介:
癌症和肿瘤基因图谱 (The Cancer Genome Atlas, TCGA)
于2006年启动,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。
作为目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上,还体现在多组学数据,包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP Indels 。
数据库网址:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga
推荐浏览器:Chrome, Edge, or Firefox
截止到2020年6月29日,数据库数据统计如下:
2.数据类型:
数据水平:
Level1和Level2 数据为controlled-access(限制下载),Level3有部分是controlled-access,其余是开放下载,数据level显示“Unauthorized”,则表示不能直接下载,需要先向TCGA申请使用权限。
3.数据下载:
TCGA Data Portal 及 GDC Data Transfer tool #官网推荐
Xena Browser #小编推荐
R包
RTCGA Toolbox
TCGAbiolinks
3.1 TCGA Data Portal :
优点:数据最全,更新最快
缺点:下载数据量有限制,部分文件按照样本存储,如果下载某一个癌症的RNA数据,要下载好几百个文件,合并工作量大。
数据下载流程
TCGA数据库在数据下载有规定:Cart文件夹大于50M时,只能通过Data Transfer Tool工具进行下载。
该工具使用说明:
需要用命令行方式下载。
4.数据可视化:
UCSC Xena功能基因组浏览器是集分析、可视化、Galaxy与一体的新一代在线数据分析和可视化平台。
现有138个队列的1588个公共数据集包括 TCGA, ICGC, TARGET, GTEx,CCLE等都进行了标准化处理。因此不同的数据集之间可以组合比较。对任何展示的变量(不同表型病人的比较,不同基因表达的比较,突变有无的比较,甲基化水平的变化)都可以进行生存分析,绘制KM-plot,计算其对病人生存率的影响。热图可以根据任一变量排序,然后查看其它变量的变化。如根据药物处理状态排序,查看基因的表达或修饰的变化。
网址:https://xenabrowser.net/datapages/
优点:Xena操作简单,下载方便,可以下载到较新的TCGA数据;
缺点:表达数据只有log2(RSEM+1),无read_count值。无法下载到read
count值;
4.1 可视化操作-生存分析:
1.UCSC Xena-How do I make a KM plot? #生存分析
我比较懒,不想码字,大家可以按照下图1-7的步骤进行操作,如果图片显示异常可以私信我。
生存分析步骤1
步骤2 画图
生存分析步骤2
4.2 可视化操作-分组基因表达比较:
UCSC Xena-How do I compare tumor vs normal expression?
操作步骤如图:
表达比较步骤1
表达比较步骤2
4.3 可视化操作-个性化分组:
如果需要个性化对样本进行分组比较,可以按照下方图片的实例进行操作,示例想要分析的内容是,ATRX基因终止和移码突变分组与不携带该突变的样本之间生存期有无差别。
步骤1
利用分组信息,进一步查看不同分组条件下是否有生存差异。
步骤2
未完待续~
linux下载ccle数据,TCGA数据库下载,挖掘,Xena Browser可视化相关推荐
- 数据库数据 | TCGA数据库33种癌症的
miRNA Isoform Expression数据
该数据是我自己下载整理过的数据. 下载日期:2021年8月25日 下载方式:TCGAbiolinks包 数据类型:RData 变量名称:mir_Count:mir_RPM path <- dir ...
- linux下载TCGA数据,TCGA数据库讲解与数据下载
原标题:TCGA数据库讲解与数据下载 前几期,生信草堂和大家分享了一篇TCGA数据下载的文章,有小白表示TCGA还是好深奥,找不到下载地址的,看不懂数据格式.今天小编就从头开始,娓娓道来,再给大家介绍 ...
- TCGA数据库下载及全流程分析(更新中)
一.GDCRNATools包下载 首先下载R包 if (!requireNamespace("BiocManager", quietly = TRUE))install.packa ...
- linux下载ccle数据,对CCLE数据库可以做的分析--转载
转载:http://www.bio-info-trainee.com/1327.html 收集了那么多的癌症细胞系的表达数据,拷贝数变异数据,突变数据,总不能放着让它发霉吧! 这些数据可以利用的地方非 ...
- R语言 关联TCGA数据库下载的RNA-SEQ数据和临床信息
刚开始学习TCGA数据处理和分析,记下来方便以后查看 setwd("E:/MyData/luadRNA-SEQ-20201028") #把工作目录定位到manifest文件所在的位 ...
- linux下下载fnl数据,方便大家下载fnl
环境python3.6 ``` #!/usr/bin/env python #阿蒋 import sys, os import requests import datetime def check_f ...
- 数据库数据 | TCGA数据库33种癌症的
transcriptome profiling (RNA-Seq) 数据
该数据是我自己下载整理过的数据. 下载日期:2021年7月12日 下载方式:TCGAbiolinks包 数据类型:RData 变量名称:expDataTPM/Counts/FPKM > ##加载 ...
- filetransferdmg魅族下载_数据通app下载-FileTransfer 安卓版v2.7.1-PC6安卓网
数据通app是一款自动发现局域网内的其他设备,并且共享图片.文件等的手机客户端,数据通app还可以通过与电脑连接,可实现数据备份.远程同步的软件.有了数据通,手机或者电脑上的文件随时能找回来,再也不用 ...
- mysql数据万能导入工具下载_mysql数据导入工具下载 - 数据导入工具(EMS Data Export for MySQL) v3.7.0多语特别版下载 - 第九软件网...
EMS Data Export for MySQL多语特别版是一款交叉平台的数据库导入工具,可以快速地从MS Excel 97-2007, MS Access, DBF, XML, TXT, CSV, ...
最新文章
- Centos系统上安装php遇到的错误解决方法集锦
- JNI错误记录--JNI程序调用本地库时JVM崩溃
- 三网齐发 HTC One行货确定4月24日发布
- ICO取缔一锤定音,投资者、发起方、交易所如何处理后续风险,保障权益?
- Sublime Text 2搭建Go开发环境,代码提示+补全+调试
- 系统性能测试--杨建旭
- 前端学习(1864)vue之电商管理系统电商系统之绘制登录表单区域带icon的输入框
- android横向滑动选项卡,android – 如何使用可滑动选项卡实现PageTransformer
- 7-42 关于堆的判断 (25 分)
- Java并发——Java与多线程
- HoloLens 2开发:获取并渲染双手
- 动手学习深度学习的PDF电子版
- 涂抹Oracle—三思笔记之一步一步学Oracle
- 米思齐Mixly图形化编程---呼吸灯与可调档位灯
- 最全最好的Tracker地址目录
- nmos导通流向_讨论一下:用NMOS还是PMOS关断好? - 模拟与混合信号 -
电子工程世界-论坛 -
手机版...
- centos8安装配置web服务器
- CCF-分蛋糕-Java
- 根据经纬度查询数据mysql
- 快速解决“多分类不平衡”问题
热门文章
- LSV软件不定时无法下载谷歌影像的原因
- android常用api大全,Android相关常用API……
- oralce常见异常——ORA-12514: TNS:listener does not currently know of service requested in connect descript
- 一个产品从0到1的完整流程
- 用python画一个蜡笔小新
- Laravel框架使用maatwebsite/excel导出自动换行
- 牛客练习赛107 A~D除C
- netty--关于NIO和OIO
- 一个电脑可以装两个java么,是否可以在一台计算机上安装多个Eclipse?
- 手机端分页 php,网站开发-php开发手机论坛(9)-分页显示评论