1.背景介绍

重要数据

  1. 外显子数据
  2. 表达数据
  3. 小RNA测序数据
  4. 拷贝数芯片
  5. 甲基化数据
  6. 蛋白质组学数据
  7. 临床信息

癌症背景知识

网页工具大全

  • GDC
  • cbioportal:按照paper来分类的
  • UCSC
  • FIREHOSE
  • oncolnc
  • gepia
  • tanric

相关数据库

  • GTEx
  • CCLE

2.使用UCSC Xera网页工具

浏览器搜索UCSC Xera,点击Launch Xera即可以在线搜索某些癌症的信息,先在Search栏输入癌症名,根据出现的结果,选择想要检索的那个数据库,点Done;之后可以根据自己的生物学背景知识以及想要挖掘这个癌症哪方面的需求,选择合适的选项,可以不断fitter,找到自己想要的数据。
过滤完成之后,是可以在线直接画出图像的,根据图像的有关信息,初步得到一些结论。

UCSC Xera

3.使用Broad GDAC firehose网页工具

Broad GDAC firehose

利用在线网页提供的数据进行数据库挖掘,找到一些感兴趣的基因且和疾病有较为显著的关系,然后就可以后续做生物学实验验证,是否有这样的关系。个人理解即反推验证法,通过实验数据确实能得到这样的结果,则说明确实存在这样的生物学意义(每一种影响的背后都可能对应着一种生物学机制)。

4.文章规律讲解

4.1Signatures规律

可以挖掘的东西,如图左边提到的东西,可以联合几个一起在这些癌症里面挖掘。

4.2WGCNA LASSO COX

5.数据下载方式

需要关注的数据

5.1GDC官方下载工具

GDC给出了一系列的用户友好选择框,你只需要根据条条框框来选择就可以下载到自己想要的数据,就不需要从几百个文件里面漫无目的地查找。
GDC链接: https://portal.gdc.cancer.gov/,根据自定义过滤条件拿到mainfest文件,只需要根据过滤得到的mainfest文件进行GDC下载数据即可,下载下来的文件,是每个样本一个文件夹,需要合并,需要了解为什么用XML来存储信息。

进入这个界面以后,可以选择File和Cases的格式,勾选自己想要的数据类型,比如mi-RNA,临床信息等等,宗旨经过筛选以后的样本数据就会少很多,然后点击左边的Mainfest,下载到本地,拖到服务器就可以进行后续整理,目前没有尝试,不是很清楚具体的linux命令。

6数据整理

TCGA学习笔记一(生信技能树概述版)相关推荐

  1. R:生信技能树学习笔记一

    生信技能树小破站:R应该这样学1-4 1.查看已经安装的包的地址 .libPaths() 2.怎么查看函数用法 #在RStudio的右下角窗口的help可以看到 ?函数名 3.三个有用的函数 1.he ...

  2. R:生信技能树学习笔记二

    生信技能树小破站:R应该这样学5-7 1.热图 rm(list=ls()) library(pheatmap) a1=rnorm(100) dim(a1)=c(5,20) #设置维度 pheatmap ...

  3. CancerSubtypes包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理)

    CancerSubtypes包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理,感谢Jimmy老师!) 1. 引言 2. 数据处理 2.1 基本处理 2.1.1 通过检查数据分布来分 ...

  4. APPCAN学习笔记004---AppCan与Hybrid,appcan概述

    APPCAN学习笔记004---AppCan与Hybrid,appcan概述 技术qq交流群:JavaDream:251572072 本节讲了appcan的开发流程,和开发工具 笔记不做具体介绍了,以 ...

  5. APPCAN学习笔记003---原生开发与HTML5技术

    APPCAN学习笔记003---原生开发与HTML5技术 技术qq交流群:JavaDream:251572072 1.HTML5的优势:   HTML5强悍牢固的骨架   CSS3精致到每一个毛孔的皮 ...

  6. 华为HCIA-datacom 学习笔记18——SDN与NFV概述

    华为HCIA-datacom 学习笔记18--SDN与NFV概述 SDN与NFV概述 1.计算机时代的演进 1.1大型机 专门的硬件 专门的操作系统 专门的应用.(稳定性能好,但封闭) 1.2小型机 ...

  7. UDT协议学习笔记(一)UDT概述

    UDT协议学习笔记(一)UDT概述 本人近来就职于国内某著名互联网血汗工厂,从事分布式后台相关的工作,最近的项目主要是网络相关.我们有许多海外的proxy节点,为了加速海外proxy与国内某机房的通信 ...

  8. PLC学习笔记(一):概述

    目录: PLC学习笔记(一):概述 PLC学习笔记(二):PLC结构(1) PLC学习笔记(三):PLC结构(2)

  9. 嵌入式学习笔记——STM32的USART通信概述

    文章目录 前言 常用通信协议分类及其特征介绍 通信协议 通信协议分类 1.同步异步通信 2.全双工/半双工/单工 3.现场总线/板级总线 4. 串行/并行通信 5. 有线通信.无线通信 STM32通信 ...

最新文章

  1. Python turtle库的画笔控制说明
  2. [Mac OSX技巧] 通过命令行开启安全性与隐私中的任何来源
  3. 转载:制造业信息化:计划模拟APS软件驱动敏捷制造
  4. 货币基金新规将出,限制T+0提现及支付额度
  5. Tapestry 5 原则
  6. k均值聚类算法原理和TensorFlow实现
  7. java-net-php-python-jsp音像店租赁录像计算机毕业设计程序
  8. SPSS 工作空间不足的解决办法
  9. 按键精灵 获取某网站服务器时间,按键精灵如何获得网络时间的毫秒
  10. gopl 底层编程(unsafe包)
  11. 湖北移动CM201-1-CH _S905L3B-UWE5621DS_线刷固件包
  12. python爬虫公众号_python爬虫_微信公众号推送信息爬取的实例
  13. 电脑硬盘不小心格式化了文件怎么恢复,手把手教你变恢复高手
  14. 对于大数据、人工智能时代,我们应该如何面对?
  15. 血战Maven,各种问题,Eclipse控制台乱码,Maven打包时Javadoc失败-UTF-8-BOM编码
  16. Python之第六章 内置容器 --- 字符串
  17. 想进BAT?这些测试面试题助你一臂之力(附答案)
  18. 杰理zHiUSB设备功能【篇】
  19. linux安装python3.7的步骤_在Linux上安装Python3.7.1
  20. ant在linux下的配置

热门文章

  1. 咖说 | TON 项目宣告终止!但社区还将继续进行开发和发币
  2. 仅用Python三行代码,实现数据库和excel之间的导入导出
  3. LaTeX 中处理参考文献的三种方法总结
  4. 谏言工信部:网站备案系统miibeian.gov.cn实在难用!
  5. 基于近端策略优化的阻变存储硬件加速器自动量化
  6. 物联网开源框架 Thingsboard 使用总结
  7. 【兼容性】ios上设置overflow: scroll不滚动bug
  8. esp8266设置sta失败_ESP8266的AP模式与STA模式简单测试
  9. 怪异盒模型flex布局
  10. /Users/ng/Library/Developer/CoreSimulator/Devices/9B82D44F-703C-481E-BA28-71892DEA823D/data/Containe