之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。

本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现,本次使用TCGA下载

数据部分

#载入R包和数TCGA-LIHC的maf数据
library(maftools)
laml.maf = read.csv("TCGA.LIHC.mutect.maf.csv",header=TRUE)#本次只展示maf的一些统计绘图,只读入组学数据,不添加临床数据
laml = read.maf(maf = laml.maf)
#查看数据的基本情况
laml
An object of class  MAF ID summary   Mean Median1:             NCBI_Build       1     NA     NA2:                 Center       1     NA     NA3:                Samples     364     NA     NA4:                 nGenes   12704     NA     NA5:        Frame_Shift_Del    1413  3.893      36:        Frame_Shift_Ins     551  1.518      17:           In_Frame_Del     277  0.763      08:           In_Frame_Ins     112  0.309      09:      Missense_Mutation   28304 77.972     63
10:      Nonsense_Mutation    1883  5.187      4
11:       Nonstop_Mutation      45  0.124      0
12:            Splice_Site    1051  2.895      2
13: Translation_Start_Site      65  0.179      0
14:                  total   33701 92.840     75

#可以将MAF文件的gene ,sample的 summary 的信息,输出到laml前缀的summary文件

write.mafSummary(maf = laml, basename = 'laml')

laml_geneSummary.txt

laml_sampleSummary.txt

分析,可视化

1,绘制MAF文件的整体结果图

plotmafSummary(maf = laml, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE)

2,绘制oncoplot图

#oncoplot for top 20 genes.
oncoplot(maf = laml, top = 20)

添加SCNA信息,添加P值信息,添加临床注释信息,更改颜色等可参考 maftools | 从头开始绘制发表级oncoplot(瀑布图)

3,绘制Oncostrip

可以使用 oncostrip 函数展示特定基因在样本中的突变情况,此处查看肝癌中关注较多的'TP53','CTNNB1', 'ARID1A'三个基因,如下:

oncostrip(maf = laml, genes = c('TP53','CTNNB1', 'ARID1A'))

4 Transition , Transversions

titv函数将SNP分类为Transitions_vs_Transversions,并以各种方式返回汇总表的列表。汇总数据也可以显示为一个箱线图堆积条形图显示每个样本中的转换比例

laml.titv = titv(maf = laml, plot = FALSE, useSyn = TRUE)
#plot titv summary
plotTiTv(res = laml.titv)

5 Rainfall plots

使用rainfallPlot参数绘制rainfall plots,展示超突变的基因组区域。detectChangePoints设置为TRUE,rainfall plots可以突出显示潜在变化的区域.

rainfallPlot(maf = laml, detectChangePoints = TRUE, pointSize = 0.6)

6 Compare mutation load against TCGA cohorts

通过tcgaComapre函数实现laml(自有群体)与TCGA中已有的33个癌种队列的突变负载情况的比较。

#cohortName 给输入的队列命名
laml.mutload = tcgaCompare(maf = laml, cohortName = 'LIHC-2')

7 Genecloud

使用 geneCloud参数绘制基因云,每个基因的大小与它突变的样本总数成正比。

geneCloud(input = laml, minMut = 15)

8 Somatic 交互性

癌症中的许多引起疾病的基因共同发生或在其突变模式中显示出强烈的排他性。可以使用somaticInteractions函数使用配对Fisher 's精确检验来分析突变基因之间的的co-occurring 或者exclusiveness。

#exclusive/co-occurance event analysis on top 10 mutated genes.
Interact <- somaticInteractions(maf = laml, top = 25, pvalue = c(0.05, 0.1))
#提取P值结果
Interact$gene_sets

gene_set       pvalue

1:   AXIN1, TP53, CTNNB1 0.0001359059

2:  TP53, CTNNB1, ARID1A 0.0017044866

3:     AXIN1, TP53, APOB 0.0083559763

4:      AXIN1, TP53, ALB 0.0166487594

5: AXIN1, CTNNB1, ARID1A 0.0354069454

6:      AXIN1, ALB, APOB 0.0503831670

可以看到TP53和CTNNB1之间有较强的exclusiveness,也与文献中的结论一致。

9 两个队列比较(MAFs)

由于癌症的突变模式各不相同,因此可是 mafComapre参数比较两个不同队列的差异突变基因

#输入另一个 MAF 文件
Our_maf <- read.csv("Our_maf.csv",header=TRUE)
our_maf = read.maf(maf = Our_maf)#比较最少Mut个数为5的基因
pt.vs.rt <- mafCompare(m1 = laml, m2 = our_maf, m1Name = 'LIHC', m2Name = 'OUR', minMut = 5)
print(pt.vs.rt)

  • result部分会有每个基因分别在两个队列中的个数以及P值和置信区间等信息。

  • SampleSummary 会有两个队列的样本数。

1) Forest plots

比较结果绘制森林图

forestPlot(mafCompareRes = pt.vs.rt, pVal = 0.01, color = c('royalblue', 'maroon'), geneFontSize = 0.8)

10 Oncogenic 通路

OncogenicPathways 功能查看显著富集通路

OncogenicPathways(maf = laml)
#会输出统计结果
Pathway alteration fractionsPathway  N n_affected_genes fraction_affected1:    RTK-RAS 85               68         0.80000002:        WNT 68               55         0.80882353:      NOTCH 71               52         0.73239444:      Hippo 38               30         0.78947375:       PI3K 29               24         0.82758626: Cell_Cycle 15               11         0.73333337:        MYC 13               10         0.76923088:   TGF-Beta  7                6         0.85714299:       TP53  6                5         0.8333333
10:       NRF2  3                2         0.6666667

可以对上面富集的通路中选择感兴趣的进行完成的突变展示:

PlotOncogenicPathways(maf = laml, pathways = "PI3K")

好了,以上就是使用maftools包对MAF格式的组学数据的汇总,分析,可视化。

生信宝典后台回复“maf文件”即可获得示例的maf文件和代码

【觉得不错,右下角点击赏个“在看”,转发就是赞赏,谢谢!】

GEO/TCGA数据

  • UCSC XENA - 集大成者(TCGA, ICGC)

  • ICGC数据库使用

  • TCGA数据库在线使用

  • BROAD开发的TCGA分析平台,强大的下载功能

  • cBioPortal功能强大的TCGA再分析平台

  • 这是数据更新最实时的TCGA网站,功能强大

  • 不懂R,如何进行GEO数据库表达谱的差异分析、富集分析、蛋白互作、可视化?

  • 典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集

  • 典型医学设计实验GEO数据分析 (step-by-step) - 数据获取到标准化

  • 这个只需一步就可做富集分析的网站还未发表就被CNS等引用超过350次

  • 一个逆天的small RNA-seq数据挖掘神器

  • 用了这么多年的PCA可视化竟然是错的!!!

生信工具

  • OrthoMCL鉴定物种同源基因 (安装+使用)

  • 微生物组学数据分析工具综述 16S+宏基因组+宏病毒组+宏转录组

  • 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版)

  • 39个转录组分析工具,120种组合评估(转录组分析工具大比拼 (完整翻译版))

  • 无参转录组分析工具评估和流程展示

  • Graphpad,经典绘图工具初学初探

  • 维恩(Venn)图绘制工具大全 (在线+R包)

  • 别人的电子书,你的电子书,都在bookdown

  • Rfam 12.0+本地使用 (最新版教程)

  • 轻松绘制各种Venn图

  • ETE构建、绘制进化树

  • psRobot:植物小RNA分析系统

  • 生信软件系列 - NCBI使用

  • 掌握这个网站,万方、维普、CNKI等众多数据库文献统统可以免费下载!

  • 拿到基因两眼一抹黑?没关系,先做个基因富集分析吧!

  • 科研小萌新,掌握这些技巧,轻松玩转各个基因!

  • 引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!

  • 如果你经常用PubMed,那么这个插件将非常好用!

  • 基于人工智能的文献检索,导师查找,更聪明

  • GeenMedical:文献查询、筛选、引用排序、相似文献、全文下载、杂志分区、影响因子、结果导出、杂志评述、直接投稿,一站服务

  • 如何快准狠地找到相关领域的经典文献?

  • Excel改变了你的基因名,30% 相关Nature文章受影响,NCBI也受波及

  • 这些基因的名字太有才了,研究一下都可以发10分文章

  • 文献检索新姿势,教你如何直搜文中的科研图片!

  • Endnote X8云同步:家里单位实时同步文献笔记,有网随时读文献

  • 还在慌?Endnote的个性化文献引用助毕业论文一臂之力

  • 参考文献中杂志名字格式混乱问题一次解决 - 修改style是没用的

  • 参考文献中杂志名字格式混乱问题一次解决

  • 实用网站和在线工具推荐

  • 在线浏览器,在线PS,在线AI,在线编程 …

  • Gephi轻松绘制超美网络图

  • 微生物组间差异分析神器-STAMP简明教程 中文帮助文档

  • 微生物网络构建:MENA, LSA, SparCC和CoNet

  • FUNGuild:真菌功能注释

  • 在线RaxML构建系统发育树

  • MetaboAnalyst 4.0,代谢组学研究利器的升级

  • RepeatMasker:基因组重复序列注释

  • 基因组注释 1重复序列 2非编码和编码基因3功能注释Prokka

  • 去东方,最好用的在线GO富集分析工具

  • 超简便的国产lncRNA预测工具

  • LGC简单漂亮的在线生信绘图工具

  • MicrobiomeAnalyst:可视化微生物组网页工具

  • NAR:MicrobiomeAnalyst微生物组分析师——统计、可视化和元分析微生物组数据的网页工具

  • Docker的基本使用-Ubuntu18.04

  • Linux命令screen—终端切换,工作环境保存,画面同步,防断网

  • Bioconda软件安装神器:多版本并存、环境复制、环境导出

  • CIRCOS圈图绘制 - circos安装

  • QIIME2中文教程-把握分析趋势

  • 9个模块+40余款软件+老司机辣评 16S信息分析流程软件和数据库合集

  • 扩增子分析神器USEARCH 简介 v11新功能v11命令大全OTU表抽平otutab_rare核心OTU鉴定otutab_core

  • 扩增子分析神器VSEARCH 分析流程 2.8.1中文帮助文档

往期精品

画图三字经 生信视频 生信系列教程

心得体会 TCGA数据库 Linux Python

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信 2019影响因子 GSEA 单细胞

后台回复“生信宝典福利第一波”获取教程合集

maftools|TCGA肿瘤突变数据的汇总,分析和可视化相关推荐

  1. TCGA肿瘤基因数据的访问(二)

    TCGA(The Cancer Genome Atlas)项目完成后,最终和其它的一些肿瘤医学项目一起归档在 GDC Portal网站,方便人们访问. 网址是  https://portal.gdc. ...

  2. excel实战应用案例100讲(四)-Excel玩转数据:从分析到可视化

    总有人觉得Excel,low,可我从没这样想."装机必备"的封号不只是调侃,要做更综合的功能,自然在更专业的领域无法绕开众口难调的窘境.况且就实用性而言,Excel用好了也是绝对的 ...

  3. matlab数据分析之脸谱图,MATLAB数据记录、分析和可视化:在MATLAB上绘制DHT11传感器读数...

    图形表示总是有助于可视化数据,通过查看它们变得非常容易找到趋势和模式.有许多软件可用于根据输入值绘制图形,但在嵌入式系统中,MATLAB是最流行的软件之一,它不仅可以以图形格式显示结果,而且可以轻松地 ...

  4. 数据分析毕业设计 大数据京东消费行为分析与可视化 - python 机器学习

    1 前言

  5. 不是maf格式的somatic突变数据就没办法读入到maftools了么

    因为使用的是百度李彦宏的文章数据,大家会比较倾向于处理tcga的肿瘤突变数据,虽然仅仅是输入数据的不一样,后续分析都是靠 maftools 这个包,maftools 全能无需我再吹嘘,必须花十几个小时 ...

  6. sql 某列数据全部为0则不显示该列_数据产品经理养成记(五):汇总分析

    学会了如何查找数据后,接下来就要对数据进行分析处理,比如求和.平均值.加总等等.这些对数据的加工处理通过汇总函数来实现.汇总函数在之前的两篇文章中都有涉及,这里采用概念--案例--总结的方式,集中介绍 ...

  7. 小学身高体重测试软件,学生身高、体重检测汇总分析

    2018年秋季,我校对全校993名学生进行体质健康检查.卫生室教师检测视力:体育组教师检测身高.体重.肺活量.镇中心卫生医院负责检查血压.龋齿.内科等16项指标,共计20项内容. 本文针对学生的身高. ...

  8. 全球100款大数据工具汇总,入行必备

    全球100款大数据工具汇总,入行必备 1. Talend Open Studio 是第一家针对的数据集成工具市场的ETL(数据的提取Extract.传输Transform.载入Load)开源软件供应商 ...

  9. 不需建模型,轻松处理数据的透视分析

    ​进行数据分析的时候,我们会根据分析的数据内容选择合适的图表来进行数据可视化分析和展示,对较大数据进行汇总分析时,我们常常会用到数据透视表,但是,excel里做数据透视表很复杂,总是记不了步骤,也经常 ...

最新文章

  1. shell命令查阅端口信息_短小强大的8个Linux命令,分分钟帮你提高工作效率!
  2. 怎么用爬虫筛选简历_Python爬虫面试简历
  3. 陈硕智能指针线程安全_C++ 创建线程的方法
  4. BZOJ.3218.a + b Problem(最小割ISAP 可持久化线段树优化建图)
  5. 从0搭建一个Springboot+vue前后端分离项目(八)把数据从后台传到前端进行展示渲染,完善增删改查
  6. 微信作为一种提供即时通讯服务器,Golang 写的即时通讯服务器 im(服务组件形式)...
  7. 汤普森算法_火箭队闹剧不断!自编算法向NBA申诉:这个公式要在NBA普及!
  8. boost::boykov_kolmogorov_max_flow用法的测试程序
  9. 选购维生素C需要注意的事项
  10. 预充电电路工作原理_常见变频空调室外机电路工作原理及组成
  11. Django 知识点回顾
  12. Python字符串index()方法应用案例一则
  13. 2021年中国电动气动控制器市场趋势报告、技术动态创新及2027年市场预测
  14. 搜集了一些AIDA64的GPGPU测试结果,现整理成表格共享
  15. dnf维护怎么偷跑进服务器,DNF:回归玩家必看,这四点忠告要牢记,一不小心就被劝退...
  16. 磁力聚合搜索工具中文版magnetW 3.1.1
  17. 金邦达:做最值得客户尊重的IC卡项目服务商
  18. vue之table案例
  19. 计算机视觉博士去向,为什么现在不看好 CV 方向了呢?
  20. 加法、乘法、除法贡献度计算实现

热门文章

  1. 【操作系统】独立进程与协作进程
  2. Python3 标准库及相关内容
  3. 写在 2019 年后的蚂蚁、头条、拼多多的面试总结
  4. Git学习笔记(2) --- References探寻
  5. Java 导入导出Excle表格 两种方式
  6. 【CentOS 7笔记13】,find用法和文件传输#171025
  7. 杭州一高中推刷脸吃饭:8秒搞定;乌海市与上海荷福签署合作协议 进入人工智能矿业安全领域...
  8. Get shell By Powershell
  9. maven deploy distributionManagement
  10. Web开发者一定会用的5个google浏览器插件