deconstructSigs-mutation signature看一下你的数据是什么“气质”的?

本文首发于“生信补给站” https://mp.weixin.qq.com/s/k7yzk9hPX3Bi-ohAo83ZYw

还有其他 R统计 绘图 生信的干货,也许有需要的呢?

Mutational Signatures 首次出现在2013年的nature文章Signatures of mutational processes in human cancer中(https://www.nature.com/articles/nature12477)。**将mutation位置加上前后一个碱基,构成三碱基模式,然后统计96(6 * 4 * 4)种突变组合的情况。

好奇为什么是96种的,可以查一下文献。

本文介绍如何利用deconstructSigs-R包进行mutation signature分析。

一 准备R包,数据

#install.packages("deconstructSigs")
library(deconstructSigs)
#读入数据
head(sample.mut.ref)Sample  chr      pos ref alt
1      1 chr1   905907   A   T
2      1 chr1  1192480   C   A
3      1 chr1  1854885   G   C
4      1 chr1  9713992   G   A
5      1 chr1 12908093   C   A
6      1 chr1 17257855   C   Tclass(sample.mut.ref)
## [1] "data.frame"

只需要将自己的数据整理成以上五列(ID,chr,pos,ref,alt )信息即可,如果是TCGA中的MAF文件也是很好提取的。

二 mut.to.sigs.input构建输入文件

使用 mut.to.sigs.input 函数,构建计算signature的输入文件,得到每个样本的96种三碱基类型。

# Convert to deconstructSigs input
sigs.input <- mut.to.sigs.input(mut.ref = sample.mut.ref, sample.id = "Sample", chr = "chr", pos = "pos", ref = "ref", alt = "alt")

注:这一步也许会提示没有XX包,按照要求下载指定R包即可(也许是数据库,耐心安装)。

#查看结果信息
dim(sigs.input)
#[1]  2 96
head(t(sigs.input)) #只有两个sample:“1”和“2”1 2
A[C>A]A  9 1
A[C>A]C  7 1
A[C>A]G  5 0
A[C>A]T  7 0
C[C>A]A 10 3
C[C>A]C 18 2

以上就得到了sample.mut.ref文件中的每一个sample的96种三碱基类型的结果了。

三 推断signature的组成

# Determine the signatures contributing to the two example samples
sample_1 = whichSignatures(tumor.ref = sigs.input, signatures.ref = signatures.cosmic, sample.id = 1, contexts.needed = TRUE,tri.counts.method = 'default')

其中:

tumor.ref:每个sample的96种三碱基突变序列
signatures.ref:已知的signatures参考文件,可选signatures.nature2013和signatures.cosmic
sample.id:对应tumor.ref文件中的样本名
contexts.needed :是否需要突变上下文
tri.counts.method:三核酸序列标准化方式,默认“default” 不进行标准化 ;或者选择exome,genome,exome2genome,genome2exome 来限定区域。

3.2 查看返回结果

#查看结果
class(sample_1)
#查看权重结果
sample_1$weights#输出tumor的三碱基序列百分比
sample_1$tumor#三碱基序列百分比 * 权重
sample_1$product

whichSignatures会输出5个元素的list文件:

  • weights – data frame containing the weights assigned to each of the k signatures of the input signatures matrix

  • tumor – matrix of the trinucleotide contexts for the tumor sample used as input

  • product – matrix obtained when the tumor matrix is **multiplied by the assigned weights **

  • diff – matrix representing the difference between the tumor matrix and product matrix

  • unknown – numeric weight not assigned to any of the input signatures

3.3 指定signature权重

通过associated参数指定参与计算的signature

sample_1.associate = whichSignatures(tumor.ref = sigs.input, signatures.ref = signatures.cosmic, sample.id = 1, associated = c("Signature.1","Signature.22"),contexts.needed = TRUE,tri.counts.method = 'default')
sample_1.associate$weights

3.4 设定signature的阈值

通过signature.cutoff设定阈值,小于此值的为0

sample_1.cutoff = whichSignatures(tumor.ref = sigs.input, signatures.ref = signatures.cosmic, sample.id = 1, contexts.needed = TRUE,signature.cutoff = 0.08 ,tri.counts.method = 'default')sample_1.cutoff$weights

plotSignatures 可视化

# Plot example
plot_example <- whichSignatures(tumor.ref = sigs.input,signatures.ref = signatures.cosmic,sample.id = 1)# Plot output
plotSignatures(plot_example, sub = 'example')

查看sample1的signature的组成情况,就是上面plot_exampleweight,plotexampleweight , plot_exampleweight,plote​xampletumor , plot_example$product 的结果可视化。

参考资料:

https://github.com/raerose01/deconstructSigs

◆ ◆ ◆ ◆ ◆

精心整理(含图版)|你要的全拿走!有备无患 (R统计,ggplot2绘图,生信图形可视化汇总)

【觉得不错,右下角点个“在看”,期待您的转发,谢谢!】

deconstructSigs|探寻cosmic的独特“气质”-mutation signature !相关推荐

  1. 用deconstructSigs来做cosmic的mutation signature图

    用deconstructSigs来做cosmic的mutation signature图 作者的英文文档对这个包的用法描述的非常清楚, 我只是记录一下自己学习该包用法的一点感悟. 安装并加载必须的pa ...

  2. 秋天来了,穿衣搭配。简单几件穿出独特气质

    (七夕特约)秋天到了,简单几件美衣,穿出女生独特气质! 作为好好学习天天向上,习惯了做乖乖女的我,在学生时代从未想过除了学习之外的其他事情.可就这么清心寡欲的我,依然记得小学快毕业那年,老爸买了条粉红 ...

  3. 第8件事 3步打造产品的独特气质

    1.到底什么才是产品的气质?气质=独特魅力,吸引别人注意,使看到的人"过目不忘",并且让别人"不可救药"地.疯狂地爱上.有这样一种产品,它能让你一见钟情,它的某 ...

  4. 你知道吗?字体会让产品有不同的气质

    当我们拿到一款产品的包装或者登入了一个网站的时候,你是否会有意或者无意地留意到属于这个产品的特定的字体设计或者使用,从而影响到你对这个产品最直观的感受.精致.优雅.科幻.古典或者是觉得粗糙难看呢? 比 ...

  5. DNA 4. SCI 文章中基因组的突变信号(maftools)

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 87篇原创内容 公众号 突变信号(Muta ...

  6. 《腾讯网UED体验设计之旅》

    体验设计的热潮又一次从西方波及了中国的设计界,但这一次最为敏感的恰恰是媒体,每当一个新概念在国内传播时,国内的商业界.传媒界乃至学术界都兴奋无比,又一轮获取名利的机遇到来了.试想从花店买来的鲜艳无比的 ...

  7. 中国高端护肤品牌林清轩数字化特色店于广州开幕

    8月28日,中国高端护肤品牌林清轩,于广州举行了全新正佳广场数字化门店开幕仪式.以丰富的数字化沉浸体验,演绎东方时尚护肤美学,呈现出极具现代感与未来式购物体验的网红打卡空间,尽显山茶花护肤的神奇魅力. ...

  8. 华米科技直面未来:用技术和战略抓住真正大机会

    两千多年前,马其顿王国的国王亚历山大,曾给他的老师亚里士多德写过一封信,信中写到:"对我来说,相较于了解力量与统治,我更愿意认识什么是美好." 再进一步,那美好如何诠释?我们又听到 ...

  9. 成都旅游 必吃火锅 看蜀大侠龙头火锅炼成记

    在餐饮江湖,创造一个品牌并不难. 难的是在较短时间内能打造好.运营好.发展好一个品牌.在这方面,成都蜀大侠火锅可谓"现象级"的存在. 从2015年12月8日创立开始,一年内便开出7 ...

最新文章

  1. 设计模式学习笔记(一)之工厂模式、单例模式
  2. Use Excel Pivot Table as a BI tool
  3. jqGrid细节备注—page参数的设置
  4. java实现图片验证码
  5. c语言上机实验作业答案,第十二次C语言上机实验参考答案
  6. c# WPF设置软件界面背景为MediaElement并播放视频
  7. SoundPool基本用法
  8. 考研高等数学张宇30讲笔记——第一讲 高等数学预备知识
  9. 关于 AI 的数百个问题,清华男神刘云浩教授的 3 万字回复给整得明明白白|附抽奖送书...
  10. HTML+CSS仿小米官网首页 项目总结
  11. pytorch 入门教程 常用知识整理
  12. [艾兰岛]制作传送门之搭建系列——kura酱长期更新
  13. 计算机专利英语笔译,基于Trados2014的专利翻译实践报告-英语笔译专业论文.docx...
  14. [Usaco2009 Nov]lights
  15. 有人对你说辛苦了要怎么回复
  16. 2017第17届CBME中国孕婴童展、童装展会刊(参展商名录)
  17. SQL Server基础操作(此随笔仅作为本人学习进度记录三)
  18. 用一些助记符表示指令的计算机语言是,2015年海南农村信用社考试营业柜员计算机练习题1...
  19. JavaFX --- 标签、文本框、密码框、下拉框、按钮、单选按钮、复选框
  20. 共享单车大败局:谁是凶手,谁在买单?

热门文章

  1. 使您的软件运行起来: 了解有关缓冲区溢出方面的基础知识
  2. 面向对象分析与设计(图书管理系统)--实验4活动图
  3. GMV从5w日增到1000w,夏日经济下它是如何成为直播间的新宠?
  4. 《Web安全攻防 渗透测试实战指南》学习笔记(2) - Sqlmap
  5. OS内核(xv6)探究-系统调用
  6. 漫长的战役-笔/面试经历(finial)
  7. 此计算机上的硬盘驱动器要更新,Win10自动更新给微软闯大祸:搞坏用户电脑硬盘...
  8. 网络管理与维护(二)网络用户设置管理
  9. StarUML 安装教程
  10. NOIP2017考前复习