我们利用Pyclone和CITUP得到了三个文件即cellfreq.txt和tree.txt 和sample_id,下面我们就利用TimeScape搞一下可视化,在这里不会出现具体的基因或突变位点,但是都是可以追述的。

  • 关于安装问题

安装很简单,利用BioManager即可顺利安装完成。

# try http:// if https:// URLs are not supported
if (!requireNamespace("BiocManager", quietly=TRUE))install.packages("BiocManager")
BiocManager::install("timescape")
  • 关于输入数据获得

该输入数据是以每个样本每个克隆的克隆系统发育和克隆流行率作为输入。将之前的主要命令行整理,获得三个输入文件:cellfreq.txt,tree.txt 和 sample_id,如下:

####利用PyClone获得文件 tables/loci.tsv,再生产三个文件freq.txt,cluster.txt 和 sample_id
PyClone run_analysis_pipeline --in_files SRR385938.tsv SRR385939.tsv SRR385940.tsv SRR385941.tsv --working_dir pyclone_analysis
cat ./pyclone_analysis/tables/loci.tsv | cut -f 6 | sed '1d' | paste - - - -  > ./pyclone_analysis/freq.txt
cat ./pyclone_analysis/tables/loci.tsv | cut -f 3 | sed '1d' | paste - - - - |cut -f 1 > ./pyclone_analysis/cluster.txt
cat ./pyclone_analysis/tables/loci.tsv | cut -f 2 | sed '1d' | head -4 > ./pyclone_analysis/sample_id
####利用CITUP获得文件results.h5
run_citup_qip.py ./pyclone_analysis/freq.txt ./pyclone_analysis/cluster.txt ./pyclone_analysis/results.h5
####利用ReadH5.py读取results.h5获得两个文件cellfreq.txt 和 tree.txt
python ReadH5.py ./pyclone_analysis/results.h5 | sed 's/^ \[//;s/\[//g;s/\]//g' | tr ' ' '\t'| grep '\.' > ./pyclone_analysis/cellfreq.txt
python ReadH5.py ./pyclone_analysis/results.h5 | sed 's/^ \[//;s/\[//g;s/\]//g' | tr ' ' '\t'| grep -v '\.' > ./pyclone_analysis/tree.txt
  • 关于运行问题

软件包自带例子好几个,但是内部使用example,直接运行,估计大家都一头雾水,其实直接看:

example("timescape") ###生成多个可视化将出现在您的浏览器中

browseVignettes("timescape")

#or:

?timescape

看例子吧,如下:

 # EXAMPLE 1 - Acute myeloid leukemia patient, Ding et al., 2012# genotype tree edges
tree_edges <- read.csv(system.file("extdata", "AML_tree_edges.csv", package = "timescape"))tree_edges source target
1      1      2
2      1      3
3      3      4
4      4      5# clonal prevalences
clonal_prev <- read.csv(system.file("extdata", "AML_clonal_prev.csv", package = "timescape"))clonal_prev timepoint clone_id clonal_prev
1 Diagnosis        1      0.1274
2 Diagnosis        2      0.5312
3 Diagnosis        3      0.2904
4 Diagnosis        4      0.0510
5   Relapse        5      1.0000# targeted mutations
mutations <- read.csv(system.file("extdata", "AML_mutations.csv", package = "timescape"))head(mutations)Tier chrom    coord clone_id timepoint    VAF
1    3     1  2554021        1 Diagnosis 0.4383
2    3     1 11965332        1 Diagnosis 0.4123
3    3     1 18952534        1 Diagnosis 0.4891
4    3     1 20382629        1 Diagnosis 0.4754
5    3     1 28395117        5 Diagnosis 0.0004
6    3     1 30729775        1 Diagnosis 0.4812# perturbations
perturbations <- data.frame( pert_name = c("Chemotherapy"), prev_tp = c("Diagnosis"))
perturbations pert_name   prev_tp
1 Chemotherapy Diagnosis                               # run timescape
timescape(clonal_prev = clonal_prev, tree_edges = tree_edges, perturbations = perturbations, height=260)

  • 关于参数问题

TimeScape需要配置的参数包括必要参数选参数。

必要参数如下:

  • clonal_prev是由每个时间点每个克隆的克隆流行率组成的数据帧,该数据的列为:
  1. character() timepoint - timepoint

  2. character() clone_id - clone id

  3. numeric() clonal_prev -clonal prevalence。

  • Tree_edges是描述根克隆系统发育的边缘的数据框架,该数据的列为:
  1. character() source - source node id

  2. character() target - target node id。

可选参数如下:

突变是由每个克隆中产生的突变组成的数据表格,如果提供了这个参数,一个突变表将出现在视图的底部。该数据的列为:

  1. character() chrom - chromosome number

  2. numeric() coord - coordinate of mutation on chromosome

  3. character() clone_id - clone id

  4. character() timepoint - time point

  5. numeric() VAF - variant allele frequency of the mutation in the corresponding timepoint.

  • 实际数据测试

利用我们生产的实际数据cellfreq.txt,tree.txt 和 sample_id作为输入数据,来获得分析结果,如下:

library(timescape)
options(stringsAsFactors = F)
#example("timescape")
#browseVignettes("timescape")
library(plotly)
library(htmlwidgets)
library(webshot)
library(tidyr)tree_edges = read.table("tree.txt")
colnames(tree_edges) = c("source","target")# clonal prevalences
cellfreq = read.table("cellfreq.txt")
colnames(cellfreq) = 0:(length(cellfreq)-1)
sample_id = read.table("sample_id")
cellfreq$timepoint = sample_id[ , 1]
clonal_prev = gather(cellfreq, key="clone_id", value = "clonal_prev", -timepoint)
clonal_prev = clonal_prev[order(clonal_prev$timepoint),]
clonal_prev
# targeted mutations
# mutations <- read.csv(system.file("extdata", "AML_mutations.csv", package = "timescape"))p = timescape(clonal_prev = clonal_prev, tree_edges = tree_edges,height=260)saveWidget(p, "test.html")
  • 关于生成文件特征

该软件包生产.html格式文件,可以用浏览器直接打开,之后可以保存为SVG,或者 PNG,一般我习惯选择SVG,之后方便使用AI编辑使用。测试结果如下:

References:

Ding, Li, et al. “Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing.” Nature 481.7382 (2012): 506-510.

Ha, Gavin, et al. “TITAN: inference of copy number architectures in clonal cell populations from tumor whole-genome sequence data.” Genome research 24.11 (2014): 1881-1893.

Malikic, Salem, et al. “Clonality inference in multiple tumor samples using phylogeny.” Bioinformatics 31.9 (2015): 1349-1356.

McPherson, Andrew, et al. “Divergent modes of clonal spread and intraperitoneal mixing in high-grade serous ovarian cancer.” Nature genetics (2016).

Topic 9. 克隆进化之 TimeScape相关推荐

  1. Topic 6. 克隆进化之 Canopy

    前五期的肿瘤可进化分析都是基于组织或血液检出的SNV和CNV,而这几年兴起的单细胞,越来越展露头角,自然,单细胞克隆进化也是目前的热点系列,接下来我们将介绍几款分析单细胞克隆进化的软件,也可以说是单细 ...

  2. Topic 3. 克隆进化之 fishplot

    上面两篇肿瘤克隆进化之后第三篇就是大家非常感兴趣的鱼图也就是sankey图,之前有发过一遍,但是好多学者反应不是很好使用,现在重新发一次,即fishplot R包 **背景:**深度大规模并行测序技术 ...

  3. Topic 8. 克隆进化之 RobustClone

    **上一期介绍了 Cardelino 的使用,这期介绍RobustClone,我们知道单细胞数据的SNV和CNV检出率都是非常低的,那么怎么有效的获得可使用的突变位点是重中之重,那么该软件包Robus ...

  4. Topic 5. 克隆进化之 CITUP

    这期介绍CITUP 全称 Conality Inference in Tumors Using Phylogeny,是一种使用系统发育论进行肿瘤的克隆推断生物信息学工具,可用于从单个患者获得的多个样本 ...

  5. IF:伴FLT3-ITD突变的急性髓系白血病在米哚妥林治疗下的克隆进化

    点击关注,桓峰基因 桓峰基因的教程不但教您怎么使用,还会定期分析一些相关的文章,学会教程只是基础,但是如果把分析结果整合到文章里面才是目的,觉得我们这些教程还不错,并且您按照我们的教程分析出来不错的结 ...

  6. DNA 1. Germline Mutation Vs. Somatic Mutation 傻傻分不清楚

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 76篇原创内容 公众号 B站直播课,肿瘤克 ...

  7. DNA 2. SCI 文章中基因组变异分析神器之 maftools

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 78篇原创内容 公众号 前 言 随着癌症基 ...

  8. IF:13+ Nomogram预测免疫检查点抑制剂治疗MSI-H型转移性结直肠癌患者的预后

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 79篇原创内容 公众号 这期分享一篇临床预 ...

  9. SCS【13】单细胞转录组之识别细胞对“基因集”的响应 (AUCell)

    点击关注,桓峰基因 桓峰基因公众号推出单细胞系列教程,有需要生信分析的老师可以联系我们!首选看下转录分析教程整理如下: Topic 6. 克隆进化之 Canopy Topic 7. 克隆进化之 Car ...

最新文章

  1. 如何在Windows 10中创建电源选项快捷图标,快速设置笔记本电脑的节能模式
  2. 操作系统设计与实现第3版笔记与minix3心得(1)-minix3简介
  3. 5 多数据save_《Netlogo多主体建模入门》笔记 7
  4. 大学期末考试SSH试题四
  5. ecshop首页调用指定分类的所有产品(指定一级调二级)
  6. ASP.NET Core Web API下事件驱动型架构的实现(一):一个简单的实现
  7. 【最全最详细】publiccms其他常用代码片段(内容、站点)
  8. php curl curlopt_getfields,PHP中CURL的CURLOPT_POSTFIELDS参数使用细节
  9. DJango — URL的Reverse和Resolve
  10. Pytorch:内部结构
  11. php文件的锁定机制
  12. 2020年TI杯大学生电子设计竞赛题A-无线运动传感节点
  13. eclipse 连 mysql 数据库 jdbc下载
  14. 给新建属性设置自己需要的快捷键
  15. 制作一个简单的Chrome extensions并发布到应用商店
  16. 机器学习、数据挖掘、统计建模的技术担当,20款免费预测分析软件
  17. 【WebDriver】WebDriverWait 用法代码
  18. 决战面试(二)智力题考察
  19. 从总监到CEO的一些思考和理解
  20. 数据扩充与数据预处理

热门文章

  1. 在网页上通过JS实现文本的语音朗读
  2. 视频图像压缩编码之预测编码
  3. Go mod 依赖管理
  4. 惊艳!华为折叠屏5G手机Mate X发布,称3秒下载1GB视频
  5. html5烟花绽放效果
  6. random函数使用说明
  7. java actioncontext_Action访问ActionContext | 学步园
  8. 流程图怎么画?超详细教程,各种高逼格流程图轻松搞定!
  9. Matlab游戏——愤怒的小鸟0.00001版程序
  10. Android中ViewPager支持一屏多个View、切换动画以及无限滚动