methylKit:差异甲基化分析
1. 1Methylation输入格式
coverage:覆盖这个位点的reads数目。
freqC:甲基化C的比例
freqT:非甲基化C的比例
1.2 纯文本的读取:methRead
file.list是一个列表,里面的元素是每个文件名
myobj = methRead(file.list,assembly = "hg19",sample.id = list("test1","test2","ctrl1","ctrl2"),treatment = c(1,1,0,0),context = "CpG")
treatment指定样本的分组,1是treatment组,0是control组;assembly指定组装版本。
1.3 bam文件读取:processBismarkAln
bam.list是一个列表,里面元素是每个bam文件名。
myobj = processBismarkAln(bam.list,sample.id = c("sample_A1","sample_A2","sample_B1","sample_B2"),assembly = "hg19",treatment = c(1,1,0,0),read.context = "CpG",save.fold = getwd())
2.1 探索样本的描述性数据:getMethylationStats
myobj是一个methylRawList
对象,它记录了每个样本的甲基化信息。
getMethylationStats(myobj[[2]],plot = FALSE/TRUE,both.strands = FALSE)
获取第二个样本的甲基化信息。
同时可以读取myobj测序深度信息。
getCoverageStats(myobj[[2]],plot = TRUE,both.strands = FALSE)
2.2 根据测序深度过滤样本:filterByCoverage
filtered.myobj = filterByCoverage(myobj,lo.count = 10,lo.perc = NULL,hi.count = NULL,hi.perc = 99.9)
lo.count:指定最小深度
hi.count:指定最大深度
lo.perc:
hi.perc:
3 合并样本数据:unite
meth = unite(myobj,destrand = FALSE)
4.1样本的相关性:getCorrelation
getCorrelation(meth,plot = TRUE)
4.2样本聚类:clusterSamples、PCASamples
clusterSamples(meth,dist = "correlation",method = "ward",plot = TRUE)
PCA碎石图:
PCASamples(meth,screeplot= TRUE)
PCA主成分图:
PCASamples(meth)
5 批量效应
批量效应用于检查哪些主要成分与潜在的批处理效果上统计相关。如果某些主要成分是批次效应造成的结果,就需要使用removeComp
将其删除。
sampleAnnotation = data.frame(batch_id = c("a","a","b","b"),age = c(19,34,23,40))
as = assocComp(mBase = meth,sampleAnnotaion)
移除第一个主成分:
newObj=removeComp(meth,comp=1)
6 平铺窗口分析:tileMethylCounts
差异甲基化区域的分析:按照滑动窗口的方式定义甲基化区域,默认窗口大小为10000 bp ,步长为10000bp.
tiles=tileMethylCounts(myobj,win.size=1000,step.size=1000)
7 查找差异甲基化的碱基或区域
测试差异甲基化:
myDiff = calculateDiffMeth(meth)
基于q值、甲基化差异阈值百分比和type类型选择差异甲基化区域:
myDiff25p = getMethylDiff(myDiff,difference = 25,qvalue = 0.01,type = "hyper" / "hypo" / "all")hyper表示相比control组,treatment组中的甲基化C更多;
hypo则相反,表示treatment组中的甲基化C比control组中少。
8 注释差异甲基化的碱基或区域:genomation包
读取基因BED文件:
gene.obj = readTranscriptFeatures("gene.bed")
使用BED文件注释甲基化区域:启动子、外显子、内含子
diffAnn = annotateWithGeneParts(as(myDiff25p,"GRanges"),gene.obj)
注释后,获取距离TSS距离最近的基因名称:
getAssociationWithTSS(diffAnn)
区域分析例如汇总启动子区域集上的甲基化信息:
myobj:一开始读入的methylation信息。
gene.obj:读入的BED文件。
promoters = regionCounts(myobj,gene.obj$promoters)
promoters[[1]]
methylKit:差异甲基化分析相关推荐
- RRBS甲基化分析流程
RRBS甲基化流程 分析流程 和普通的测序分析一致,首先fastqc质量检测,接着对序列进行修剪,修剪后再质量检测:如果质量检测通过,则进行序列回帖,然后去除重复,计算甲基化程度,以及一些后续分析,本 ...
- 易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 乳腺癌早期发现是提高患者预后和生存率的关键.基于乳房X线片和超声技术的乳腺影像报告和数据系统(BI-RADS)被广泛用于乳腺癌的早期诊断 ...
- 基于TCGA数据库的差异基因分析实现
1.数据下载 1.1 网页下载 1.2 TCGABiolinks下载 setwd("D:\Bioinformatics data analysis") if (!requireNa ...
- 易基因|综述:单细胞DNA甲基化分析方法全介绍及未来发展前景预测
大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因. 2021年07月10日,<Biomolecules>杂志上发表一篇关于单细胞表观测序的综述文章,详细介绍了单细胞DNA甲基化 ...
- 易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIP、RRBS和WGBS)| 研究综述
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. CpG密度(CpG density)与各种组织中的DNA甲基化相关.基因组按CpG密度分为:CpG岛(CpG island,CGI).C ...
- 精准医学:新发现!全基因组cfDNA甲基化分析或可用于胰腺癌早期诊断应用
易点评: 作为消化道常见恶性肿瘤之一,胰腺癌在肿瘤领域素有"癌症之王"的称号,据柳叶刀杂志记载,胰腺癌大多一经发现即为中晚期,确诊后的五年生存率约10%,是预后最差的恶性肿瘤之一. ...
- 使用MACS2进行差异peak分析
欢迎关注"生信修炼手册"! MACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,所有的子命令功能描述如下 通过bdgdiff子命令来进 ...
- MPB:亚热带生态所谭支良组-基于微生物成分数据的差异zOTU分析流程
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
- python 分析两组数据的差异_R语言limma包差异基因分析(两组或两组以上)
使用limma包进行差异基因分析时,做最多的是两分类的,例如control组和disease组,但也会碰到按照序列进行的分组.这时,如果逐一使用两两比较求差异基因则略显复杂.其实开发limma包的大神 ...
- 蜜汁问题?差异基因分析谁比谁有差别吗?
做差异基因分析时经常会遇到有老师纠结是样品组A比样品组B还是样品组B比样品组A.每次我都是很诧异,这有区别吗? 这是一个典型的DESeq2输出结果,我们怎么知道他计算的是trt/untrt还是untr ...
最新文章
- 单片机是否为嵌入式技术,单片机和嵌入式学哪个?
- MySQL FIND_IN_SET(s1,s2)	返回在字符串s2中与s1匹配的字符串的位置
- tps波动很大的原因_花生价格小幅上涨,要突破6元大关?粮贩:还有很大距离...
- MySQL表的非外键约束
- seo全攻略_SaaS 企业推广获客全攻略(2):如何做好企业官网?
- 用JS实现的常见几种排序算法
- setTimeout,setInterval你不知道的事
- bootstrapt学习指南_bootstrap-知识点梳理-学习入门篇
- KNN(七)--最近邻及OpenCV源码分析
- JDBC 8.0 和 JDBC 5.0 区别
- 天邑TY1608卡刷包晶晨S905L3B支持RTL8822CS、MT7668、MT7661
- priya-dwivedi关于人脸情绪识别
- java实现lbs_Java总结篇系列:Java泛型
- 检索报告计算机类,计算机类的检索报告.docx
- ICEM-圆柱与长方体相切
- 高通平台sensor学习
- 小技巧(10):使用Python绘制激活函数(Sigmoid、Tanh、ReLU、PReLU)图像
- RaspberryPi 3 B下的64位 uboot linux编译更新
- 6、TWS API的体系结构和连接
- HihoCoder 1082 : 然而沼跃鱼早就看穿了一切
热门文章
- ArcGIS API for iOS在俄勒冈大学校园中的创新应用
- C# Winform鼠标样式设置方法
- 税法18个税种全总结附记忆小口诀
- 【文件处理】python 在线预览文件_OFFICE 文档转换为html在线预览
- 幽游白书雕像:岁月流转,闪耀如初,我回来了
- win7 c盘空间不足怎么扩大
- 完美安装运行Xcelsius 2008 SP3解决方案
- php each 指针,PHP each() 函数用法简介
- TCP控制拥塞的四种算法:慢开始,拥塞避免,快重传,快恢复
- liunx下载安装JDK1.8教程