大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

总体来说,DNA甲基化一般遵循三个步骤进行数据挖掘。

首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。

其次,进行甲基化差异水平分析,筛选具体差异基因,包括DMC/DMR/DMG鉴定、DMC/DMR在基因组元件上的分布、DMC/DMR的TF结合分析、时序甲基化数据的分析策略、DMG的功能分析等。

最后,将甲基化组学&转录组学关联分析,包括Meta genes整体关联、DMG-DEG对应关联、网络关联等。

一、甲基化图谱分析

(1)平均甲基化水平的比较

平均甲基化水平能反应样本整体的甲基化水平。

但是平均水平差异不大并不能说明样本间甲基化图谱没有差异。

胚胎发育

果实成熟

肌肉发育

(2)CG/CHG/CHH甲基化水平分布

不同物种中,甲基化修饰可能倾向于发生在不同类型的C位点上,该分析有助于反应甲基化发生位点类型的偏好性。

甲基化水平分布的组间比较,能够更进一步了解组间甲基化水平的变化。

不同基因组元件(CGI相关元件、重复序列元件、基因元件等)的甲基化水平分布规律不同。特别是在不同物种中,基因元件的甲基化水平可能有一定的特点。

比较特定元件甲基化水平的组间差异也能发现潜在的功能差异。

单样本三类甲基化水平分布

组间CpG甲基化水平分布比较

CGI相关元件

各类重复序列元件

基因元件

(3)降维分析

降维分析尝试找到最能反映数据点真实分布情况的两个维度,以方便对数据进行直观把握。一般采用共同覆盖的5×以上位点进行分析:

  • 主成分分析(PCA)

  • 非度量多维标度法(NMDS)

  • 主坐标分析(PCoA)

PCA

可采用统计检验分析组间差异的显著性:

  • 相似性分析(ANOSIM)

  • 置换多元方差分析(ADONIS)

NMDS

PCoA

(4)聚类分析

聚类分析考虑的是各样本之间的距离,即不相似性。一般采用共同覆盖的5×以上位点进行分析。

与降维分析的差别在于,聚类分析更真实地反映样本的差距,而非仅考虑两个代表性维度。

(5)相关性分析

相关性分析考虑的是各样本之间的相似性。一般采用共同覆盖的5×以上位点进行分析。

一般采用皮尔森相关系数

二、差异甲基化位点/区域分析DMC/DMR分析)

(1)DMC/DMR鉴定

差异甲基化位点:DMC

差异甲基化区域:DMR

(甲基化位点一般是与附近的位点一起起作用的)

鉴定实验组与对照组甲基化图谱的具体差异。

如果实验设计包括多个时间节点,也可以比较相邻时间节点/感兴趣的时间节点之间的甲基化图谱的差异。

DMC在基因组上的分布

DMR在基因组上的分布

(2)DMC/DMR转录因子结合分析(TF binding motif )

主要关注Promoter和Enhancer等调控区域DMC/DMR的TF结合位点。

(3)时序甲基化数据的分析策略(Time Course)

比较相邻时间点的差异

直接筛选时间阶段相关的DMC和DMR

线性模型/混合线性模型

(可以排除混杂因素干扰,如性别)

共甲基化模式分析(阶段特异性Cluster筛选)

WGCNA(权重基因共表达网络分析)

MEGENA(多尺度嵌入式基因共表达网络分析)

mfuzz

... ...

(4)DMC/DMR在基因元件上的分布

TE(转座元件):影响基因组稳定性

Promoter:影响基因表达

Genebody

(5)差异甲基化基因集(DMGs)的功能分析

分析策略:

可以分为Hyper-DMG和Hypo-DMG

可以分为Promoter-DMG和Genebody-DMG

  • Gene Ontology

  • KEGG pathway

  • Reactome pathway

  • DisGeNET disease

  • Disease Ontology

三、组学关联分析:甲基化组学&转录组学

(1)Meta genes整体关联

同一样本/组别内,所有基因的表达水平与对应基因的甲基化水平进行关联。

研究的是基因甲基化与表达的整体关系。

  • TSS位点附近负相关

  • Genebody区正相关

整体负相关

(2)DMG-DEG对应关联

重叠分析:

特点:简单粗暴,也适用于样本量少的情况。

分析结果:韦恩图。

皮尔森/斯皮尔曼相关性分析

特点:准确计算相关性程度(R值),及其显著性(p值)。

分析结果:散点图(+拟合线);相关性热图

(3)网络关联

基于基因表达具有功能和通路的富集性。有最低样本数量要求。

共表达-共甲基化网络关联:

  • WGCNA module correlation

  • EMDN algorithm

融合网络关联:

  • SNF algorithm

以上就是关于DNA甲基化测序的数据挖掘思路分享,易基因科技提供全面的DNA甲基化研究整体解决方案,技术详情了解请致电易基因。

相关阅读:

14种全基因组DNA甲基化测序(WGBS)标准分析比对软件的比较 | 生信专区

DNA甲基化方法全解析:方法发展、技术应用、优缺点

2022最新:8种常用DNA甲基化测序技术,你知道几个?

一文读懂:十大DNA甲基化研究核心问题

易基因|DNA甲基化研究的测序数据挖掘思路:干货分享相关推荐

  1. 易基因:DNA甲基化研究的3大前期探索性实验思路|干货系列

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 近些年以来,DNA甲基化研究一直是顶级期刊.基金资助.临床研究.药物研发上市的多重热点,其研究方向涵盖疾病发生发展.疾病标志物研究.环境 ...

  2. 易基因 | DNA甲基化测序新技术发布:扩展重亚硫酸盐测序(XRBS)

    DNA甲基化是最早被发现.也是研究最深入的表观遗传调控机制之一.目前研究中常用的DNA甲基化测序方法包括全基因组(WGBS.oxWGBS等).简化基因组(dRRBS.RRBS等).靶向基因组(液相捕获 ...

  3. 一文读懂:十大DNA甲基化研究核心问题

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. DNA甲基化是最早被发现.也是研究最深入的表观遗传调控机制之一,近年来关于DNA甲基化的研究成果屡屡见刊.小编翻阅各类文献,为大家总结了 ...

  4. 易基因2022年度DNA甲基化研究高分项目文章精选

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 回顾刚刚过去的2022年,易基因参与的DNA甲基化研究在细胞分化与发育.疾病发生发展及标志物筛选.环境因素暴露与响应等应用场景成果层出不 ...

  5. 精准DNA甲基化/羟甲基化测序(oxBS-seq)|易基因技术推介

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 羟甲基化5hmC是哺乳动物基因组上的第六碱基,在发育.衰老.神经退行性疾病.复杂疾病及肿瘤发生过程中起重要作用.DNA羟甲基化是近年发现 ...

  6. DNA甲基化研究概述

    DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一,基于芯片和下一代测序的高通量技术为DNA甲基化的广泛检测提供了技术平台.包括,WGBS,RRBS,microarray ...

  7. 易基因:精原干细胞移植后出生小鼠子代中的精子DNA甲基化变化机制|新研究

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 精原干细胞移植(Spermatogonial stem cell transplantation,SSCT)被提议作为儿童癌症幸存者的生 ...

  8. 易基因|m6A RNA甲基化研究的数据挖掘思路:干货系列

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 关于m6A甲基化研究思路 (1)整体把握m6A甲基化图谱特征:m6A peak数量变化.m6A修饰基因数量变化.单个基因m6A peak ...

  9. 易基因:染色质免疫共沉淀测序(ChIP-seq)的数据挖掘思路 |干货系列

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. CHIP-seq研究的数据挖掘思路主要分为3步: 整体把握CHIP-seq图谱特征:peak/reads在基因组上的分布.peak在元件 ...

最新文章

  1. python中的新式类与旧式类的一些基于descriptor的概念(上)
  2. 【从零学习OpenCV 4】安装过程中问题解决方案
  3. python跨文件全局变量_Python跨文件全局变量的实现方法示例
  4. 北京邦永科技有限公司
  5. 一个能够保护个人收藏夹隐私的Chrome扩展
  6. 项目管理基础:项目的生存周期模型
  7. 计算机没有搜索筛选功能,EXCEL中筛选工具怎么没有搜索功能
  8. Android TV Overscan
  9. 何如添加到将文章添加到首页
  10. 项目进度计划表_18份施工进度计划图 | 开工必备,都给你整理好了
  11. 我有一个还在蹒跚学步的小孩是否应该学习Python?
  12. 开放数据资产估值白皮书,首创“数据势能”估值模型【附下载链接】
  13. 《C语言程序教程》课后编程题
  14. vba CAD提取图元属性
  15. java 拼音转汉字_用Java转化汉字为拼音全拼
  16. 利用python下载哨兵1号轨道数据
  17. 初识深度学习(将各方所写融合)
  18. Linux图形图像处理软件
  19. Centos7关闭锁屏界面
  20. 企业如何召开发布会,发布会如何邀请媒体

热门文章

  1. 如何打包 zeit/micro 程序
  2. 爱上hal库学习笔记——cubemx图形界面,洋桃电子YYDS
  3. w10计算机意外的遇到错误安装无法继续,安装w10操作系统时遇到错误无法继续安装怎么办?...
  4. W520 改造通电自动开机
  5. 天数最少的年份_年月日天数计算方法
  6. 10. Redis持久化之AOF
  7. 查看mysql的多线程_在for循环里使用多线程查询数据库
  8. openCV C++ 图像拼接
  9. proteus常见问题解答
  10. LuaPlus学习(一)