illumina 的DNA甲基化芯片,内置了control 探针,用于检测降噪,归一化等各种用途。

以450K  为例, control 探针共有以下15种类型,每种类型的探针都有不同的用途

> unique(IlluminaHumanMethylation450kmanifest@data$TypeControl[[2]])
[1] "STAINING"                "EXTENSION"              [3] "HYBRIDIZATION"           "TARGET REMOVAL"         [5] "BISULFITE CONVERSION I"  "BISULFITE CONVERSION II"[7] "SPECIFICITY I"           "SPECIFICITY II"         [9] "NON-POLYMORPHIC"         "NEGATIVE"               [11] "RESTORATION"             "NORM_A"                 [13] "NORM_G"                  "NORM_C"                 [15] "NORM_T"

在这些control探针中, NEGATIVE探针用于计算探针的P值。

minfi 中计算探针P值的过程如下:

探针的P值  =  1 - P(intensity)

假设探针的信号强度服从正态分布,首先要计算出该正态分布的期望和方差。
由于I 型探针和II 型探针的技术原理不同,所以两种探针是分开计算的。

首先根据negative 探针的信号强度,分别计算红绿两种通道的均值和方差

# 获取negative 探针的IDcontrolIdx <- getControlAddress(rgSet, controlType = "NEGATIVE")   # 计算红色荧光通道的均值和标准差r <- getRed(rgSet)
rBg <- r[controlIdx,,drop=FALSE]
rMu <- matrixStats::colMedians(rBg)
rSd <- matrixStats::colMads(rBg)# 计算绿色荧光通道的均值和标准差g <- getGreen(rgSet)
gBg <- g[controlIdx,,drop=FALSE]
gMu <- matrixStats::colMedians(gBg)
gSd <- matrixStats::colMads(gBg)# 这里用了中位数代替了算数平均值

I 型探针

I 型探针发出的是单色荧光,可能是红色也可能是绿色,所以红色和绿色也是单独计算的。

对于红色荧光的I 型探针而言,其正态分布的均值等于negative 探针红色荧光通道的均值,标准差对应negative 红色荧光通道的方差

TypeI.Red <- getProbeInfo(rgSet, type = "I-Red")
intensity <- r[TypeI.Red$AddressA, i] + r[TypeI.Red$AddressB, i]
detP[TypeI.Red$Name, i] <- 1-pnorm(intensity, mean=rMu[i]*2, sd=rSd[i]*2)

对于绿色荧光的I 型探针而言,其正态分布的均值对应negative 绿荧光通道的均值,标准差对应negative 绿色荧光通道的方差

TypeI.Green <- getProbeInfo(rgSet, type = "I-Green")
intensity <- g[TypeI.Green$AddressA, i] + g[TypeI.Green$AddressB, i]
detP[TypeI.Green$Name, i] <- 1-pnorm(intensity, mean=gMu[i]*2, sd=gSd[i]*2)

I 型探针

II 型探针是双色荧光,其正态分布的均值对应negative探针红色荧光和绿色荧光的中位数之和,标准差对应红色荧光和绿色荧光的标准差之和

TypeII <- getProbeInfo(rgSet, type = "II")
intensity <- r[TypeII$AddressA, i] + g[TypeII$AddressA, i]
detP[TypeII$Name, i] <- 1-pnorm(intensity, mean=rMu[i]+gMu[i], sd=rSd[i]+gSd[i])

NEGATIVE探针是一系列质量差的探针信号,假设其分布是一个正态分布。
在某个样本中,某个探针检测到的信号强度为 intensity,这个intensity 可能是一个质量差的信号,也可能是一个质量高的信号。

该探针检测到的信号质量可靠记为事件A, 质量不可靠记为事件B, 很显然 P(A)+ P(B) = 1。

探针的P值代表这个探针的信号质量可靠的概率,所以在计算时,只需要用1减去不可靠的概率就行了。

在计算不可靠的概率时,由于I型探针和II 型探针的技术原理,共分成3个正态分布来计算概率。以上就是minfi计算探针P值的详细过程。

计算出探针的P值之后,就可以根据p值进行过滤了。从计算过程也可以看出,P值越小,探针质量越高。

DNA甲基化芯片探针的P值如何计算相关推荐

  1. 国家生物信息中心开发DNA甲基化芯片数据标准化方法—GMQN

    过去十年来,由于DNA甲基化芯片技术的不断发展以及测序成本的快速下降,DNA甲基化芯片数据呈现爆发式增长.这些数据是表观基因组关联研究(Epigenome-Wide Association Studi ...

  2. DNA甲基化数据分析专题

    欢迎关注"生信修炼手册"! DNA 甲基化作为重要的表观遗传学的标记,能够调控基因的表达,在生长发育和疾病相关研究领域都有着重要意义.测定甲基化的手段有很多,芯片作为一种成熟的手段 ...

  3. 甲基化芯片入门学习-基础知识(一)

    基本概念梳理 什么是DNA甲基化 DNA甲基化是表观遗传学的中最为常见的一种修饰,其主要形式包括:5-甲基胞嘧啶 (5-mC).少量的N6-甲基腺嘌呤 (N6-mA) 以及7-甲基鸟嘌呤(7-mG). ...

  4. 【Bioinfo Blog 013】【R Code 011】——甲基化芯片数据分析(ChAMP包)

    目录 一.甲基化芯片检测 1.1 DNA甲基化 1.2 甲基化芯片原理 1.3 β值 1.4 分析需要考虑的问题 二.甲基化芯片数据分析 2.1 Pipeline 2.1.1 450K 2.1.2 E ...

  5. amt630a芯片中文资料_甲基化芯片学习记录

     今天是生信星球陪你的第539天 大神一句话,菜鸟跑半年.我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新 ...

  6. 易基因|疾病研究:DNA甲基化与转录组分析联合揭示吸烟免疫相关疾病的表观遗传机制

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2021年12月09日,<Clin Epigenetics>杂志发表了题为"Genome-wide methyla ...

  7. DNA甲基化与表观遗传学数据挖掘与分析学习会 (10月26-27 上海)

    两天一夜高强度训练,理论与实战相结合 赠送高清视频供学员复习使用 会务背景 表观遗传学调控多种生命活动及疾病发生发展,已成为近年来生命科学领域的研究热点,促使了生物学多领域研究的突破性进展.随着实验和 ...

  8. DNA甲基化测序数据的分析流程及相关软件总结

    目前检测DNA甲基化的方法众多,主要可以分为以下几类(如表1所示): 图片来源(凡时财等,中国科学: 生命科学,2015) <更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信 ...

  9. 表观遗传学及DNA甲基化数据分析

    关于举办"表观遗传学及DNA甲基化数据分析"专题班通知 各有关单位: 表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科.随着实验技术的 ...

  10. 甲基化系列 3. 甲基化芯片数据分析完整版(ChAMP)

    点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 104篇原创内容 公众号 桓峰基因的教程不 ...

最新文章

  1. winxp升级win7教程_WinXP桌面右下角提示网络电脑没有插好的原因及解决方法教程一览-...
  2. SVM+HOG:用初次训练的.xml分类器在负样本原图上检测生成HardExample样本
  3. Hello,Expression Blend 4 (含Demo教程和源码)
  4. List(Map(String, Object))转为Fastjson JSONArray
  5. VS 常用的一些技巧和问题集锦【不断的更新中】
  6. 上传问题分析2--文件重名
  7. ios开发之plist 的文件的读写以及沙盒容器路径打印
  8. 三维点云网络——PointNet论文解读
  9. ap音频测试仪软件,美国进口音频分析仪/AP音频测试仪/电声测试仪
  10. linux vi编辑(20160628)
  11. hexo文章中插入图片
  12. Web初学-2022.11.12-11.18
  13. PMP知识点:项目经理必备的11种人际关系技能
  14. 解决THINKBOOK 14安装windows系统不识别固态硬盘的问题
  15. 实例:用C#.NET手把手教你做微信公众号开发(8)--普通消息处理之链接(普通消息终结篇)
  16. 多米诺骨牌上演:三箭资本崩盘始末
  17. Java 生成支付二维码返回给前端和自定义二维码背景色
  18. 【0091】【创建postgres后端进程】PostgreSQL如何接收并处理客户端的socket请求(4)?
  19. 【工具】Gamepad Tester游戏手柄在线测试平台
  20. 网络常用密码忘记破解方法

热门文章

  1. python巡检网络设备_pyhton对网络设备的日常巡检
  2. linux下gzip用法,Linux gzip 命令的使用
  3. 线段树合并学习笔记(P4556)
  4. 学计算机应用技术买什么笔记本电脑,大学什么专业用电脑 要不要买电脑
  5. Java中 ? extends T 和 ? super T 的理解
  6. 豆瓣电影(二):数据分析
  7. 随机身份证号码计算年龄
  8. SpringCloud之熔断器Hystrix(二)
  9. 135编辑器使用教程
  10. 原创 | 从土地财政到数据财政