一 互信息网络简介:

互信息网络是基因调控网络推理方法的一个子类,这一系列方法的基本原理是如果两个基因之间的互信息值比较高,就认为两个基因之间存在调控关系。然而因为互信息是一种对称的度量方法(symmetric measure),因此这类方法是不能推断出边的方向的。

下面简单介绍几种基于互信息开发出来的一些推导基因调控网络的算法。

1.1 相关网络(Relevance Network)

计算两个基因之间的互信息值,如果该值高于规定的阈值,则认为这两个基因之间存在一条边(即具有调控关系)

1.2 CLR算法

图片来源:https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.0050008

CLR算法首先计算两两基因之间的互信息值,之后该算法比较Genei与所有基因的互信息值,若Genei与Genej的互信息值得分显著高于Genei与其他基因的,则认为这两个基因之间存在调控关系。需要注意的是,这里比较的不是互信息值,而是得分Zij:

μi——均值 σ—— 标准差

1.3 ARACNE

该算法的原理基于数据处理不等式(the Data Processing Inequality),该不等式认为,如果GeneX1是通过GeneX2与GeneX3发生作用的,则:

步骤:①计算两两基因间的互信息值

②将小于规定阈值(Io)的边移除掉

③在每三个基因组成的三角形中,如果两个互信息值的差高于规定的阈值(Wo),则把互信息值最低的那条边删掉。

注意:提高Io,会降低边的数量。提高Wo,则会增加边的数量。

1.4 MRNET

MRNET使用最大相关性/最小冗余度(maximum relevance/minimum redundancy,MRMR)特征选择方法推断网络

二 互信息值的估计

MIM: mutual information matrix , 互信息矩阵

H(X) : 随机变量X的熵

I(Xi ; Xj) : 随机变量Xi , Xj 的互信息值

因此,要计算互信息,就需要计算熵,下面,罗列一些最常用和最快的熵估计器,感兴趣的可以去看文章

2.1 Empirical and Miller-Madow corrected estimators

2.2 Shrink entropy estimator

2.3 The Schurmann-Grassberger Estimator

三 连续变量离散化方法

上面罗列的2.1 2.2 2.3 熵估计器都是为离散变量设计的。因此,如果随机变量是连续的,则需要将其离散化,常用的离散化方法有等宽离散化(equal width)和等频率(equal width)离散化。

3.1 Equal Width

将数据集中的每个变量的取值范围划分为大小相同的子区间

3.2 Global Equal Width

与Equal Width 的原理相同,区别在于区间[a,b]的范围是数据集中所有随机变量的范围,即a、b分别是数据集的最小值和最大值

3.3 Equal Frequency

每个区间都有相同数量的数据点,因此,每个区间的大小可以是不同的

下一节介绍网络推断算法的评估方法 : )

参考文献:minet: A R/Bioconductor Package for Inferring Large Transcriptional Networks Using Mutual Information | BMC Bioinformatics | Full Text (biomedcentral.com)

利用互信息推断基因调控网络相关推荐

  1. SCENIC | 从单细胞数据推断基因调控网络和细胞类型

    在2019/08/07的Nature刊中,中科院景乃禾课题组发表了文章--Molecular architecture of lineage allocation and tissue organiz ...

  2. 推断基因调控网络的算法的评估

    基因调控网络的推理问题可以看成一个二元决策问题,推理算法扮演着分类器的角色.节点之间存在边视为阳性(positive),不存在则为阴性(negative).阳性又包括了真阳性( true positi ...

  3. <文献阅读>用转移熵通过微阵列的时间序列推断基因调控网络(inferring gene regulatory networks from microarray time series data

    这篇文章是2007的时候发表在IEEE杂志上,并没有收录到PubMed里面.是韩国的学者开发出来的方法.具体来说,通过转移熵计算基因对的因果关系(causal relations), 也就是转移熵的值 ...

  4. scGEMA:基于单细胞多组学增强子的基因调控网络推断

    本文介绍由德国RWTH亚琛大学医学院的Ivan G Costa通讯发表在 bioRxiv 的研究成果:为了利用单细胞多组学数据定量表征基因调控,作者提出了scGEMA模型,一种基于单细胞多组学增强子的 ...

  5. 【基因调控网络】Discovering Gene Networks with a Neural-Genetic Hybride(单层神经网络与遗传算法混合算法2005)

    Discovering Gene Networks with a Neural-Genetic Hybride(2005)阅读笔记 摘要 这篇文章属于基因调控网络方面的内容,其中一个挑战是阐明基因.蛋 ...

  6. 基于单细胞多组学数据无监督构建基因调控网络

    在单细胞分辨率下识别基因调控网络(GRNs,gene regulatory networks)一直是一个巨大的挑战,而单细胞多组学数据的出现为构建GRNs提供了机会. 来自:Unsupervised ...

  7. 基于合作层次基因调控网络的多机器人目标捕获

    基于合作层次基因调控网络的多机器人目标捕获 与单机器人相比,多机器人系统具有单机器人所不具备的优良性能,因而在实现目标方面具有更好的性能.特别是目标诱捕是一个有意义的应用,它仍然面临着许多挑战,包括如 ...

  8. 【基因调控网络】Gene regulatory networks modelling using a dynamic evolutionary hybrid(ENFRN ,动态进化混合模型2010)

    ENFRN 动态进化混合模型2010 摘要 跟据基因调控网络重建面临的三个问题:数据高维.时间动态.测量噪声,提出了一种多层进化训练的神经-模糊递归网络(ENFRN),可以用于描述潜在目标基因和调控的 ...

  9. 基因调控网络群体机器人(1)

    基因调控网络&群体机器人(1) 生物体的复杂程度并不仅仅是由基因数目决定的,基因无法完全反映复杂的生命现象.在简单到复杂.低级到高级的生物进化过程中,生物系统中基因.蛋白质.小分子之间的复杂相 ...

最新文章

  1. 安卓读取mysql数据库文件路径_Android开发实现读取assets目录下db文件的方法示例...
  2. LeetCode171——Excel Sheet Column Number
  3. Java:Linux上java -jar xxx.jar命令执行jar包时出现Error: Invalid or corrupt jarfile xxx.jar解决方案...
  4. Caffe官方教程翻译(9):Multilabel Classification with Python Data Layer
  5. 什么是bean的生命周期?
  6. vs怎么更改编译的堆空间_再见吧 buildSrc, 拥抱 Composing builds 提升 Android 编译速度...
  7. 小程序能打开html页面,小程序新功能直接打开网页
  8. SolarWinds 公司:Web Help Desk 实例正遭攻击
  9. 【Redis学习笔记】Redis特性
  10. Gephi初识之简单绘图学习
  11. 18年6月英语六级第二套听力单词
  12. 煮酒论AI,看看大牛怎么说
  13. SVN的目录结构,trunk、tag、branches
  14. Python函数必须先定义、后调用(函数调用函数例外)
  15. 从一篇防范钓鱼邮件的通知说起
  16. dcos里面跑jenkins的问题
  17. ng-alain之G2图表
  18. 弘辽科技:淘宝如何提升店铺流量?需要准备什么?
  19. 机械键盘按键不灵敏怎么办、机械键盘按键坏了怎么办、维修机械键盘
  20. 风险管理中决策树理论与案例

热门文章

  1. tl-wdr5620虚拟服务器,TP-Link TL-WDR5620路由器怎么设置?
  2. 微型计算机原理应用总结,微机原理应用复习提纲及重要知识点总结
  3. 数字手势识别App--(1)项目简介
  4. transparent特性
  5. HBuilder下载
  6. 首席新媒体运营黎想教程:活动运营避坑指南,促销活动的正确使用
  7. 如何更改Windows 10操作系统的默认字体
  8. RK3588s imx415相机适配及ISP调优系列(一)
  9. 为什么文本乱码呢,我来告诉你什么是编码,解码,乱码
  10. php+mysql分页公式