MIC

我在论文使用MIC来衡量两个基因之间的关联程度,线性或非线性关系,相较于Mutual Information(MI)互信息而言有更高的准确度巴拉巴拉的,按作者的话说总之比其他的方式好。

原文参照:
Detecting Novel Associations in Large Data Sets

相关东西自己看看人家原文,一直觉得人家歪果仁写东西很认真,基础提到,实验充足…英文可以的话,尽量多读读歪果仁写的东西,提升很大…

直接进入主题


MIC概念解释

在了解MIC概念之前,你需要知道MI的概念、如何计算,一句话概括:衡量两信息的相似程度,相似程度越高,值越大;反之亦然!至于MI的计算,网上一搜一大堆,自己研究去吧…

先来看看MIC的定义:

一大串公式代表什么意思?有一篇文章介绍这个,忘了出处了!这里借用一下
MIC计算分为三个步骤:

  1. 给定i、j,对XY构成的散点图进行i列j行网格化,并求出最大的互信息值
  2. 对最大的互信息值进行归一化
  3. 选择不同尺度下互信息的最大值作为MIC值

(1) 给定i、j,对XY构成的散点图进行i列j行网格化,并求出最大的互信息值
值得注意的是,给定i和j后,可以得出多种不同的网格化方案。我们需要从这些不同的网格化方案中找到使互信息最大的网格化方案。举个例子,假设i=2,j=2。则可能有以下红、黄、绿三种网格化方案(其实更多,这里只是随便挑三种方案作说明),分别计算每个网格化方案对应的互信息值,找出使互信息值最大的网格化方案。

那么,给定了某个网格化方案后,如何计算其对应的互信息值呢?这里以上图中红色的网格化方案为例进行说明。红色网格化方案将所有数据点分为四个区域:左上,右上,左下,右下。每个区域对应的数据点数量为1,4,4,1。将数据点数归一化得到四个区域的数据点频率,分别为0.1,0.4,0.4,0.1。也就是说,此时,X有两种取值:左和右,Y有两种取值:上和下。P(X=左,Y=上)=0.1,P(X=右,Y=上)=0.4,P(X=左,Y=下)=0.4,P(X=右,Y=下)=0.1。并且,P(X=左)=0.5,P(X=右)=0.5,P(Y=上)=0.5,P(Y=下)=0.5。根据前面介绍的互信息计算公式,得到X和Y在这种分区下的互信息为:

以此类推,算出哪种方案得到的互信息值最大,最大的互信息值是多少。为了方便讨论,这里得到最大互信息值表示为,D表示数据点集。
###(2)对最大的互信息值进行归一化
将得到的最大互信息除以log(min(X,Y)),即为归一化!概念我也不是很理解,有理解的同学可以交流一下呗…
###(3)选择不同尺度下互信息的最大值作为MIC值
上面讲述了给定i和j的情况下M(X,Y,D,i,j)的计算方法。这一步就是给定很多(i,j)值,计算每一种情况下M(X,Y,D,i,j)的值,将所有M(X,Y,D,i,j)中的最大那个值作为MIC值。注意的是,这里的(i,j)是有条件的,要满足,n表示数据集D的数据量。当然,B(n)这个值可以自己定,这里是别人做实验认为效果最好的值。

##MIC计算
MIC的计算使用的是Minepy-master,搜这些东西嘛,度娘就不要用了,Google还是棒棒的,有同学肯定说我不会翻墙,这里推荐大家搜一下Latern,翻墙利器,其他你懂得…

使用Minepy的MATLAB代码实现时,mine_mex使用c来实现的,MATLAB需要配置mex环境,这个还是你来做,编译C时需要在后面加上lib,不然会提示mine_mic为外部引用,错误,错误,错误,下面官网给出的解决方式:

有什么不对的地方,欢迎指正!

Maximal Information Coefficient (MIC)最大互信息系数相关推荐

  1. 【转】Maximal Information Coefficient (MIC)最大互信息系数详解与实现

    Maximal Information Coefficient (MIC)最大互信息系数详解与实现 ---------------- 版权声明:本文为CSDN博主「Font Tian」的原创文章,遵循 ...

  2. Maximal Information Coefficient (MIC)最大互信息系数详解与实现

    MIC MIC 即:Maximal Information Coefficient 最大互信息系数. 使用MIC来衡量两个基因之间的关联程度,线性或非线性关系,相较于Mutual Informatio ...

  3. python计算互信息_Maximal Information Coefficient (MIC)最大互信息系数详解与实现

    MIC MIC 即:Maximal Information Coefficient 最大互信息系数. 使用MIC来衡量两个基因之间的关联程度,线性或非线性关系,相较于Mutual Informatio ...

  4. matlab mic系数_科学网—最大信息系数 (Maximal Information Coefficient, MIC)详解(1) - 彭勇的博文...

    最大信息系数 (Maximal Information Coefficient, MIC)详解(1) 四年前看过的一篇论文,当时还在组会上报告过,很确信当时把它弄懂了,由于当时是用机器学习的方法来做预 ...

  5. Equitability, mutual information, and the maximal information coefficient

    解读:     一个人应该如何量化两个随机变量之间的关联强度,而不偏向特定形式的关系?尽管统计"公平性"的概念概念简单,但它还没有得到明确的数学形式.     在MIC中公平性的定 ...

  6. 使用Matlab和Minepy工具箱做变量的互信息MIC (maximal information coefficient ) 分析

    环境: Windows, MatlabR2018 Minepy是一个可以计算互信息的库,matlab中使用需要安装该库 Minepy的说明及安装步骤详见官方文档: https://minepy.rea ...

  7. 最大信息系数java_相关性分析之最大互信息系数

    最大互信息系数简介 互信息Mutual Information(MI)是用来评价一个事件的出现对于另一个事件的出现所贡献的信息量.在先前聚类算法的评估指标中有过简单的介绍.抛开公式,通俗的理解:原来我 ...

  8. 聚类效果评价——Silhouette Coefficient(轮廓系数)——内部评估标准(1)

    公式与简介 Rousseeuw, Peter J. "Silhouettes: a graphical aid to the interpretation and validation of ...

  9. Python实现 灰色关联分析 与结果可视化

    之前在比赛的时候需要用Python实现灰色关联分析,从网上搜了下只有实现两个列之间的,于是我把它改写成了直接像Pandas中的计算工具直接计算person系数那样的形式,可以对整个矩阵进行运算,并给出 ...

最新文章

  1. List查询排序删除泛型 应用
  2. 玩转Google开源C++单元测试框架Google Test系列(gtest)(总)
  3. 2560x1600分辨率高吗_手机屏幕分辨率真的越高越好?它的好处和坏处你知道吗?...
  4. python队列join
  5. SAP UI5 使用 Smart Control 的一个具体例子
  6. 模型参数太多怎么办?用谷歌高效训练库GPipe啊
  7. Total Defense Anti-Virus – 免费6个月
  8. BMS 项目过程中遇到的问题
  9. python与c语言数据交互,python与c语言交互---学习012
  10. html5怎么设置年月日选择框,HTML5文件选择框(各种类型)
  11. iOS 10.1发现新漏洞:可绕过“激活锁”强行进入主屏
  12. 24张高清无码图,看到就停不下来了...
  13. 有个大神级女朋友是什么体验
  14. python word修改神器docxtpl
  15. 华为云桌面,数字化时代便捷、安全的办公选择
  16. python爬虫天猫商品数据及分析(4)
  17. 我的rpg小游戏(2)怪物设计
  18. 从后渗透分析应急响应的那些事儿(二)免杀初识篇
  19. 2014年9月4日新GRE真题回忆
  20. 利用Linux系统搭建网站(含相关,域名申请,服务器选择,Java JDK安装,数据库配置,域名绑定服务器,服务器绑定域名),最终实现通过域名访问你的网站项目,创作不易,如果对你有帮助的还请点赞支持

热门文章

  1. 有道翻译 python 翻译
  2. vagrant启动虚拟机Stderr: VBoxManage.exe: error: Call to WHvSetupPartition failed: ERROR_SUCCESS (Last=0xc
  3. 32线镭神雷达跑LeGO-LOAM:3D 激光SLAM
  4. [最小生成树] 篱笆
  5. 树的最小带权路径问题:POJ3253 修篱笆
  6. 如何用好 Google 等搜索引擎?
  7. HackTheBox-Jeeves
  8. 【已解决】ping: www.baidu.com: 未知的名称或服务
  9. python莫比乌斯内接矩形_用莫比乌斯带巧解内接矩形问题:拓扑学的用处
  10. 对于API5L管线管的感应圈调控