社团划分结果评估指标:Q、ARI、NMI

一、模块度Q(Modularity)

模块度也称模块化度量值,是目前常用的一种衡量网络社区结构强度的方法,最早由Mark NewMan提出了。模块度的定义为:

模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度Q来获得最优的网络社区划分。

Python:可以直接使用Community.modularity()包计算模块度。

二、兰德指数ARI(Adjusted Rand Index)

若已知样本的真实类别标签labelstruelabelstrue ,和聚类算法得到的标签labelspredlabelspred,ARI是计算两种标签分布相似性的函数,该函数对标签的定义形式没有要求。ARI定义如下:

如果C是真实类别,K是聚类结果,我们定义a和b分别是:

a: 在C和K中都是同一类别的样本对数

b: 在C和K中都是不同类别的样本对数

Raw Rand Index公式如下:

是样本所有的可能组合对.

RI不能保证在类别标签是随机分配的情况下,其值接近0(极端情况是类别数和样本数相等).为了解决这个问题,ARI被提出,它具有更高的区分度.

Python:使用sklearn.metrics.adjusted_rand_score(labels_true, labels_pred)计算。

三、标准化互信息NMI(Normalized Mutual Information)

假设对于N个样本点的两种标签划分为U 和 V. 熵为划分集的不准确性,定义如下:

其中 P(i)=|Ui|/NP(i)=|Ui|/N表示任取一个样本划分为 UiUi的概率. 对于V同时成立:

其中 P′(j)=|Vj|/NP′(j)=|Vj|/N. U和V之间的互信息(MI) 可以通过下式进行计算:

其中 P(i,j)=|Ui∩Vj|/NP(i,j)=|Ui∩Vj|/N表示两个样本点划分相同的类 Ui和VjUi和Vj的概率.
也可以通过集合的势来表示:


规则化互信息定义如下:

This value of the mutual information and also the normalized variant is not adjusted for chance and will tend to increase as the number of different labels (clusters) increases, regardless of the actual amount of “mutual information” between the label assignments.
The expected value for the mutual information can be calculated using the following equation, from Vinh, Epps, and Bailey, (2009). In this equation, ai=|Ui|ai=|Ui| (the number of elements in UiUi) and bj=|Vj|bj=|Vj|(the number of elements in VjVj).

Using the expected value, the adjusted mutual information can then be calculated using a similar form to that of the adjusted Rand index:

Python: 使用sklearn.metrics.normalized_mutual_info_score(labels_true, labels_pred)计算。

【复杂网络】社团划分结果评估指标:Q、ARI、NMI相关推荐

  1. 聚类的外部指标(Purity, ARI, NMI, ACC) 和内部指标(NCC,Entropy,Compactness,Silhouette Index),附代码 (Python 和 Matlab)

    聚类性能评估的外部指标和内部指标,附代码 (Python 和 Matlab) 文章目录 聚类性能评估的外部指标和内部指标,附代码 (Python 和 Matlab) 1 外部指标 1.1 Purity ...

  2. GAN网络评估指标:IS、FID、PPL

    GAN网络评估指标:IS.FID.PPL 转自:IS.FID.PPL,GAN网络评估指标 另外关于GAN的评价指标,推荐李宏毅老师的视频:[機器學習2021]生成式對抗網路 (Generative A ...

  3. 西瓜书+实战+吴恩达机器学习(一)机器学习基础(数据集划分、分类回归评估指标)

    文章目录 0. 前言 1. 数据集划分方法 2. 模型性能度量 2.1. 回归评估指标 2.2. 分类评估指标 3. 非均等代价 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的 ...

  4. 社团划分评估-标准化互信息NMI的Python实现

    标准化互信息nmi是评估社团划分质量的一项重要指标,我在网上找了很久没有找到能用的,干脆自己参照公式写了一个,如果对你有帮助,请一键三连. 首先附上论文地址 NMI的公式定义如下: 最后附上代码: # ...

  5. 聚类技术---复杂网络社团检测_基于Plato高性能图计算框架的社团发现算法

    近年来,图作为一种表示和分析大数据的有效方法,因为特别适合用作 社交网络.推荐系统.网络安全.文本检索和生物医疗等领域至关重要的 数据分析和挖掘工具, 而受到广泛关注. 这里的"图" ...

  6. 关于模型的评估指标(超详细)

    文章目录 正负样本的选择 标准评估指标 回归问题的评估指标 SSE 和方差 均方误差(MSE) 均方根误差(RMSE) R Squared 分类问题的评估指标 错误率 召回率(查全率) 精确率(查准率 ...

  7. 图像质量评价概述(评估指标、传统检测方法)

    一.概述 在图像信息技术被广泛应用的情况下,对图像质量的评估变成一个广泛而基本的问题.由于图像信息相对于其它信息有着无可比拟的优点,因此对图像信息进行合理处理成为各领域中不可或缺的手段.在图像的获取. ...

  8. 社团划分——Fast Unfolding算法

    社团划分--Fast Unfolding算法 一.社区划分问题 1.社区以及社区划分 在社交网络中,用户相当于每一个点,用户之间通过互相的关注关系构成了整个网络的结构,在这样的网络中,有的用户之间的连 ...

  9. 评估指标(Metric)(二)

    对于GAN网络,需要对生成器的好坏做一些评估,有一些对应的评估指标.比如当生成器G训练好后,我们需要评价生成图片的质量好坏,主要分为主观评价和客观评价,接下来分别介绍这两类方法: 主观评价 人眼去观察 ...

最新文章

  1. 使用dplyr进行数据操作(30个实例)
  2. KernelIoControl和OEMIoControl的分析和使用(作者:wogoyixikexie@gliet)
  3. [HOW TO]-下载android官方源码
  4. MongoDB资料大全
  5. 【实用】ABAP“FOR ALL ENTRIES”的Hints 优化
  6. 图片流写出 并带数据_第九章 IO流
  7. iphone开机白苹果_摔过的iPhone,手机不开机、白苹果、听筒无声,多重问题一次搞定...
  8. 如何分析线程转储– IBM VM
  9. Java基础学习总结(48)——Java 文档注释
  10. 关于Sa系列用户不能登录,只能本地windows身份验证的说明
  11. 什么是在JavaScript中扩展错误的好方法?
  12. linux中求当前时间gettime,linux – 你如何在shell中获得clock_gettime(2)时钟?
  13. 莫比乌斯函数与莫比乌斯反演
  14. 「leetcode」112. 路径总和113. 路径总和II(详解)递归函数究竟什么时候需要返回值,什么时候不要返回值?
  15. 由于焦点冲突导致TextView的跑马灯效果和EditText不能共存的问题
  16. 计算机网络telnet命令作用,全面解析telnet命令
  17. EXCEL批量修改文件名
  18. 基于FPGA的AD9854并行接口驱动(VerilogHDL语言)
  19. 面试mysql索引底层_面试必备之MYSQL索引底层原理分析
  20. css html 高仿word 格式,制作的可编辑的微软Word样式文档 HTML-Sheets-of-Paper

热门文章

  1. xhtml转xsl-fo
  2. Tableau表计算(1):计算类型
  3. 我家厨房--冬阴功汤和青椒炒腊肠
  4. 地铁车辆基础制动装置设计
  5. EMC联邦帝国前世今生
  6. 计算机技术论文搜索引擎,搜索引擎-毕设论文.doc
  7. HMI-42-【节能模式】实现油量表和水温表
  8. JS轮播图(点击切换、自动播放、悬停控制)
  9. 宽带连接错误691,623,678......
  10. HTC Lengend G6上网-彩信设置