来源:机器之心

熟知社区发现算法,你不能错过这个 Python 库。它涵盖 Louvain 算法、Girvan-Newman 算法等多种社区发现算法,还具有可视化功能。

网络是由一些紧密相连的节点组成的,并且根据不同节点之间连接的紧密程度,网络也可视为由不同簇组成。簇内的节点之间有着更为紧密的连接,不同簇之间的连接则相对稀疏。这种簇被称为网络中的社区结构(community structure)。

由此衍生出来的社区发现(community detection)算法用来发现网络中的社区结构,这类算法包括 Louvain 算法、Girvan-Newman 算法以及 Bron-Kerbosch 算法等。

最近,机器之心在 GitHub 上发现了一个可以发现图中社区结构的 Python 库 communities,该库由软件工程师 Jonathan Shobrook 创建。

项目地址:https://github.com/shobrook/communities

首先,该库可以实现以下几种社区发现算法:

  • Louvain 算法

  • Girvan-Newman 算法

  • 层次聚类

  • 谱聚类

  • Bron-Kerbosch 算法

其次,用户还可以使用 communities 库来可视化上述几种算法,下图为空手道俱乐部(Zachary's karate club)网络中 Louvain 算法的可视化结果:

该库的安装方法也非常简单,可采用 pip 的方式安装 communities,代码如下:

$ pip install communities

对于这个 Python 库,很多网友给予了高度评价,表示会去尝试。

算法详解

Louvain 算法

louvain_method(adj_matrix : numpy.ndarray, n : int = None) -> list

该算法来源于文章《Fast unfolding of communities in large networks》,简称为 Louvian。

作为一种基于模块度(Modularity)的社区发现算法,Louvain 算法在效率和效果上都表现比较好,并且能够发现层次性的社区结构,其优化的目标是最大化整个图属性结构(社区网络)的模块度。

Louvain 算法对最大化图模块性的社区进行贪婪搜索。如果一个图具有高密度的群体内边缘和低密度的群体间边缘,则称之为模图。

示例代码如下:

from communities.algorithms import louvain_methodadj_matrix = [...]
communities, _ = louvain_method(adj_matrix)

Girvan-Newman 算法

girvan_newman(adj_matrix : numpy.ndarray, n : int = None) -> list

该算法来源于文章《Community structure in social and biological networks》。

Girvan-Newman 算法迭代删除边以创建更多连接的组件。每个组件都被视为一个 community,当模块度不能再增加时,算法停止去除边缘。

示例代码如下:

from communities.algorithms import girvan_newmanadj_matrix = [...]
communities, _ = girvan_newman(adj_matrix)

层次聚类

hierarchical_clustering(adj_matrix : numpy.ndarray, metric : str = "cosine", linkage : str = "single", n : int = None) -> list

层次聚类实现了一种自底向上、分层的聚类算法。每个节点从自己 的社区开始,然后,随着层次结构的建立,最相似的社区被合并。社区会一直被合并,直到在模块度方面没有进一步的进展。

示例代码如下:

from communities.algorithms import hierarchical_clusteringadj_matrix = [...]
communities = hierarchical_clustering(adj_matrix, metric="euclidean", linkage="complete")

谱聚类

spectral_clustering(adj_matrix : numpy.ndarray, k : int) -> list

这种类型的算法假定邻接矩阵的特征值包含有关社区结构的信息。

示例代码如下:

from communities.algorithms import spectral_clusteringadj_matrix = [...]
communities = spectral_clustering(adj_matrix, k=5)

Bron-Kerbosch 算法

bron_kerbosch(adj_matrix : numpy.ndarray, pivot : bool = False) -> list

Bron-Kerbosch 算法实现用于最大团检测(maximal clique detection)。图中的最大团是形成一个完整图的节点子集,如果向该子集中添加其他节点,则它将不再完整。将最大团视为社区是合理的,因为团是图中连接最紧密的节点群。因为一个节点可以是多个社区的成员,所以该算法有时会识别重叠的社区。

示例代码如下:

from communities.algorithms import bron_kerboschadj_matrix = [...]
communities = bron_kerbosch(adj_matrix, pivot=True)

可视化

绘图

draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)

可视化图(graph),将节点分组至它们所属的社区和颜色编码中。返回代表绘图的 matplotlib.axes.Axes。示例代码如下:

from communities.algorithms import louvain_method
from communities.visualization import draw_communitiesadj_matrix = [...]
communities, frames = louvain_method(adj_matrix)draw_communities(adj_matrix, communities)

可视化图如下:

Louvain 算法的动图展示

louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)

Louvain 算法在图中的应用可以实现动图展示,其中每个节点的颜色代表其所属的社区,并且同一社区中的节点聚类结合在一起。

示例代码如下:

from communities.algorithms import louvain_method
from communities.visualization import louvain_animationadj_matrix = [...]
communities, frames = louvain_method(adj_matrix)louvain_animation(adj_matrix, frames)

动图展示如下:

参考链接:

https://www.codenong.com/cs105912940/

https://www.reddit.com/r/MachineLearning/comments/lozys9/p_i_made_communities_a_library_of_clustering/

推荐阅读

误执行了rm -fr /*之后,除了跑路还能怎么办?!

程序员必备58个网站汇总

大幅提高生产力:你需要了解的十大Jupyter Lab插件

这个Python库助你发现网络图的社区结构相关推荐

  1. matlab 写excel 慢_我在12w+的Python库中,发现了让Excel快到起飞的秘密......

    Amber | 作者 图片源自网络 在这篇文章里,小编向大家介绍了Excel在数据分析中的妙用.不知大家在看完后,有没有亲自动手去体验下呢?有没有遇到什么问题呢? 虽说Excel在处理小批量数据时的优 ...

  2. NLTK01 《NLTK基础教程--用NLTK和Python库构建机器学习应用》

    01 关于NLTK的认知 很多介绍NLP的,都会提到NLTK库.还以为NLTK是多牛逼的必需品.看了之后,感觉NLTK对实际项目,作用不大.很多内容都是从语义.语法方面解决NLP问题的.感觉不太靠谱. ...

  3. Python资源大全 屌炸Python库

    交互式解析器 交互式 Python 解析器. IPython – 功能丰富的工具,非常有效的使用交互式 Python. bpython– 界面丰富的 Python 解析器. ptpython – 高级 ...

  4. [转载] 20个常用Python库及200个第三方库

    参考链接: 使用Python在Linux Terminal中格式化文本 Requests.Kenneth Reitz写的最富盛名的http库.每个Python程序员都应该有它 Scrapy 如果你从事 ...

  5. Python 库 资源大全

    偶然的机会翻到这篇文章,很全面,来源:  Python 资源大全中文版       哪些 Python 库让你相见恨晚? 环境管理 管理 Python 版本和环境的工具 p:非常简单的交互式 pyth ...

  6. 100个相见恨晚的Python库(建议收藏)

    大家好,我是一行 在python程序员成为大神之前,都不可避免的都要做一段时间的调包侠 那就算是调包侠也都会有自己调包秘籍,拿出来能让他人感叹"相见恨晚"的那种 Awesome P ...

  7. PYTHON库,让你相见恨晚的第三方库

    转载自:https://www.cnblogs.com/duanlinxiao/p/9865240.html 环境管理 管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版 ...

  8. 20个必不可少的Python库也是基本的第三方库

    引用: https://www.cnblogs.com/jiangchunsheng/p/9275881.html 读者您好.今天我将介绍20个属于我常用工具的Python库,我相信你看完之后也会觉得 ...

  9. 100个相见恨晚的Python库

    大家好,我是一行 在python程序员成为大神之前,都不可避免的都要做一段时间的调包侠 那就算是调包侠也都会有自己调包秘籍,拿出来能让他人感叹"相见恨晚"的那种 Awesome P ...

最新文章

  1. 高质量的友谊总是发生在两个优秀的独立人格之间
  2. linux useradd(adduser)命令参数及用法详解(linux创建新用户命令)
  3. Python用selenium获取Cookie并用于登录。
  4. ajax get时不能更新页面的解决方法
  5. 2022年全球及中国角鲨烯和角鲨烷市场需求规模与十四五竞争策略研究报告
  6. mac 安装配置java环境变量
  7. 使用Zookeeper实现leader选举-Leader Latch
  8. [SHOI2008]cactus仙人掌图
  9. 前端学习(1889)vue之电商管理系统电商系统之绘制用户列表组件的基本布局
  10. Java输出箭头_java基于XSSF 导出带箭头的直线
  11. ControllerBrokerRequestBatch分析
  12. 我的大学,我的SPR机器人队
  13. d3.js 旋转图形_PROE、Creo绘制手轮图形案例,二维草图绘制练习项目
  14. 输出大于某个正整数n的最小质数(1除外
  15. Windows10 添加打印机
  16. Unity3D游戏引擎最详尽基础教程
  17. 十大推荐提交的安卓市场
  18. torch.optim.lr_scheduler源码和cosine学习率策略学习
  19. UGI九宫格sliced显示问题
  20. Java匿名类习题_输出英文字母表和希腊字母表

热门文章

  1. Java处理split分割【for循环】
  2. 写代码的16个好习惯,减少80%的bug
  3. 日期格式转换成时间戳格式php,php日期转时间戳,指定日期转换成时间戳
  4. iphone备忘录突然没了_iphone备忘录突然没了?丢失的备忘录内容怎么找回?
  5. Redis(5种数据类型)
  6. jmeter执行python脚本,Jmeter+Python-1问题记录jmeter执行Python3的脚本时报 ValueErro
  7. java bmp rgb数组_将RGB数据写入BMP位图文件
  8. python多核多线程编程_python是否支持多处理器/多核编程?
  9. java 网络编程 聊天_Java——网络编程(实现基于命令行的多人聊天室)
  10. python中常见的运行时错误_常见Python运行时错误之一