本文转载自公众号:Nebula Graph Community 。


我们都知道《权利的游戏》在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外“惊喜”,当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 NetworkX 访问开源的分布式图数据库 Nebula Graph,并借助可视化工具—— Gephi 来可视化分析《权力的游戏》中的复杂的人物图谱关系。

1. 数据集

本文的数据集来源:冰与火之歌第一卷(至第五卷)[1]

  • 人物集 (点集):书中每个角色建模为一个点,点只有一个属性:姓名

  • 关系集(边集):如果两个角色在书中发生过直接或间接的交互,则有一条边;边只有一个属性:权重,权重的大小代表交互的强弱。

这样的点集和边集构成一个图网络,这个网络存储在图数据库 Nebula Graph [2]中。

2. 社区划分——Girvan-Newman 算法

我们使用 NetworkX [3] 内置的社区发现算法 Girvan-Newman 来为我们的图网络划分社区。

以下为「社区发现算法 Girvan-Newman」解释:

网络图中,连接较为紧密的部分可以被看成一个社区。每个社区内部节点之间有较为紧密的连接,而在两个社区间连接则较为稀疏。社区发现就是找到给定网络图所包含的一个个社区的过程。

Girvan-Newman 算法即是一种基于介数的社区发现算法,其基本思想是根据边介数中心性(edge betweenness)从大到小的顺序不断地将边从网络中移除直到整个网络分解为各个社区。因此,Girvan-Newman 算法实际上是一种分裂方法。

Girvan-Newman 算法的基本流程如下:(1)计算网络中所有边的边介数;(2)找到边介数最高的边并将它从网络中移除;(3)重复步骤 2,直到每个节点成为一个独立的社区为止,即网络中没有边存在。

概念解释完毕,下面来实操下。

  1. 使用 Girvan-Newman 算法划分社区。NetworkX 示例代码如下


  2. 为图中每个点添加一个 community 属性,该属性值记录该点所在的社区编号


3. 节点样式——Betweenness Centrality 算法

下面我们来调整下节点大小及节点上标注的角色姓名大小,我们使用 NetworkX 的 Betweenness Centrality 算法来决定节点大小及节点上标注的角色姓名的大小。

图中各个节点的重要性可以通过节点的中心性(Centrality)来衡量。在不同的网络中往往采用了不同的中心性定义来描述网络中节点的重要性。Betweenness Centrality 根据有多少最短路径经过该节点,来判断一个节点的重要性。

  1. 计算每个节点的介数中心性的值


  2. 为图中每个点再添加一个 betweenness 属性

4. 边的粗细

边的粗细直接由边的权重属性来决定。

通过上面的处理,现在,我们的节点拥有 name、community、betweenness 三个属性,边只有一个权重 weight 属性。

下面显示一下:

emmm,有点丑…

虽然 NetworkX 本身有不少可视化功能,但 Gephi [4] 的交互和可视化效果更好。

5. 接入可视化工具 Gephi

现在将上面的 NetworkX 数据导出为 game.gephi 文件,并导入 Gephi。


6. Gephi 可视化效果展示

在 Gephi 中打开刚才导出的 game.gephi 文件,然后微调 Gephi 中的各项参数,就以得到一张满意的可视化:

  1. 将布局设置为 Force Atlas, 斥力强度改为为 500.0, 勾选上 由尺寸调整 选项可以尽量避免节点重叠:

Force Atlas 为力引导布局,力引导布局方法能够产生相当优美的网络布局,并充分展现网络的整体结构及其自同构特征。力引导布局即模仿物理世界的引力和斥力,自动布局直到力平衡。

  1. 给划分好的各个社区网络画上不同的颜色:

在外观-节点-颜色-Partition 中选择 community(这里的 community 就是我们刚才为每个点添加的社区编号属性)

  1. 决定节点及节点上标注的角色姓名的大小:

在外观-节点-大小-Ranking 中选择 betweenness(这里的 betweenness 就是我们刚才为每个点添加的 betweenness 属性)

  1. 边的粗细由边的权重属性来决定:

在外观-边-大小-Ranking 中选择边的权重

  1. 导出图片再加个头像效果

大功告成,一张权力游戏的关系谱图上线 :) 每个节点可以看到对应的人物信息。

7. 下一篇

本篇主要介绍如何使用 NetworkX,并通过 Gephi 做可视化展示。下一篇将介绍如何通过 NetworkX 访问图数据库 Nebula Graph 中的数据。

本文的代码可以访问[5]。

8. 致谢

致谢:本文受工作 [6] 的启发

Reference

[1]https://www.kaggle.com/mmmarchetti/game-of-thrones-dataset

[2]https://github.com/vesoft-inc/nebula

[3]https://networkx.github.io/

[4]https://gephi.org/

[5]https://github.com/jievince/nx2gephi

[6]https://www.lyonwj.com/2016/06/26/graph-of-thrones-neo4j-social-network-analysis/


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

技术实践 | 用 NetworkX + Gephi + Nebula Graph 分析权力的游戏人物关系(上篇)相关推荐

  1. 人物关系 人脸识别_用 NetworkX + Gephi + Nebula Graph 分析权力的游戏人物关系(上篇)...

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  2. gephi生成网络关系图_用 NetworkX + Gephi + Nebula Graph 分析lt;权力的游戏gt;人物关系(上)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  3. 用 NetworkX + Gephi + Nebula Graph 分析<权力的游戏>人物关系(上篇)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  4. 用 NetworkX + Gephi + Nebula Graph 分析<权力的游戏>人物关系(下篇)

    在上一篇[1]中,我们通过 NetworkX 和 Gephi 展示了<权力的游戏>中的人物关系.在本篇中,我们将展示如何通过 NetworkX 访问图数据库 Nebula Graph. N ...

  5. java实现人物关系预测_用 NetworkX + Gephi + Nebula Graph 分析人物关系(上篇)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  6. NLP分析小说人物关系,找找主人公的真爱。

    思路 基于共现来挖掘人物之间的关系. 准备好三个存储器 names 存放的是人物出现次数,用来后面刻画节点的大小.names类似'叶三姐': 8, '马鞍': 6, relationships 存放人 ...

  7. python实现对小说的文本分析(人物关系图,人物词云等)

    文本分析 0.效果图 这里有些"二人"."不会"等词语没用筛选掉,手动筛选即可. 1.整体思路: 调用的库:jieba,matplotlib,networkx, ...

  8. python自然语言分析--倚天屠龙记人物关系、词云、柱状图、-词频

    python倚天屠龙记人物关系.词云.柱状图.-词频 # -*- coding = utf-8 -*- # @Time : 2022/3/17 15:45 # @Author : luxiaoguo ...

  9. python 小说人物分析_用python分析小说人物关系(二)——实战篇

    用到的工具jieba jieba分词,最好用的开源中文分词工具.他最主要的两个功能是分词和关键词的抽取.在这里我们需要用他的分词功能来提取文本中的人名. gephi gephi是一个开源的复杂网络数据 ...

最新文章

  1. Linux 服务器带宽异常跑满分析解决
  2. hql Hibernate.gethibernatetemplate()
  3. jvm运行时类加载机制_JVM体系结构:JVM类加载器和运行时数据区
  4. php文件锁 阻塞区别,php文件锁阻塞模式和非阻塞模式
  5. 关于碰撞检测和物理引擎
  6. js byte数组转string_JVM系列之:String,数组和集合类的内存占用大小
  7. emq mysql消息存储_EMQ X 规则引擎系列(二)存储消息到 MySQL 数据库
  8. 不可以! 南阳理工ACM 题目1071
  9. 数据结构算法—非递归算法求二叉树的叶子结点(C语言)
  10. 第十二章:如何制定里程碑
  11. 薅羊毛php源码,薅羊毛软件-抢福袋源码分享
  12. 二维树状数组--hdu1892
  13. Tomcat配置登录拦截功能
  14. java实现HTTPS单向认证TLS指定加密套件(文章很详细,好文章!)
  15. STM32模拟USB多点触控屏
  16. 客户说:在忙,回头联系你。如何话术应对呢?
  17. 【2020年天梯赛—校内选拔赛】7-4手机话费
  18. Oracle中编码与字符转换
  19. rdma软件架构的理解。
  20. Redis缓存:java写入文件不覆盖

热门文章

  1. 打开约束指令,让编码更规范
  2. hdu 1054 Strategic Game 最小点覆盖 = 最大二分匹配
  3. ORA-23616:执行块5失败
  4. Symbian中不能跨越线程(RThread)使用的对象/组件(RSocket/Memery Heap,etc)
  5. __va_rounded_size
  6. socket api中send()和recv()函数工作原理与要点
  7. C语言 ,嵌入式 ,数据结构 面试题目(2)
  8. VS2003升级VS2010修改
  9. 机器学习——超参数调优
  10. 【Pytorch神经网络理论篇】 29 图卷积模型的缺陷+弥补方案