我们都知道《权利的游戏》在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外“惊喜”,当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 NetworkX 访问开源的分布式图数据库 Nebula Graph,并借助可视化工具—— Gephi 来可视化分析《权力的游戏》中的复杂的人物图谱关系。

数据集

本文的数据集来源:冰与火之歌第一卷(至第五卷)[1]

人物集 (点集):书中每个角色建模为一个点,点只有一个属性:姓名

关系集(边集):如果两个角色在书中发生过直接或间接的交互,则有一条边;边只有一个属性:权重,权重的大小代表交互的强弱。

这样的点集和边集构成一个图网络,这个网络存储在图数据库 Nebula Graph [2]中。

社区划分——Girvan-Newman 算法

我们使用 NetworkX [3] 内置的社区发现算法 Girvan-Newman 来为我们的图网络划分社区。

以下为「社区发现算法 Girvan-Newman」解释:

网络图中,连接较为紧密的部分可以被看成一个社区。每个社区内部节点之间有较为紧密的连接,而在两个社区间连接则较为稀疏。社区发现就是找到给定网络图所包含的一个个社区的过程。

Girvan-Newman 算法即是一种基于介数的社区发现算法,其基本思想是根据边介数中心性(edge betweenness)从大到小的顺序不断地将边从网络中移除直到整个网络分解为各个社区。因此,Girvan-Newman 算法实际上是一种分裂方法。

Girvan-Newman 算法的基本流程如下:

(1)计算网络中所有边的边介数;

(2)找到边介数最高的边并将它从网络中移除;

(3)重复步骤 2,直到每个节点成为一个独立的社区为止,即网络中没有边存在。

概念解释完毕,下面来实操下。

使用 Girvan-Newman 算法划分社区。NetworkX 示例代码如下

comp = networkx.algorithms.community.girvan_newman(G)

k = 7

limited = itertools.takewhile(lambda c: len(c) <= k, comp)

communities = list(limited)[-1]

为图中每个点添加一个 community 属性,该属性值记录该点所在的社区编号

community_dict = {}

community_num = 0

for community in communities:

for character in community:

community_dict[character] = community_num

community_num += 1

nx.set_node_attributes(G, community_dict, 'community')

节点样式——Betweenness Centrality 算法

下面我们来调整下节点大小及节点上标注的角色姓名大小,我们使用 NetworkX 的 Betweenness Centrality 算法来决定节点大小及节点上标注的角色姓名的大小。

图中各个节点的重要性可以通过节点的中心性(Centrality)来衡量。在不同的网络中往往采用了不同的中心性定义来描述网络中节点的重要性。Betweenness Centrality 根据有多少最短路径经过该节点,来判断一个节点的重要性。

计算每个节点的介数中心性的值

betweenness_dict = nx.betweenness_centrality(G) # Run betweenness centrality

为图中每个点再添加一个 betweenness 属性

nx.set_node_attributes(G, betweenness_dict, 'betweenness')

边的粗细

边的粗细直接由边的权重属性来决定。

通过上面的处理,现在,我们的节点拥有 name、community、betweenness 三个属性,边只有一个权重 weight 属性。

下面显示一下:

import matplotlib.pyplot as plt

color = 0

color_map = ['red', 'blue', 'yellow', 'purple', 'black', 'green', 'pink']

for community in communities:

nx.draw(G, pos = nx.spring_layout(G, iterations=200), nodelist = community, node_size = 100, node_color = color_map[color])

color += 1

plt.savefig('./game.png')

emmm,有点丑…

虽然 NetworkX 本身有不少可视化功能,但 Gephi [4] 的交互和可视化效果更好。

接入可视化工具 Gephi

现在将上面的 NetworkX 数据导出为 game.gephi 文件,并导入 Gephi。

nx.write_gexf(G, 'game.gexf')

Gephi 可视化效果展示

在 Gephi 中打开刚才导出的 game.gephi 文件,然后微调 Gephi 中的各项参数,就以得到一张满意的可视化:

将布局设置为 Force Atlas, 斥力强度改为为 500.0, 勾选上 由尺寸调整 选项可以尽量避免节点重叠:

Force Atlas 为力引导布局,力引导布局方法能够产生相当优美的网络布局,并充分展现网络的整体结构及其自同构特征。力引导布局即模仿物理世界的引力和斥力,自动布局直到力平衡。

给划分好的各个社区网络画上不同的颜色:

在外观-节点-颜色-Partition 中选择 community(这里的 community 就是我们刚才为每个点添加的社区编号属性)

决定节点及节点上标注的角色姓名的大小:

在外观-节点-大小-Ranking 中选择 betweenness(这里的 betweenness 就是我们刚才为每个点添加的 betweenness 属性)

边的粗细由边的权重属性来决定:

在外观-边-大小-Ranking 中选择边的权重

导出图片再加个头像效果

大功告成,一张权力游戏的关系谱图上线 :) 每个节点可以看到对应的人物信息。

下一篇

本篇主要介绍如何使用 NetworkX,并通过 Gephi 做可视化展示。下一篇将介绍如何通过 NetworkX 访问图数据库 Nebula Graph 中的数据。

本文的代码可以访问[5]。

致谢:本文受工作 [6] 的启发

Reference

作者有话说:Hi,我是王杰,是图数据 Nebula Graph 研发工程师,希望本次的经验分享能给大家带来帮助,如有不当之处也希望能帮忙纠正,谢谢~

人物关系 人脸识别_用 NetworkX + Gephi + Nebula Graph 分析权力的游戏人物关系(上篇)...相关推荐

  1. 技术实践 | 用 NetworkX + Gephi + Nebula Graph 分析权力的游戏人物关系(上篇)

    本文转载自公众号:Nebula Graph Community . 我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜", ...

  2. gephi生成网络关系图_用 NetworkX + Gephi + Nebula Graph 分析lt;权力的游戏gt;人物关系(上)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  3. java实现人物关系预测_用 NetworkX + Gephi + Nebula Graph 分析人物关系(上篇)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  4. 用 NetworkX + Gephi + Nebula Graph 分析<权力的游戏>人物关系(上篇)

    我们都知道<权利的游戏>在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外"惊喜",当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 Ne ...

  5. 用 NetworkX + Gephi + Nebula Graph 分析<权力的游戏>人物关系(下篇)

    在上一篇[1]中,我们通过 NetworkX 和 Gephi 展示了<权力的游戏>中的人物关系.在本篇中,我们将展示如何通过 NetworkX 访问图数据库 Nebula Graph. N ...

  6. 人物关系 人脸识别_原因解密:格里兹曼宣布终止与华为合作,不只是因为人脸识别系统...

    恐怕不少球迷在看到这篇文章之前,依旧不知道格里兹曼突然间宣布终止了与华为方面的代言合作,并且这突然违约的行为背后是什么原因也让人不得而知.真的是因为华为方面研发了一款特殊的人脸识别系统,还是受到舆论的 ...

  7. 人物关系 人脸识别_内在美人物关系介绍图谱 - 电视剧 - 星关系

    <内在美>主要人物关系介绍 顶级巨星.通过上百张面孔诠释多样演技的"百面美人",同时也是一个麻烦制造者,绯闻制造机,走到哪儿都有闪光灯聚焦.然而就是这样一位巨星,却有着 ...

  8. 人物关系 人脸识别_一种基于人脸识别系统的人物关系挖掘系统及方法与流程...

    本发明涉及人脸识别技术领域,具体涉及一种基于人脸识别技术进行人物关系挖掘的系统及其方法. 背景技术: 人脸识别作为生物身份识别的典型技术,由于不需要被检测个体的主动配合,近年来在人机交互,安防,身份认 ...

  9. 人物关系 人脸识别_「人脸识别」可以代替「人像鉴定」吗?

    刷脸支付.刷脸安检.刷脸取快递.刷脸住酒店--人脸识别正在替代钥匙.公交卡.身份证.银行卡等,迅速渗透人们日常生活和工作的方方面面,一个"全民刷脸"的时代正在加速到来. 在司法鉴定 ...

最新文章

  1. ZOJ 2723 Semi-Prime ||ZOJ 2060 Fibonacci Again 水水水!
  2. Java在linux新建png_教你如何使用libpng显示PNG图片
  3. pandas_getdummies()
  4. mysql查看所有存储过程,函数,视图,触发器,表
  5. 跨界创立PayPal、特斯拉、SpaceX……,埃隆·马斯克是这样“掌控”知识的
  6. Scrollview+ListView冲突解决
  7. 关于C#资源文件操作的总结
  8. mysql 8.0 集群_集群架构03·MySQL初识,mysql8.0环境安装,mysql多实例
  9. css 一行显示_CSS笔记1
  10. 前端学习(2872):Vue路由权限『前后端全解析』3
  11. 旧调重弹-SetUnhandledExceptionFilter的使用问题
  12. 多条实体类数据怎么接受_解决并发问题,数据库常用的两把锁!
  13. python搜索关键词自动提交_python+selenium实现自动化百度搜索关键词
  14. php 二位数组排序
  15. 数据清洗Chap4——dataframe操作
  16. 【我们一起写框架】MVVM的WPF框架(一)—序篇
  17. 生物识别技术在汽车领域带来了巨大变革
  18. h5后缀文件python处理
  19. safari浏览器找不到服务器怎么办,IOS系统中Safari图标不见了怎么办 safari浏览器不见了找回方法图解...
  20. Http 400错误重现实验及解决办法

热门文章

  1. linux系统读写eth网卡PHY寄存器工具mdio_cmd
  2. java毕业设计青少年心理健康公益扶助网站源码+lw文档+mybatis+系统+mysql数据库+调试
  3. PAT考试乙级1024(C语言实现)重点题目
  4. 在Unity中模仿游戏《江南百景图》中物体的出现效果
  5. 一个简单的ADFR的re-docking教程
  6. Java岗大厂面试百日冲刺【Day50】— 秒杀系统2 (日积月累,每日三题)
  7. 有了群晖怎么玩,分享一下我的群晖中运行的服务
  8. c# 中文数字转阿拉伯数字
  9. Android Selinux avc报错分析
  10. VS Code 中选中英文单词大小写切换快捷键