拓展分析:我们需要在下面操作流程某一步进行改动,然后看看对结果有什么影响

操作流程

统计分析→外观→布局→过滤

Gephi简易学习[五]———— 分析红楼梦数据,了解Gephi操作流程中的 最终结果

改变一:

外观——节点颜色与标签颜色,渲染方式都从Modularity改为PageRank,结果如下

分析:这个就不是看以谁度大然后呈现出的社区情况,而是看哪个节点的搜索更多更重要 ,像上图我们就可以看出是以林黛玉、薛宝钗等众多妹纸的PageRank高些

改变二:

布局:从Force Altas 变为Fruchterman Reingold ,结果如下

Force Altas:

FR算法改进了弹簧算法,是现在用途最为广泛的布点算法,很多算法都是在这个算法上改进的。

FR受到了天体重力系统的启发,使用力来计算每个节点的速度,而不是加速度,从而得到每个节点应当移动的距离。它的每次迭代分为三个步骤:

  • 计算节点之间的排斥力
  • 计算相邻节点之间的吸引力
  • 综合吸引力和排斥力,通过最大位移限制移动的距离

使用模拟退火算法,使得在图变得越来越稳定时,温度变得更低,节点每次移动的距离就变得更小。其主要原因是防止震荡。

KK算法使得能量最小化,在图的布局上减少了边的交叉,除了需要计算所有节点对之间的最短路径,并不需要其他理论知识。它虽然每一步的计算复杂度高于FR算法,但迭代次数较少,使其执行速度和效果都比FR好。

改变三:

统计:选择边概述——平均路径长度,然后选择外观——节点——Betweenness Centrality

操作如下

结果如下

中间状态(betweenness)—— 在整个网络中,一个点在其他两两节点之间的最短路径上多次出现,我们说这样的点具有较高的中间状态值

所以上图分析结果:就是像金陵这些人中间状态比较高,在连接中的作用比较重要

改变四:

过滤:首先移除之前度度范围的过滤,然后将可以将边标签也勾上,就成了下图

这个时候我们可以观察数据资料——每一列的开头,来进行有选择地过滤

比如我们过滤category ,去掉location、event,只留下Person

结果就只剩person,category里面的event与location就被过滤掉了

注意

外观节点如何选择统计算法

建议是下面红框——节点本身大小与标签尺寸   从度、入度、出度里面选,并且最好一致

下面黄框——节点本身颜色与标签颜色选择需要的统计算法,并且最好一致

如果不这样,你会发现呈现出的结果想要表达的信息量太多,并不容易分析

额外补充

介绍社交网络分析中的几个重要度量参数:

  • 度(degree)—— 一个节点有 n 条边即度数为 n,如图 1 中的点 A 度数为 6;
  • 接近度(closeness)—— 若一个节点与其他节点的几何距离之和(如最短路径之和)相对较小,我们认为该节点的接近度偏高,如图 1 中的点 B;
  • 中间状态(betweenness)—— 在整个网络中,一个点在其他两两节点之间的最短路径上多次出现,我们说这样的点具有较高的中间状态值,如图 1 中的点 B;
  • 中央性(centrality)—— 以上 3 个参数都是用于度量中央性的。简单来说,中央性指的是一个节点对于整个网络的重要程度。比如上文提到的具有弱关联(weak ties)的节点即有很高的中央性;
  • 桥(bridge)—— 如果一条边删除后会增加整个网络图中的连通分支的数量,我们称这条边为桥,如图 1 中的边 CD。

Gephi简易学习[六]———— 拓展分析红楼梦数据相关推荐

  1. Gephi简易学习[五]———— 分析红楼梦数据,了解Gephi操作流程

    处理数据 链接:https://pan.baidu.com/s/11mzYYnU4DBucH0lUhvXrrw 密码:wgbr 操作流程 统计分析→外观→布局→过滤 : 具体操作步骤: 打开hongl ...

  2. 代码实现 | LDA方法分析红楼梦各回主题

    文章目录 1 数据预处理 1.1 准备工作 1.2 读入文本 1.3 分词.去停词 2 基本情况 2.1 全文词频及词云图 2.2 人物出场情况 2.3 宝玉的cp 3 LDA分析红楼梦各回的主题 3 ...

  3. 这是入门生信,学习生信分析思路和数据可视化的首选?

    封面来源:https://www.zhihu.com/question/304747766 常规转录组是我们最常接触到的一种高通量测序数据类型,其实验方法成熟,花费较低,是大部分CNS必备的技术,以后 ...

  4. python红楼梦人数统计结果_Python学习分析红楼梦社交网络,意外发现一个有影响力的神秘人物...

    前言 这次我们将分析整个红楼梦的社交网络.我们尝试用算法去寻找红楼梦中最重要的人物,最有权势的人物,以及一些关系亲密的小团体.看看都有哪些有趣的发现吧. 社交网络 据统计,红楼梦中出场人数共有四百四十 ...

  5. 红楼梦人物分析系统c语言,Gephi分析红楼梦

    前言 上一周赶了好久的社会网络计算,貌似是第四周还是第五周的时候,那时候我们就把题目定下来了吧,然后一直拖着没有做.其中的原因多种多样 ,其实也可以说没有什么原因,就是不想做而已,然后就假装忘记233 ...

  6. python分析红楼梦出现的虚词词频统计_用Python分析红楼梦,见证贾府的兴衰

    分词词频统计 什么是分词?众所周知中文是以字为单位,句子中所有的字连起来才能描述一个意思.例如我是一个学生.计算机不能很容易明白"学"."生"两个字合起来才表示 ...

  7. 红楼梦人物出场顺序python_Python 中文词频分析——红楼梦人物出场次数

    本篇文档,带大家用Python做一下词频统计 本章需要用到Python的jieba模块 jieba模块是一个经典的用于中文分词的模块 首先呢 我们需要读取文章的内容,并用jieba库的lcut进行分词 ...

  8. python红楼梦人物统计_Python分析红楼梦,宝玉和十二钗的人物关系

    红楼梦出场人物很多,人物关系极其复杂,这次我们用Python来分析主人公贾宝玉和他的姐妹们,金陵十二钗之间的关系,做一个简要的分析. 出场率 由于我们只统计宝玉和十二钗(正册)这些人物,因此我们需要实 ...

  9. python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计

    python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...

最新文章

  1. 五分钟了解Mysql的行级锁——《深究Mysql锁》
  2. 《那些年啊,那些事——一个程序员的奋斗史》——78
  3. kotlin 构造函数_Kotlin程序| 主要构造函数示例
  4. 玩转oracle 11g(12):卸载
  5. Rabbitmq的三种方式
  6. 一个切图仔的工作日常
  7. Atitit.js获取上传文件全路径
  8. php去除空格和换行
  9. 水系图一般在哪里找得到_真空排水系统在综合管廊工程中的应用探讨
  10. html动态生成表格源码,JavaScript动态生成表格的示例
  11. 看完知乎轮子哥的编程之路,我只想说,收下我的膝盖。。。
  12. 百度统计热力图邀请码
  13. html 5 游戏 脚本,HTML 5开发RPG游戏之四(游戏脚本化)(2)
  14. 宁德时代钠电池雷声大,雨点小?
  15. matlab版大学物理学,MATLAB可视化大学物理学(第2版)
  16. 基于WiFi的CSI数据做呼吸频率检测-python版(含代码和数据)
  17. 计算机 我们一起学猫叫歌词,猫叫是什么歌 抖音我们一起学猫叫完整版歌词
  18. 产品DAU下降如何分析
  19. 信道检测手机软件 ios_如何在iOS设备上用PS4或Xbox One的手柄玩游戏?
  20. 比特率 波特率 数据传输速率 区别;波特率与比特率--转换公式

热门文章

  1. HBase原理(读写流程)
  2. 火狐浏览器各版本下载及插件httprequest
  3. 如何批量提取 PDF 文档内容,将 PDF 格式文档转为 Txt 文本格式
  4. LeetCode每日抑题 554. 砖墙
  5. 基于linphone android sdk 的voip语音、视频通话 教程一、注册
  6. Java后端开发小日记
  7. 技术解析|如何绘制密度分布图
  8. 软件测试太卷了,三个练手的软件测试实战项目偷偷提升自己(附全套视频跟源码)
  9. 湖南省2021年高考成绩查询电话,湖南高考成绩查询电话号码多少,2021年湖南高考查分电话...
  10. atomikos mysql_mysql – Atomikos:当事务包含多个持久性时的异常