Gephi简易学习[六]———— 拓展分析红楼梦数据
拓展分析:我们需要在下面操作流程某一步进行改动,然后看看对结果有什么影响
操作流程
统计分析→外观→布局→过滤
Gephi简易学习[五]———— 分析红楼梦数据,了解Gephi操作流程中的 最终结果
改变一:
外观——节点颜色与标签颜色,渲染方式都从Modularity改为PageRank,结果如下
分析:这个就不是看以谁度大然后呈现出的社区情况,而是看哪个节点的搜索更多更重要 ,像上图我们就可以看出是以林黛玉、薛宝钗等众多妹纸的PageRank高些
改变二:
布局:从Force Altas 变为Fruchterman Reingold ,结果如下
Force Altas:
FR算法改进了弹簧算法,是现在用途最为广泛的布点算法,很多算法都是在这个算法上改进的。
FR受到了天体重力系统的启发,使用力来计算每个节点的速度,而不是加速度,从而得到每个节点应当移动的距离。它的每次迭代分为三个步骤:
- 计算节点之间的排斥力
- 计算相邻节点之间的吸引力
- 综合吸引力和排斥力,通过最大位移限制移动的距离
使用模拟退火算法,使得在图变得越来越稳定时,温度变得更低,节点每次移动的距离就变得更小。其主要原因是防止震荡。
KK算法使得能量最小化,在图的布局上减少了边的交叉,除了需要计算所有节点对之间的最短路径,并不需要其他理论知识。它虽然每一步的计算复杂度高于FR算法,但迭代次数较少,使其执行速度和效果都比FR好。
改变三:
统计:选择边概述——平均路径长度,然后选择外观——节点——Betweenness Centrality
操作如下
结果如下
中间状态(betweenness)—— 在整个网络中,一个点在其他两两节点之间的最短路径上多次出现,我们说这样的点具有较高的中间状态值
所以上图分析结果:就是像金陵这些人中间状态比较高,在连接中的作用比较重要
改变四:
过滤:首先移除之前度度范围的过滤,然后将可以将边标签也勾上,就成了下图
这个时候我们可以观察数据资料——每一列的开头,来进行有选择地过滤
比如我们过滤category ,去掉location、event,只留下Person
结果就只剩person,category里面的event与location就被过滤掉了
注意
外观节点如何选择统计算法
建议是下面红框——节点本身大小与标签尺寸 从度、入度、出度里面选,并且最好一致
下面黄框——节点本身颜色与标签颜色选择需要的统计算法,并且最好一致
如果不这样,你会发现呈现出的结果想要表达的信息量太多,并不容易分析
额外补充
介绍社交网络分析中的几个重要度量参数:
- 度(degree)—— 一个节点有 n 条边即度数为 n,如图 1 中的点 A 度数为 6;
- 接近度(closeness)—— 若一个节点与其他节点的几何距离之和(如最短路径之和)相对较小,我们认为该节点的接近度偏高,如图 1 中的点 B;
- 中间状态(betweenness)—— 在整个网络中,一个点在其他两两节点之间的最短路径上多次出现,我们说这样的点具有较高的中间状态值,如图 1 中的点 B;
- 中央性(centrality)—— 以上 3 个参数都是用于度量中央性的。简单来说,中央性指的是一个节点对于整个网络的重要程度。比如上文提到的具有弱关联(weak ties)的节点即有很高的中央性;
- 桥(bridge)—— 如果一条边删除后会增加整个网络图中的连通分支的数量,我们称这条边为桥,如图 1 中的边 CD。
Gephi简易学习[六]———— 拓展分析红楼梦数据相关推荐
- Gephi简易学习[五]———— 分析红楼梦数据,了解Gephi操作流程
处理数据 链接:https://pan.baidu.com/s/11mzYYnU4DBucH0lUhvXrrw 密码:wgbr 操作流程 统计分析→外观→布局→过滤 : 具体操作步骤: 打开hongl ...
- 代码实现 | LDA方法分析红楼梦各回主题
文章目录 1 数据预处理 1.1 准备工作 1.2 读入文本 1.3 分词.去停词 2 基本情况 2.1 全文词频及词云图 2.2 人物出场情况 2.3 宝玉的cp 3 LDA分析红楼梦各回的主题 3 ...
- 这是入门生信,学习生信分析思路和数据可视化的首选?
封面来源:https://www.zhihu.com/question/304747766 常规转录组是我们最常接触到的一种高通量测序数据类型,其实验方法成熟,花费较低,是大部分CNS必备的技术,以后 ...
- python红楼梦人数统计结果_Python学习分析红楼梦社交网络,意外发现一个有影响力的神秘人物...
前言 这次我们将分析整个红楼梦的社交网络.我们尝试用算法去寻找红楼梦中最重要的人物,最有权势的人物,以及一些关系亲密的小团体.看看都有哪些有趣的发现吧. 社交网络 据统计,红楼梦中出场人数共有四百四十 ...
- 红楼梦人物分析系统c语言,Gephi分析红楼梦
前言 上一周赶了好久的社会网络计算,貌似是第四周还是第五周的时候,那时候我们就把题目定下来了吧,然后一直拖着没有做.其中的原因多种多样 ,其实也可以说没有什么原因,就是不想做而已,然后就假装忘记233 ...
- python分析红楼梦出现的虚词词频统计_用Python分析红楼梦,见证贾府的兴衰
分词词频统计 什么是分词?众所周知中文是以字为单位,句子中所有的字连起来才能描述一个意思.例如我是一个学生.计算机不能很容易明白"学"."生"两个字合起来才表示 ...
- 红楼梦人物出场顺序python_Python 中文词频分析——红楼梦人物出场次数
本篇文档,带大家用Python做一下词频统计 本章需要用到Python的jieba模块 jieba模块是一个经典的用于中文分词的模块 首先呢 我们需要读取文章的内容,并用jieba库的lcut进行分词 ...
- python红楼梦人物统计_Python分析红楼梦,宝玉和十二钗的人物关系
红楼梦出场人物很多,人物关系极其复杂,这次我们用Python来分析主人公贾宝玉和他的姐妹们,金陵十二钗之间的关系,做一个简要的分析. 出场率 由于我们只统计宝玉和十二钗(正册)这些人物,因此我们需要实 ...
- python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计
python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...
最新文章
- 五分钟了解Mysql的行级锁——《深究Mysql锁》
- 《那些年啊,那些事——一个程序员的奋斗史》——78
- kotlin 构造函数_Kotlin程序| 主要构造函数示例
- 玩转oracle 11g(12):卸载
- Rabbitmq的三种方式
- 一个切图仔的工作日常
- Atitit.js获取上传文件全路径
- php去除空格和换行
- 水系图一般在哪里找得到_真空排水系统在综合管廊工程中的应用探讨
- html动态生成表格源码,JavaScript动态生成表格的示例
- 看完知乎轮子哥的编程之路,我只想说,收下我的膝盖。。。
- 百度统计热力图邀请码
- html 5 游戏 脚本,HTML 5开发RPG游戏之四(游戏脚本化)(2)
- 宁德时代钠电池雷声大,雨点小?
- matlab版大学物理学,MATLAB可视化大学物理学(第2版)
- 基于WiFi的CSI数据做呼吸频率检测-python版(含代码和数据)
- 计算机 我们一起学猫叫歌词,猫叫是什么歌 抖音我们一起学猫叫完整版歌词
- 产品DAU下降如何分析
- 信道检测手机软件 ios_如何在iOS设备上用PS4或Xbox One的手柄玩游戏?
- 比特率 波特率 数据传输速率 区别;波特率与比特率--转换公式
热门文章
- HBase原理(读写流程)
- 火狐浏览器各版本下载及插件httprequest
- 如何批量提取 PDF 文档内容,将 PDF 格式文档转为 Txt 文本格式
- LeetCode每日抑题 554. 砖墙
- 基于linphone android sdk 的voip语音、视频通话 教程一、注册
- Java后端开发小日记
- 技术解析|如何绘制密度分布图
- 软件测试太卷了,三个练手的软件测试实战项目偷偷提升自己(附全套视频跟源码)
- 湖南省2021年高考成绩查询电话,湖南高考成绩查询电话号码多少,2021年湖南高考查分电话...
- atomikos mysql_mysql – Atomikos:当事务包含多个持久性时的异常