处理数据

链接:https://pan.baidu.com/s/11mzYYnU4DBucH0lUhvXrrw 密码:wgbr

操作流程

统计分析→外观→布局→过滤

具体操作步骤:

打开honglou_edge.csv与honglou_node.csv节点

显示标签

统计分析:

模块化计算

外观

设置:我们这里节点本身颜色与标签颜色都选择的Modularity Class,节点大小与标签尺寸都选择的度

节点——颜色

节点——大小

节点——标签颜色

节点——标签尺寸

布局

过滤

目的:取一些小点的度和大点的度,过滤掉中间的度

步骤:将拓扑---度范围,拉入到查询里面,然后进行度范围设置,最终进行选择

目的:将2个度范围进行并集运算

步骤:将拓扑---并集,拉入查询里面,然后将两个度范围拉入并集里

预览

在下图主要点击节点标签里面的字体与比例大小就行

结果分析

统计分析里面的不同算法→选择不同的渲染模式→最终图形,因此我们需要搞懂算法原理,才能进一步分析

1由于我们节点本身大小与节点标签尺寸都是选择Rank中的度,所以由图可以明显看出谁的度越大,说明在个图中与其他点联系越大,作用越大

2由于我们节点本身颜色和标签颜色的渲染方式都选的模块化,所以整个图以度大的节点最终呈现出社区稳定

对上面操作流程的进一步理解:

统计分析

模块化:Modularity Measure(模块化度量值),由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。

定义:         

模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度Q来获得最优的网络社区划分。

PageRank

PageRank算法主要应用在搜索引擎的搜索功能中,其主要用来计算网页的重要程度,将最重要的网页展示在网页的前面,此算法主要围绕以下两个假设:

①如果存在一个网页,它被许多其他的链接链接到,则说明这个网页比较重要,则此网页的PageRank值比较高。
②如果存在一个网页,它本身的PageRank值比较高,且此网页又链接了一个网页,则这个被链接的网页比较重要,其PageRank值较高。

外观:

度(degree)—— 一个节点有 n 条边即度数为 n

布局:

Force Atlas:

基于力导向 (Force-directed) 的算法作为弹簧理论算法的一类典型,被广泛应用于描述社交网络等关系型信息图。它的原理其实非常易懂,我们可以把整张网络想象成一个虚拟的物理系统。系统 中的每个节点都可以看成是一个带有一定能量的放电粒子,粒子与粒子之间存在某种库仑斥力,使它们两两相互排斥。同时,有些粒子间被一些“边”所牵连,这些 边产生类似弹簧的胡克引力,又紧紧牵制着“边”两端的粒子。在粒子间斥力和引力的不断作用下,粒子们从随机无序的初态不断发生位移,逐渐趋于平衡有序的终 态。同时整个物理系统的能量也在不断消耗,经过数次迭代后,粒子之间几乎不再发生相对位移,整个系统达到一种稳定平衡的状态,即能量趋于零。此刻,最终的 这幅理想的社交网络图也基本绘制完成。

基本上绝大多数算法都遵循着这样的原则,即:

  1. 将网络看成一个顶点为钢环,边为弹簧的物理系统
  2. 不断迭代,使整个系统的总能量达到最小

清单. 力导向核心算法实现伪代码

Set up initial node positions randomly Loop for k For each node u For each node v net-force += Coulomb_repulsion( u, v ) End For End For For each edge e compute net-force += Hooke_attraction( u1, u2 ) // u1, u2 is start and end node of edge e End For Update x and y values with each net-force // every node has its own net-force End Loop

伪代码的整体思想归纳如下:

  1. 随机分布初始节点位置;
  2. 计算每次迭代局部区域内两两节点间的斥力所产生的单位位移(一般为正值);
  3. 计算每次迭代每条边的引力对两端节点所产生的单位位移(一般为负值);
  4. 步骤 2、3 中的斥力和引力系数直接影响到最终态的理想效果,它与节点间的距离、节点在系统所在区域的平均单位区域均有关,需要开发人员在实践中不断调整;
  5. 累加经过步骤 2、3 计算得到的所有节点的单位位移;
  6. 迭代 n 次,直至达到理想效果。

Gephi简易学习[五]———— 分析红楼梦数据,了解Gephi操作流程相关推荐

  1. Gephi简易学习[六]———— 拓展分析红楼梦数据

    拓展分析:我们需要在下面操作流程某一步进行改动,然后看看对结果有什么影响 操作流程 统计分析→外观→布局→过滤 Gephi简易学习[五]---- 分析红楼梦数据,了解Gephi操作流程中的 最终结果 ...

  2. 代码实现 | LDA方法分析红楼梦各回主题

    文章目录 1 数据预处理 1.1 准备工作 1.2 读入文本 1.3 分词.去停词 2 基本情况 2.1 全文词频及词云图 2.2 人物出场情况 2.3 宝玉的cp 3 LDA分析红楼梦各回的主题 3 ...

  3. android webrtc学习五(webrtc视频数据传递和切换摄像头问题处理)

    android webrtc学习五(webrtc视频数据传递和切换摄像头问题处理) Android webrtc摄像头流程分析 1.打开摄像头 2.获取流数据 摄像头切换 问题场景:在使用华为手机(忘 ...

  4. 红楼梦人物分析系统c语言,Gephi分析红楼梦

    前言 上一周赶了好久的社会网络计算,貌似是第四周还是第五周的时候,那时候我们就把题目定下来了吧,然后一直拖着没有做.其中的原因多种多样 ,其实也可以说没有什么原因,就是不想做而已,然后就假装忘记233 ...

  5. python红楼梦人数统计结果_Python学习分析红楼梦社交网络,意外发现一个有影响力的神秘人物...

    前言 这次我们将分析整个红楼梦的社交网络.我们尝试用算法去寻找红楼梦中最重要的人物,最有权势的人物,以及一些关系亲密的小团体.看看都有哪些有趣的发现吧. 社交网络 据统计,红楼梦中出场人数共有四百四十 ...

  6. 红楼梦人物出场顺序python_Python 中文词频分析——红楼梦人物出场次数

    本篇文档,带大家用Python做一下词频统计 本章需要用到Python的jieba模块 jieba模块是一个经典的用于中文分词的模块 首先呢 我们需要读取文章的内容,并用jieba库的lcut进行分词 ...

  7. 使用word2vec分析红楼梦中的人物

    上周四给陈老大和几个研究生汇报工作,主要讲了word2vec的应用,陈老大他们觉得这个东西很牛逼,汇报结束之后陈老大让我拿红楼梦来训练,看看这样能不能发现红楼梦中的人物关系,目前清华有个实验室试图用机 ...

  8. 使用NLP库textblob进行情感分析-红楼梦评论

    最近做了一个分析国外读者对红楼梦评价的小项目.这部分是使用textblob库对评论进行情感分析,得到情感值,并且进行分类,生成词云. 生成直方图.条形图的数据分析过程见我的这篇文章 读入的数据是这样的 ...

  9. NLP(4) | 用词向量技术简单分析红楼梦人物关系用n-gramma生成词向量word2vect进行模型训练

    NLP(1) | 词向量one hot编码词向量编码思想 NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词 NLP(3)| seq to seq 模型 前言:出于种种原因,总是不自觉把 ...

最新文章

  1. WCF服务端返回:(413) Request Entity Too Large
  2. 计算机高校应用现状的参考文献,【计算机应用论文】高校计算机实验室管理思考探索(共4094字)...
  3. C#字节数组与值类型变量的互相转换,以及注意事项
  4. SQLite大批量插入性能优化
  5. ASP.NET验证码的实现
  6. 随想录(redis的学习和使用)
  7. PHP array_intersect_assoc()
  8. 管道|符与xargs命令
  9. java万年历的实现
  10. KT148A电子语音芯片ic方案适用的场景以及常见产品类型
  11. 关于java中JDBC读取字段属性原理
  12. 四款软件,提高团队工作效率
  13. zz成人笑话四级考试(绝对经典)
  14. 【C++】不同模板对象之间赋值
  15. elasticsearch和elasticsearch-sql安装教程
  16. 倩女幽魂次世代服务器为什么维护,8月22日停服维护公告--《倩女幽魂》手游2.0次世代全新起点...
  17. Git 忽略某些文件,忽略已提交的文件记录,Git 不追踪变更
  18. windows系统启动时多了onekey ghost选择项要怎么删掉
  19. 个人认为最完美的css处理div圆角的方法
  20. STC8h1k28六个基本实验

热门文章

  1. m分集2跳OFDM系统中基于功率分配和子载波配对算法的信道容量matlab仿真
  2. 同瑞无人船远距离通讯方案
  3. dw网页设计期末设计一个网页_Dreamweaver网页设计模拟试题一及答案
  4. burp suite使用
  5. vba九九乘法表代码_Access设计九九乘法表
  6. 2022-2028全球与中国激光显示技术市场现状及未来发展趋势
  7. 发布我的下棋作品--Monkey黑白棋(AI还可以,战胜了不少其它的黑白棋程序)
  8. css用什么空格,CSS中用什么进行空格的处理(实例)
  9. Java Swing打猎射击游戏编程代码下载
  10. 蓝色微立体图表合集4PPT模板