向心性的计算

临近节点(Neighbourhood)

集中系数(Clustering Coefficient):节点的集中系数 == 其临近的节点中有边相连的节点数/其临近节点总数。图的集中系数是其每个节点的聚类系数的平均数。节点的集中系数表现了这个节点的临近节点的集中情况。图的集中系数表明图的集中水平。

度中心性(Degree Centrality):计算一个节点的边数,度中心性关注单个节点。

Hub节点:度很高的节点。在网络中通常扮演重要的角色。对于一个有向的网络来说,输入度通常用来代表受欢迎程度。

中介中心性(Betweenness Centrality):出现在许多其他节点间最短路径上的节点有较高的中介中心性分数。

节点A的度中心性高于节点H,因为节点H的直接连接更少。而节点H有更高的中介中心性,它在这个网络中扮演经纪人的角色,它处在网络内许多节点交往的路径上,因此,它具有控制其他人交往的能力。

特征向量中心性(Eigenvector Centrality):一个节点的特征向量中心性与其临近节点的中心性得分的总和成正比。与重要的节点连接的节点更重要。有少量有影响的联系人的节点其中心性可能超过拥有大量平庸的联系人的节点。这点与PR值类似。

特征向量中心性的计算:

1、计算图的成对临近矩阵的特征分解

2、选择有最大特征值的特征向量

3、第i个节点的中心性等于特征向量中的第i元素

随机网络(Random Networks)以及小世界网络(Small World Networks)

Erdős–Rényi随机图模型(Random Graph Model):一个有n个非连通节点的图,以概率p在每对节点间创建边。

小世界网络:

1、米尔格拉姆(著名的社会心理学家,曾主持服从实验)的小世界实验(Small World Experiment)

向内布拉斯加州随机选出的人发送一个包裹,让他们将这个包裹送给波士顿州的一名股票经纪人。要求他们将这个包裹转寄给可能认识这个股票经纪人的人。

尽管大部分节点不是直接连接,但是,每个节点可以通过一个相对较少的几次传递与其他节点相连。

2、凯文·贝肯的六度(Six Degrees of Kevin Bacon):基于小世界网络的一个室内游戏

从互联网电影数据库(IMDB)找出演员间合作的图。

一个演员的贝肯数是指他与贝肯相连最短路径的度数。

3、小世界网络的典型属性

高集中系数

短平均路径

很多hub节点

构建一个直径较大的连通图,然后随机在其上添加几条边,图的直径将快速变小。

小世界网络有许多局部的联接和少量的“捷径”。

4、生成小世界网络

创建n个节点的环,每一个节点与其最近的k个邻近节点相连

以概率p将每个节点与某个目标节点相连。

小团体(Clique):是指互相认识的一个社交群组(即每一对节点间都有边。)

极大团(Maximal Clique):当一个团不是图中其他团的子集时称为极大团。

最大团(Maximum Clique):当一个团的规模大于等于图中的其他团时称为最大团。

团体发现(Community Detection)
人们经常对在一个节点网络中识别团体很感兴趣

**团体(Community)/类别(Cluster)/模块(Module)**存在许多种定义:

一组有共同性质或在图中扮演类似角色的节点[Fortunato, 2010]

一个节点子集其中节点间联系密集,而到其他团体的边则密度较小[Girvan & Newman, 2002]

图的分割(Graph Partitioning)

目的:将图的节点分成用户指定数量的独立群组,用于优化与切分边相关的标准。

最小切分(Min-cut):就是找到一种分割使边的个数或边的权重最小。

近期的做法:使用更复杂的标准(即标准化分割)以及应用多层次的策略来扩展到大图。

**存在的问题:**需要预先制定分割的数量,切分原则通常基于聚类层次的强假设。

层次聚类(Hierarchical Clustering)

根据相似度计算构建一个聚类树来识别高相似度的节点组。

有两类基本算法:

**聚合:**从每个节点做为一个单独的群体开始,应用自下而上的策略,合并每个层次上最相似的群体。

**拆分:**从包含所有节点的单个群体开始,应用自上而下的策略,将每个层次上选定的群体分为两个子群体。(Hierarchical Clustering)

应用在团体发现时的问题:

如何从多种不同的聚类方式中进行选择?
在图是否真的存在层次结构?

通常对大图的扩展性很差

模块度最优化(Modularity Optimisation)

Newman & Girvan [2004]提出了分割质量的测量

随机图不应该有群体结构

通过比较实际的节点密度与随机图中的节点期望密度里验证群体的存在

Q = (群体中存在的节点数) − (群体中期望存在的节点数)

应用聚合技术迭代合并节点组组成更大的群体,使模块度在合并后提升。

近期出现的模块度最大化的高效贪婪方法可以将图的规模扩展到10的9次方个节点。

Louvain Method [Blondel et al, 2008]

应用在团体发现时的问题:

图的总节点数控制哪个团体被识别[Fortunato, 2010]

仅将节点分配给一个团体是否合理?

重叠VS不重叠

在现实的社交网络中,一个节点可能属于多个团体。(Overlapping Networks)

在许多的现实网络中,真正的“非重叠”团体很少大规模出现[Leskovec et al, 2008]。

团体重叠的普遍存在,使得无法分割网络而不拆分团体[Reid et al, 2011]。

(Overlapping In Large Graph)

重叠的团体发现

**CFinder:**基于小团体渗透技术(clique percolation method [Palla et al, 2005])的一种算法。

K-Clique识别:是完全连接的K个节点的子图。

如果一对K-Clique共享K-1Clique,那么,这两个K-Clique是临近的。

从最大的K-Cliques的组合就可以构成重叠的团体。

K-Cliques的组合是指可以通过临近的K-Clique互相达到的一组K-Clique。

贪婪小团体扩展(Greedy Clique Expansion,GCE):识别不同的小团体作为种子,通过优化本地适应性函数贪婪扩展这些种子[Lee et al, 2010]。

**MOSES:**识别高度重叠的团体的可扩展方法[McDaid et al, 2010]。

随机选择一条边,在这个边周围贪婪地扩展一个团体,以便优化目标函数。

删除“低质量”的团体

通过重新分配个别节点对团体进行微调

动态团体发现(Dynamic Community Finding)
在许多社交网络分析任务中,需要分析随着时间变化,团体是如何创建和发展的。

通常以“线下的”方式检查大量网络的快照来进行这项研究。

Snapshot of Network Snapshot of Network

可以用生命周期中的关键事件来描述动态团体的特征[Palla et al, 2007; Berger-Wolf et al, 2007]。Dynamic Community

为图的每个快照应用团体发现算法。

将新生成”后续团体”与过去发现的团体进行匹配。

动态团体跟踪软件[Greene et al, 2010]

社区检测(网络分析)(图聚类)---进阶概念解析相关推荐

  1. python画聚类图、并且把聚类图保存起来_Python利用igraph绘制复杂网络聚类(社区检测)结果图-Go语言中文社区...

    前言:研究生期间主要做复杂网络聚类,也称为社区检测.临毕业前,老师让之前发表的论文里的算法代码C化,并写出界面进行可视化.由于之前虽然做过可视化,但基本上都是将聚类结果导入到pajek或者gephi这 ...

  2. Python利用igraph绘制复杂网络聚类(社区检测)结果图

            前言:研究生期间主要做复杂网络聚类,也称为社区检测.临毕业前,老师让之前发表的论文里的算法代码C化,并写出界面进行可视化.由于之前虽然做过可视化,但基本上都是将聚类结果导入到pajek ...

  3. PyTorch图神经网络实践(七)社区检测

    文章目录 前言 组合优化 社区检测 端到端的学习与优化 作者介绍 核心思想 技术手段 方法创新 代码复现 导入包 数据转换 ClusterNet模型 创建网络 参数设置和数据导入 训练网络 前言 最近 ...

  4. 高清屏概念解析与检测设备像素比的方法

    前言 做移动端h5开发很久了,从开始入行到现在.很多知识和工具都是在用前辈留下的遗产,都没有深入的研究过原因,了解为什么要这么去做. 也许自己也是过了交给自己做什么就做什么的阶段了.在国庆节有一个大块 ...

  5. 这个图聚类Python工具火了:可对社群结构进行可视化、检测 | 开源

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最近,又 ...

  6. 从工具到社区,美图秀秀大规模性能优化实践

    导读:本文由演讲整理而成.美图秀秀社区自上线以来已经有近一年时间,不管是秀秀海量的用户还是图片社区特有的形态都给性能优化提出了巨大的挑战.本文将会结合这一年内我们遇到的具体案例和大家分享下美图秀秀社区 ...

  7. “黑产“识别算法(社区检测,相似度,关联关系)

    "黑产"识别算法 前言 黑产的特性 通过业务特性识别 通过关联关系识别(非监督学习) 通过行为相似度识别(非监督学习) 通过用户画像识别(分类.预测) 前言 我们讨论的黑产识别,实 ...

  8. 重叠社区检测基础算法

    1.思维导图 2.算法详解 1)CPM算法 (1)算法思想 假设社区由完全连接的子图的重叠集(团)构成,并通过搜索相邻的团来检测社区. 首先识别网络中所有大小为K的团,一旦这些被识别出来,就会构建一个 ...

  9. QUANT[6] 量化交易常见概念解析

    QUANT[1]:从零开始量化交易 - プロノCodeSteel - CSDN博客 QUANT[2]:量化交易策略基本框架搭建 - プロノCodeSteel - CSDN博客 QUANT[3]:量化交 ...

最新文章

  1. 线程撕裂者安装linux,CPU-Z 1.90发布:初步支持三代线程撕裂者
  2. js 截取 前后 空格 获取字符串长度
  3. 获取自定义组件的宽度和高度
  4. JavaFX给控件添加css样式
  5. Android开发之修改ImageView(图片)的颜色
  6. linux下启动solr命令,如何自动启动Solr?
  7. 使用ThreadLocal绑定连接资源(事务)
  8. 【我的物联网成长记2】设备如何进行选型?
  9. SWAT 学习相关基础知识(一)---Mr.Zhang
  10. BIO,NIO和AIO的区别
  11. Android JNI 学习(十):String Operations Api Other Apis
  12. 杭电 -- 2553 N皇后问题
  13. [51nod1116]K进制下的大数
  14. 使用valgrind检查内存越界
  15. 趋势 | 或许,这就是大佬吧!——美国ETF产业三巨头格局浅谈
  16. office批量打印助手(excel批量打印word批量打印)
  17. 在夕阳再晨的日子里(二)----掌管市场部的岁月之合作团队与社区的拓展
  18. 如何用计算机画函数图像,用Excel绘制函数图像的技巧
  19. php判断是否submit,submit什么意思 php提交表单时判断 if$_POST[submit]与 ifisset$_POST[submit] 的区别...
  20. java dns缓存清理_jvm dns缓存问题解决方式

热门文章

  1. 安卓APP蓝牙上位机的编写二——搜索附近蓝牙设备
  2. 【报告分享】2021小红书投放运营指南书-小红书(附下载)
  3. 【报告分享】2021年度小红书高效种草营销手册-标记我的生活-小红书(附下载)
  4. 第四课:点亮LED灯
  5. mysql诸如漏洞攻击_MySQL及漏洞笔记
  6. 漫画:滑动窗口入门题目,没有之一
  7. SAP FICO CBS接口-银企直连联盟收款功能开发说明书(包括测试样例、程序代码仅作参考,不保证一定可以运行)
  8. 【2021-07-16】堆糖小程序
  9. 在 Kubernetes 中基于 StatefulSet 部署 MySQL(下)
  10. 满足哪些条件的商品有资格参与亚马逊秒杀卖家们知多少?