参考资料

  1. 《社会媒体挖掘》

中心性(centrality)用来度量结点在网络中的重要性。对于单个结点或由多个结点组成的群体都可以定义中心性。

单个结点中心性

单个结点中心性主要分为度中心性、特征向量的中心性、Katz中心性、PageRank、中间中心性、接近中心性。

度中心性

针对无向图,结点 v i v_i vi​的度中心性为 C d ( v i ) = d i C_{d}\left ( v_{i}\right )=d_{i} Cd​(vi​)=di​,即为结点的度;
针对有向图,中心性既可以是入度(视为声望) C d ( v i ) = d i i n C_{d}\left ( v_{i}\right )=d_{i}^{in} Cd​(vi​)=diin​,也可以是出度(视为合群性) C d ( v i ) = d i o u t C_{d}\left ( v_{i}\right )=d_{i}^{out} Cd​(vi​)=diout​,还可以是二者的和 C d ( v i ) = d i i n + d i o u t C_{d}\left ( v_{i}\right )=d_{i}^{in}+d_{i}^{out} Cd​(vi​)=diin​+diout​。

特征向量中心性

特征向量中心性是想结合结点邻居的中心性作为该结点的中心性:

c e ( v i ) = 1 λ ∑ j = 1 n A j , i c e ( v j ) c_{e}\left ( v_{i}\right )=\frac{1}{\lambda }\sum_{j=1}^{n}A_{j,i}c_{e}\left ( v_{j}\right ) ce​(vi​)=λ1​∑j=1n​Aj,i​ce​(vj​)

其中, λ \lambda λ是个常量, c e ( v i ) c_{e}\left ( v_{i}\right ) ce​(vi​)是结点 v i v_{i} vi​的中心性。
将上式写成矩阵形式,特征向量中心性实际上是对网络的邻接矩阵 A A A进行特征分解,选择最大特征值对应的特征向量作为各结点的中心性。

λ C e = A T C e \lambda C_{e}=A^{T}C_{e} λCe​=ATCe​

其中, C e C_{e} Ce​是邻接矩阵 A T A^{T} AT的特征向量, λ \lambda λ是对应的特征值。
但是中心性要求大于0,所以引入Perron-Frobenius Theorem:
假设 A ∈ R n × n A \in \textrm{R} ^{n\times n} A∈Rn×n是[强]连通图的邻接矩阵,或者 A : A i , j > 0 A:A_{i,j}> 0 A:Ai,j​>0(即一个正的 n × n n\times n n×n的矩阵),存在一个正实数(Perron-Frobenius特征值) λ m a x \lambda_{max} λmax​,满足 λ m a x \lambda _{max} λmax​是矩阵 A A A的特征值,并且 A A A的其余特征值均严格小于 λ m a x \lambda _{max} λmax​。 λ m a x \lambda _{max} λmax​所对应的特征向量为 v = ( v 1 , v 2 , ⋅ ⋅ ⋅ , v n ) \mathbf{v}=\left ( v_{1},v_{2},\cdot \cdot \cdot ,v_{n}\right ) v=(v1​,v2​,⋅⋅⋅,vn​),满足 ∀ v i > 0 \forall v_{i}> 0 ∀vi​>0。

Katz中心性

对于入度为0的结点,其特征向量中心性为0。为了解决这个问题,加入了一个偏差项 β \beta β:

c K a t z ( v i ) = α ∑ j = 1 n A j , i c K a t z ( v j ) + β c_{Katz}\left ( v_{i}\right )=\alpha \sum_{j=1}^{n}A_{j,i}c_{Katz}\left ( v_{j}\right )+\beta cKatz​(vi​)=α∑j=1n​Aj,i​cKatz​(vj​)+β

写为向量形式:

C K a t z = α A T C K a t z + β 1 C_{Katz}=\alpha A^{T}C_{Katz}+\beta \textbf{1} CKatz​=αATCKatz​+β1

移项得:

C K a t z = β ( I − α A T ) − 1 ⋅ 1 C_{Katz}=\beta \left ( I-\alpha A^{T}\right )^{-1}\cdot \textbf{1} CKatz​=β(I−αAT)−1⋅1

注意:当 det ( I − α A T ) = 0 \textbf{det}\left ( I-\alpha A^{T}\right )=0 det(I−αAT)=0时,矩阵 I − α A T I-\alpha A^{T} I−αAT将不可逆。实际中,一般选择 α < 1 / λ \alpha < 1/\lambda α<1/λ以便正确计算中心性。

PageRank

PageRank则是在Katz中心性的基础上,对结点传递出的中心性对其出度作了归一化,这显然是合理的。

C p ( v i ) = α ∑ j = 1 n A j , i C p ( v j ) d j o u t + β C_{p}\left ( v_{i}\right )=\alpha \sum_{j=1}^{n}A_{j,i}\frac{C_{p}\left ( v_{j}\right )}{d_{j}^{out}}+\beta Cp​(vi​)=α∑j=1n​Aj,i​djout​Cp​(vj​)​+β

表示为矩阵形式:

C p = α A T D − 1 C p + β 1 C_{p}=\alpha A^{T}D^{-1}C_{p}+\beta \textbf{1} Cp​=αATD−1Cp​+β1

改写为:

C p = β ( I − α A T D − 1 ) − 1 ⋅ 1 C_{p}=\beta \left ( I-\alpha A^{T}D^{-1}\right )^{-1}\cdot \textbf{1} Cp​=β(I−αATD−1)−1⋅1

类似于Katz中心性,实际上,选取 α < 1 / λ \alpha < 1 / \lambda α<1/λ,其中 λ \lambda λ是矩阵 A T D − 1 A^{T}D^{-1} ATD−1的最大特征值。在无向图中,由于矩阵 A T D − 1 A^{T}D^{-1} ATD−1的最大特征值为 λ = 1 \lambda =1 λ=1,所以 α < 1 \alpha < 1 α<1。

中间中心性

中间中心性计算其他结点间通过结点 v i v_{i} vi​的最短路径数。

C b ( v i ) = ∑ s ≠ t ≠ v i σ s t ( v i ) σ s t C_{b}\left ( v_{i}\right )=\sum_{s\neq t\neq v_{i}}^{}\frac{\sigma _{st}\left ( v_{i}\right )}{\sigma _{st}} Cb​(vi​)=∑s​=t​=vi​​σst​σst​(vi​)​

通俗地讲,结点 s s s与结点 t t t间存在许多条最短路径,共 σ s t \sigma _{st} σst​,其中有 σ s t ( v i ) \sigma _{st}\left ( v_{i}\right ) σst​(vi​)条是通过结点 v i v_{i} vi​的,如果这个数量越大,说明该结点越重要,极端情况下,所有路径都需要经过它,那么它也就是枢纽站,比值就为1。所以结点 v i v_{i} vi​的最大值为:

C b ( v i ) = ∑ s ≠ t ≠ v i 1 = 2 ( n − 1 2 ) C_{b}\left ( v_{i}\right )=\sum_{s\neq t\neq v_{i}}^{}1=2 \binom{n-1}{2} Cb​(vi​)=∑s​=t​=vi​​1=2(2n−1​)

则归一化后的中间中心性:

C b n o r m ( v i ) = C b ( v i ) 2 ( n − 1 2 ) C_{b}^{norm}\left ( v_{i}\right )=\frac{C_{b}\left ( v_{i}\right )}{2\binom{n-1}{2}} Cbnorm​(vi​)=2(2n−1​)Cb​(vi​)​

对无向图,有 ∑ s ≠ t ≠ v i σ s t ( v i ) σ s t = 2 ∑ s ≠ t ≠ v i , s < t σ s t ( v i ) σ s t \sum_{s\neq t\neq v_{i}}^{}\frac{\sigma _{st}\left ( v_{i}\right )}{\sigma _{st}}=2\sum_{s\neq t\neq v_{i},s< t}^{}\frac{\sigma _{st}\left ( v_{i}\right )}{\sigma _{st}} ∑s​=t​=vi​​σst​σst​(vi​)​=2∑s​=t​=vi​,s<t​σst​σst​(vi​)​,所以中心性乘以2。

接近中心性

接近中心性的思想是,趋于中心的结点,满足与其他结点之间有最小平均最短路径。接近中心性定义为:

C c ( v i ) = 1 l ˉ v i C_{c}\left ( v_{i}\right )=\frac{1}{\bar{l}_{v_{i}}} Cc​(vi​)=lˉvi​​1​

其中, l ˉ v i = 1 n − 1 ∑ v j ≠ v i l i , j \bar{l}_{v_{i}}=\frac{1}{n-1}\sum_{v_{j}\neq v_{i}}^{}l_{i,j} lˉvi​​=n−11​∑vj​​=vi​​li,j​是结点 v i v_{i} vi​与其他结点之间的平均最短路径。最短路径越小,那么结点的中心性会越高。

群体中心性

群体中心性的定义与单个结点的中心性相差不大,就是将一个群体视为一个结点。

群体度中心性

群体度中心性,是群体外部的结点连接到群体内部结点的数目。

C d g r o u p ( S ) = ∣ { v i ∈ V − S ∣ v i 连 接 到 v j ∈ S } ∣ C_{d}^{group}\left ( S\right )=\left | \left \{v_{i}\in V-S|v_{i}连接到v_{j}\in S\right \}\right | Cdgroup​(S)=∣{vi​∈V−S∣vi​连接到vj​∈S}∣

与度中心性相似,可以利用有向图中的入度或出度。同样,该值可以进行归一化。

群体中间中心性

和中间中心性相似,将群体中间中心性定义为:

C b g r o u p ( S ) = ∑ s ≠ t , s ∉ S , t ∉ S σ s t ( S ) σ s t C_{b}^{group}\left ( S\right )=\sum_{s\neq t,s\notin S,t\notin S}^{}\frac{\sigma _{st}\left ( S\right )}{\sigma _{st}} Cbgroup​(S)=∑s​=t,s∈/​S,t∈/​S​σst​σst​(S)​

群体接近中心性

群体接近中心性定义为:

C c g r o u p ( S ) = 1 l ˉ S g r o u p C_{c}^{group}\left ( S\right )=\frac{1}{\bar{l}_{S}^{group}} Ccgroup​(S)=lˉSgroup​1​

其中, l ˉ S g r o u p = 1 ∣ V − S ∣ ∑ v i ∉ S l S , v j \bar{l}_{S}^{group}=\frac{1}{\left | V-S\right |}\sum_{v_{i}\notin S}^{}l_{S,v_{j}} lˉSgroup​=∣V−S∣1​∑vi​∈/​S​lS,vj​​, l S , v j l_{S,v_{j}} lS,vj​​是群体 S S S与群体外的元素 v j v_j vj​的最短路径的长度。该长度可以以多种方式定义,一种方法是寻找 S S S中距离 v j v_{j} vj​最近成员元素,另一种是使用最大距离或平均距离。

中心性(centrality)相关推荐

  1. 网络结点中心性 Centrality

    结点中心性 node centrality 被认为是度量网络结点重要性的重要指标 常见的结点中心性有以下7种: (以下各中心的概念在不同地方的定义可能不同,实际计算应查看使用工具的具体实现) 1.度中 ...

  2. 节点中心性:度中心性、特征向量中心性、Katz中心性、介数中心性

    目录 一.度中心性(Degree Centrality) 二.特征向量中心性(Eigenvector Centrality) 三.Katz中心性(Katz Centrality) 四.介数中心性(Be ...

  3. 社交网络分析:网络中心性

    原文地址:社交网络分析:网络中心性作者:酸嘢 本文为Social Network Analysis学习笔记,课程地址为https://www.coursera.org/course/sna. 对于中心 ...

  4. 图神经网络系列-Graph图基本介绍、度中心性、特征向量中心性、中介中心性、连接中心性

    图神经网络系列-Graph图基本介绍.度中心性.特征向量中心性.中介中心性.连接中心性 目录 图的定义 图的类型 空图形 简单图 多重图 有向图 无向图 连通与断开图 正则图 完全图 循环图 二部图 ...

  5. 关系网络理论︱细讲中介中心性(Betweeness Centrality)

    关系网络在我认为都是一种很简单暴力地能挖掘人群特征关系的一种方式,特别今天去听了一场关于AI与金融领域的结合,里面提到了拓扑分析其实就是关系网络的解释.我在之前的文章( R语言︱SNA-社会关系网络- ...

  6. python中心性评价_复杂网络中边的中心性(Edge Centrality)

    一分钟读完全文 补充了OSMNX给的官方demo中的一些未描述清楚的地方.对复杂网络中的主要用到的两种边中心性betweenness centrality以及current-flow closenes ...

  7. Stress Centrality (重力中心性)的计算方法

    Stress Centrality的计算方法 Stress Centrality也称为重力中心性是最短路径经过某顶点的次数.如从A到D的最短路径经过B,则此路径对B的Stress Centrality ...

  8. Gephi不显示Betweenness Centrality等中心性的问题

    最近在学习文献计量和社会网络分析,了解到了Gephi,现在还在学习摸索阶段. 问题 想导出数据的中心性值,已经统计了网络直径,但是数据表格中没有中心性等数据. 找了很久发现在数据资料的最右边有个小灯泡 ...

  9. 如何使用netwokx进行复杂网络的中心性分析?

    如何使用netwokx进行复杂网络的中心性分析? 这是本学期在大数据哲学与社会科学实验室做的第七次分享了. 第一次分享的是: 如何利用"wordcloud+jieba"制作中文词云 ...

最新文章

  1. python类直接调用不实例化_未实例化类的python调用方法
  2. UML静态建模之用例图
  3. Python面向对象进阶及类成员
  4. tableau实战系列(三十八)-Tableau Server 端口耗竭的具体表象及如何避免端口耗竭
  5. c均值算法的设计与实现_如何使用C链表实现 LRU 算法
  6. zz 聊聊并发(一)
  7. 雇佣K个工人的最小费用 Minimum Cost to Hire K Workers
  8. 吉林大学操作系统上机(实验二:处理机调度——实时调度算法EDF和RMS)
  9. Elasticsearch分布式搜索引擎-安装到实战
  10. 使用C++让鼠标指针抖动
  11. html 禁止触摸事件,html5的触摸事件
  12. Riak - 背景篇(3)
  13. 飞天技术汇 | 你用Kubernetes的样子很酷!
  14. 咕泡P6:ElasticStack高级开发与架构(实战班)二期
  15. 【C#懒蛋编程——5分钟经验分享】02使用partial关键字,分离代码
  16. 8支团队正在努力构建下一代区块链以太坊Ethereum 2.0
  17. 卖炭翁引发的创新经济
  18. GD32片内flash读写数据
  19. 年轻就要勇敢闯荡校园招聘会PPT模板
  20. 【深度思维】读书笔记

热门文章

  1. Caliburn.Micro中的WindowManager
  2. 为DELL品牌的ESXI服务器安装OMSA,实现硬件监控
  3. Java 多项式求值
  4. 欧尼酱讲JVM(02)——类的加载过程
  5. Axure RP9 利用中继器实现表单
  6. SpringBoot整合redis实现简单的操作demo
  7. 计算机网络实训室建设设备,计算机网络技术综合实训室建设方案--200万.doc
  8. C++ 银行家算法与时间片轮转调度算法结合
  9. 数据分析 | 如何对年终销售数据进行可视化分析快速搞定统计图表
  10. win8 桌面显示计算机图标怎么删除,win8系统桌面图标显示快捷方式箭头怎么删除...