6.4 介数

度和接近中心度是基于一个人在网络中的可达性:信息到达一个人的难易程度。中心度和中心性的第二种方法基于这样一种观点,即如果一个人作为通信网络中的中介更重要,那么他或她就更中心化。一个人对于通过网络传输信息有多重要?如果一个人停止传递信息或从网络中消失,有多少信息流被打断或必须绕道更远?由于他或她在通信网络中的位置,一个人可以在多大程度上控制信息流?
这种方法基于介数的概念。一个人的中心性取决于在多大程度上需要他或她作为联系链中的一个环节,以促进网络内信息的传播。一个人越是中间人,他或她在网络中的位置就越中心。如果我们认为测地距离是最有可能在参与者之间传输信息的渠道,那么位于多对顶点之间的测地距离上的参与者对于网络内的信息流非常重要。这个行为人更核心。
例如,Juan 对于锯木厂中 HP-1 和 EM-4 之间的通信很重要,因为所有(四个)测地距离都包括 Juan(图 61)。相比之下,HP-5 和 HP-7 或 EM-2 和EM-5 就不那么重要,因为如果一个人不能传递信息,另一个人可能会扮演这个角色,HP-1 和 EM-4 之间的通信链仍然完好无损。
每对顶点都可能有助于顶点的中介中心度。例如,HP-5 和 EM-1 有助于 Juan 的中介中心度,因为它们的测地距离包括 Juan。相比之下,HP-4 和 HP-5 这对对 Juan 的中介中心度没有贡献,因为他不包括在他们的测地距离中。一般来说,我们可以说一个顶点的中介中心度是网络中包含该顶点的其他顶点之间的所有测地距离的比例。中介中心性是中介中心度分数的变化与最大变化的比率。(本书中的变化Variation, 指一个网络中,每个顶点的某个属性值与所有顶点该属性值中的最大值的差的求和数)

  • 顶点的中介中心度是包含该顶点的其他顶点对之间所有测地距离的比例。
  • 中介中心性是顶点的中介中心度的变化除以相同大小的网络中可能的中介中心分数的最大变化。

很容易看出星形网络的中心(图 59 中的顶点 v5)​​具有最大中介中心度:其他顶点对之间的所有测地距离都包括该顶点。相反,所有其他顶点具有最小中介中心度(0),因为它们不位于其他顶点之间。**星中顶点的中心度分数具有最大的变化,因此星的中介中心性是最大的:移除它的中心顶点,所有的通信联系都被破坏了。**在线形网络(图 59 中的 B)中,删除一个顶点也可能会破坏信息流,但链的某些部分保持完整。因此,中心度指标的变化小于星形网络中的变化,并且介数中心性较低。
应用
Network> Create Vector> Centrality> Betweenness 命令为网络中的顶点创建一个中介中心度向量。此外,网络的中介中心性打印在报告屏幕中。在有向网络中,该过程会自动搜索有向路径,因此输入、输出和全部没有单独的命令。即使在未连接的网络中,也可以计算中介中心度。

锯木厂通信网络的中介集中度为 0.55。员工的中介中心度分数范围为 0.00 到 0.59。在图 62 中,顶点大小表示中介中心度。几个顶点是不可见的,因为它们的中介中心度为零:它们不是其他顶点间中介。在这个例子中,顶点的介数中心度比它们的接近中心度变化更大,因为网络外边缘的顶点的介数为零,而它们仍然接近网络的一部分。因此,中介中心性高于接近中心化。
有趣的是,Juan (0.59)、EM-1 (0.21) 和 HP-5 (0.20) 比工厂经理 (0.17) 更重要。工厂部门内的每个族群——除了说英语的刨工——似乎都有一个非正式的发言人负责与其他部门或族群的沟通。作为工厂西班牙裔员工的发言人,Juan 显然是最核心的。

6.5 特征向量中心性

除了度、接近性和中介性之外,还有第四个关于中心性的观点。基本假设:如果你有更多的联系人——像度中心度那样——特别是如果你的联系人更中心,也就是说,如果他们有很多中心联系人,你将更重要。认识人很重要,但认识谁更重要。如果你认识有影响力的人,你更有可能通过他们施加影响。边的方向在这里无关紧要,因此这种类型的中心性仅适用于无向网络。
正如你可能从对这种中心性的描述中注意到的那样,这种方法固有一个循环性:要计算一个顶点的中心度,你必须首先计算它的邻居的中心度,邻居的中心度同样要计算他们的邻居,包括我们开始的顶点。然而,这个问题有一个优雅的算术解决方案。如果我们将网络表示为矩阵(参见第 12.2 节),则在该矩阵上计算的第一个归一化特征向量会产生广受欢迎的中心度值。出于这个原因,这种类型的中心性称为特征向量中心性,尽管它可能并不总是通过特征值分析来计算。

  • 顶点的特征向量中心度是它与具有高特征向量中心度的顶点相关联的程度。
  • 特征向量中心性是顶点的特征向量中心度的变化除以相同大小的网络中可能的特征向量中心度分数的最大变化。

应用
Pajek 命令 Network> Create Vector> Centrality> Hubs-Authorities 应用的原则是顶点的重要性取决于其网络邻居对有向网络的重要性。它区分枢纽(Hubs,即作为重要发送者的顶点、与重要的权威连接)和权威(Authorities,作为重要接收者的顶点,与重要的枢纽连接)。 Pajek 计算每个顶点的中心和权威权重,并将其存储为向量。此外,Pajek 创建了一个partition ,其中包含最高得分的权威(1 类)、顶级枢纽(3 类)以及既是顶级枢纽又是最高权威的顶点(2 类)。用户必须确定要选择的权威和枢纽(Hubs)的数量,但这些选择不会影响权重的计算,因此所有选择都是安全的。对话框中的最后两个条目(“向网络添加循环”和“在计算中选择有效小数位数”)对于我们的目的并不重要,因此不需要更改它们。(即在有向图中,按照弧的方向,发出方叫枢纽,接受方叫权威)
如果应用于无向网络,则枢纽(Hubs)和权威之间没有区别,因此枢纽(Hubs)和权威的权重向量是相同的,并且它们与顶点的特征向量中心度得分相同。简而言之,由 Hubs-Authorities 命令为无向网络创建的两个向量包含特征向量中心度值。在锯木厂网络中,Juan 的特征向量中心性最高(0.54),其次是工厂所有者,得分为 0.28。打印在报告屏幕中的锯木厂网络的特征向量中心性为 0.72。

6.6 同配性

你的联系人的中心度问题是特征向量中心度的核心(第 6.5 节),它把我们带到了社交网络的另一个有趣现象:中心度高的人往往与中心度高的人联系在一起,而中心度低的人往往与中心度低的人联系在一起。这种现象称为度同配性。
度同配性是同配性或匹配关系(Assortative Mixing)的特例,即与相似的其他人相关的偏好。同配性类似于同质性(homophily)——“物以类聚”——这两个概念有时被使用,好像它们具有相同的含义。然而,在本书中,同配性指的是与顶点的数字属性(例如人的网络度、年龄或体重)相关的相似性。对于顶点的类别属性(例如性别、种族或社会阶层)的相似性,我们保留同质性(homophily)。数值变量之间的相似性,即关联性,需要除分类变量之间的相似性之外的其他度量。

  • 同配性是根据数字属性将顶点连接到与它们相似的其他顶点的偏好。
  • 同配系数是直接连接的顶点的一个或两个数值属性之间的相关性。

网络中的同配性由同配相关系数来衡量,该系数是顶点的数值属性(例如它们的度数)与它们直接连接的顶点的数值属性之间的皮尔逊相关系数。最大值为 1,表示得分高的顶点与得分高的顶点相关联,而得分低的顶点与得分低的其他顶点相关联。最小值为 –1,表示高度顶点与低度顶点相关联。负的同配相关系数表示负同配性。例如,在动物网络中就身体大小观察到了不相称的行为。小动物想依附于大动物,期望它们会保护它们,而大动物则喜欢控制小动物的强大权力感。两个不同物种之间的长期相互作用称为共生(见进一步阅读)。如果度数分类度为 0,则顶点的度数不会告诉我们任何有关其接触度数的信息。
在无向网络中,我们无法区分链接的两个顶点。因此,同配相关系数必须对两个顶点使用相同的数值属性。相反,我们可以区分有向网络中的发送顶点和接收顶点。我们可以推测发送者和接收者的不同属性与链接相关。在异性婚姻制度中,新郎的家人必须向新娘的家人求婚,儿子的数量可能是发送者的重要财产,而女儿的数量是接收者的重要财产。
应用
度同配相关系数是网络的一个特征,因此 Network> Info> Degree Assortativity命令位于网络菜单。子选项 Input-Input、Input-Output、Output-Input、Output-Output 仅与有向网络相关。例如,Input-Output 计算发送顶点的入度和接收顶点的出度之间的相关性。在无向网络中,例如 Sawmill 网络,入度等于出度,我们无法区分发送者和接收者,因此所有四个可能的子选项都会产生相同的结果。任何子选项都可以。 Sawmill 网络的度同配相关系数为 –0.07,接近于零,表明员工的度数不是选择讨论伙伴时的重要因素。
Operations> Network + Vector> Info> Assortativity
同配性相关系数的计算,除了度同配性,需要网络和顶点的数值属性,它被存储为向量。让我们转向第 5 章的例子,董事和公司的双模式网络。打开 Pajek 项目文件 Scotland.paj,将双模网络 Scotland.net 转换为单模企业网络(Network> 2-Mode Network> 2-Mode to 1-Mode> Rows,选项 Multiple Lines not selected )。在第一个向量下拉列表中选择包含公司资本 (Capital.vec) 的向量。企业的单模网络是无向的,因此我们必须对链接的两个顶点使用相同的数值属性,并且一个向量就足够了。运行命令 Operations> Network + Vector> Info> Assortativity,Report 屏幕将显示 同配性相关系数为 –0.08。同配性为负但接近于零,因此资本大的公司倾向于与资本少而不是大资本的公司共享董事。请注意,同配性相关系数不考虑边值。
在有向网络中,以类似方式计算同配性相关系数。让我们使用进口的制成品网络(打开第 2 章的示例:World_trade.paj)。国家是否从 1995 年国内生产总值 (GDP) 相似的国家进口制成品(向量 GDP_1995.vec)?在 Network 下拉列表中选择网络 Imports_manufactures.net,在第一个 Vector 下拉列表和第二个 Vector 下拉列表中选择 GDP_1995.vec 或确保第二个下拉列表为空。现在,同配性相关系数(Operations> Network + Vector> Info> Assortativity)计算直接关联国家的 GDP 之间的相关性。它的值为 0.16,因此各国倾向于从 GDP 相似的国家进口。
如果第一个和第二个 Vector 下拉列表各包含一个向量,则第一个向量用作发送顶点的数值属性,第二个向量用作接收顶点的属性。虽然说不通,但让我们看看GDP大的国家是否从人口多的国家进口制造品。发送顶点是出口国,所以我们必须在第一个向量下拉列表中选择人口规模向量(Population_1995.vec)。接收方是进口国,所以我们必须在第二个向量下拉列表中选择 GDP 向量。同配性相关系数约为 –0.03,因此富裕国家从较小的国家进口制成品,而不是相反。
同配性相关系数需要两个链接顶点的数字属性,但有一个例外。也可以使用只有两个类别的分类属性(二分法)。作为示例,我们使用 Sawmill 网络附带的language.vec。该向量包含两个值表示工人的主要语言:1 – 英语和 2 – 西班牙语。 Sawmill 网络中语言的同配性相关系数非常高,即 0.79。我们可以得出结论,种族群体的成员身份与选择与工人讨论工作问题的同事密切相关。请注意,您可以使用任何一对数字来对这两个类别进行编码。 Pajek 将恰好具有两个不同数字的向量解释为二分法或虚拟变量。相反,具有三个或更多不同数字的向量被视为顶点的真正数字属性。如果您有两个以上的类别,请不要使用同配性相关系数;请改用E-I指数(第 5.5 节)。

6.7 小结

顶点中心度和网络中心性的概念最好通过考虑无向通信网络来理解。如果说社会关系是人与人之间传递信息的渠道,那么中心人就是那些要么拥有快速获得在网络中流通的信息或可以控制信息的流通。
信息的可访问性与距离的概念有关:如果您与网络中的其他人更近,则信息到达您的路径更短,因此您更容易获取信息。如果我们只考虑直接邻居,邻居的数量(一个简单的无向网络中一个顶点的度数)是一个简单的中心度度量。特征向量中心性扩展了邻居的重要性。如果我们还想考虑间接接触,我们使用接近中心性,它衡量我们与网络中所有其他顶点的距离。如果到所有其他顶点的总距离较短,则顶点的接近中心性较高。
顶点对信息流通的重要性可以通过中介中心度的概念来体现。从这个角度来看,如果一个人是网络中其他人之间更多信息链中的一个链接,那么他或她就更中心化了。高中介中心度表明一个人是通信网络中的重要中介。信息链由测地距离表示,顶点的中介中心度只是包含该顶点的其他顶点对之间测地距离的比例。
如果网络包含非常中心的顶点和非常外围的顶点,则网络的中心化程度更高。网络集中度可以从网络内顶点的中心度得分计算:中心度得分的更多变化意味着网络更加集中。每个中心性度量都有一个网络中心化指标,但一些中心化度量需要特殊的网络:度中心度仅适用于没有多重边和环的网络,而接近中心度需要(强)连接的网络。在本书中,我们仅将中心度和中心性应用于无向网络。为有向网络设计中心性度量很容易。我们可以将度中心度基于顶点的出度,从一个顶点到所有其他顶点的距离(而不是反向)计算接近中心度,并在中介中心度的情况下只考虑最短的有向路径。事实上,其他关于社交网络分析的书籍都提倡这种方法。然而,我们认为,将中心度和中心性限制在无向网络并应用其他概念(例如声望值)在概念上更清晰。

Exploratory Social Network Analysis with Pajek(第三版)6-2相关推荐

  1. Exploratory Social Network Analysis with Pajek(第三版)11

    11.家谱和引文 11.1 引言 时间造成了社会关系中一种特殊的不对称,因为它以不可逆转的方式对事件和世代进行排序.社会身份和地位部分地建立在共同的祖先之上,无论是在生物学意义上(出生)还是在智力上: ...

  2. Exploratory Social Network Analysis with Pajek(第三版)8

    八.扩散 扩散是一个重要的社会过程.管理者对信息和意见的传播感兴趣,制造商寻求采用新技术和产品,我们所有人都对不感染传染病有着浓厚的兴趣.传播科学.社会心理学和社会学.公共管理.市场营销和流行病学正在 ...

  3. Exploratory Social Network Analysis with Pajek(第三版)2-1

    二.属性和关系 2.1 引言 在第 1 章中,我们认为社会网络分析侧重于社会关系.网络由一系列顶点和线构成.顶点和线都具有我们希望在分析中包含的特征(例如,人的性别和他们的关系强度).如第 1 章所述 ...

  4. Exploratory Social Network Analysis with Pajek(第三版)12

    第五部分建模 在​​最后一部分,我们将注意力从纯粹的网络结构探索性描述转移到建模上.介绍了两种类型的建模:块模型(第 12 章)和随机图模型(第 13 章). 内聚性.中介和等级与社会角色相关:成为团 ...

  5. Exploratory Social Network Analysis with Pajek(第三版)7

    七.经纪人和桥 7.1 引言 有很多朋友和熟人的人有更好的机会获得帮助或信息.因此,社会关系是衡量社会资本的一种方式,是一种可以被行为者用来获得积极优势的资产.然而,网络分析师发现,除了联系的数量之外 ...

  6. Exploratory Social Network Analysis with Pajek(第三版)3

    第二部分 内聚性 团结.共同规范.身份认同.集体行为和社会内聚性被认为是从社会关系中产生的.因此,社交网络分析的首要问题是调查谁是相关的,谁不是.为什么有些人或组织是相关的,而有些则不是?这里的一般假 ...

  7. Exploratory Social Network Analysis with Pajek(第三版)1-1

    文章目录 第一部分基础 一.寻找社会结构 1.1 引言 1.2 社会计量学和社会学图 1.3 探索性社会网络分析 1.3.1 网络定义 1.3.2 操作 第一部分基础 社交网络分析侧重于例如人.人群. ...

  8. Exploratory Social Network Analysis with Pajek(第三版)6-1

    第三部分 中介 在很多理论中,社会关系被认为是人与人或组织之间传递信息.服务或商品的渠道.从这个角度来看,社会结构有助于解释信息.商品甚至态度和行为如何在社会系统中扩散.网络分析揭示了社会结构并有助于 ...

  9. Exploratory Social Network Analysis with Pajek(第三版)2-2

    2.4 简化网络 partition 将网络的顶点划分为许多互斥的子集.换句话说,一个partition 将网络分割成块.因此,我们可以通过三种方式使用partition 来简化网络:提取一个部分(局 ...

最新文章

  1. SVN服务器搭建和使用教程
  2. Python中必学知识点:类方法、实例方法和静态方法
  3. 【软件开发底层知识修炼】十五 快速学习GDB调试二 使用GDB进行断点调试
  4. dual mysql 获取序列_如何使用mysql 一次查询多个序列
  5. 2021年快手大健康行业数据价值报告
  6. ICallbackEventHandler不支持二次回调的问题
  7. 实战系列-HashMap深入剖析
  8. java代码中获取classpath路径
  9. 字符串常量池、堆、栈
  10. 无监督学习——非负矩阵分解(NMF)
  11. php向redis list一次性lpush多个值
  12. 计算机存储成本,仓储成本
  13. 十问业务中台和我的答案
  14. swr,解决 React 项目 API 调用的最好方案
  15. Ubuntu使用sudo apt-get upgrade升级软件出现问题后的处理
  16. java ireport生成pdf_jasperreport 生成pdf实现下载与打印
  17. Java生成词云!你喜欢得书都在图里!
  18. 手把手教你六类网线水晶头接法,超详细教程
  19. python窗口编程哪个好_Python界面编程好用的模块推荐
  20. 擦亮AI之星:百度奖学金到底在嘉奖什么?

热门文章

  1. 网站SEO优化知识基础大全汇总
  2. 电脑广告多?Windows 自带恶意软件删除工具还不会使用?有必要安装杀毒软件吗?
  3. QR分解求矩阵全部特征值
  4. vxworks pci驱动
  5. Ubuntu系统下安装opencv3.x并打开图片和视频文件以及打开摄像头录制视频
  6. 软件产品的形态如何决定其成功与否
  7. 【Python-24】Python 元组+列表+字典+文件
  8. 汉字编码与编程相关问题总结:ASCII、机内码、区位码、国标码、Unicode码是如何转换的
  9. Centos7安装subversion
  10. CCSP2016-1 选座(ticket_chooser)