第三部分 中介

在很多理论中,社会关系被认为是人与人或组织之间传递信息、服务或商品的渠道。从这个角度来看,社会结构有助于解释信息、商品甚至态度和行为如何在社会系统中扩散。网络分析揭示了社会结构并有助于追踪商品和信息可能遵循的边。一些社会结构允许信息的快速传播,而另一些则包含难以到达的部分。
这是整个社交网络的鸟瞰图。但是,我们也可以关注网络中特定人员或组织的位置。一般来说,连接良好是有利的。联系人是获取信息和帮助的必要条件。一个人关系的数量和强度被称为他或她的社交能力或社会资本,在西方社会中,众所周知,它与年龄和教育程度呈正相关。有些人在渠道系统中占据中心或战略地位,对传播过程至关重要。这样的职位可能会给居住者带来压力,但也可能会产生权力和利润。
在本书的这一部分,我们将关注社交网络作为允许信息交换的结构。在这种方法中,关系的方向不是很重要,所以我们只讨论无向网络(有一个例外)。在第 6 章中,我们介绍了中心性和中心化的概念。在第 7 章中,我们讨论了直接参与者网络的结构,尤其是与这个自我网络的特定结构相关的压力或权力。在第 8 章中,我们在研究网络结构在创新和疾病传播中的作用时将时间考虑在内。

六、中心和外围

6.1 介绍

在本章中,我们介绍中心性和集中化的概念,这是网络分析中最古老的两个概念。大多数社交网络都包含处于中心位置的人员或组织。由于他们的地位,他们有更好的获取信息的渠道和更好的传播信息的机会。这被称为以自我为中心的中心化方法。从社会中心的角度来看,整个网络或多或少是中心化的。请注意,我们使用中心性来指代网络中各个顶点的位置,而我们使用中心化来表征整个网络。如果中心和外围之间有明确的边界,则网络是高度集中的。在高度中心化的网络中,信息很容易传播,但中心对于信息的传递是不可或缺的。
在本章中,我们讨论了几种测量顶点中心性和网络中心化的方法。我们将我们对中心性的讨论限制在无向网络上,因为我们假设信息可以在通过纽带联系在一起的人或组织之间双向交换。与定向网络中的重要性相关的概念,尤其是声望,在本书的第四部分进行了讨论。

6.2 示例

对组织的研究通常侧重于非正式沟通:谁与谁讨论工作问题,人们向谁寻求建议?非正式沟通对组织的运作很重要,但并不总是与组织的正式结构相吻合。了解在沟通网络中占据中心位置的人,对于信息的传播和检索,至关重要。
我们的示例是小型企业内的沟通网络:锯木厂。所有员工都被要求说明他们与每位同事讨论工作问题的频率,以 5 分制,从每周少于一次到每天几次不等。如果两名员工将他们的联系人评级为三个或更多,则他们会在沟通网络中链接。我们不知道两位员工是否必须以这种方式评价他们的关系,或者至少一名员工必须表明强度为 3 或更多。网络存储在文件 Sawmill.net 中。
在锯木厂,员工会说西班牙语 (H) 或说英语 (E),这当然与他们的交流有关。锯木厂包含两个主要部分:磨坊 (M),将树干锯成圆木,刨床部分 §,刨光原木。然后有一个院子(Y),两名员工在此工作,还有一些经理和其他官员。

图 58 显示了锯木厂的沟通网络。请注意,顶点标签表示每个员工的种族和工作类型;例如,HP-10 是在刨床部门 § 工作的西班牙裔 (H)。在该图中,顶点标签而不是顶点颜色标识了员工的属性。很容易看出,与工作相关的沟通是按照工作部分(左边是刨工,右边是锯木工)和种族来构建的:西班牙裔在顶部,说英语的在底部——假设管理人员、林务员、窑工、和员工
院子里都是说英语的。这是同质性的一个例子(第 3 章),它与分类性密切相关(第 6.6 节)。
直观地说,HM-1 (Juan) 是这个网络中的核心人物,也许是最核心的人物。他与许多同事直接交流,通过他的直接联系,他很容易接触到大多数在锯木厂工作的人。Juan似乎在刨床、轧机部门和管理层之间的信息流中占据了关键位置。本章介绍了集中性和集中化的正式度量,它们捕捉了这些直觉。

6.3 距离

中心化和集中化的一种方法是基于一个简单的想法,即信息可以很容易地到达在通信网络中处于中心位置的人。或者,换个说法,如果可以很容易获得信息的人是中心。
一个人可以访问的资源越多,获取信息就越容易;例如,如果他或她的社会支持网络更大,老年人将更容易获得有关在哪里寻求帮助的信息。从这个意义上说,社会纽带构成了一种社会资本,可以用来调动社会资源。因此,最简单的中心性指标是其邻居的数量,即他或她在简单无向网络中的度数(见第 3 章)。顶点的度数越高,它拥有的信息源越多,信息到达顶点的速度就越快,因此它越中心。在锯木厂网络中,Juan 与不少于 13 个同事通信,而工厂经理只有 7 个通信关系(图 58)。在这方面,Juan 比经理更重要,来自车间的信息比经理更容易到达他的手中。如果度是顶点中心性的最简单度量,那么表示网络具有中心的程度的整个网络的相关中心化度量是什么?让我们首先回答另一个相关问题:给定固定数量的边,交换信息的最有效结构是什么?我们应该注意,这个网络必须是连接的;否则信息无法到达所有顶点。在这种情况下,已知星形网络是给定固定边数时最有效的结构。星形是一个网络,其中一个顶点连接到所有其他顶点,但这些顶点之间没有连接(例如,图 59 中的网络 A)。

将图 59 中的星形网络与包含相同数量的顶点和边的线形网络(网络 B)进行比较。在星形网络中比在线形网络中更容易识别中心顶点,因为中心顶点之间(V5)外围顶点(v1、v2、v3 和 v4)的差异比线形网络中的要明显得多。这导致了一个可能违反直觉的想法,即如果顶点在中心性方面的差异越大,则网络会更加中心化。顶点中心性值的更多变化会产生更集中的网络。
现在我们可以将度中心性( degree centralization)定义为顶点度数变化除以给定网络中顶点数可能的最大度数变化。在特定大小的简单网络中,星形网络具有最大度数。在星形网络的情况下,除以最大度数确保度中心性范围从 0(无变化)到 1(最大变化)。

  • 一个顶点的度中心度(degree centrality)就是它的度数。
  • 网络的度中心性( degree centralization)是顶点度数的变化除以相同大小的网络中可能的最大度数变化。

变化是顶点的中心度得分与它们之间的最大中心度得分之间的总和(绝对)差异。例如,在网络 A(图 59)中,一个顶点 (v5) 的度数为 4,这是这种大小的简单无向网络中的最大度数,因为该顶点连接到所有其他顶点。其他四个顶点的度数最小,在连通无向网络中为 1。因此,度数变化量为 12:(顶点 v1 到 v4 贡献)4 ×(4 - 1)和(顶点 v5 贡献)1 ×(4 - 4)。在一个简单的无向网络中,顶点的度数变化不能超过这个,所以 12 是最大变化;当然,将 12 除以自身会产生 1.00 的度中心性。
在网络 B 中,两个顶点的度数为 1(v1 和 v2),其他顶点的度数为 2。因为 2 是该网络中的最大度数,所以度数变化等于 2 × (2 − 1) (对于顶点 v1和 v2),3 × (2 − 2)(对于顶点 v3 到 v5),即 2。为了获得网络 B 的度中心化,我们将 2 除以 12,这是简单无向网络中的最大变化,并且我们得到 0.17。如果我们在 v1 和 v2 之间添加一条边,则度中心性变为最小 (0.00),因为所有顶点的度数相等,因此度数的变化为 0.00,度中心性为 0.00。

度中心性=(实际最大度数−顶点度数)(理论最大度数−顶点度数)度中心性 =\frac{(实际最大度数 - 顶点度数)}{(理论最大度数 - 顶点度数)}度中心性=(理论最大度数−顶点度数)(实际最大度数−顶点度数)​

我们应该在这里发出警告。在具有多重边或环的网络中,顶点的度数不等于其邻居的数量。因此,星形网络不一定具有最大变化,如果我们将具有多重边或环的网络中的变化与相同的简单星形网络中的变化进行比较,我们可能会获得超过 1.00 的度中心性分数。在这种情况下,我们建议不要使用度中心性。
在一个简单的无向网络中,度中心度只是一个顶点的邻居数。在某些情况下,这就是我们所知道的关于人们的网络位置的全部信息,例如,当通过一项调查收集数据时,要求人们指出他们的个人网络的规模。但是,如果要分析网络的通信结构,我们需要知道整个网络中谁与谁相连;我们必须注意间接联系,因为信息可以从一个人流向另一个人,然后再传给其他人。在通信网络中,如果信息不必“走很远”,信息将更容易到达一个人。这给我们带来了网络中距离的概念,即某人到达网络中的另一个人所需的步骤或中介的数量。顶点之间的距离越短,信息交换就越容易。
在第 3 章中,我们将路径定义为一系列边,其中第一个和最后一个顶点之间的顶点不会出现多次。通过一条路径,我们可以到达网络中的另一个人:我们可以通知我们的邻居,他将信息传递给他的邻居,而他的邻居又将其传递,直到信息最终到达目的地。如果有一条从后者到前者的路径,我们说一个人可以从另一个人到达。请注意,如果两个人在无向网络中通过一条路径连接,则他们是相互可达的,但在有向网络中需要两条路径(每个方向一个)。
在无向网络中,两个顶点之间的距离只是连接这些顶点的最短路径中的边数或步数。最短路径也称为测地距离。在有向网络中,一个人到另一个人的测地距离与反向的测地距离不同,因此距离可能不同。如果您习惯于地理距离,这听起来很奇怪,但可以将定向网络视为单向街道系统:很容易想象从 A 到 B 的路边与返回的路不同。然而,在本章中,我们只使用无向网络,因此您不必担心这个问题。

  • 测地距离是两个顶点之间的最短路径。
  • 从顶点 u 到顶点 v 的距离是从 u 到 v 的测地距离长度。

距离在社交网络分析中很重要。回想一下小世界问题(第 1.3 节),它指出所有人之间的网络距离非常低,平均约为 6。有了距离的概念,我们还可以定义另一个中心性指标,称为接近中心性。顶点的接近中心性基于一个顶点与所有其他顶点之间的总距离,其中较大的距离产生较低的接近中心性分数。一个顶点离所有其他顶点越近,信息就越容易到达它,它的中心性就越高。
就像度中心性一样,我们可以将接近中心性概念化为顶点接近中心性分数的变化量。同样,我们将中心性分数的变化与可能的最大变化进行比较,即相同大小的星网络中接近中心性的变化。

  • 顶点的接近中心性是其他顶点的数量除以顶点与所有其他顶点之间的所有距离的总和。
  • 接近中心性是顶点接近中心性的变化除以相同大小的网络中可能的接近中心性分数的最大变化。

在星形网络 A(图 59)中,顶点 v5 具有最大的接近中心,因为它直接链接到所有其他顶点。到其他顶点的距离之和最小,即长度为 1 的四个测地距离组合成距离之和为 4。由于除 v5 之外还有四个顶点,因此顶点 v5 的接近中心性最大:4/4 = 1.00。网络 A 的其他顶点的接近中心性得分要低得多(0.57=4/1+2∗30.57=4/1+2 * 30.57=4/1+2∗3),因为三个顶点距离它们两步。
在网络 B 中,v5 也具有最高的接近中心度,因为它位于中间,但现在它的接近中心度不是最大的(0.67),并且它与接近中心度为 0.57 (顶点 v3 和 v4)、0.40(v1 和 v2)的其他顶点的差异较小,并且。因为网络 B 中的接近中心性分数的变化小于网络 A,所以网络 B 的中心化程度较低。其接近中心度为 0.42,而接近中心度最大的A是1。
请注意,如果网络没有(强)连接,则会出现复杂情况。如果无向网络不连通或有向网络不强连通,则所有顶点之间没有路径,因此无法计算某些顶点之间的距离。这个问题的解决方案是只考虑到我们想要计算接近中心性的顶点可到达或到达的顶点,并按可到达顶点的百分比加权总和距离。该解决方案适用于顶点的接近中心度。然而,它不允许我们计算整个网络的接近中心性,因为如果网络没有(强)连接,星型网络不一定具有最高的接近中心度数变化。因此,在网络没有(强)连接的情况下,我们不使用接近中心性。
应用
在第 3 章中,我们解释了如何计算顶点的度。请注意,Network> Create Partition> Degree> All 命令只计算一次边,如果网络是无向的,这很好。但是,在包含边和弧的网络中,您可能希望将边计算为传入和传出弧。如果是这样,在使用 All 命令计算度数之前,将边替换为双向弧(Network> Create New Network>Transform>Edges→Arcs)。此外,我们建议在计算度中心性和度中心度之前,从网络中删除多重边(Network> Create New Network>Transform> Remove> Multiple Lines)和环(Network>Create New Network>Transform> Remove> Loops)。Degree partition 告诉我们所有顶点的度中心度。对于度中心性,我们必须计算度的变化。在 Pajek 哲学中,partition 是将顶点分配给簇的分类。簇(Cluster)数不应用于计算;向量应该用于计算。出于这个原因,网络的度中心性没有与Degree partition 一起报告。我们必须使用 Create Vector> Centrality> Degree 子菜单来获得报告屏幕中的度数集中。该命令将顶点的度中心度分数存储为向量。
请注意,仅当网络不包含多重边和环时才报告度中心性。否则,Pajek 会报告一条消息,说明度中心性对该网络无效。在锯木厂网络中,集中度为 0.289。这种集中化值仅与其他网络相比才有意义。
如果你想知道一个顶点(例如,Juan)和网络中所有其他顶点之间的距离,你可以使用 Network> Create Partition> k-Neighbours 子菜单中的命令,它创建一个partition ,包含该顶点与所有其他顶点之间的距离的类。输入选项计算到选定顶点的距离,而输出选项计算到顶点的距离。 All 命令不考虑边的方向。在无向网络中,您可以选择 Input、Output 或 All 命令:它们产生相同的结果。
当你执行一个 k-Neighbours 命令时,你必须首先指定顶点编号或从其计算距离的顶点的标签。在 Juan 的情况下,输入 12(他的顶点编号)或 HM-1(他的顶点标签的开始)。接下来,您可以设置要计算的最大距离的限制。在非常大的网络中,设置限制可能会大大加快计算速度。在此对话框中,0 表示您想要所有距离,这在小型网络的情况下通常是正确的选择。结果存储在一个partition 中;而无法到达的顶点或比最大距离更远的顶点被放置在类号 999999998 中,这表明它们的距离是未知的。

在图 60 中,顶点颜色和类号表示 Juan 和其他员工之间的距离。大多数员工直接连接到 Juan(黑色)或间接连接到一个中介(浅灰色,距离 2)。两名员工距离 Juan 四步之遥,分别是 HP-1 和 EM-4。
员工 HP-1 和 EM-4 似乎在通信网络中相距最远,因为他们与 Juan 的距离为 4。但他们的测地距离不一定包括 Juan,因此他们可能会在少于八步的时间内连接起来。在 Pajek 中,可以使用命令 Network> Create New Network> SubNetwork with Paths> All Shortest Paths between two Vertices找到两个顶点之间的测地距离。首先输入 HP-1 的顶点编号或标签,然后输入 EM-4,然后对“忘记边的值?”的问题回答“是”。因为您不想通过它们的值对边条进行加权。这是正确的做法,除非边值指示距离,例如地理距离。最后,一个对话框询问是否必须在源网络中识别路径。如果您对此问题的回答是“是”,Pajek 会为原始网络生成一个partition ,将测地距离上的顶点分配给 1 类,将其他顶点分配给 0 类。无论您在此对话框中选择什么,Pajek 都会创建一个新网络,其中包含顶点和构成测地距离的边(图 61)。

此外,它还会在报告屏幕中打印距离。在我们的示例中,HP-1 和 EM-4 之间的所有测地距离都包括 Juan(参见图 61),因此 HP-1 和 EM-4 之间的距离不能小于 8,即它们到 Juan 的距离之和。
对于网络的一般描述,所有顶点对之间距离的频率分布通常很有用。网络的特征是短测地距离还是长测地距离?命令 Network> Create Vector> Distribution of Distances∗ 报告网络中的平均和最大距离,并生成一个包含距离分布的向量。请注意,这不是一个网络中的每个顶点都有一个条目的普通向量,相反,它为每个距离包含一个条目,并且向量值指定网络中具有此长度的测地距离的数量。编辑距离分布向量 (File> Vector> View/Edit) 以检查锯木厂网络中的距离分布:124 对顶点通过长度为 1 的路径连接,308 对通过长度为 2 的路径连接,依此类推。
在 Pajek 中,计算接近中心度很简单。因为接近中心度的值是连续的而不是离散的,所以中心度命令位于 Network> Create Vector> Centrality> Closeness 子菜单中,可以计算网络中所有顶点的接近中心度。对于无向网络,您可以选择Input, Output, or All,但都产生相同的结果。如果网络没有(强)连接,Pajek 会创建一个具有接近中心度分数的向量,但它不计算接近度中心性,这在这样的网络中是未定义的。无法到达或来自所有其他顶点的顶点的接近中心度设置为0。对于中型和大型网络,接近中心度需要大量计算时间,因此应谨慎应用。
Pajek 使用顶点的接近中心度值创建一个向量。你可以检查这个向量或者按照前面章节中解释的方式将它用于计算。在我们的示例中,接近中心度值范围从 0.20 到 0.51,而 Juan (0.51) 比经理 (0.42) 更中心化。此外,Pajek 计算网络的接近中心性,并打印在报告屏幕中。锯木厂通信网络的紧密度中心性得分为 0.38,再次强调,与其他网络相比,必须对其进行解释。

Exploratory Social Network Analysis with Pajek(第三版)6-1相关推荐

  1. Exploratory Social Network Analysis with Pajek(第三版)11

    11.家谱和引文 11.1 引言 时间造成了社会关系中一种特殊的不对称,因为它以不可逆转的方式对事件和世代进行排序.社会身份和地位部分地建立在共同的祖先之上,无论是在生物学意义上(出生)还是在智力上: ...

  2. Exploratory Social Network Analysis with Pajek(第三版)8

    八.扩散 扩散是一个重要的社会过程.管理者对信息和意见的传播感兴趣,制造商寻求采用新技术和产品,我们所有人都对不感染传染病有着浓厚的兴趣.传播科学.社会心理学和社会学.公共管理.市场营销和流行病学正在 ...

  3. Exploratory Social Network Analysis with Pajek(第三版)2-1

    二.属性和关系 2.1 引言 在第 1 章中,我们认为社会网络分析侧重于社会关系.网络由一系列顶点和线构成.顶点和线都具有我们希望在分析中包含的特征(例如,人的性别和他们的关系强度).如第 1 章所述 ...

  4. Exploratory Social Network Analysis with Pajek(第三版)12

    第五部分建模 在​​最后一部分,我们将注意力从纯粹的网络结构探索性描述转移到建模上.介绍了两种类型的建模:块模型(第 12 章)和随机图模型(第 13 章). 内聚性.中介和等级与社会角色相关:成为团 ...

  5. Exploratory Social Network Analysis with Pajek(第三版)7

    七.经纪人和桥 7.1 引言 有很多朋友和熟人的人有更好的机会获得帮助或信息.因此,社会关系是衡量社会资本的一种方式,是一种可以被行为者用来获得积极优势的资产.然而,网络分析师发现,除了联系的数量之外 ...

  6. Exploratory Social Network Analysis with Pajek(第三版)3

    第二部分 内聚性 团结.共同规范.身份认同.集体行为和社会内聚性被认为是从社会关系中产生的.因此,社交网络分析的首要问题是调查谁是相关的,谁不是.为什么有些人或组织是相关的,而有些则不是?这里的一般假 ...

  7. Exploratory Social Network Analysis with Pajek(第三版)1-1

    文章目录 第一部分基础 一.寻找社会结构 1.1 引言 1.2 社会计量学和社会学图 1.3 探索性社会网络分析 1.3.1 网络定义 1.3.2 操作 第一部分基础 社交网络分析侧重于例如人.人群. ...

  8. Exploratory Social Network Analysis with Pajek(第三版)6-2

    6.4 介数 度和接近中心度是基于一个人在网络中的可达性:信息到达一个人的难易程度.中心度和中心性的第二种方法基于这样一种观点,即如果一个人作为通信网络中的中介更重要,那么他或她就更中心化.一个人对于 ...

  9. Exploratory Social Network Analysis with Pajek(第三版)2-2

    2.4 简化网络 partition 将网络的顶点划分为许多互斥的子集.换句话说,一个partition 将网络分割成块.因此,我们可以通过三种方式使用partition 来简化网络:提取一个部分(局 ...

最新文章

  1. Ubuntu 12.10 拨号上网及停用方法
  2. 《易学Python》——第6章 类与面向对象编程 6.1 类是什么
  3. unity3d世界坐标系和本地坐标系
  4. 【工具】win10修改默认输入法,开机直接启动谷歌输入法
  5. Intellij IDEA 神器那些让人爱不释手的小技巧
  6. 不会玩游戏的程序员不是好作家,《深入理解Java虚拟机》周志明来了!
  7. java虚拟机参数详解
  8. 关于 php 用webservice传输数据的问题(nosoap与.NET对接)此处一直困扰三天时间,终于解决...
  9. 【NOI2016】循环之美,mobius反演+杜教筛
  10. c语言对用下标法二维数组遍历,二维数组遍历:下标法与指针法的较量
  11. html按钮突出效果,这10个按钮,把 CSS HOVER 的创意发挥到极致了
  12. 数据库---查询操作
  13. hdoj1176 免费馅饼(dp 数塔)
  14. python基础 数据类型
  15. 【简单实用】百度网盘提速方法,不用破解和插件
  16. C++ 判断矩形是否相交
  17. Cypress 自定义方法命令
  18. vs2013+qt生成的exe无法找到入口,无法定位程序输入点与动态库*.exe,而不是DLL
  19. 深度强化学习(3):策略学习篇
  20. 网站服务器垃圾清理,服务器安全狗垃圾清理功能操作教程

热门文章

  1. 离线文档管理服务器,离线数据管理
  2. android安卓音乐播放器课程代码9.5.2
  3. solidity 操作符01
  4. Python知识要点
  5. Kubernetes 笔记 07 豌豆荚之旅(二)
  6. Java Swing 漂亮界面beautyeye_lnf美化包的使用
  7. “数学界的诺贝尔”公布2019年得主,首位女数学家获奖...
  8. ISC CCSP 从2022年8月起 支持使用汉语考试了,在中国 北京设置考点
  9. 全球25米分辨率PALSAR镶嵌式和森林/非森林地图(FNF)。数据集介绍及下载
  10. 零中频接收机频率转换图_测量 DC-DC 转换器和无源 PDN 元器件的阻抗