05 无标度网络

  • 5.1幂律分布
  • 5.2幂律分布的数据拟合
  • 5.3无标度网络的性质
  • 5.4BA无标度网络模型
  • 5.5满足给定度分布的网络生成模型

5.1幂律分布

  • 二八定则:意大利经济学家Vilfredo Pareto(1848-1923)研究了个人收入的统计分布,发现少数人的收入要远大于大多数人的收入提出了著名的80/20法则,即20%的人口占据了80%的社会财富。
  1. 货币收入财富1公司规模分布2均满足幂律分布。
  2. 无标度网络
    网络的度分布为幂律分布的异类网络
    P(k)∝kP(k)∝kP(k)∝k−γ-\gamma−γ
    lnP(k)∝−γlnP(k)∝-\gammalnP(k)∝−γlnklnklnk(线性关系)
  3. 实例
    WWW 节点:网页 连边:超链接
    因特网 节点:路由器 连边:光缆链接3
    生物系统4
    蛋白质交互网络5
    科学家合作网 节点:科学家 连边:合著关系67
    科学引文网(有向网) 节点:论文 连边:论文间的引用8
    在线社区 节点:在线用户 连边:电子邮件联系9
    瑞典性关系网 节点:人 连边:性关系10

5.2幂律分布的数据拟合

  • 数据分箱:所谓分箱就是对原始数据进行分组,然后对每一组内的数据进行平滑处理。常见的分箱的方式主要有等深分箱(每组数据一样多)、等宽分箱(每组区间长度一样)、用户自定义、最小熵(各分组内的数据具有最小熵)

    • 平滑的方式主要有均值平滑(用组内均值来代替组内每个元素)、中间值平滑(用组内中间值来代替组内每个元素)、边界平滑(用组内离得较近的边界值来代替组内元素)
    • 对数分箱对原数据进行分箱,第i个箱的宽度为bib^ibi, b>1。例如: b=2,则第一个箱的宽度为2,第二个箱的宽度为4,第三个箱的宽度为8,……(非线性分箱
      对于幂律分布,在做直线拟合时,采用对数分箱更能准确的估计幂指数。
  • 幂指数估计

    • 最小二乘法就是寻找最优参数γ\gammaγ的估计值使得因变的观察值与估计值之间的离差平方和达到最小。
    • 参数拟合:极大似然估计11构造似然函数
      两者结果可能存在差异
  • 累积度分布

    • 累计度分布PkP_kPk​表示在网络中随机选取一个节点的度不小于k的概率,即Pk=P_k=Pk​=∑k′=k∞\sum_{k'=k}^{\infin}∑k′=k∞​P(k′)P(k')P(k′)
    • 若网络中节点的度分布为幂律分布,即P(k)=CkP(k)=CkP(k)=Ck−γ-\gamma−γ
    • 则累积度分布函数近似服从幂指数为γ−1\gamma-1γ−1的幂律分布。
    • 因此,通过估计累积度分布的幂指数,进而得到度分布的幂指数。
      可以减少数据波动

5.3无标度网络的性质

  • 道路网络
    更服从泊松分布:大部分节点拥有相同数目的连边,没有大度节点
  • 航空网络
    更服从幂律分布:许多节点拥有较少的连边,少数节点拥有大量连边。(大度节点可被称为中枢节点)
  • 高度值节点出现的概率
    • 在WWW网络中,随机抽到一个度值为100的节点的概率为:
      大约p100p_{100}p100​≈4×10−4≈4\times10^{-4}≈4×10−4,如果节点的度分布为幂率分布
    • 在相对应的随机网络中,节点的度分布为泊松分布,随机抽到一个度值为100的节点的概率为:
      大约p100≈10−94p_{100}≈10^{-94}p100​≈10−94
  • KmaxK_{max}Kmax​随NNN的变化
    • KmaxK_{max}Kmax​随网络规模的增加而增加:系统规模越大 它的最大度值就越大
    • 当γ>2\gamma>2γ>2,KmaxK_{max}Kmax​的增加慢于NNN:随着N的增加,最大的hub节点将拥有越来越少的连边
    • 当γ=2\gamma=2γ=2,KmaxK_{max}Kmax​~NNN:最大核心节点的规模是O(N)O(N)O(N)
    • 当γ<2\gamma<2γ<2,KmaxK_{max}Kmax​的增加快于NNN:随着N的增加,最大的hub节点将拥有越来越多的连边
  • 幂律分布的自相似结构
    自相似性就是局部与整体相似,局部中又有相似的局部。
    从整体来看,若节点的度分布为幂律分布,那么当取出一部分节点,观测它们的度分布,仍然是幂律分布。
  • 幂律分布的弥散

5.4BA无标度网络模型

  • 实际网络的两个重要特性
    节点数目的增长:实际网络在演化的过程中有新节点的加入,网络规模不断扩大。
    偏好连接:新节点更倾向于和连边多的节点进行连接。12
  • BA无标度网络模型
    • 增长:
      在每个时间步,我们向网络中添加一个带有m条连边的新节点,这些边连接到网络中已存在的节点上。
    • 偏好链接:一个新节点与一个已存在的节点i相连的概率∏\prod∏iii与节点i的度kik_iki​,之间满足以下关系:
      ∏\prod∏iii=ki∑jkj=\frac{k_i}{\sum_jk_j}=∑j​kj​ki​​
      最终,BA模型生成了度分布为幂律分布的网络,且幂指数γ\gammaγ=3。
  • 证明
    • 平均场理论13
    • 速率方程 主方程14
    • 模型A:只有增长 无偏好连接:指数分布
    • 模型B:只有偏好连接,无增长:幂律分布→正态分布

5.5满足给定度分布的网络生成模型

  • 两种网络生成模型
  1. 配置模型:该模型能够生成事先给定度序列的网络,生成的网络中可能含有自环和重边。
  2. 隐藏参数模型:该模型能够生成事先给定度分布的网络并且生成的网络中不含有自环和重边。
  • 配置模型15 16
    基于给定度序列(或者根据节点的度分布生成一个度序列) , 分配给每个节点一个度值ki,从每个节点引出ki个线头,总共有2M个线头(M为网络中的连边数)。
    随机地选择两个线头,把它们连在
    一起,形成一条连边;然后再在剩
    余的线头中随机选择一对线头形成一条连边;以此类推,直至匹配完所有线头。
    注:配置模型算法生成的网络可能
    含有自环或重边。
  • 隐藏参数模型17 18 19
    假设网络中有N个节点,每个节点被赋予一个隐藏参数η\etaη,然后基于两个节点的隐藏参数判定是否产生连边。通过调整节点的隐藏参数生成满足给定度分布的网络。

参考文献


  1. Dragulescu A , Yakovenko V M . Exponential and power-law probability distributions of wealth and income in the United Kingdom and the United States[J]. Physica A Statistical Mechanics & Its Applications, 2001, 299(1):213-221. ↩︎

  2. Axtell, R. L . Zipf Distribution of U.S. Firm Sizes[J]. Science, 2001, 293(5536):1818-1820. ↩︎

  3. Faloutsos M , Faloutsos P , Faloutsos C . On power-law relationships of the Internet topology[J]. ACM SIGCOMM Computer Communication Review, 1999, 29(4):251-262. ↩︎

  4. H Jeong, B Tombor, R Albert,et al. The Large-Scale Organization of Metabolic Networks[J]. Nature, 2000, 407(6804):651-654. ↩︎

  5. H, Jeong,S P, Mason,A L, Barabási,Z N, Oltvai.Lethality and centrality in protein networks.[J].Nature,2001,411(6833):41-2. ↩︎

  6. Newman, M. E. J. Scientific collaboration networks.??I. Network construction and fundamental results[J]. Physical Review E Statistical Nonlinear & Soft Matter Physics, 64(1):016131. ↩︎

  7. Barabási, A.L, Jeong, H, Néda, Z,et al. Evolution of the social network of scientific collaborations[J]. Physica A: Statistical Mechanics and its Applications, 2002, 311(3):590-614. ↩︎

  8. Redner, S. How popular is your paper? An empirical study of the citation distribution[J]. 4(2):131-134. ↩︎

  9. Ebel, Holger, Mielsch, Lutz-Ingo, Bornholdt, Stefan. Scale-free topology of e-mail networks[J]. Phys Rev E Stat Nonlin Soft Matter Phys, 66(3):035103. ↩︎

  10. Liljeros, Fredrik, Edling, Christofer R, Amaral, Luis A. Nunes,et al. The Web of Human Sexual Contacts[J]. Nature, 2001, 411(6840):907-8. ↩︎

  11. Clauset, A.,Shalizi, C. R., & Newman, M. E. (2009). Power-law distributions in empirical data. SIAM review, 51(4), 661-703. ↩︎

  12. AL Barabasi, Reka Albert. Albert, R.: Emergence of Scaling in Random Networks. Science 286, 509-512[J]. Science, 1999, 286(5439):509-512. ↩︎

  13. Barabási, Albert-László, Albert, Réka, Jeong, Hawoong. Mean-field theory for scale-free random networks[J]. Physica A: Statistical Mechanics and its Applications, 1999, 272(1-2),173-187. ↩︎

  14. Dorogovtsev S N , Mendes J F F , Samukhin A N . Structure of Growing Networks with Preferential Linking[J]. Physical Review Letters, 2000, 85(21):4633-4636. ↩︎

  15. Bollobás, Béla. A Probabilistic Proof of an Asymptotic Formula for the Number of Labelled Regular Graphs[J]. European Journal of Combinatorics, 1(4):311-316. ↩︎

  16. Molloy M , Reed B . A critical point for random graphs with a given degree sequence[J]. 1995, 6(2-3):161-180. ↩︎

  17. Caldarelli, G, Capocci, A, De Los Rios, P,et al. Scale-Free Networks from Varying Vertex Intrinsic Fitness[J]. Physical Review Letters, 89(25):258702. ↩︎

  18. S?derberg, Bo. General formalism for inhomogeneous random graphs[J]. Physical Review E, 2002, 66(6):066121. ↩︎

  19. Marián Boguñá, Pastor-Satorras R . Class of correlated random networks with hidden variables[J]. Physical Review E, 2003, 68(3 Pt 2):036112. ↩︎

复杂网络分析 05 无标度网络相关推荐

  1. 复杂性思维第二版 四、无标度网络

    四.无标度网络 原文:Chapter 4 Scale-free networks 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在本章中,我们将处理来自在线社交网络的数据,并使 ...

  2. 网络模型 - 随机网络,无标度网络,分层网络

    转自: http://www.flickr.com/photos/caseorganic/4510691991/in/set-72157624621620243 小图 大图 Network Model ...

  3. networkx 标签_networkx绘制BA无标度网络

    step1: 导入networkx复杂网络库.matplotlib.pyplot.pandas import networkx as nximport matplotlib.pyplot as plt ...

  4. 级联失效matlab,加权无标度网络的级联失效模型

    社交网.交通网.通信网等领域均呈现无标度特性[, 是复杂网络中常见的一种现象, 不同网络中的节点和边都承载着不同形式的负载, 且负载的承受能力是有限的.加权无标度网络是指节点和边根据权值构建成的网络[ ...

  5. 从零认识 无标度网络

    喜欢的话请关注我们的微信公众号~<你好世界炼丹师>. 公众号主要讲统计学,数据科学,机器学习,深度学习,以及一些参加Kaggle竞赛的经验. 公众号内容建议作为课后的一些相关知识的补充,饭 ...

  6. 无标度网络/幂律分布、小世界网络

    无标度网络.幂律分布这两个概念都是指复杂网络中的度 分布不均匀 通俗点说就是80/20原则,枢纽节点很少,但是却连接着大量的节点,而大量的非枢纽节点却只有不多的几个连接. 小世界网络: 虽然有50个节 ...

  7. 复杂网络之无标度网络与小世界网络生成程序

    近日需要用到无标度网络与小世界网络,早上用matlab写了这两种网络的matlab程序,放在这,有用者可以拿去用,请自己验证正确性后使用. 共有三个文件,swnet.m 是sw小世界模型        ...

  8. Anylogic建立无标度网络

    创建Agent 将左边面板中的智能体拖入界面中,选择智能体群,动画为无,数量为100,点击"完成" Main界面设置 在Main中随意点击空白处,出现右侧"属性" ...

  9. networkx学习(五)无标度网络

    networkx学习(五)无标度网络 参考:参考来源,<巴拉巴西网络科学> 无标度网络: 对于随机网络和规则网络,度分布区间非常狭窄,大多数节点都集中在节点度均值< k >的附 ...

  10. BA无标度网络(一):规则网络生成

    在讨论BA网络的生成时,涉及到初始网络的选择,理论上当然可以选择只之前已近提及的ER随机网络模型或者WS小世界网络等等,但是如果初始规模较小,这些网络的的特性并不能很好的体现,所以我在生成BA无标度网 ...

最新文章

  1. SSD(Single shot multibox detector)目标检测模型架构和设计细节分析
  2. python键盘输入数组_python 二维数组切割Python读取键盘输入的2种方法
  3. DSOfile,修改windows系统文件摘要
  4. 图片服务 - thumbor用法
  5. MySQL 约束语法
  6. 给小黑升级三星970EVOPlus固态硬盘手记(图文)
  7. python读取手机通讯录_利用python解析手机通讯录
  8. dedecms教程:织梦建站教程之如何为内容模型添加新字段?
  9. DB2数据库生成html巡检报告
  10. android 隐藏wifi密码,手机连接隐藏wifi怎么设置密码 手机如何添加隐藏wifi?-192路由网...
  11. PAT甲级1146 Topological Order (25 分)
  12. SpringCloud微服务架构学习
  13. web淘宝电商页面搭建
  14. 小知识 | Java中的“魔数”
  15. 电机控制进阶——PID速度控制
  16. iMX6ULL启动流程
  17. Java方法创建及调用--------06
  18. linux fedora 10下载,Linux_Fedora 9官方最终稳定版下载地址集合,HTTP下载:http://mirror.karneval.cz/p - phpStudy...
  19. 干货 | 足式机器人运动控制发展方向——轨迹优化
  20. [LK光流法,disflow using Dense Inverse Search, VariationalRefinement变分优化 原理和代码]

热门文章

  1. 011游移方位惯导系统的力学编排之指令角速度
  2. VC 2012 visualstudio的项目属性表 .props文件
  3. 基于jeesit下的工作流开发步骤
  4. 16qam星座图 matlab,16QAM星座图
  5. win10诊断启动后联网_2步打开win10隐藏高级启动,解决80%系统问题
  6. 问题解决之——未知usb设备设备描述符请求失败(Jlink驱动)
  7. Python代码混淆工具,Python源代码保密、加密、混淆
  8. 安卓加密软件_教你用手机NFC模拟加密门禁卡
  9. 荣耀盒子无线网连接不上电脑连接服务器,华为荣耀盒子无法连接有线网络怎么解决...
  10. 计算机编程和机器人编程哪个有用吗,儿童编程和机器人编程哪个好