幂律是说节点具有的连线数和这样的节点数目乘积是一个定值,也就是几何平均(对各变量值的连乘积开项数次方根)是定值。

例:有10000个连线的大节点有10个,有1000个连线的中节点有100个,100个连线的小节点有1000个,在对数坐标上画出来会得到一条斜向下的直线。

幂律分布的特征:其通式可写成y=cx^(-r),其中x,y是正的随机变量,c,r均为大于零的常数。这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。对上式两边取对数,可知lny与lnx满足线性关系lny=lnc-rlnx,也即在双对数坐标下,幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给定的实例中随机变量是否满足幂律的依据。
      判断两个随机变量是否满足线性关系,可以求解两者之间的相关系数;利用一元线性回归模型和最小二乘法,可得lny对lnx的经验回归直线方程,从而得到y与x之间的幂律关系式。
      幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给定的实例中随机变量是否满足幂律的依据。

      幂律分布现象:自然界与社会生活中存在各种各样性质迥异的幂律分布现象,因而对它们的研究具有广泛而深远的意义。借助于有效的物理和数学工具以及强大的计算机运算能力,科学家们对幂律分布的本质有了进一步深层次的理解。

  • 1932年,哈佛大学的语言学专家Zipf在研究英文单词出现的频率时,发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在简单的反比关系,这种分布就称为Zipf定律,它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用。实际上,包括汉语在内的许多国家的语言都有这种特点。
  • 19世纪的意大利经济学家Pareto研究了个人收入的统计分布,发现少数人的收入要远多于大多数人的收入,提出了著名的80/20法则,即20%的人口占据了80%的社会财富。个人收入X不小于某个特定值x的概率与x的常数次幂亦存在简单的反比关系,即为Pareto定律。

Zipf定律与Pareto定律都是简单的幂函数,我们称之为幂律分布;还有其它形式的幂律分布,像名次—规模分布,规模—概率分布,这四种形式在数学上是等价的。

统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。


帕累托定律
      自然界中大多数的量都遵循钟形曲线,而钟形曲线对应的分布和刻画随机网络的单峰分布非常相似。但是在过去几十年里,科学家发现,自然界有时会产生一些遵循幂律分布的量,它们不再遵循钟形曲线。
      幂律最突出的特征不是有很多小事件,而是大量微小事件和少数非常重大的事件并存。而与之相对,这些非常重大的事件绝对不可能出现在钟形曲线中。
      在物理学家和数学家大谈幂律时,80/20定律风行于大众媒体和商业刊物中。只要80/20定律适用,你就可以确定,其背后一定有幂律存在。80/20定律即帕累托定律,源自一位非常有影响力的意大利经济学家维弗雷多·帕累托。在学术之外,帕累托凭借一个经验观察而享有盛名。作为一个勤劳的园丁,他注意到,80%的豌豆是20%的豆荚结出的。作为经济不平等现象的细心观察者,他发现意大利80%的土地被20%的人口占有。
      最近,帕累托定律(也被称为80/20定律)又演变成管理学中的墨菲定律:80%的利润由20%的员工创造,80%的客户服务问题来自20%的顾客,80%的决定在20%的会议时间里完成,诸如此类。80/20法则还在很多领域里以常识的形式出现,例如,80%的犯罪行为来自20%的罪犯。

复杂的万维网遵循幂律分布
      经过令人信服的数据分析我们发现,数百万网页创造者以某种神秘的方式协同工作,形成了复杂的万维网,在这里,随机宇宙不再存在。网络的连通性由少数枢纽节点保证,是它们让真实网络免于瓦解。不均匀性,是幂律度分布网络的特性。幂律分布迫使研究者们放弃了尺度或者特征节点的想法,在连续的层级中,无法找到一个能够代表所有节点特性的节点。在这些网络中,并不存在固有的尺度。幂律分布预言,每个无尺度网络中都有一些大的枢纽节点,是它们从根本上确定着网络的拓扑。
      人们发现,包括万维网和细胞网络在内的大多数重要网络都是无尺度的,这让人们逐步认可了枢纽节点的存在。我们将看到,枢纽节点决定着真实网络的结构稳定性、动态行为、健壮性、容错性和故障容忍性。它们的存在预示着,有一些非常重要的组织规则在支配着网络的演化。
      在网络中观察到幂律,预示着网络和其他自然现象之间存在着未知的联系,从而将网络置于理解一般复杂系统的最前沿。

整体大于部分之和,相变点理论
      人类对部分的了解远多于整体。比如对于水分子,无论是其大小还是内部结构,我们都已经了解得非常清楚。这一点都不奇怪,毕竟水是地球上最常见和被研究最多的物质。但是,玻璃杯里由数十亿紧密结合的水分子形成的液态水,对我们而言仍是个挑战。磁体的有序和无序状态对应着物质不同的热力学状态。在相变点,系统在两个状态间面临的抉择,就像站在山脊上的登山者要选择从哪一边下山一样。在没有做出决定之前,系统通常左右摇摆,这种摇摆在临界点附近达到极致。
      随着物理学家仔细研究不同的系统中有序是如何从无序中涌现出来的,越来越多的幂律在相变过程中被发现。
      1965年的一天,厄巴纳的伊利诺伊大学的物理学家利奥·卡达诺夫突然悟到:在临界点附近,我们不能再把各个原子分开研究。相反,这些原子应该被视为行动一致的群体。原子被由原子形成的盒子取代,每个盒子中的原子行为一致。人们在理解无序到有序的相变方面取得了第一个重大突破。

有序和涌现
      幂律从数学角度阐释了这样的概念:少数几个大事件发挥了大部分的作用。在完全随机的系统中,幂律极少出现。我们在万维网中看到的幂律,首次以严格的数学术语表明,真实网络远不是随机的。而物理学家已经明白,幂律通常标志着从无序到有序的过渡。
      自然界往往厌恶幂律,在常见的系统中,量遵循钟形曲线,而且相关性按照指数率迅速衰减,但是,当系统被迫发生相变时,所有这一切都改变了。相变理论清清楚楚地告诉我们,从无序到有序的道路,是自组织在强有力地推动,并通过幂律铺就。它还告诉我们,幂律不仅是刻画系统行为的另一种方式,更是复杂系统自组织所独有的特性。幂律具有非常独特而深远的意义,由此我们在网络中看到了一种全新而未知的秩序,这种秩序具有不同寻常的优美和一致性。

第10章* 网络 幂律分布相关推荐

  1. 无标度网络/幂律分布、小世界网络

    无标度网络.幂律分布这两个概念都是指复杂网络中的度 分布不均匀 通俗点说就是80/20原则,枢纽节点很少,但是却连接着大量的节点,而大量的非枢纽节点却只有不多的几个连接. 小世界网络: 虽然有50个节 ...

  2. 数理统计10.15 | 幂律分布

    数理统计10.15 | 幂律分布 定义 示例 幂律与"长尾" 克莱伯定律(Kleiber's Law) Zipf定律:书籍中单词频率的分布 Pareto定律(帕累托定律) 性质 标 ...

  3. 用幂律分布研究工资收入

    本文系即将出版的<机器学习数学基础>中的"第5章概率"的"5.3.3 连续型随机分布"一节中"幂律分布"节选.本书将由电子工业出 ...

  4. 逆幂律模型_思维模型18 - 幂律分布是什么?

    上篇关于正态分布的内容中提到了自然界中许多事物的概率分布都近似的符合正态分布,后来我们拿大多数人最关心的财富来举例,但它符合正态分布符合对数正态分布,这是以人数做统计,但如果按照各个资产量统计人数的话 ...

  5. 可推导出幂律分布的模型的文献小结

    可推导出幂律分布的模型的文献小结 看了一些paper后,一直想写一个关于幂律分布的文献综述,但近年来研究复杂系统,特别是复杂网络的文献增长迅速,而只要是涉及复杂网络的,基本上都谈到了类幂律分布,因此, ...

  6. Python数据可视化:幂律分布

    1.公式推导  对幂律分布公式:    对公式两边同时取以10为底的对数:    令,且为常数,所以公式变为:  所以对于幂律公式,对X,Y取对数后,在坐标轴上为线性方程. 2.可视化  从图形上来说 ...

  7. 对数正态分布_正态分布与幂律分布

    1.正态分布 英国生物统计学家法兰西斯·高尔顿做了一个实验.他在一块木板上画了一块等腰三角形,并在三角形区域内钉上n+1层钉子.第1层钉2个钉子,第2层钉3个钉子,下面每一层都比上一层增加一个钉子,上 ...

  8. 从幂律分布到特征数据概率分布——12个常用概率分布

    在机器学习领域,概率分布对于数据的认识有着非常重要的作用.不管是有效数据还是噪声数据,如果知道了数据的分布,那么在数据建模过程中会得到很大的启示. 首先,如下图所示8个特征数据概率分布情况(已经做归一 ...

  9. 详解幂律分布,以及用于重尾分布的Python库powerlaw的使用

    详解幂律分布,以及用于重尾分布的Python包powerlaw 总述 幂律分布简要回顾 powerlaw库拟合效果 powerlaw库基本操作介绍 可视化 拟合范围 离散与连续数据 与其他分布比较 总 ...

最新文章

  1. 盛夏海边,用Python分析青岛哪些景点性价比高
  2. 英特尔CPU机密数据大量泄露:芯片后门实锤,下一代CPU原理图曝光
  3. boost::system::linux_error相关的测试程序
  4. POJ - 2348 Euclid's Game(博弈)
  5. 【机器学习】决策树知识点小结
  6. c语言朋友,[原创]写给初学 c语言的朋友
  7. linux文件目录含义,Linux中文件权限目录权限的意义及权限对文件目录的意义
  8. git入门_绝对入门的Git
  9. linux下mknod命令介绍
  10. 静态路由实现负载均衡和高可用
  11. bzoj 2844 子集异或和名次
  12. Dubbo服务暴露(导出)流程
  13. matlab画图基本命令
  14. php fckeditor,FCKeditor的安装(PHP)
  15. 22年新款MacBookAir屏幕解析
  16. nginx安装三大的命令的解释./configure make make install
  17. 【Spring】AOP - 面向切面
  18. 那些年我们用过的机械键盘#keychron#
  19. 【大咖有约】白帽汇邓焕:大数据下的攻防
  20. ant design的Switch组件的坑,怎么更改Switch的状态?

热门文章

  1. 矩阵二范数(norm)
  2. java运行机制是什么_JAVA运行机制
  3. 树莓派-格式化硬盘(U盘)为ext4格式并挂载
  4. codeup 二叉树(dfs超时版)
  5. 【概率论系列学习】泊松分布和指数分布的关系
  6. 《构建之法》8、9、10章
  7. Git 安装及常用操作配置
  8. forward 和redirect的区别
  9. 如何解决:Android中 Error generating final archive: Debug Certificate expired on 的错误
  10. [SharePoint]ExcelService未响应或拒绝访问