【摘要】

本文简略地介绍了网络科学的前世今生。从有趣的哥尼斯堡七桥问题谈起,引出了数学图论的诞生,介绍了随机图网络、小世界网络和无标度网络等三个经典代表性复杂网络模型,包括它们的生成机制和基本特性,并谈及它们的一些周知应用。最后,归纳了网络科学的一些重要意义、普适特征、研究挑战性和发展前景。希望能引起大众对网络科学的广泛关注,特别期望青年科学家们能进行更深入的学习和研究。

关键词:七桥问题,网络科学,随机图网络,小世界网络,无标度网络

【一】 从哥尼斯堡七桥问题说起

欧洲波罗的海东南沿岸的桑比亚半岛南部有一座小巧玲珑的古城堡哥尼斯堡(Königsberg),在历史上先后是条顿骑士团国、普鲁士公国和东普鲁士国(East Prussia)的首府,在二战之后归属于俄罗斯并被改名为加里宁格勒(Kaliningrad)(见图1)。

哥尼斯堡历史不长、地域不大,但地灵人杰、名人众多。在哥尼斯堡出生长大的知名人物至少有“一、二、三”,即一位哲学家(康德Kant)、二位物理学家(基尔霍夫Kirchhoff和索末菲Sommerfeld)和三位数学家(哥德巴赫Goldbach、希尔伯特Hilbert和闵可夫斯基Minkowski),还未计及化学、文学、历史、政治、宗教、音乐、艺术等领域的名家 [1]。

图1 哥尼斯堡(Kaliningrad Tourism,源于网络)

流经哥尼斯堡市区的小河Pregel有一个小岛和七座小桥(见图2)。在18世纪,当地居民聊天时会经常讨论,是否可以从河畔某一个地点出发,不重复也不遗漏地走过所有七条小桥,最后回到起点?居民们经多番努力都没找到这个貌似简单的画图游戏的答案。

图2  哥尼斯堡城中河面上七条小桥(欧拉手稿)

于是,这个七桥问题便在民间流传开来,以至引起了身在俄国圣彼得堡的瑞士裔年轻数学家欧拉(Leonhard Paul Euler,1707年4月15日-1783年9月18日)的兴趣,让他认真地去思考这个路径游戏问题。

当年,欧拉大概是这样琢磨的:假定你在图2上沿着某条路线往前走。当你走到任意一个地点(图2里的A、B、C、D)时,如果它不是终点,那么你得穿过它然后继续往前走。于是,这个地点便有两条连接路径:一条进来、一条出去。你就这样继续往前走。你有可能再也不回到这个地点,但也可能还会回来。如果你走回来而这个地方又不是终点的话,你还得再次离开它,这样它就有四条连接路径了。如此类推,所有不是终点的地方必须有偶数条连接路径。这里,重复走过某些地点是允许的,只是不允许重复走过任何一条连接路径,因为每条路径都穿过一条小桥。最后,假定你走到了终点,按要求它必须是起点,所以终点与起点重合,这个特殊的地点也同样有两条连接路径。

至此,欧拉找到了七桥问题是否有解的答案:如果有解的话,图2中的所有地点(A、B、C、D)都必须有偶数条连接路径。但是,从图看出,所有地点(A、B、C、D)都与奇数条桥相通,即有奇数条连接路径。实际上,只要有一个地点与奇数条桥相通,问题就是没有解的:不管你从哪里出发,你都不可能不重复也不遗漏地把七条桥全部走一遍,最后回到出发点。

1735年8月26日,欧拉向俄罗斯圣彼得堡科学院作了一个学术报告,从数学上论证了哥尼斯堡七桥问题是没有解的。后来欧拉以拉丁文正式发表了论文“关于位置几何问题的解法”,详细讨论了七桥问题并作了一些推广。该论文被认为是数学图论、拓扑学和网络科学的发端。

随后,欧拉和其他一些数学家分别考虑了一般多条桥的各种地图,并把它们抽象为数学图来加以研究。所谓数学图就是只有节点和连边而且它们是没有大小长短和物理意义的图,如图3的三幅图所示,其中为了视觉美观添加了红色。在图论中,一幅有限规模的图,不管它有多少个节点(图2中的地点)和多少条连边(图2中的连接路径),也不管你从哪个节点起步,如果总存在一条连续的路线让你走遍所有的连边,不重复也不遗漏,最后还能回到起点,那么这幅图就称为是“欧拉图”。因此,把哥尼斯堡七桥地图(图2)画成的数学图不属于欧拉图。

就这样,从欧拉解决七桥问题开始,数学家们逐步建立起了数学图论,并把欧拉尊为“图论之父”。

【二】 三个基本网络模型

历史很快便走过了二百多年。

1959年,匈牙利数学家埃尔德什(Paul Erdős)和伦伊(Alfréd Rényi)提出了一个随机图模型[2]:从有限个孤立节点开始,把所有可能的节点对(即两个不同的节点)分别以相同的概率用一条连边连接起来,并且整个过程的操作不重复也不遗漏,最后便得到一个数学图(也称为网络)。因为连接的概率小于1,有些节点对之间并没有建立连边。这个概率越小,没有连边的节点对就越多。但不管这个概率是大还是小,所产生的图的连接分布是比较均匀的。这是因为对所有节点和连边的操作都是一样的,没有特别偏袒某些节点或者某些连边,因此所有节点的连边数(称为节点的“度”)大体上是相等的。当然会有差别,但相差不会太大。也就是说,生成的图看起来是比较均匀的(见图3,左图)。数学上,这类随机图的节点度服从泊松(Poisson)分布。

图3 三个基本网络模型(示意图)

1998年,美国康奈尔(Cornell)大学应用数学博士研究生瓦茨(Duncan J. Watts)在导师斯托加茨(Steven H. Strogatz)指导下,遵循随机网络的基本思想,提出了一个“小世界网络模型”,发表在《自然》杂志上,被称为WS小世界网络模型[2]。该模型在具有最近邻接边的规则网络(例如环形网络)的基础上,把所有可能的节点对按某种规律以相同的概率增加或删除连边(见图3,中图)。由于随机性,必然出现一些远程连边,把两个相离较远的节点连接起来。在图论中,两个相连节点之间的连线长度定义为1,与它们在所画的图形中放置的远近无关。任意两节点之间的“距离”定义为它们之间最短可能路径中通过其它一些节点的连边的总数目。上面所说的远程连边就把网络变成了一个“小世界”,也就是说任意两个节点之间的距离都变得相对的短。这类网络和随机图类似,看上去还是相对比较均匀的,网络节点度近似服从泊松分布。小世界网络中任意两节点相离不远,从而整个网络节点之间的平均距离也比较短。因此,小世界网络模型的意义是显而易见的,例如它把人群和技术网络中的社会联络、信息交流和信号传输等功能变得高效快捷。

对小世界关系的生活经验和哲学认知古来有之。在中国有唐诗“海内存知己,天涯若比邻”为证。20世纪60年代,美国哈佛大学的社会心理学家米尔格拉姆(Stanley Milgram)通过社会调查发现任意两个人之间平均只需要通过五个熟人就能联系起来,即“六度分离”(Six Degrees of Separation)现象。瓦茨于2003年8月在《科学》杂志上报道了他组织来自166个国家和地区 60,000多名志愿者参加的电邮联络游戏,发现大家收到的电子邮件都通过五至七个中间人的转送,和六度分离现象非常吻合。Facebook 数据团队于 2011年11月21日宣布,根据他们对7.21亿活跃用户和690亿好友连接的调查,任意两人之间的联络人数仅为4.74;而到了2016年,他们的报告表明,这个平均距离仅为3.57,表明世界变得越来越小。尽管人们对“小世界”现象早有各种各样的经验,对其认知并不新奇,但无论如何WS小世界网络给出了第一个从科学角度定性定量地描述小世界关系的数学模型。

1999年,美国圣母(Notre Dame)大学物理学导师巴拉巴西(Albert-László Barabási)和女博士研究生阿伯特(Réka Albert)一起,提出了一个基于增长和带偏好性随机连接的“无标度网络模型”,发表在《科学》杂志上,简称为BA模型[2]。像前辈数学家埃尔德什和伦伊一样,这师生俩都是匈牙利人。该模型在建立过程中陆续有新节点加入,从而不断地增长扩大。新加入的节点按照正比于各个老节点的度的概率和它们分别相连,具有不同的偏好性。由于随机性,新节点和一些老节点并不建立新的连接。但是,由于这随机性的概率正比于老节点的度,新节点连接到节点度略大即连边数稍多的老节点的可能性就较高,从而让该老节点的度变大,并且在过程中变得越来越大。最后,网络的度分布出现“富者越富、穷者越穷”的局面,少数节点有特别大的度而绝大多数节点只有相对较低的度,相差可能很远(见图3,右图)。这类网络虽然也根据概率来建立连接,因而具有随机性,但它们和上面说的两类网络截然相反,其连接结构是很不均匀的。数学上,它们的节点度服从幂律分布。由于节点幂律分布是由上述网络的生成机制决定的,与网络规模大小无关,因此这类网络称为“无标度网络”。这个模型可以用来描述非常多的现实世界网络。容易想象,社会上明星有很多粉丝而普通人只有很少;互联网上Google和百度等网站的访问人次很多而普通个人网站却很少人光顾;“的、和、是”等少数文字在句子里出现的频数很高而大部分普通文字在文献里的使用并不太多,等等。

无标度网络模型在自然界和现实生活中如此普遍地存在,为何这么晚才被科学家们注意到呢?其实不然。早在1965年,也就是埃尔德什和伦伊建立随机图模型不久,英国裔的美国科学史及计量学家普莱斯(Derek de Solla Price)基于对科学论文的引文网络所作的许多定量研究,在《科学》杂志上发表文章“科学论文网络”,指出了引文网络的入度和出度都符合幂律分布,描绘了无标度网络并提供了一个具体例子[3]。更细致的“普莱斯模型”(Price Model)发表在1976年《美国信息学会杂志》上。受“通才人物”司马贺(Herbert A. Simon)[4]幂律分布随机模型的启发,普莱斯在这篇论文中引进了一个具体的网络数学模型,用来描述引文网络增长的过程和度分布生成的规律,包括了增长过程及偏好性连接机制。不过,由于在普莱斯那个时代尚未有高速计算机和大型数据库,特别是还没有互联网(Internet),科学家们对普莱斯模型不太关注,因而该网络模型并不为人熟识。虽然巴拉巴西和阿伯特“重新发现”了普莱斯模型,两者并非全同。BA模型的最大贡献,是它在千禧之年之后带起了一波研究网络科学的热潮,在科学发展进程中功不可没。

【三】网络科学前瞻

网络科学的研究发展到今天,全面覆盖了几乎所有的复杂网络,包括互联网和万维网(WWW)、移动通信网络、交通网络、电力网络、社会网络、经济网络、生态网络、神经网络和各种生物网络,等等。这些看上去各不相同的网络之间,有着许多惊人的相似之处,并且都可以用上面介绍的网络模型来加以刻画和分析。

长期以来,通信网络、电力网络、生物网络、社会网络和经济网络等实际网络分别是不同科学各自独立的研究对象。但是,由于它们的诸多重复共性以及现代科学技术的迅速发展,需要并且可能统一地来研究整个网络科学。首先,网络科学的研究对象是各种看上去互不相同的复杂网络之间的共性以及分析它们的普适方法。网络科学中的研究问题来源于各种实际网络,它所产生的共同概念、方法和理论又可以反过来为各种实际网络的分析与设计提供宏观指导和具体处置。其次,网络科学把多种学科用统一的网络理论和技术联络起来,使得对某一类网络的研究可以为另一类网络的研究提供参考和借鉴。此外,许多复杂网络的问题依靠单个学科难以有效解决,需要多学科的协同努力,而网络科学则提供了一个多学科交互的平台。一个简单的例子是,传染病在社会网络中的传播,人群信息、舆情、观点和谣言等在社会网络中的传播,计算机病毒在互联网和移动通信网络上的传播,电站相继故障在电网上的传播,凡此等等不同领域的不同问题,其实都可以归结为复杂网络上的传播动力学,研究局部节点或连边的行为是如何在全局网络中扩散的。这些研究能够为人们提供十分有效的推广策略或防范措施。简而言之,网络科学的数学理论、计算方法、仿真分析和数据实证都可以为这些问题提供有效的研究和解决手段。

但是,网络科学的研究和应用极具挑战性。大规模网络系统的复杂性体现在以下几个方面:首先是结构的复杂性,其连接错综复杂而且是动态变化并具有随机性;其次是节点的复杂性,其动力学行为具有异质性和多样性,甚至出现分岔混沌等非线性特征;网络结构与节点系统之间的相互作用,以至网络和网络之间的交互影响,都是不可避免的十分棘手的理论和技术问题。

目前,网络科学研究的主要内容包括:发现—揭示和刻画各种网络的结构的拓扑特性,以及度量和计算这些指标的有效方法;建模—建立合适的网络模型以帮助人们理解其统计性质的内在意义和产生机理;分析—基于单个节点的性质和整个网络的结构特征去分析和预测网络的演变及行为;设计—提出具有理想功能的新型网络和改善已有网络的性能并给出有效的分析和计算方法;应用—从网络科学到网络工程的各种各样的理论和实际应用。

瞻观未来,方兴未艾的网络科学任重道远、前途无量。这门学科值得大家广泛关注,更值得青年科学家们致力研究。

参考文献

[1] 汪小帆、李翔、陈关荣(2012).网络科学导论》.高等教育出版社.

[2] 陈关荣(2021年12月18日).〈从哥尼斯堡七桥问题谈起〉〔微信公众号〕.《集智俱乐部》. https://mp.weixin.qq.com/s/flgH-2l2fAuTVCF-RnsglNw

[3] 陈关荣(2022年3月12日).〈司马贺之问:学习还是创造?〉〔微信公众号〕.《集智俱乐部》.https://mp.weixin.qq.com/s/h5gvnaU-0LsYDiICtSU49g

[4] 陈关荣(2022年5月22日).〈普莱斯和他的定律及模型〉〔微信公众号〕.《集智俱乐部》.https://mp.weixin.qq.com/s/X0vmSVoNwLJo0YqTQM1FvQ

本文2023年4月发表在《复杂学》1卷2期85-92页,经作者本人同意授权转载。DOI:10.29783/Complexitics.202304_1(2).0005

华院计算技术(上海)股份有限公司
华院计算成立于2002年,公司以算法研究和创新应用为核心,致力于数学应用与计算技术发展,着力发展认知智能技术,提供底层智能引擎,引领算法自主创新,为数字治理、智能制造、零售金融、数字文旅等行业提供AI+产品及解决方案,推动企业数字化转型和智能化升级,让世界更智慧。

华院计算 | 简单的七条小桥引出了复杂的网络科学相关推荐

  1. 华院计算 | 郭守敬,一个仕途坦荡的科学家

    郭守敬(1231年-1316年),字若思,河北邢台人. 郭守敬出生于金哀宗正大八年(1231年),时为宋朝(960年-1279年),但当年的河北地域属于女真族人管治的金国.他40岁那年,大蒙古国忽必烈 ...

  2. 华院计算 | 他自己的生命游戏结束了,留给后人的数学游戏长存

    [一] 让我们从一个简单的游戏开始. 在一个很大(理论上无穷大)的围棋棋盘上,让黑子代表"生"而空格(称为白子)代表"死".在棋盘上的任何9个格子组成的正方形区 ...

  3. 华院计算|切比雪夫,他带起了俄罗斯现代数学的发展

    俄罗斯的数学家们常说,他们的现代数学是由切比雪夫带动而建立和发展起来的. 图1  帕夫努蒂·切比雪夫(1869年) 帕夫努蒂·切比雪夫(Pafnuty Lvovich Chebyshev, 1821年 ...

  4. 华院计算 | 东方文艺复兴式的学者—朱载堉

    朱载堉(1536年–1611年)是明代杰出的乐律学家和历算学家 [生平简介] 朱载堉出生于河南省怀庆府河内县(今河南沁阳市),是明太祖朱元璋(1328年–1398年)的第九代孙.朱载堉的父亲朱厚烷(1 ...

  5. 突破AI应用落地难点,华院计算与信通院解读认知智能

    人工智能是什么?不同的人有着不同的看法,但如果我们以浅显的角度来看,人工智能最初的样子就是让机器不断的模仿人类,从最初的听到.看到,到现在逐渐开始学会推理.思考.判断.当然,人工智能的发展速度飞快,机 ...

  6. WAIC2023|华院计算成功举办“认知世界 智创未来”主题论坛 中国信通院认知智能研究报告及华院认知智能引擎平台正式发布

    7月盛夏,2023年人工智能大会(WAIC)如约而至.大会期间,由华院计算技术(上海)股份有限公司(以下简称"华院计算")主办的WAIC "认知世界 智创未来" ...

  7. 新闻 | 华院计算入选中国科技产业智库AIGC产业图谱

    4月,中国科技产业智库甲子光年发布<AIGC应用与实践研究展望报告>及AIGC产业图谱,面向AIGC技术创新者.产业参与者.资本机构和政府等各方展现AIGC产业的整体生态环境和行业发展.华 ...

  8. 华院计算|维托里斯—最长寿的数学家

    百岁长寿的数学家并不多见,大家熟识的两位中国人是108岁的浙江大学朱良璧教授(1913年11月–2021年11月20日)和101岁的复旦大学苏步青教授(1902年9月23日–2003年3月17日).朱 ...

  9. 华院计算 | 葛利普和他的燕园归宿

    我于2005年4月至2009年3月在北京大学任职教育部长江讲座教授,期间注意到燕园里安葬着三位美裔校友:艾琳·罗德(Aline Hardy Rood,1879年8月29日–1926年6月5日),她是燕 ...

最新文章

  1. maven实现依赖的“全局排除”
  2. sed和awk中使用shell变量
  3. php如何做浏览量,php+ajax实现的点击浏览量加1
  4. 【2018年11月21日】煤炭行业的估值高度排名
  5. Spring Boot(十七):使用Spring Boot上传文件
  6. 一段成功通过SAP云平台IDP SAML验证的响应字段分析
  7. 《团队激励与沟通》第 5 讲——沟通的技巧 重点部分总结
  8. HDU 1085 Holding Bin-Laden Captive!
  9. python 闭包和装饰器
  10. .net 安装remoting服务
  11. 为VIP解决问题时写的源码
  12. 生活中的实验 —— 家庭电路
  13. linux配置ssh免密码登录
  14. 28个超有用的PPT小技巧,快来收藏
  15. OpenCV——LBP特征
  16. jsp js弹出网页对话框
  17. Vue中router-link路由跳转以及传参方式
  18. 网络数据传输的节点大全
  19. 关于技术人员创业入股的问题
  20. 关于ios 卡顿检测分析

热门文章

  1. java map遍历最快_Java Map遍历速度最优解
  2. MySQL数据库规范
  3. CKEditor5 功能追加,自定义设置:段落对齐,字体颜色,背景色,字体大小等配置添加
  4. dbvisualizer 查表结构_Sql语句查看表结构
  5. IEC61499 重大进展-UniversalAutomation.org 协会成立
  6. 二维数组练手小程序--后宫管理
  7. 8183微型计算机,刷题组:2014山东资料分析
  8. Linux的shuf命令
  9. CocosCreator官方示例 - spine系列
  10. MICK-SQL基础教程(第二版) 第八章 SQL高级处理