导语

以诺贝尔奖得主为代表的精英科学家群体,引领了现代科学的发展方向,其学术生涯路线,对青年学者有启发意义。近日由国防科技大学李际超与美国西北大学王大顺、殷裔安及印第安纳大学Santo Fortunato等合作发表的论文,整理了 1900-2016 年间 545 位诺奖得主的论文发表与合作网络数据,对比发现诺奖科学家与普通科学家之间在论文发表、科研合作及创新研究上的诸多差异。例如被诺奖认可的研究工作往往出现在学者职业生涯早期,独立或小团队完成的工作更可能获得获奖,精英科学家在获得诺奖之后的新文章影响力可能下降等。本文是对这项研究的详细解读。

论文题目:

Scientific elite revisited: patterns of productivity, collaboration, authorship and impact

论文地址:

https://royalsocietypublishing.org/doi/10.1098/rsif.2020.0135

那些荣获诺奖的明星科学家们

科研工作者不是躲在象牙塔里终日和瓶瓶罐罐、键盘机器打交道的书呆子,他们的研究工作能给社会提供巨大的价值。而其中的科学大牛、明星科学的影响不仅局限在科学界、更对全世界都作出了巨大的贡献。诺贝尔奖作为一个高含金量、最负盛名的科学奖项,为研究者去追踪那些明星科学家的学术生涯提供了线索和依据。

近日由国防科技大学的李际超与美国西北大学科学学与创新研究中心的王大顺、殷裔安及印第安纳大学的Santo Fortunato合作发表的论文融合了诺贝尔奖官网维基百科词条、诺奖获得者个人网站及微软学术图谱多源数据,通过姓名消歧获取了545位1900年至2016年间自然科学(物理、化学、生理学或医学)领域诺奖获得者完整的论文发表及引文合作网络数据,基于此,将诺奖科学家与普通科学家的职业生涯进行对比分析,探究了诺奖科学家论文发表、科研合作及颠覆性创新的工作模式和规律。

数据收集

图1:数据收集与验证框架

论文作者首先从多个数据源如诺贝尔奖官网、维基百科词条、诺奖获得者个人网站,爬取收集并手动整理了每位诺奖科学家发表的论文,并将这些论文在微软学术图谱(MAG)数据库进行了匹配作为“种子”;然后,通过“种子+个人引文网络扩展”这一过程收集每个获奖者的整个论文发表列表;最后将所获得的数据集的准确性及完备性采用多种方法包括手动收集CV、谷歌学术、单位信息等进行了验证。

最终,几位作者收集了545位诺奖科学家的完整发文记录,共有93,394篇期刊论文,并人工识别了874篇诺奖论文(整个数据收集及验证过程工作量超过了1000小时)。

今日诺奖科学家,昔时当红少年郎

一个坊间常见的观点认为:学术大师往往在年轻时就已经展现出了傲人的资质这一点在该研究的数据集中确实得到了体现,获得诺奖的科学家在学术生涯的早期——发表第一篇论文后的五年内——发表的论文数影响力(是否是同时期、同领域被引数量前1%的论文),都远远超过同领域的科学家。

图2:诺奖获得者在学术生涯早期的表现差异

从上图我们可以看到无论是发表论文数量(左图)还是论文的影响力(右图)物理、化学与医学领域中的诺奖得主(深蓝色)的表现均优于普通的科学家(蓝绿色)。其中,论文发表数量是普通科学家的两倍多,而影响力更是普通科学家的八倍。

但这些天资优异的少年天才并不是独来独往的独行侠,实际上他们与其他科学家合作发文的数量是普通科学家的1.77倍,而独立发表的论文数量并不是特别突出。

图3:获得诺奖的科学家-普通科学家在独立-合作发文数量上的差异。

虽然从上图我们可以看到,在独立发表论文数量上,获得诺奖的科学家(浅蓝色)与普通科学家(绿色)在化学和医学领域并无显著区别。但是,他们在学术生涯的早期独立完成的研究、论文往往更能获得诺贝尔奖的青睐。

图4:获得诺奖的科学家独立完成的论文(红色)获得诺奖的概率是合作论文(紫色)的2.16倍

学术大师与他们的奇迹年

作者通过控制变量法,证明了生长和优先连接两条假设是产生无标度分布的必要条件。不仅仅是如前文所说,获奖者学术生涯早期的独立工作获奖的可能性更大,而在科学家完整的学术生涯中,被诺贝尔奖认可的研究工作也往往出现在职业生涯的早期。

图5:研究工作发表的顺序(横轴)与文章影响力(纵轴)的累计分布

从图中我们确实可以看出获得诺贝尔的研究论文很有可能出现在研究者研究生涯的早期。但是如果我们考虑到诺贝尔奖颁奖的一个条件:只颁发给在世的学者。以及一个研究者的学术研究可能要经过十几年才能得到有效的公论。我们会发现这里存在着选择效应。如果研究者在晚年做出了重要的工作有可能会被诺贝尔奖排除在外。

就此问题,作者在排除诺奖获奖论文后重新绘制了上图,他们得出的结论令人吃惊。

图6:移去获得诺奖的论文后,研究工作发表的顺序(横轴)与文章影响力(纵轴)的累计分布

如上图所示,如果去除了诺贝尔奖带来的影响,我们发现一位科学家所发表的重要论文(上图中所示是Top3)其实在其学术生涯中出现的概率是等可能的换句话说绝对的年龄与优秀的研究成果之间并没有必然的关系。也许,只有爱因斯坦的奇迹年发生在他26岁的时候,而对于其他科学家来说,他们的奇迹年可以出现在其学术生涯中的任何时候。

同样,我们也知道即便是资质极高学术天才也无法一生都引领着学术界前进的方向,每一名科学家都存在着他的奇迹年、“热手期”(hot streak)——一名科学家有影响力的重要论文集中出现的时间段。实际中,从该研究统计的数据来看88%的诺奖工作是在热手期完成的,这一时间段发表的学术成果获诺奖的概率是其他时间段发表学术成果的1.4倍。

作者研究就发现,这些获得诺贝尔奖的科学家的重要研究论文往往是在热手期内依次接连出现。

图7:三个学科领域中高影响力论文出现概率相关关系的热力图

从图中我们能够较为明显的看到重要研究成果之间的关系(这也太简单了吧!一个函数完成数据相关性热图计算和展示)。如果打乱论文之间的顺序关系,这样的相关性就会立刻消失。

图8:在打乱论文发表次序后,三个学科领域中高影响力论文出现概率相关关系的热力图(显然我们无法从图中看到任何关系)

在热手期这一现象中,诺奖科学家也确实表现的优于其他的科学家,热手期的长度是普通科学家的1.93倍。

图9:诺奖科学家的热手期持续概率(黄色曲线)与普通科学家(绿色曲线)的对比

谁能摘取璀璨的荣誉桂冠?

时至今日我们知道,科研工作者已经不再是某个躲在阁楼里在危险的边缘疯狂试探的“科学怪人”,科研工作往往需要团队成员的通力合作才能完成。这一趋势也同样存在与获得诺奖的作品中。

图10:学术论文合作者数量变化趋势

从图中我们可以看到,无论是获得诺贝尔奖的论文还是普通的对照论文,由一名研究者独立完成的比例大幅减小(深浅两种绿色所表示的曲线)而合作完成科研工作成为趋势。

但是诺贝尔奖显然无法授予每一个人,根据作者的研究发现论文一作获得诺贝尔奖的可能性更高,而且获得诺奖的论文也往往是由小团队撰写的,该现象同时也支持了2019年Nature文章《Large teams develop and small teams disrupt science and technology》的研究结论:小团队更容易做出颠覆式创新。

图11:获得诺贝尔奖的研究论文(黄色)与同一时期近似的研究论文(蓝色)相比,无论是在团队规模(左图)还是在一作比例(右图)上都存在着明显的差异。

永恒的学术追求,不变的学术理想

获得诺贝尔奖对与任何一个科学家来说都可谓是极大的荣耀,但这样的一份荣耀并不一定会像火箭的助推器一般能让科学家的学术影响得以进一步的发展。而实际上,在一位科学家获得诺贝尔奖后的两年内发表的论文影响力反而会下降。

图12:获奖前后论文影响力的变化

以获得诺贝尔奖为时间分界点,与获奖前几年相比,获奖后的两年内论文的影响力存在着明显的下降现象,平均降幅为11.1%。对此现象,作者认为:“获得诺奖后,诺奖获得者单独撰写的论文数量急剧减少,团队撰写论文的比例稳步上升,表明在赢得诺贝尔奖之后,团队合作对于获奖者的职业生涯变得越来越重要”。

图13:获得诺奖前后四年,团队合作发表论文的比例变化。(黄色是获奖前,蓝色是获奖后)

此外,该研究也发现有不少的科学家在获得诺贝尔奖之后,改变了研究方向。以法国化学家让-马里·莱恩(Jean-Marie Lehn)为例,他与美国化学家唐纳德·克拉姆和查尔斯·佩德森一道因“发展和使用了可以进行高选择性结构特异性相互作用的分子”获得了1987年的诺贝尔化学奖。

图14:法国化学家让-马里·莱恩(Jean-Marie Lehn)和他的研究主题网络图 | 左图来源:维基百科

在研究主题网络图中(Cytoscape制作带bar图和pie图节点的网络图),每一个节点表示一篇论文;节点间的连边则表示两篇论文中存在共同的引用关系。从图中我们可以看出让-马里·莱恩在七个领域都展开过研究。这些研究并不是让-马里·莱恩在同一时期同步展开的。根据作者的分析,让-马里·莱恩在获得诺贝尔奖以后,研究方向发生了有趣的变化。

图15:在1987年让-马里·莱恩获得诺贝尔奖以后,他的研究主题发生了变化

然而,作者进一步研究发现获得诺奖后诺奖科学家开展的课题研究并没有获奖前的关注度高,获奖前后新合作者数量、获得的资助也没有明显的区别。值得注意的是,尽管作者发现获奖后诺奖科学家文章影响力下降这一现象和研究方向转移都在同一时间发生(被授予诺贝尔奖),但这并不意味着两者之间存在因果关系。无论如何,这些结果凸显了诺奖科学家的坚定不移的科学努力,他们积极地寻求新的研究方向,而不受日益增加的职责和责任所带来的额外负担的束缚。

我们能找到那些“诺奖预定”科学家么?

通过前文分析我们发现那些建立了伟大功绩的科学家和别的科学家一样需要与他人合作、也存在着热手期。但他们往往在年轻时就做出了令人侧目的研究成果。我们也会发现有些研究刚刚发表就被以所谓的“诺奖级”来加以形容。抛开媒体炒作、舆论渲染的成份以外,这其实意味着我们可以在一个研究项目的得出成果的早期阶段就判断出该研究团队的潜在价值和影响力。

本文所提到的研究也许有助于我们去即时地发现科研领域中的无冕之王,而不再是等待着一年一度的学术界春晚——诺贝尔奖颁奖典礼。

参考报道及相关论文:

[1] 诺贝尔奖得主有哪些异于普通科学家的特质?

https://mp.weixin.qq.com/s/md_1UxgjYoJdhIskmBvCmA

[2]  Li J, Yin Y, Fortunato S, Wang D. Scientific elite revisited: patterns of productivity, collaboration, authorship and impact. J R Soc Interface 2020, 17.

[3]  Li, J., Yin, Y., Fortunato, S. & Wang, D. Nobel laureates are almost the same as us. Nature Reviews Physics 1, 301–303 (2019).

[4]  Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Sci Data 6, 33 (2019).

[5]  Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Harvard Dataverse, https://doi.org/10.7910/DVN/6NJ5RN (2018).

[6]  Liu, L. et al. Hot streaks in artistic, cultural, and scientific careers. Nature 559, 396–399 (2018).

[7]  Wu, L., Wang, D. & Evans, J. A. Large teams develop and small teams disrupt science and technology. Nature 566, 378–382 (2019).

作者:Leo

审校:李际超、刘培源

编辑:张希妍

你可能还想看

  • 2019年诺贝尔生理医学奖揭晓 |动图展示历年生理学奖

  • 2019年诺贝尔化学奖揭晓 |八一八,那些年的诺贝尔化学奖

  • 2018“不务正业”的化学奖又发给了生物

  • 2018美日科学家因免疫治疗得诺贝尔生理医学奖-动图展示历年生理学奖

  • 一场大病引起的诺贝尔2017年生理学奖角逐

送书

在上周的留言送书活动中,恭喜下面这位读者获得书籍“Git:从入门到精通”,请及时与生信宝典编辑(shengxinbaodian)联系。

本文利用大数据探究了诺奖科学家论文发表、科研合作及颠覆性创新的工作模式和规律,发现诺奖科学家往往在年轻时就做出了令人侧目的研究成果,不过世界这么大,总有不在这个“规律”内的人事,小编在这提名2002年的诺贝尔化学奖得主田中耕一。这位大佬在43岁时获奖,彼时他只有学士学位,得知获奖消息时还正在公司加班……

看到这的您有什么感想呢?

欢迎转发朋友圈并留言评论,留言得赞最高者将获得下面的书籍(联系小编时请附上分享截图),结果在下一期送书活动中公布:

往期精品(点击图片直达文字对应教程)

后台回复“生信宝典福利第一波”获取教程合集

送书 | 获得诺贝尔奖之后影响力会下降?绘制精英科学家的职业生涯路线图相关推荐

  1. 获得诺贝尔奖之后影响力会下降?绘制精英科学家的职业生涯路线图

    导语 以诺贝尔奖得主为代表的精英科学家群体,引领了现代科学的发展方向,其学术生涯路线,对青年学者有启发意义.近日由国防科技大学李际超与美国西北大学王大顺.殷裔安及印第安纳大学Santo Fortuna ...

  2. 语义分割如何走下去?| 文末送书

    链接:https://www.zhihu.com/question/390783647 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 本人研究方向是语义分割(研一),但目前学习有些迷茫,目前感 ...

  3. 谁打败了浏览器之王?浏览器背后需要什么技术 ? (送书活动)

    前言 文末留言送书5本 Windows官宣:ie浏览器将于6月16日今天正式退役. 那个曾几何时的浏览器之王,经历一次又一次操作系统的迭代,直至新兴浏览器的出现后沦为浏览器鄙视链的最后一层,在叹息与嘲 ...

  4. 【送书】联邦学习在视觉领域的应用,揭秘2020年AAAI人工智能创新应用奖获奖案例!...

    联邦学习是如何应用在视觉领域的? 本文会通过一个获得了2020年AAAI人工智能创新应用奖(也是第一个基于联邦学习的人工智能工业级奖项)的案例来向大家介绍! 本案例是联邦学习在视觉.物联网.安防领域的 ...

  5. 干货丨深度迁移学习方法的基本思路(文末送书)

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  6. 博弈论:别人的想法(文末送书!)

    本文节选自<算法之美:指导工作与生活的算法> 中信出版集团,2018年05月出版 我是一个乐观主义者,我相信人类是高尚和可敬的,而且他们中的一些人真的很聪明--我对群体中的人有一些比较悲观 ...

  7. 送书 | 师妹越多,团队集体智慧越高,当占比80%时,达到巅峰

    最近,<哈佛商业评论>杂志采访了卡内基梅隆大学组织行为和理论学助理教授安妮塔·伍利和麻省理工斯隆管理学院Patrick J. McGovern管理学教席教授托马斯·马龙,他们的团队研究表明 ...

  8. 「文末送书」如何让数据分析不脱离业务?

    如果数据分析脱离业务,那么数据分析无任何意义,数据分析师或者数据分析部门于企业而言没有任何存在的价值. 这不仅是企业老板的想法,这也是所有业务部门的想法. 所以任何数据分析都要紧密贴切企业的业务,这看 ...

  9. 送书 | 哈佛大学单细胞课程:笔记汇总前篇

    经典赏析 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅综述:三 ...

最新文章

  1. oracle 10.2 64位,Oracle 10.2.0.5 x64升级到11.2.0.3 x64
  2. Windows XP下,JDK环境变量配置
  3. python语言入门p-python语言程序设计基础(第2版)课后答案嵩天
  4. Web运行控制台输出乱码解决总结
  5. 【OpenCV学习】brg转换hsv函数
  6. LeetCode 70. 爬楼梯(Climbing Stairs)
  7. django请求与响应(HttpRequest对象和HttpResponse对象)
  8. 深入学习jQuery选择器系列第四篇——过滤选择器之属性选择器
  9. MassTransit Get Started-
  10. SQL Server 查询性能优化——创建索引原则(一)
  11. Java ObjectOutputStream flush()方法与示例
  12. MS SQL 语法大全
  13. apache虚拟主机、日志轮询、日志统计、去版本优化
  14. 深入理解ButterKnife源码并掌握原理(二)
  15. Easy3D 样条曲线拟合
  16. 手电筒app制作实录
  17. 大话设计模式之爱你一万年:第八章 结构型模式:外观(门面)模式:冬天有你不再寒冷:2.外观模式之一键开关
  18. 洛谷P4767 [IOI2000]邮局(决策单调DP,四边形不等式优化)
  19. java jks 转pfx_证书pfx转换成jks
  20. JAVA毕设项目林家餐厅自助点餐管理系统(java+VUE+Mybatis+Maven+Mysql)

热门文章

  1. 【程序设计】变量名的命名原则
  2. Spring中的自动装配和Autowired
  3. android studio的 jar导入问题 ‘Android Studio Failed to Create MD5 hash for file’
  4. 英国科学家研究用AI预测地震:未来或提前一周预报
  5. jenkins即将重启问题
  6. 云计算已在大数据分析中发挥重要作用
  7. 场景服务只创建了 Service Difinition 和feature layer
  8. Windows Server 2012R2之重复数据删除实战
  9. Flume OOM 处理
  10. 教你制作U盘,内存卡,硬盘等等等的漂亮背景