曾有人通过数据造假,在最难忽悠的物理学界骗倒了一众学术大牛,甚至在《科学》、《自然》两大权威期刊上频频发表文章。

这个数据造假的高手就是德国的物理学家舍恩。

我们把镜头拉回到 2004 年。

2004 年,一位年轻的研究员惴惴不安的坐在巴黎一所大学物理学院的办公室里,对面的教授正在逐条过目着她的简历,思考着要不要给这个年轻人一个博士后的职位。

一番审核后,教授的目光停留在了 2001 年到 2002 年上,这本该是研究员最高产的博士生涯最后两年,可是现在呈现上在简历上的居然是完全的空白?

研究员似乎注意到了这点,她明白,如果没有一个合理的解释来说服教授的话,她的博士后职位怕是要泡汤了。于是她深吸了一口气,向教授解释道:「那时的我研究了铜镓硒的镀膜技术,就是扬·舍恩所研究的那种。

教授听完点点头表示理解,虽然简历是空白的,但是这并不能否认研究员在博士期间付出的努力,她仍然能够获得一个博士后的职位。

为什么一份空白的简历也能让研究员得到博士后职位呢?这就不得不提到我们故事的主角-扬·舍恩。这位欺骗了整个物理学界长达数十年的「天才」学者。

一、内向者舍恩

1997 年,年仅 27岁的扬·舍恩( Jan Hendrik Schön ) 带着他的博士学位走出德国最南端的康斯坦茨大学,加入了著名的贝尔实验室。

贝尔实验室

从未发表过世界最顶尖期刊 Nature 和 Science 的他,根本没有想过在接下来的四年里他会在这两个期刊以及其他顶尖期刊以第一作者的身份发表数十篇论文,最快的时候每 8 天就能发表一篇论文。也想不到他的研究也被 Science 评为 2001 年十大科技进展之首。更无法预料在短短一年之后,他的一系列重要突破被指造假。而一年之内,Nature,Science 撤回了他 15 篇论文,PRL 撤回了 6 篇他的论文。

他所获得的大奖被收回,博士学位被母校剥夺。在顶刊上如此大规模的造假直接引起了学界对同行评审制度的质疑。其影响之大,之深远,一直被认为是 50 年内物理学界最大的污点。而舍恩的造假方式,仅仅只是修改了一些数据,让他的结果看起来更符合人们对于这个实验期待。

事发后的 Jan Hendrik Schön

舍恩的投机取巧,可以从他的青年时代说起。

1970 年,舍恩出生在在德国阿勒尔河畔的费尔登,母亲再婚后随继父前往奥地利生活,舍恩的幼年时期是和祖父母一起度过的。稍微年长后,十六岁的舍恩去往奥地利于养母于继父在一个三国交界的小镇一起居住,也因此逃避了兵役。随后,避开兵役的舍恩回到德国,进入康斯坦茨大学攻读物理学学位。

尽管辗转多地,这位年轻的孩子依旧有着德国人独有的气质,彬彬有礼又沉着冷静。在本科学习期间,舍恩展现出了对物理学知识强大的记忆力。在被问到物理学问题时,他总能迅速给出正确答案,然后完美的复述出相关的公式。

根据他的本科同学回忆:「舍恩也从来不参加争论,他总是在需要发言的时候给出适当的回答,一句不多,一句不少。「」

这低调的性格伴随了舍恩很长一段时间,他完成本硕学习后进入德国知名的太阳能电池学家 Ernst Bucher 实验室攻读博士学位后,Ernst Bucher 给他的评价也是:「他(舍恩)用永远不和我争论,一直是那么谦卑,无论我说什么,他都只会说对,对,对。」

Ernst Bucher 教授是康斯坦茨大学知名的太阳能学者,由于二十世纪九十年代环保主义的兴起,德国为了在新能源领域抢占先机,投入了大量的资金研究太阳能技术,而 Ernst Bucher 是相关领域的执牛耳者。Ernst Bucher 在瑞士的大学和美国的贝尔实验室都工作过,在两国有着一定的影响力。因为母亲是英语教师而从小就学习英语的舍恩,一开始就想加入 Ernst Bucher 的团队以获得去英语国家深造的机会。

在攻读博士之前,舍恩就在 Ernst Bucher 进行过短期的学术训练,当时他的任务是使用实验室现成的计算机代码计算金属氧化物对阳光的吸收率。他小心翼翼的记录着所有的数据,这时的他对编造和篡改数据没有任何的概念,完全没有想过通过舍弃几个异常值或者更改几个不那么「完美」的数据来让自己的论文产出更加顺利。通过出色完成自己的硕士学习,他也拿了 Ernst Bucher 实验室的博士入场券。

那时,没人能想到这样一个低调,喜欢团队运动,甚至有点木讷的男孩子,几年后居然通过学术造假将整个物理学界弄的天翻地覆。Ernst Bucher 在事情败露后接受记者采访时,拿出了舍恩在他实验室的第一份实验报告。并指出了舍恩实验报告图表中一个明显的异常值(outlier),并告诉记者这种因为样品混入杂物的异常值最后肯定会被移除的,可舍恩还是一丝不苟的记录的下来。然而就是这样一个孩子居然在几年内就成为了一个编造完美数据的造假者。

博士学习期间,舍恩的工作是将实验室师兄留下来的一种铜镓硒(copper, gallium, selenide, 又称 CGS)的材料通过修饰和加工,从 P 型半导体变为 N 型半导体,从而运用到太阳能的转化设备中。由于整个实验室除了他之外的所有人都专注在硅的研究,这让研究 CGS 的他显得格格不入。这种无形之中的孤立让他直到毕业都没有完成这项任务,但这并不代表舍恩的博士生涯是一事无成的。

恰恰相反,舍恩在博士期间一共发表了 24 篇论文,以至于导师在他没能成功完成博士课题的情况依旧让他毕业。这时候的舍恩已经开始造假了么?因为时间太过久远,相关的文献资料已经无法查证了。但是可以肯定的是,舍恩的第一次学术不端行为,就发生在他的博士阶段。

在博士研究的初期,舍恩负责的工作还比较简单,所以这时的他还不在乎在展示数据的时候算入异常值。而随着研究的深入,他慢慢的开始发现,自己通过测量后分析得出的结果往往与别人报道的理论值有很大的偏差。在一开始的一个研究 CGS 能量密度的实验中,舍恩采集多个数据点后,试图通过拟合得出曲线和公式,然后用公式得出的计算结果与文献的能量密度进行对比。

可舍恩发现自己得出来的数据总是低于 1987 年的一篇论文。显然,那时的他没有能力解决这个问题,而他的实验室同僚们也没有研究 CGS 的经验。可是为了发表论文,符合文献数据的计算结果是必要的。怎么能够通过自己的努力获得合理的数据呢?其实说来也很简单,舍恩决定使用不是自己数据拟合出来的曲线来进行计算,也就是编造实验数据,通过这样的方式舍恩轻而易举的得到了文献中报道的结果。

而这,也许是舍恩的第一次取巧。

python收集论文数据造假_现在的学术论文里存在数据造假的情况吗?相关推荐

  1. 论文写作课堂总结4:学术论文写作中的语法问题

    论文写作课堂总结4:学术论文写作中的语法问题 在课上,闵老师讲解了实用的两种方式来在学术论文写作中规避可能的语法问题 1.借鉴法 简单说,就是多阅读顶刊论文,仔细阅读后总结出在顶刊学术论文中常使用到的 ...

  2. excel 两组数据交点_【如何写论文系列之 SPSS数据分析】独立样本 t 检验

    今天我们来介绍一种研究中使用最为广泛的数据分析方法--独立样本 t 检验.为什么说独立样本 t 检验是使用最为广泛的方法呢?这要从我们研究设计开始说起,研究一般是建立在发明了一种新方法,对于一部分研究 ...

  3. python爬虫爬网站数据登录_使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)...

    urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...

  4. 在珠海python工资一般多少钱_珠海学习BI工资多少,大数据的应用

    珠海学习BI工资多少 深圳傲翔数据网络科技有限公司是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDALEVELⅠ,LEVELⅡ,LEVELⅢ,涉及金融.电商.互联网.电信等行业大数据及数据 ...

  5. python编程语言排行曲线绘制_最新编程语言排名(TIOBE)-数据抓取及绘图(使用Python)...

    本章数据分析的主要步骤: 1.从网上获取公开数据:html 网页 2.读取html中表格数据 3.数据清洗和整理 4.数据绘图与可视化 5.保存绘图 接下来进行详细的说明 1.从网上获取公开数据:ht ...

  6. Nature论文爆出千行Python代码Bug,或影响百篇学术论文

    你的论文借鉴了 Nature 文章的代码?对不起,论文可能要重新写了. 在 10 月 8 日发表于<ACS Publication>期刊的一篇论文中,来自夏威夷大学的 Jayanti Bh ...

  7. modis数据介绍_【更新90篇】地理数据科学技术文章合集,欢迎大家点赞、在看、转发三连!...

    最近因微信公众号修改了规则, 不将公众号标星可能无法及时收到推送, 还请大家把"走天涯徐小洋地理数据科学"加个星标. 公众号技术文章合集目录,目前已整理以下8个部分,共计90篇文章 ...

  8. 对数据仓库进行数据建模_确定是否可以对您的数据进行建模

    对数据仓库进行数据建模 Some data sets are just not meant to have the geospatial representation that can be clus ...

  9. influxdb数据过期_为什么腾讯QQ的大数据平台选择了InfluxDB数据库?

    导读:本文带你了解一个开源的.高性能的时序型数据库--InfluxDB. 作者:韩健 来源:华章科技 00 为什么QQ要选择InfluxDB? 从2016年起,笔者在腾讯公司负责QQ后台的海量服务分布 ...

最新文章

  1. GD32F103内部Flash做虚拟U盘
  2. 人工智能 | 自动驾驶与人工智能前沿研究报告(概念篇)
  3. 云服务器端口对外开放详解
  4. 用vi在linux下查看16进制文件
  5. python 爬虫程序示例,python实现简单爬虫功能的示例
  6. C#算法设计排序篇之01-冒泡排序(附带动画演示程序)
  7. php解析markdown前端渲染,Vuejs使用 vue-markdown 来渲染评论方法
  8. UVA11063 B2-Sequence【序列】
  9. PHP如果查询结果为空,php – 如果子查询的结果为NULL,则整个查询失败
  10. WordPress出现循环重定向解决办法
  11. python程序与设计课程设计二级减速器_二级减速器课程设计心得体会
  12. 怎么在matlab里分析房价,房价问题 附带MATLAB程序 数学建模.doc
  13. unity3d 虚拟博物馆_基于Unity3d的博物馆移动信息化系统
  14. 工信部发布八项互联网新通用顶级域名服务技术要求
  15. html标题(heading)
  16. [业界资讯]Ubuntu 2010“雪地猞猁”最新进展
  17. 古墓丽影10linux,《古墓丽影11:暗影》Linux平台与Windows平台流畅度对比
  18. bch verilog代码_基于FPGA的多进制BCH编码
  19. 数据库MySQL系统实操实验从安装系统到实际操作全过程,五万字系列五,这不直接学完去学校装杯?
  20. DUL Oracle Data Unloader工具下载

热门文章

  1. 1250. 格子游戏
  2. python 经典脚本文件_Python3.5文件读与写操作经典实例详解
  3. 戴尔灵越15 Plus,到底值不值得入手?
  4. informatica 中SQ组件有那些功能?
  5. 民族证券午评:成交萎缩,延续调整格局
  6. [现代控制理论]3_Phase_portrait 相图 相轨迹
  7. 为什么会出现雷粉?他们为什么会流失?怎样维护和粉丝之间的关系?
  8. 获取手机号码,和IMEI 获取本地iphone手机号码
  9. 笔记本在卸载oracle就蓝屏了,导致笔记本电脑蓝屏原因 导致笔记本电脑蓝屏解决方法【详解】...
  10. 航海世纪提示服务器维护中,《航海世纪》3月31日维护公告