“我想上百度去找找数据写篇论文。”

“你哈佛大学的?”

从全球最好的大学之一,到民间口碑大翻车的“野鸡团队”,哈佛大学只花了一晚上的时间。

谁也没想到,权威QS全球大学排名的2021版刚刚公布,赫然排在第三名的哈佛大学,竟然写了一篇“千古奇文”,然后被百度打脸了。

近段时间,BLM运动在美国各地爆发,一度有愈演愈烈的趋势。

而全球疫情形势依然严峻,其中美国确诊达200余万例,死亡超11余万例。

与此同时,川普的支持率也一路下滑。

于是,他再次使出了甩锅大法——火速转发了一则福克斯新闻:

 “哈佛大学最新研究:武汉2019年8月就开始疫情蔓延了 !”

甩锅大法的效果明显,一时之间,美国广播公司、美国CNN、路透社、英国BBC等一众西方主流媒体也火速跟进。

“武汉8月就有疫情蔓延”,这比目前发现病毒的时间整整早了一个季度。

病毒的“中国起源论”再次迅速在境外疯狂传播,甚至很多人深信不疑。

为什么这么多人会对这篇论文深信不疑呢?

因为它真的来自于世界顶尖学府哈佛大学的医学院。

6月8日,哈佛大学医学院在其学术社区平台“DASH”公布了一篇论文,标题就是《武汉在2019年秋天就可能有(新冠)病毒迹象》。

乍一看,这篇论文洋洋洒洒好几页,似乎有理有据。

但仔细看过后,相信每个人都会忍不住表示怀疑:

这满篇的低级漏洞是在侮辱我们的智商吗?

这篇论文正文一共4页,数据集两页,开篇就让人虎躯一震。

研究团队表示,他们这次另辟蹊径,打算用医院的车辆密度和病毒症状的网络搜索指数,来讨论武汉是不是有潜在的新冠疫情爆发前兆。

于是,他们分析了100多张武汉6家医院停车场的图片,以及百度搜索引擎搜出来的“腹泻”“咳嗽”等词数量。

最后,他们断定,早在2019年秋季甚至8月,武汉就出现了一些异常。

......

疫情蔓延 > 去医院的人增多 > 相关症状搜索词增多,你说这逻辑没问题,那就暂且当它没问题。

首先,哈佛甩出的“证据”就是武汉六家医院停车场的车辆状况。

下图中的黄线,可以看做是从2018年1月至今的医院停车场车辆数量的趋势图。

图中显示,从2019年8月开始,这条黄线开始上扬。

然后,哈佛便以此得出了结论:8月开始武汉的病人变多了。

当然,为了力证那段时间病人增多,他们还给出了停车场的卫星对比图,图片上还细心地将车辆标注为红点。

然而,这些卫星图的拍摄时间有的是工作日,有的是周末,有的是上午,有的是下午。

去过医院的中国老百姓都知道,医院每天不同时段的诊量有所不同。

所以,在不同的时段计算医院停车场车辆数,根本没有任何说服力。

更何况,这组对比图不仅拍摄时间段不同,就连拍摄角度都是不一样的......

也就是说,哈佛医学院团队用了不同的样本数据和不同的参考标准,来强行拼凑了一组对比。

在路透社的报道中,两名英国的专家也称结论可能没有什么意义。

另一名专家也指出,论文拿湖北妇幼保健院来说事也存在问题,因为儿童更容易因感冒而出现症状,而不是新冠肺炎。

说实话,这种低级错误,不仅连同行的学者看不下去,而且大概连大学本科论文都过不了吧.....

退一万步讲,不论停车场的对照数据是否有偏差,光是以医院停车场车辆数量变化来证明病人的增减这个逻辑,就已经很牵强了。

医院停车场的车,就一定是病人的了吗?

但是,这篇报告还没完。

研究团队接着抛出了第二个证据:

他们声称查询了2017年4月至2020年5月的“咳嗽” 和 “腹泻”的搜索量数据,发现 “腹泻”的搜索量在2019年8月有了提升。

因此,他们得出“应该是8月武汉出现了新冠病毒的相应症状”的结论。

但是,论文图标给出的数据区间,并非2017年4月至2020年5月,而是从2018年5月开始的。

为啥不把说好的2017年的数据放进来呢?

因为,如果将2017年的数据纳入,你会发现2017年和2018年同期的检索量均有猛增。

按照哈佛的逻辑,2017年秋武汉“应该”就已经有新冠病毒迹象了。

而如果把武汉切换成全国,你还会发现全中国在那个时候,这个词的搜索热度都有上升。

所以说,按照哈佛的说法,全中国在那时候疫情都已经蔓延了。

最后,这篇粗制滥造、漏洞百出,简直是砸哈佛大学医学院牌子的论文,就连意外被碰瓷的百度也看不下去了。

“这丫的写论文也太不严谨了,是不是想讹我广告费啊?”

6月11日,百度紧急回应:

从武汉医院附近交通车流量和百度上关于“咳嗽”与“腹泻”的搜索数据来得出关于病毒的结论,这是非常牵强和不严谨的。

百度表示,事实上,武汉地区“咳嗽”的整体搜索量峰值跟每年的流感季是吻合的,而“腹泻”的搜索量与往年相比并没有明显变化。

根据百度指数显示,2019年12月左右“腹泻”搜索量还有轻微的下降。

这你总不能说新冠病毒不治而愈、自己就消失了吧?

世卫组织回应称,不能对医院停车场汽车数量的变化做过多解读,然后“跳跃”两三个推论将此同新冠肺炎疫情相联系。

国家卫健委防控新冠肺炎高级别专家曾光则表示,该论文漏洞百出,可以作为大数据流行病学教学的反面教材。

总之,哈佛这篇论文正好就是“开局一张图,内容全靠编”的套路。

比起医学研究报告,它更像是一篇生编硬凑的命题作文。

最重要的是,这篇论文根本还没有经过同行评审,就已经被媒体争先转发奉若宝典。

而论文的作者之一John S.Brownstein,其本人就是ABC新闻的的撰稿人。

是炒作甩锅,还是真的在为抗击疫情调查事实真相,一目了然。

这篇论文,现在还挂在某些欧美主流媒体的网站上,包括百度这家中国最大搜索引擎的名字。

而在这次事件中,天降黑锅的百度不得不说是有点“冤”。

估计百度也没想到,哈佛大学还会有用自家搜索写论文的一天。

2020年,真的是很魔幻的一年。

哈佛大学通过百度搜索的数据写了篇论文:新冠病毒起源于去年8月的武汉...相关推荐

  1. CnOpenData全国小区新冠病毒确诊病例数数据

    一.数据简介 2019年末爆发的新冠疫情是百年来传播速度最快.感染范围最广.防控难度最大的一次重大突发公共卫生事件,而最早遭受这一重大危机冲击与考验的中国,以上下一心.众志成城的魄力和行动最早阻断了疫 ...

  2. 百度搜索大数据:“摆摊技巧”搜索热度暴涨655%;中国电信:将逐步关闭3G网络业务;IntelliJ IDEA新版发布|极客头条...

    整理 | 屠敏 头图 | CSDN 下载自东方 IC 快来收听极客头条音频版吧,智能播报由出门问问「魔音工坊」提供技术支持. 「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极 ...

  3. 基于跨国人口流动数据的新冠病毒传播途径分析

    来源:运筹OR帷幄 本文约5500字,建议阅读5分钟. 本文通过建立跨国航空网络数据基础上的空间-时间动态模型,分析过去三个月新冠病毒在国家人口流动与国家感染增长方面的关联. [ 导读 ]本文通过建立 ...

  4. [转载] python+selenium定时爬取丁香园的新冠病毒每天的数据,并制作出类似的地图(部署到云服务器)

    参考链接: Python vars() python+selenium定时爬取丁香园的新冠病毒每天的数据,并制作出类似的地图(部署到云服务器) 声明:仅供技术交流,请勿用于非法用途,如有其它非法用途造 ...

  5. 使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少?

    使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少? ChatGpt一经发布就大火,迅速应用在各个领域,尤其在程序圈自动帮我们写代码着实是圈了一大波粉.那么它用在科研领域会出现怎样的效果呢, ...

  6. python+selenium定时爬取丁香园的新冠病毒每天的数据,并制作出类似的地图(部署到云服务器)

    python+selenium定时爬取丁香园的新冠病毒每天的数据,并制作出类似的地图(部署到云服务器) 声明:仅供技术交流,请勿用于非法用途,如有其它非法用途造成损失,和本博客无关 目录 python ...

  7. python新冠病毒COVID-19数据分析和数据可视化

    在全球范围内,截至2021 年 11 月 15 日欧洲中部时间下午 4:30,各国已向世卫组织报告了253,163,330(2.5亿)例COVID-19确诊病例,包括5,098,174(5百万)例死亡 ...

  8. 数据看世界|9幅动态图5个数据指标带你了解新冠肺炎的全球现状!!

    点击上方 蓝字 关注我们 PS:本来小编是打算全部都放动态图的,奈何动态图太大,超过了公众号正篇文章不超过10M的限制,所以小编就只能放静态图了,如果大家需要动态图,文末有动态图领取方式. 随着冬季气 ...

  9. 这一年人们都在搜索什么?谷歌发布2020年度搜索热榜,「新冠病毒」高居榜首

    CDA数据分析师 出品 编译:Mika [导读]谷歌发布2020年的搜索热榜!来看看今年大家都在关心什么吧. 当感到疑惑.不确定时,人们就会去寻找答案.如今遇到这种情况,只需将问题输入搜索引擎即可. ...

最新文章

  1. 使用Visual Studio 2019开发Qt程序
  2. windows server 2012多用户用一个账号同时登陆
  3. 标准库函数、系统调用的区别
  4. C#中控制线程池的执行顺序
  5. 算法题目——杨辉三角问题
  6. 开滦二中2021高考成绩查询,2021年唐山查询中考成绩
  7. Spark 原理 —— 从 akka 到 spark 集群的启动
  8. python操作数据库的几种方法_Python操作MySQL数据库的三种方法总结
  9. volatile的总结
  10. JAVA调用百度OCR实现身份证识别
  11. 订单页面添加收货地址html,添加收货地址展示
  12. wifi6无线网卡驱动linux,linux2.6.8内核装intel wifi link 5100无线网卡驱动的问题?
  13. 带权图上的三个问题--最短路问题、中国邮递员问题与货郎担问题
  14. 光缆定位仪光衰点定位光纤识别方法
  15. python header是啥_Python爬虫之Header
  16. 去除字符串首尾的空白字符
  17. LOJ10064黑暗城堡
  18. TJOI 2015 弦论 题解
  19. 基于Java Web的在线考试系统的实现
  20. G003-182-18组

热门文章

  1. 【怎样写代码】确保对象的唯一性 -- 单例模式(一):问题案例
  2. 【通俗理解线性代数】 -- 特殊的矩阵
  3. Matlab数据的可视化 -- 线性图函数plot
  4. Hadoop运行模式 之 伪分布式运行模式
  5. mysql8.0取消授权_mysql8创建用户、删除用户、授权、取消授权
  6. 收藏喜+1!值得使用的100个Python小技巧
  7. 快收藏!整理了 100 个 Python 小技巧
  8. 总点第一个视频产生选择偏差?Youtube用“浅塔”来纠正
  9. 2019世界机器人大赛圆满落幕,荆州中学等15支队伍获「全能奖」
  10. 打造AI产教融合共赢生态,微软亚洲研究院扩大开放了这些资源