David Rothschild是微软纽约研究院一名经济学家, 2013年,他猜中了奥斯卡全部24个奖项中19个的归属;今年奥斯卡他进一步发威,猜中了21项奥斯卡奖!是不是以后就不用蹲守在电视机前忍受主持人卖关子了,提前看看David Rothschild的预测,就把奥斯卡获奖名单预见个八九不离十了?

  他不止预测奥斯卡。在2012年的总统大选中,他成功猜对了51个选区中的50个区的结果,准确率高达98%,现在他在网站上主要发布体育和政治方面的预测。Rothschild很少失手,因为他有个杀手锏叫“大数据”。

  预测有多神?


  精确到百分比,一眼看出谁输谁赢


  Rothschild用百分比表达预测成真的可能性。来看看之前他对今年几个奥斯卡重要奖项的预测吧,得票最高的分别为:

  最佳影片:《为奴十二年》,88.7%

  最佳导演:阿方索·卡隆(《地心引力》),  97.6%

  最佳男主角:马修·麦康纳(《达拉斯买家俱乐部》),  90.9%

  最佳女主角:凯特·布兰切特 (《蓝色茉莉》), 99.2%

  最佳男配角:杰瑞德·莱托 (《达拉斯买家俱乐部》),97.9%

  最佳女配角:露皮塔·尼永奥 (《为奴十二年》),60.1%

  从他的统计结果来看,阿方索·卡隆拿下最佳导演奖是板上钉钉;但有些奖也有不定因素,比如《她》和《美国骗局》获最佳原创剧本奖的概率分别是56.3%和41.8%,咬得相当紧,不过这一项他还是猜对了。

  怎么办到的?


  收集大数据,不断更新模型


  在网络时代,每个人都会在互联网上留下痕迹,几何级的数据正在构建出一个新的世界。高明的政客、风投者、互联网大佬,无不动用大数据为自己指明前进方向。Rothschild的通用预测方法是关注四个领域的数据:投票数据、预测市场数据、基本数据和用户产生的数据,对于奥斯卡,则主要关注投票数据和用户数据。这些数据来自哪?博彩网站、好莱坞证券交易所、各个前哨奖项、公开的用户数据等等,然后建立极其复杂的数据模型,并且不断更新数据、校正误差、升级模型。
  所以,Rothschild的预测跟明星、影迷们的预测都不同,他不掺杂任何私人趣味,纯粹以数据说话。
  他还跟微软团队联合开发了一款Excel应用——Oscars Ballot Predictor(奥斯卡投票预测器),用户可以实时记录和查看奥斯卡奖预测。这也帮助团队实现了动态挖掘。今年是Rothschild第二次预测奥斯卡,相比2013年的预测,他修正了许多技术和方法,所以结果更加精准了。
  想不到吧?看似主观的奥斯卡评选其实也可以“算”出来!

转载于:https://my.oschina.net/u/1160813/blog/204992

大数据预言帝现身 猜奥斯卡奖24中21相关推荐

  1. 《大数据》杂志——大数据技术发展的十个前沿方向(中)

    大数据技术发展的十个前沿方向(中) 吴甘沙 英特尔中国研究院 doi:10.11959/j.issn.2096-0271.2015034 Ten Fronties for Big Data Techn ...

  2. dataframe数组做元素_大数据技术之使用 DataFrame 读取复杂 JSON 中的嵌套数组

    本篇教程探讨了大数据技术之使用 DataFrame 读取复杂 JSON 中的嵌套数组,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入. 众所周知,在早期Spark版本中就已经支持 ...

  3. 博士申请 | 英国华威大学计算机大数据团队招收数据挖掘方向全奖博士生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! University of Warwick 华威大学(University ...

  4. linux执行class文件_「大数据干货」Windows系统和Linux系统中打jar包与导入语句剖析...

    Jar包是Java中的压缩包格式,同Zip格式一样,用来对.class文件统一管理,如下是在Windows系统和Linux系统中不同的打包和执行.class程序的过程. windows: Linux: ...

  5. 关于大数据相关的问答汇总,持续更新中~

    NO.1 想要学好大数据需掌握哪些技术? 答:1,Java编程技术 Java编程技术是大数据学习的基础,Java是一种强类型语言,拥有极高的跨平台能力,可以编写桌面应用程序.Web应用程序.分布式系统 ...

  6. 大数据未来产业的爆发,主要会集中在哪几个方面?

    1.工业企业上云引爆工业APP市场 2017年以来,伴随着工业互联网概念的提出,工业企业上云和工业APP开发成为热点词汇.我国工业领域的云化水平较低,在上云企业数量的广度和企业在云端部署的深度两个维度 ...

  7. 新媒体大数据在线课堂第一讲《危机事件中的舆论引导》课堂笔记

    3月28日10时,由蜜度信息联合政务新媒体学院主办的--新媒体大数据在线课堂正式开课.首期在线课堂邀请上海社科院社会科学大数据实验室主任张雪魁老师讲授,主题是<危机事件中的舆论引导>.以下 ...

  8. spring boot整合scala和spark做大数据预言

    原来用jetty 和 restful 做过驱动spark的计算框架,最近想用spring boot +scala + spark 重新做一个,一下是pom.xml 和代码分享 pom.xml < ...

  9. 【大数据】带你理解并使用flink中的Time、Window(窗口)、Windows Function(窗口函数)

    提醒:本文的示例代码基于flink1.13,在讲window的使用时也会说明flink版本一些api的弃用情况. 文章目录 一.Time的简介 二.Window的概念 三.Window的类型 1.分类 ...

最新文章

  1. linux设备驱动归纳总结(四):1.进程管理的相关概念【转】
  2. java正则hitend,Java Matcher hitEnd()用法及代码示例
  3. VMware 虚拟机 1、ubuntu 扩容(扩展硬盘容量)2、修改内存大小
  4. vm显示打不开 /dev/vmmon:Broken pipe
  5. 实例对象静态对象实例方法静态方法
  6. 1.2.1 计算机网络的分层结构、协议、服务和接口
  7. intellij idea操作maven时控制台中文乱码
  8. ASP 判断Session变量是否存在的4种方法
  9. 2.3基本算法之递归变递推_3525上台阶 python
  10. Oracle中删除重复记录
  11. UE5 使用Spine插件
  12. python交通流预测算法_(5)基于深度学习的短时道路交通流预测
  13. python整行列匹配,python-熊猫将行与列值匹配
  14. Codeforces--1311A--Duff and Weight Lifting
  15. 【转】Ubuntu常用软件合集
  16. 忆贵州三年的教书编程岁月:不弛于空想,不骛于虚声
  17. C#   格式化XML方法
  18. 4.2 人工智能产业岗位分布
  19. windows下安装GVM
  20. 服务器运维技术-02 Linux基本使用

热门文章

  1. 苏州移动实习二面惨痛教训
  2. 100道经典算法题(76-100)
  3. linux系统怎么学习
  4. 五分钟让你搞懂Nginx负载均衡原理及四种负载均衡算法
  5. 黑马学成在线项目之Day4实战
  6. 天梯赛自主练习4补题 (如果20年去打有机会拿国二吧,国一不太可能,最后俩题都好难啊)
  7. Oracle数仓分区表创建及其数据清理存储过程
  8. httpclient302错误
  9. java中int的取值范围是多少
  10. 中继器与集线器的纠葛,CSMA/CD的“微微无能”