2018年世界杯开幕在即,谁会赢得最后的冠军?机器学习预测是巴西,而统计方法则认为德国会赢。

3天后,2018年俄罗斯世界杯开打,首场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日拉开序幕。

每届世界杯最受关注的当属决赛,上届2014年巴西世界杯,东道主巴西队意外爆冷,只获得第四名,无缘决赛。今年的世界杯,不少机构/研究人员给出预测:德国将和巴西争夺冠军,并且,巴西队夺冠的概率更大些。

综合各种预测和民意调查,冠军几乎肯定在巴西、德国和阿根廷之间展开,虽然强强争锋喜闻乐见,但似乎也少了些惊喜。

机器学习和大数据的方法正越来越多地被用在比赛结果预测上,不仅是世界杯,也不仅是结果,球队组成、战术选择和球员训练都已经开始见到机器学习的身影。对于球迷和观众而言,人工智能也将展开一种全新的参与/观看体育赛事的体验。

机器学习预测结果:巴西获得冠军

肯尼亚的投资银行Genghis Capital Investment Bank的投资银行分析师Gerald Muriuki,日前在Medium上公布了他使用机器学习预测FIFA 2018的结果——巴西将赢得冠军。

这一结果跟微软的AI和数据科学专家Sorin Peste的预测结果一致。

实际上,预测世界杯冠军是一个典型的机器学习问题,你首先预测每场比赛的获胜者,接着再预测小组赛、半决赛和决赛的冠军。在这个过程中,你需要进行数据整合、特征建模和结果预测。因此,很多机器学习或数据科学家,都做过类似的项目。

Muriuki和Peste两个人都是根据足球比赛的历史数据,建立机器学习模型,模拟比赛,并预测这些比赛的结果。下面我们分别来看看。

使用逻辑回归进行预测

Muriuki使用了两个来自Kaggle的数据集,包含了从1872年到2017年国际足球比赛的结果。他先分析了两个数据集,做了一些特征工程,选择跟2018年世界杯最相关的特征进行预测,再足控了一些数据增强。

在模型的选择上,Muriuki用的是逻辑回归,一种分类器算法。逻辑回归通过使用逻辑函数预估概率,从而衡量分类因变量和一个或多个自变量之间的关系。简单说,给定一组相关的数据后,逻辑回归能够预测结果(在世界杯的情况下,就是预测是输还是赢)。

这是他的模型预测最初几场比赛的结果:俄罗斯vs沙特,俄罗斯胜利;乌拉圭vs埃及,乌拉圭胜利;伊朗vs摩洛哥,平局。4天以后就可以验证这个结果是对还是错了。

16强的结果是这样的:

四分之一决赛将在葡萄牙vs巴西,以及德国vs阿根廷之间展开。

最终巴西vs德国,巴西获胜。

使用随机森林进行预测

另一方面,微软的AI和数据科学专家Sorin Peste的预测过程则更加完善。在数据的选择上,除了历年世界杯结果,Peste还使用了欧洲杯、奥运会等大型比赛的数据,以及这些比赛的胜率分布。

此外,Peste还考虑了比赛的地址,也即是在主场、客场还是在双方都无关的中立场所,以及比赛是否“friendly”,在踢friendly比赛时,目的不是为了赢球,而是为了观察对手的球员和策略。

在模型的选择上,Peste用的是随机森林(深度500),一种根据呈现给它的特征生成多个决策树的算法,并且每个单独的树对每个新输入向量的结果“投票”。随机森林的速度快,相当准确,可以对泛化误差进行无偏估计,因此不需要交叉验证。

下图展示了迭代1000次后的结果,巴西获胜,阿根廷第二。

统计的方法:德国战车险胜巴西

当然,除了机器学习,还有更多预测是使用大数据方法。KDnuggets上一位狂热球迷用统计的方法,预测德国队会夺冠。他的操作步骤如下:

收集信息:

国际足联世界排名:这是所有211支国家足球队的排名系统。使用积分系统,积分是基于所有FIFA认可的国际比赛的结果。然而,这并不是最好的系统,而且有很多缺点。

Elo评级:该系统最初是为国际象棋联合会FIDE开发的,目的是给棋手打分。它的复杂矩阵根据比赛的类型分配点数,并考虑到双方的净胜球差异。它和国际足联的主要不同之处在于,它也统计了友谊赛的数量。

TransferMarkt team value:这个总部位于德国的网站提供了关于足球各个方面的信息,包括每个知名球员的估计市值。他们列出了参与国的名单和他们的团队价值。

投注赔率:使用投注比较网站OddsChecker,采用每个国家最慷慨的赔率。

TransferMarkt的数字是欧元,而FIFA和Elo有他们自己的评级系统,投注赔率是分数。作者将每一个系统都标准化,使它们具有可比性。在统计中,标准分数(也称为z分数/值,正常分数或标准化值)是数值与平均值不同的标准偏差数。

2018年世界杯,四个流行的预测来源

KDnuggets预测的z分数

如果KDnuggets的预测是正确的,那么世界杯小组赛的结果会是下面这样的:

研究结果引出了一些有趣的结论:

  • 德国排名第一,但仅略高于巴西。紧随其后的是西班牙和法国。

  • Elo排名系统和投注几率看起来最相似,都列出了相同的前五名(上面提到的四个球队和阿根廷)。

  • 在整个体系中有一些鲜明的对比,其中最引人注目的是秘鲁在国际足联(FIFA)和Elo排名中z分数都排在第10位,而在TrasferMarkt的球队价值排名却在第30位。

民意调查:德国、巴西、阿根廷最受欢迎

除了KDnuggets上的预测,还有诸多世界杯赛前的其他预测:

《每日电讯报》对每支球队进行了广泛的分析,最后进行了一项投票,让读者预测冠军,投票结果如下:

此外,据中新网报道,俄罗斯彼尔姆国立研究大学学生维克多•扎科派洛建立了一个能预测2018年世界杯冠军的神经网络,神经网络综合各项参数进行分析计算后得出结论称,世界杯前三名将是德国队、巴西队和阿根廷队。

四年前,巴西在家门口以1:7输给了德国队,创下了自1920年0:6输给乌拉圭以来最大的世界杯输球记录,震惊全国人民。最终,德国队夺得了当年的世界杯冠军。

今年的俄罗斯世界杯,诸多机构预测巴西和德国将上演冠军大战。巴西能否一雪前耻,德国能否成功卫冕?我们拭目以待。

资料来源:

1、Muriuki逻辑回归预测:https://medium.com/@itsmuriuki/predicting-fifa-world-cup-2018-using-machine-learning-dc07ad8dd576

2、Peste随机森林预测(附代码):https://notebooks.azure.com/sorinpeste/libraries/footballpred/html/worldcup.ipynb

3、统计预测结果:https://www.kdnuggets.com/2018/06/football-world-cup-predictions.html

4、基于Elo的世界杯预测模型:https://arxiv.org/pdf/1806.01930.pdf

∞∞∞∞∞

IT派 - {技术青年圈}持续关注互联网、区块链、人工智能领域

公众号回复“机器学习”,

邀你加入{ IT派AI机器学习群 }

机器学习预测世界杯球队冠相关推荐

  1. 机器学习预测世界杯:巴西夺冠

      新智元报道   来源:Medium,Github,KDnuggets等 [导读]2018年世界杯开幕在即,谁会赢得最后的冠军?机器学习预测是巴西,而统计方法则认为德国会赢. 3天后,2018年俄罗 ...

  2. Python!使用机器学习预测2022世界杯

    使用机器学习预测2022世界杯 文章目录 使用机器学习预测2022世界杯 项目说明 数据集说明 1872年至2022年国际足球成绩 国际足联世界排名1992-2022 数据分析及预处理 对1872年至 ...

  3. #Python #2022卡塔尔世界杯 #FIFA World Cup Qatar 2022 # 机器学习 #数据分析 用Python预测世界杯决赛

    今天2022年11月29日的凌晨,葡萄牙队2比0获击败乌拉圭队!葡萄牙队提前晋级16强,你熬夜看这场比赛了吗? 今天晚上11点荷兰将对战卡塔尔,NED(荷兰)有望取胜! 现在让我们通过Python数据 ...

  4. #世界杯征文活动 #Python #2022卡塔尔世界杯 #FIFA World Cup Qatar 2022 # 机器学习 #数据分析 用Python预测世界杯决赛

    今天2022年11月29日的凌晨,葡萄牙队2比0获击败乌拉圭队!葡萄牙队提前晋级16强,你熬夜看这场比赛了吗? 今天晚上11点荷兰将对战卡塔尔,NED(荷兰)有望取胜! 现在让我们通过Python数据 ...

  5. 使用机器学习预测2018年世界杯足球赛

    2018年世界杯正进行的如火如荼,日本.塞内加尔相继爆冷战胜了强大的对手,东道主俄罗斯依旧保持开挂状态,碾压拥有萨拉赫的埃及队,豪取两连胜.在足球的世界里,没有强者恒强的定律,这或许也是足球的魅力所在 ...

  6. ML之预测:玩转2018世界杯—采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

    ML之预测:玩转2018世界杯-采用机器学习预测小组赛.十六比赛.四决赛.半决赛.决赛以及世界杯总冠军的各个队伍 导读       机器学习预测.玩转2018世界杯-采用机器学习预测小组赛.十六比赛. ...

  7. 2018世界杯球队热度CGI榜:大数据预测巴西、法国成夺冠热门

    2018世界杯赛程已过半,在各种爆冷和黑马横飞之中,球迷们目送卫冕冠军德国队带着几百斤土豆离开了俄罗斯,也为梅西和C罗的离去在天台久久徘徊.在各种实力排行榜都被推翻后,球迷们苦于找不到一个依据来预测今 ...

  8. MIT:机器学习预测2018世界杯冠军

    来源 :199IT互联网数据中心 摘要:麻省理工学院报道,他们的研究人员开发了一种新型人工智能,用以预测世界杯走势. 麻省理工学院报道,他们的研究人员开发了一种新型人工智能,用以预测世界杯走势. 研究 ...

  9. 神了!用Python预测世界杯决赛,发现准确率还挺高!

    那么四年一度的世界杯即将要在卡塔尔开幕了,对于不少热爱足球运动的球迷来说,这可是十分难得的盛宴,而对于最后大力神杯的归属,相信很多人都满怀着期待,每个人心中都有不同的答案. 今天小编就通过Python ...

最新文章

  1. 《智能数据时代:企业大数据战略与实战》一3.5 步步为营
  2. 使用tensorflow实现全连接神经网络的简单示例,含源码
  3. postgis学习笔记
  4. 树莓派3b配置耳机音频输出
  5. How is an SAP OData Batch request handled in the backend
  6. python数据录入和分析_hive+python数据分析入门
  7. scala不可变和可变_Scala使期货变得轻松
  8. 计算机辅助翻译术语PPT,计算机辅助翻译
  9. MES助力日立电梯提升精细化管理水平
  10. 在Xubuntu上安装中文输入法
  11. tensorflow 2.0 Layer定义的源码分析
  12. 使用Python-OpenCV实时测量物体的尺寸大小(仅供参考)
  13. 后台管理系统开发流程
  14. OpenCV Error:Insufficient memory(Failed to allocate 1244164 bytes)
  15. JAVAweb连接不上数据库原因及解决办法
  16. 火狐浏览器添加自动阻止加密挖矿选项
  17. NLP相关知识点问答总结(三)
  18. python gdal:hdf转tif
  19. SpringMVC学习系列(5) 之 数据验证
  20. 小米CC能否打开手机高端市场的大门?

热门文章

  1. 一种留存分析的方案:Cohort Analysis
  2. CVPR 2022 | Accuracy和F1-score真的能代表车道线检测网络性能吗?
  3. 黄河科技学院计算机等级考试成绩查询,全国计算机等级考试成绩查询汇总
  4. 个人项目(二)-- 自助点餐系统
  5. Python 雪球API 股票价格监控预警程序脚本
  6. 成功鲜有偶然:一览IT名人的教育成长经历
  7. 2、软件造价总结(主要基准数据)
  8. 逆袭之路——python进阶基础之 网络编程【day32】
  9. 一个懦夫,是没有人愿意同情的。
  10. 【SCIR Lab】事件表示学习简述