“阿根廷和瑞士,谁会赢?”7月1日深夜,劲松桥附近一家烤串吧里依然灯火通明,和朋友们聚在一块看球的李天响兴致勃勃地拿这顿夜宵饭钱当起彩头,猜起了这场将于2日零点开始的世界杯淘汰赛的输赢。

大伙儿七嘴八舌地说着自个儿的想法,其中,李天响说:“我觉得,阿根廷赢得不会太容易,说不准拖到点球都不一定。”最终结果是,比赛一直到加时赛的下半段才打破僵局,最终阿根廷以1:0的比分艰难获胜。

“你小子这次怎么神啦?”朋友们问。面对大伙儿的疑惑,李天响摇了摇手上的手机:“我有‘军师’。”

点开手机上一款名为“500彩票”的APP,李天响找出了1日晚上刚收到的一条资讯:“阿根廷战瑞士小胜。”“全是数据说话,挺有门路。”李天响告诉身旁的朋友。

这款APP由500彩票网运营,它是如何准确预测到比赛结果的?这背后离不开大数据的运用。

就在阿根廷对瑞士那场生死战开始前不到6个小时的1日下午,海淀方圆大厦12层的一间办公室里,临近下班,在500彩票网担任数据开发工程师的王雷(化名),仍在紧张地处理着刚刚汇集到手头的数据。他身前的电脑屏幕上,红红绿绿的数字不停闪过,汇聚成高低错落的峰状图。

“这是把一场足球赛事的各个因素层层分解,变成一个个单元数字。通过软件对数字的分析,得出大致的预测结果。”王雷解释说,这些因素包含两支球队历史交锋记录、近期状态、得失球数据、主客场战绩、未来对阵数据、球员伤停数据,甚至会细化到当天比赛天气。“这不难理解,比如这次世界杯小组赛期间,不少欧洲球队表现不佳,其中一个原因就是因为巴西天气过于闷热,而南美球员更容易适应。”

“强队以一球取胜的几率很大。”世界杯开始后不久,王雷和他的同事把这么一条预测资讯放进了数据库中。

这是一次“牛刀小试”。原来他们一一记录下了48场小组赛中凌晨零点开打的18场比赛后分析发现,其中平局仅有1场,其余17场比赛全部分出胜负;这17场分胜负的比赛中,有12场比赛输赢差距在1球,比例高达66.7%。也就是说,12场输赢差距在1球的比赛中,强队取胜10场,胜率极高。

如何找到这些数据成为关键的技术活。王雷介绍,现在国际顶级足球赛事都会通过在球场架设的多台摄像机全面收集数据,用电脑自动将比赛过程的每个细节转化为数据存储。每一场比赛下来,球员在场上是进攻还是防守,是有球进攻还是无球跑动,球员上场时间、助攻情况、防守情况都一一被记录下来。

另一方面,网友在网络上的搜索数据、媒体对比赛结果的报道、赔率市场数据等这些“外围”数据也同样会被王雷和他的同事用软件捕捉到。所有这些数据进入到王雷的电脑里则会转变成一条条编码,经过软件飞速地“扫码”,寻找到其中的规律。

在500彩票网,和王雷一样的工程师还有20多名,他们组成的“数据平台组”成为整个公司的数据核心,每天都在为球迷提供球赛咨询服务。早在每一场比赛开始前的四五天,他们就开始去搜集数据,而其中的数据甚至会在比赛前的一两个小时还有所变化。

“我们抓取的数据不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。”500彩票网首席财务官潘正明称,他们所处理的世界杯数据囊括125项联赛、1万多支球队、45万多场比赛数据。显然,拥有“数据池”的大小成为资讯网站之间比拼的一大资本。同样做着“据透”生意的百度大数据研究院相关负责人就不甘示弱地告诉记者,他们通过自有软件采集和向国际数据供应商采购数据,一共采集到了过去5年内全世界987支球队的3.7万场比赛数据,共涉及到19972名球员和1.12亿条相关数据。这些大数据为预测某场比赛结果提供了坚实的基础。

转载于:https://my.oschina.net/u/1160813/blog/287321

靠大数据 资讯网站“据”透世界杯?相关推荐

  1. HTML期末学生大作业-资讯网站html+css+javascript

    html网页制作期末大作业-资讯网站html+css+javascript+Jquery 8个页面适用学生作业 课程设计在线新闻资讯网站.期末作业资讯网.毕业设计资讯网站 部分页面截源代码 <! ...

  2. 大数据平台网站日志分析系统

    1:大数据平台网站日志分析系统,项目技术架构图: 2:大数据平台网站日志分析系统,流程图解析,整体流程如下: ETL即hive查询的sql; 但是,由于本案例的前提是处理海量数据,因而,流程中各环节所 ...

  3. 【强烈推荐】十三个鲜为人知的大数据学习网站

    [强烈推荐]十三个鲜为人知的大数据学习网站 发布时间: 2017-4-19 11:06:46   文|邓凯 数据分析重要性 越来越多的管理者意识到数据分析对经济发展.企业运营的重要意义. 在古代,得琅 ...

  4. python 化学计量学_【强烈推荐】十三个鲜为人知的大数据学习网站

    原标题:[强烈推荐]十三个鲜为人知的大数据学习网站 文|邓凯 数据分析重要性 越来越多的管理者意识到数据分析对经济发展.企业运营的重要意义. 在古代,得琅琊阁者得天下 现在,得大数据者得天下. 我总结 ...

  5. 基于大数据的网站日志分析系统

    本文没有任何代码,只有各个模块工作的大体机制和整体流程.算是一个科普文吧,我也对原理一知半解. 基于大数据的网站日志分析系统 1. 日志数据格式 1.1 访问日志 1.1.1 log_format 1 ...

  6. 大数据旅游网站Hopper获新一轮1600万美元融资

    基于大数据的旅游网站 Hopper 获新一轮 1600 万美元的融资,由 BDC 投资. 2012年,这家秘密开发了 5年 的旅游网站曾经宣布完成 B 轮融资,获得 1200 万美元投资,当时的投资方 ...

  7. 深圳爱思拓大数据 网站_建议收藏!13个大数据学习网站很少人知道!附大数据自学资料分享...

    数据分析重要性 越来越多的管理者意识到数据分析对经济发展.企业运营的重要意义 在古代,得琅琊阁者得天下 现在,得大数据者得天下 我总结的数据分析五步走: 1.锁定分析目标,梳理思路,叫纸上谈兵: 2. ...

  8. 常见大数据学习网站总结(不定期更新)

    由于本人有收集癖,虽然收集了之后不怎么看,但还是喜欢收集,说不定哪天想看了呢.. 这里总结几个常见的比较不错的大数据相关的学习.交流网站,后期会不定时更新,欢迎大家提供建议. 没有先后顺序! 1.36 ...

  9. 十三个大数据学习网站

    数据挖掘与大数据分析 微信号datakong 功能介绍以传播大数据.解读行业趋势.数据化运营为核心的新媒体平台,已有150多万行业人士关注,荣获2013年新浪微博百强自媒体.2016年中国十大大数据领 ...

最新文章

  1. 基于 Android NDK 的学习之旅----- C调用Java
  2. php向指定文件发送消息,PHP-将文件发送给用户
  3. [YTU]_2535( C++复数运算符重载(+与))
  4. “美登杯”上海市高校大学生程序设计邀请赛 (华东理工大学)
  5. Hadoop_NameNode_代码分析_目录树(2)
  6. c向文件中插入数据_Redis从文件中批量插入数据
  7. [Sharepoint2007对象模型]第二回:Web应用程序服务(SPWebService)
  8. ReportViewer教程(15)-矩阵报表-6
  9. 南邮计算机学院答辩,南京邮电大学答辩PPT模板讲述.pptx
  10. [转]Eclipse创建Maven项目
  11. Linux 动态链接和静态链接简析(库名与库文件名)
  12. 【学堂在线数据挖掘:理论方法笔记】第l六天(3.31)
  13. 谷歌android q 安装,谷歌修复了Pixel智能机安装Android Q Beta 4后循环重启的bug
  14. 凸优化有关的数值线性代数知识 3LU Cholesky和LDL因式分解
  15. IOS-播放器开发(1)-视频基本原理
  16. LaTeX 公式编辑器(网页版)
  17. word怎么填满一页_Word文档如何让插入的表格自动充满整个页 – 手机爱问
  18. BiTree T 和 Bitree T 和 BitNode *T 和 T-lchild
  19. 谷歌浏览器怎么设置成暗黑模式
  20. php自学提升进阶路线

热门文章

  1. 2020安徽省大数据竞赛可视化题目解析
  2. 11.29 随堂练习
  3. 【HTML5】HTML5
  4. 软件面试常见题目(转帖)
  5. linux下启动node服务出现events.js:167 throw er; // Unhandled ‘error‘ event 的解决方法
  6. 【机器人运动学/姿态角】欧拉角和RPY角
  7. 关于tools:ignore=“Suspicious0dp“的问题父类定向为竖向时,别横向等分父类的高
  8. 将一个n位数分解为各个位数的数字。
  9. 软件测试·系统测试·安全性测试
  10. java并行编程_RxJava(十一): 并行编程