数据分析: http://codesnippet.info/Article/Index?ArticleId=00000038
拟合算法: http://codesnippet.info/Article/Index?ArticleId=00000041

滴滴算法大赛到底需要什么样子的答案?
我一开始的想法是建立一个模型,通过天气,POI,交通拥堵的参数来推导出订单数和GAP数。
但是通过现有的数据发现,这个模型很难建立。

其实看一下题目,这是一个预测题:

给定每个区域在时间片tj,tj-1...的各项数据,预测gapi,j+1, ∀di∈D。

如果不是想研究机器学习的话,其实也没有必要(或者没有可能)建立一个完整的模型。
我们只需要知道,数据的发展趋势,例如这个时间点是 N ,按照经验,后一个时间点的趋势是上升还是下降,幅度大约多少即可。

那些因素左右订单

前几天一直在寻找那些因素制约着订单数。

9点整和18点整 全区域订单分析图
订单的总量在不同日期,表现出极大的不同。但是,接单量和司机数有关系,司机数则是比较稳定的,9点的司机数大约是5000人,18点为4500人。(前三个数据是 01-01 到 01-03 节假日 ,01-09 ,01-10,01-16,01-17 分别是节假日,所以早晨的需求比较少 )
通过分析,我们应该可以整理出一张司机数和时间段的对应函数。(节假日和非节假日区分开来)

如果我们按照节假日和非节假日去看分时接单量

  • 节假日的早高峰和平日的早高峰项目,相差巨大。
  • 节假日和非节假日,其他时段接单量,基本持平。
  • 每天的8:30分,17:30分 是两个最高值。

  • 根据这个统计数据,我们大概知道了每天的接单情况。可以预测未来的某个时间片的接单量。当然,如果我们能够计算出Gap比率(GAP数/总订单数[GAP+接单数]),Gap数也是可以预测出来的。很遗憾,Gap比率的数据统计如下:(每天订单量起伏比较大,接单数较为固定,GAP比率则变化很大)
    日期别9:00和18:00GAP比率

预测订单趋势

上面说了,日期别的订单差异量很大,但是我们是否可以考察一下,每个时段的订单变化率是否有规律可循呢?
例如在 100个时间片上订单时 N,则101个时间片上,根据统计一般会增加 1.5%的话,则可以预测101个时间片上的订单时 1.05 * N;
当然如果就这么计算的话,可能会接近于正确答案,但是完全没有使用POI,天气,交通等数据,基本上是不可能获奖的。。。
不过,我们可以先来试试看,是不是可以找到规律呢。从图表上看,我们应该可以统计出,每个时间点上数据的变化率。

周三的变化:

从第一个周三到第二个周三的变化

从第一个周三到第二个周三的变化率
订单变化率:(这个时间片 - 上个时间片)/ 上个时间片

这样的话,我们大概可以对于各个时间片之间订单的变化率做一个统计平均表。
假设时间片 N 的订单数位 Order ,下一个时间片N+1的订单数为 NextOrder,则 变化率 K = (NextOrder - Order) / Order。
我们可以计算出全区域的每个时间片的变化率,也可以算出单个区域的每个时间片的变化率。

每个区域的订单比例

有些区域订单多,有些区域订单少,这个比例是否会随着时间变化而变化呢?
放心,基本上每个区域的订单比率很固定的。

如何解决问题

题目里面告诉了我们所需测试Gap的时间片的前三个时间片的数据。结合变化率的概念,其实我们可以计算出待预测的时间片的订单量。
还有一个问题是接单量怎么考虑,我的想法是将这三个已知时间片的接单量的平均值作为新的接单量。
(有一种情况,例如一个时间片里 有50个订单,但是有1个GAP,这个时候其实不能认为接单量只有49,而应该认为这个区域的基本上是公供需平衡的。1个GAP有可能是偶然因素。所以我这里认为5个GAP以下都是供需正常的。)

  • 第N+1个时间片的GAP = 第N + 1个时间片的订单数 - 第N + 1个时间片的接单能力。
  • 第N + 1个时间片的订单数 = 第N 个时间片的订单数 * (订单变化率+ 1)
  • 第N + 1个时间片的接单能力 = 第 N ,N-1, N-2 个时间片的接单能力的平均值。

最后公式是:

  • 第N+1个时间片的GAP = 第N 个时间片的订单数 * (订单变化率+ 1) - 第 N ,N-1, N-2 个时间片的接单能力的平均值

这种方法计算出来的结果可能接近于答案,也可能远离答案。但是完全没有体现出机器学习的作用,所以本人觉得肯定是有问题的。这里只是给出一种解决方案。接下来,开始思考正统的解决方案。

滴滴算法大赛算法解决过程 - 方案设计相关推荐

  1. 滴滴算法大赛算法解决过程 - 机器学习

    按照前面文章的方法进行数据预测,完全不使用POI,天气,交通情况的数据,可以达到0.43的成绩. 不过如果想要获得更好的成绩,简单的预测方法显然无法满足要求了. GBDT 网友说可以使用GBDT的方法 ...

  2. 滴滴算法大赛算法解决过程 - 拟合算法

    拟合 概论 Gap的预测,是建立在一个拟合函数上的.也有一些机器学习的味道. 总的Gap函数 = 函数(时间,地区) TimeID : 时间片编号 DistricID:地区编号 Traffic:交通流 ...

  3. 滴滴算法大赛算法解决过程(实时更新)

    (这里只是做分析,不提供源代码,毕竟是一个比赛) 题目分析 赛题详情 构建一个模型,根据天气,交通,区域里面的各种设施,以往历史数据,预测未来的某个时间点,某个区域里,打车需求的缺口.整个算法其实就是 ...

  4. 算法“视”界杯来袭,2021腾讯广告算法大赛正式开启

    全球算法达人注意啦,2021腾讯广告算法大赛强势归来!本届赛事围绕视频广告议题开设两大赛道--"视频广告秒级语义解析"与"多模态视频广告标签"两大前沿命题等你来 ...

  5. 腾讯广告算法大赛已启动,逆向算法,等你来战

    2020年 腾讯广告算法大赛广撒"英雄帖" 面向全社会召集技术人前来一"战"! 腾讯广告算法大赛步入第四年 已经为来自海内外的企业和研究人员 提供了富有研究价值 ...

  6. 名校大厂 AI 高手云集,芒果 TV 音视频算法大赛硕果累累

    东京奥运会已正式开幕,最新的IT技术也在进入奥运赛场. 本届奥运会引入的 AI 辅助打分,扮演了"助理裁判"的角色.这项技术可以追踪选手动作并实时转换为三维立体图像,再由系统根据图 ...

  7. 适合小团队作战,奖金+招聘绿色通道,这一届算法大赛关注下?

    大赛背景 伴随着5G.物联网与大数据形成的后互联网格局的逐步形成,日益多样化的用户触点.庞杂的行为数据和沉重的业务体量也给我们的数据资产管理带来了不容忽视的挑战. 为了建立更加精准的数据挖掘形式和更加 ...

  8. 冠军奖3万元!CSDN×易观算法大赛开赛啦

    伴随着5G.物联网与大数据形成的后互联网格局的逐步形成,日益多样化的用户触点.庞杂的行为数据和沉重的业务体量也给我们的数据资产管理带来了不容忽视的挑战. 为了建立更加精准的数据挖掘形式和更加智能的机器 ...

  9. AI一分钟 | 特朗普以国家安全为由否决博通收购高通;阿里发起时尚AI算法大赛

    整理 | 阿司匹林 一分钟AI 3月12日,美国总统特朗普以国家安全为由,否决了博通对高通公司总额高达1170亿美元的收购案. 百度地图近日做出大调整,地图事业部从百度搜索公司转入 AI 技术平台体系 ...

最新文章

  1. EOS 智能合约源代码解读 (10)token合约“简介”
  2. 大整数乘法--leetcode Multiply Strings
  3. HttpClientHelper的封装
  4. java web 收发邮件_Java总结(五)之实现javaweb发送邮件
  5. 【java笔记】hello world入门程序
  6. LeetCode刷题——63. 不同路径 II
  7. 第一天:搭建环境和初始化路由
  8. java 图片自适应_水印宽高比例自适应图片(Java-Thumbnails)
  9. Flutter圆形图片
  10. wps-奇数偶数页眉不同设定方法
  11. oracle的音标,oracle的意思在线翻译,解释oracle中文英文含义,短语词组,音标读音,词源【澳典网ODict.Net】...
  12. Mariadb数据库
  13. 交换机端口mtu值最大_思科交换机基本配置命令全集-mtu值怎么设置
  14. Android补间动画之旋转动画
  15. CSS中常用的几种选择器是哪几种呢?
  16. Anaconda安装Jupyter Notebook及使用
  17. 2016全国房价趋势
  18. 21. WebAR那些事: ARDemo之《天马行空》
  19. Win7右击计算机管理打不开,提示找不到文件或没有关联的程序
  20. 【原创】MATLAB模糊控制算法Fuzzy Control

热门文章

  1. dell 远程访问管理卡iDRAC 7
  2. VMware View 5.0 Ready! 资源汇总(持续更新)
  3. ASP.NET获取客户端IP及MAC地址
  4. Windows Live Messenger 8.5 抢先试用
  5. Leetcode738. 单调递增的数字[C++题解]:贪心,数学解法
  6. c语言求解热传导方程,二维稳态导热问题的数值解法.docx
  7. 当前元素_90行代码,15个元素实现无限滚动
  8. java实现layui分页_基于LayUI分页和LayUI laypage分页的使用示例
  9. 计算机游戏的作文,玩电脑游戏作文
  10. java的标量和聚合量_第5节:Java基础 - 必知必会(下)