1.项目背景:

随着移动设备的完善和普及,移动互联网+各行各业进入了高速发展阶段,这其中以O2O(Online to Offline)消费最为吸引眼球。据不完全统计,O2O行业估值上亿的创业公司至少有10家,也不乏百亿巨头的身影。O2O行业天然关联数亿消费者,各类APP每天记录了超过百亿条用户行为和位置记录,因而成为大数据科研和商业化运营的最佳结合点之一。以优惠券盘活老用户或吸引新客户进店消费是O2O的一种重要营销方式。然而随机投放的优惠券对多数用户造成无意义的扰。对商家而言,滥发的优惠券可能降低品牌声誉,同时难以估算营销成本。个性化投放是提高优惠券核销率的重要技术,它可以让具有一定偏好的消费者得到真正的实惠,同时赋予商家更强的营销能力。本次大赛为参赛选手提供了O2O场景相关的丰富数据,希望参赛选手通过分析建模,精准预测用户是否会在规定时间内使用相应优惠券。

2.总体情况统计分析

2.1 数据总体情况

  • 数据集样本大小:共1754884条记录, 每条记录包括7个特征
  • 总用户数:539438
  • 总店铺数:8415
  • 总领券记录数:1053282
  • 总消费记录数:776984

2.2 优惠券使用的总体情况

  • 有优惠卷,购买商品:75382
  • 有优惠卷,未购商品:977900
  • 无优惠卷,购买商品:701602
  • 无优惠卷,未购商品:0

分析:很多人(701602)购买商品却没有使用优惠券,也有很多人(977900)有优惠券但却没有使用,真正使用优惠券购买商品的人(75382)很少!所以,优惠券的精准投放很重要。

2.3 每月消费数统计


分析:3月份-6月份的销售量比1、2月份高很多,需考虑是商户采取的运营策略导致的销量提高还是受季节影响。

2.4 一周每天消费总数统计


分析:周末的消费量比工作日的略高,周末较活跃。

2.5 一周每天领券数量


分析:周五至周一的领券数比周二至周四多。对比上面一周每天的消费总量,可以发现用户在每周的周末比较活跃,领券数也较多,发放优惠券的时候要重点考虑周末时间。

2.6 每月新增用户数


分析:每月新增用户数有规律地涨跌,可能是商铺在每次新增消费用户减少时采取了一些提高用户转化率的运营策略。

2.7 流失可能性较大的用户数

最近消费日期离2016年6月30日超过120天的用户很有可能流失,这部分用户有64893,占消费用户的近30%(29.75%),流失率比较大。还需要继续采取一些运营策略维护老用户。

2.8 用户最近消费日期,最早消费日期,消费次数三维散点图**

分析:结合用户流失率和上面的最近消费日期,最早消费日期,消费次数三维散点图,我们可以看到,虽然用户流失率高,但是留存下来的用户忠诚度高。

2.9 复购率

整体复购率:52.5%

分析:2016年1月至6月各月的复购率在0.310-0.382之间,用户的粘性基本保持,没有出现异常。

2.10 商户消费次数和消费天数描述性统计

商户消费天数描述性统计:

分析:商户最多活跃天数达182天,,而超过75%的商户消费天数在32天以下,大部分商户不活跃。
商户消费次数描述性统计:

分析:商户最多消费次数达36238次,而超过75%的商户消费次数在38次以下,商户消费次数差异大,消费集中于部分活跃商户。

2.10 每月有消费商户数量


分析:活跃商户逐月递增

2.10 一周每天有消费商户数量


分析:周末活跃商户比工作日略多,周末消费较活跃

3.用户分层

3.1 用户核销率

用户核销率描述性统计:
  • 平均值:0.548212
  • 标准差 :0.317454
  • 最小值:0.012500
  • 下四分位数:0.250000
  • 中位数:0.500000
  • 上四分位数:1.000000
  • 最大值:1.000000

3.2 用户分层

分层标准:

借鉴RFM模型对用户进行分层,这里的数据只有用户消费频数和最近消费日期,没有提供消费金额,所以仅根据R和F两个指标来对用户分层,将用户分为四类。

  • 消费次数>1,最近消费日期在一个月内:价值用户
  • 消费次数>1,最近消费日期在一个月之前:保持用户
  • 消费次数<=1,最近消费日期在一个月内:发展用户
  • 消费次数<=1,最近消费日期在一个月之前:挽留用户
  • 未消费用户:待引导消费用户
分层后各层用户数量


各层用户数量在消费用户中占比

分层后各层用户消费总数:


各层用户消费次数在消费总次数中占比

分析:价值用户在消费用户中占比仅25.8%,却贡献了58.7%的消费次数,是销售贡献主力。需要重点维护。

3.3 分层用户优惠券敏感度

在用户分层的基础上考察用户优惠券核销率,核销率超过50%的消费用户定性为优惠券敏感用户。进一步分层后各分层用户数量:

消费用户中优惠券敏感用户占比:

分析:消费用户中优惠券敏感用户仅占12.1%,说明优惠券并不能起到很好的带动消费作用,需要进一步调整优惠券的发放策略,提高用户优惠券敏感度。

各分层用户中优惠券敏感用户在总消费用户中的占比:

分析:优惠券敏感价值用户在消费用户中仅占5.2%,优惠券不敏感价值用户占比20.6%,即80%左右的价值用户不受优惠券驱动。

4.商户分层

4.1 商户优惠券被核销率

商户优惠券被核销率的描述性统计:

分析:可以看到,75%的商户发放的优惠券被核销率在34.8%以下。

4.2 商户分层

分层标准:
  • 消费天数>31天,最近消费日期在一个月内:活跃商户
  • 消费天数>31天,最近消费日期在一个月之前:保持商户
  • 消费天数<=31天,最近消费日期在一个月内:发展商户
  • 消费天数<=31天,最近消费日期在一个月之前:低活跃商户
  • 消费天数=0:近6个月无消费商户
分层后各层商户数量:

Remark:近6个月无消费商户有94个
各层商户数量在有消费商户总数中的占比

分析:低活跃商户占比超过60%,需要帮助商户盘活销售能力,同时引进更有吸引力的商户。

4.3 分层商户优惠券敏感度

在商户分层的基础上考察商户优惠券被核销率,核销率超过10%的商户定性为优惠券敏感商户。进一步分层后各分层商户数量:

有消费商户中优惠券敏感商户占比:

分析:优惠券敏感商户占比38%,平台商户整体而言对优惠券不敏感。

各分层用户中优惠券敏感用户在总消费用户中的占比:

分析:优惠券敏感的活跃商户仅占不到10%。

4.优惠券分析

4.1 优惠券总体情况统计分析

  • 总领券量1053282
  • 领券种类45
  • 总用券量75382
  • 用券种类45
  • 总核销率0.07156867771404049
优惠券总核销率仅7%

4.2 优惠券核销率分析

4.2.1 月领券量,用券量,核销率,用券消费占比

4.2.2 计算不同种类优惠券的核销率及其描述性分析

分析:总共有45种不同类型的优惠券,每周优惠券的平均领券数为23406张,平均用券数为1675张,平均每种优惠券的核销率为8.7%

4.3 优惠券分层

分层标准:
  • 核销率超过7%,用券数超过239张:优质优惠券
  • 核销率超过7%,用券数少于239张:谨慎优惠券
  • 核销率小于7%,用券数超过239张:一般优惠券
  • 核销率小于7%,用券数少于239张:低质优惠券

分层后各层优惠券种类数:

分层次优惠券的核销率:

5.交叉分析

5.1 基本分层交叉分析

用户分层、商户分层和优惠券分层交叉后用券量最大的前15项

5.1 优惠券敏感度分层交叉分析

在基本分层基础上考察优惠券敏感度后进一步分层,进行交叉后用券量最大的前15项:

O2O优惠券使用数据分析相关推荐

  1. O2O优惠券核销-数据分析

    目录 一.项目背景 二.分析目的 三.数据集描述 四.分析思路 五.分析内容 5.1 优惠券维度 5.1.1 距离因素 5.1.2优惠券类型因素 5.1.3 时间因素 5.2 用户维度 5.2.1 不 ...

  2. O2O优惠券核销-数据分析2.0

    写2.0版本是因为后来再次复盘的时候我觉得1.0版本比较杂乱,没有一个比较明确的分析目标和分析路线,从头在看好像只是在进行一个简单的数据探索,有种东一榔锤西一锄头的感觉,于是2.0版本决定聚焦在用户的 ...

  3. O2O优惠券核销-SQL实现

    前言: 目的:利用O2O优惠券数据集锻炼个人SQL编写能力 过程:将文件导入datagrip,利用SQL进行数据分析,具体分析内容见另一篇博客:O2O优惠券核销-数据分析 说明:本次SQL主要实现上述 ...

  4. python项目--O2O优惠券线下使用情况数据分析

    数据来源:天池大赛数据集:天池新人实战赛o2o优惠券使用预测:数据链接: https://tianchi.aliyun.com/competition/entrance/231593/introduc ...

  5. O2O优惠券数据分析(一)

    写在前面的话 本文的数据分析任务是我在几个月前为了准备面试锻炼自己的数据分析思路做的,项目中没有涉及到机器学习建模内容,是一个单纯用数据得出结论的任务.因为准备时间仓促,所以项目里待完善的内容很多.最 ...

  6. python O2O网站优惠券使用率数据分析

    项目源码请见:https://github.com/dennis0818/O2O_offline 一 项目简介 随着移动设备的完善和普及,移动互联网+各行各业进入了高速发展阶段,这其中以O2O(Onl ...

  7. O2O优惠券使用预测项目总结

    O2O优惠券使用预测笔记 前言 项目介绍 数据 评价方式 赛题分析 基本思路 数据集划分 特征工程 模型选取 过程及代码 导入python库 导入与划分数据集 特征工程 模型训练与调参 预测测试集 总 ...

  8. 天池o2o优惠券使用预测(入门)

    一.前言 近期学习了一下天池中o2o优惠券使用预测的学习赛,主要任务是通过分析建模,精准预测用户是否会在规定时间内使用相应优惠券.这次的参与主要是学习为主,牛刀小试. 二.解决方案 数据分析:对于给定 ...

  9. O2O优惠券发放与使用情况分析

    一. 项目背景 随着互联网+行业的趋势不断加快,各行各业逐渐通过线上(online)与线下(offline)结合的方式来扩大营销面.与此同时,消费者也越来越愿意为便利以及更多更优的选择买单,也就促进了 ...

最新文章

  1. python rjust() 方法 与 ljust()方法 的使用
  2. 和12岁小同志搞创客开发:检测按键状态的两件法宝
  3. 0x41.数据结构进阶 - 并查集
  4. 一些关键字表明变量属性值
  5. 百度工程师控制公司服务器“挖矿”:4个月赚10万 判刑3年
  6. c oracle帮助类,C#DbHelperOra,Oracle数据库帮助类
  7. Kotlin学习记录1
  8. 去重 指定区域数据_大数据分析常用去重算法分析
  9. 设计模式之美:Strategy(策略) -未经作者同意的转载
  10. 【新手答疑】很迷茫,次世代角色建模我该怎么学习?需要掌握哪些技术?
  11. 4 相机切换_价格屠夫、训练伴侣——海鸟4K运动相机简评
  12. java重构三部曲,建构·解构·重构——漫谈批注式阅读三部曲
  13. GERM格沵有哪些适合夏天的高颜值杯子推荐吗?
  14. lunix入侵别人电脑_记录一次Linux的实战入侵过程
  15. c语言符号意思大全,c语言符号意思
  16. 小程序input获得焦点触发_小程序文本框焦点 小程序input自动获取焦点
  17. aptana php,aptana 3 + xdebug php
  18. java-web阶段性总结
  19. 关闭 Eureka 自我保护模式
  20. 关于自己配置电脑的一点心得

热门文章

  1. 算法-二叉树:合并两颗二叉树
  2. android studio模拟手机黑屏,Android Studio 模拟器启动问题——黑屏 死机 解决方法...
  3. python mysql limit_数据库mysql中LIMIT取值
  4. 生成webservice客户端以及解决SSL异常
  5. 【第11天】SQL进阶-索引的创建、删除(SQL 小虚竹)
  6. FreeRTOS学习笔记【二】——FreeRTOS 移植
  7. 计算机在生活中的应用论文2000字,浅议计算机在生活中的应用论文(2)
  8. 可靠性试验类毕业论文文献都有哪些?
  9. 基于Twitter数据的情感预测与案例分析
  10. 山东大学项目实训小组一——基于深度学习的AI视频剪辑器“易剪”