参考文献:

题目简介:

https://tianchi.aliyun.com/getStart/information.htm?raceId=231593

https://blog.csdn.net/ccj_ok/article/details/72675956

美年的待看

https://tianchi.aliyun.com/forum/new_articleDetail.html?spm=5176.100067.444.2.7c761db77xUahI&from=user&raceId=&postsId=3192

以它为准,进行学习的

O2O优惠券使用新人赛数据发掘工程

https://tianchi.aliyun.com/course/courseConsole?courseId=263&chapterIndex=1&sectionIndex=3

一:赛题简介

以优惠券盘活老用户或吸引新客户进店消费是O2O的一种重要营销方式。然而随机投放的优惠券对多数用户造成无意义的干扰。对商家而言,滥发的优惠券可能降低品牌声誉,同时难以估算营销成本。 个性化投放是提高优惠券核销率的重要技术,它可以让具有一定偏好的消费者得到真正的实惠,同时赋予商家更强的营销能力。

本次大赛为参赛选手提供了O2O场景相关的丰富数据,希望参赛选手通过分析建模,精准预测用户是否会在规定时间内使用相应优惠券。

2.     数据

本赛题提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为,预测用户在2016年7月领取优惠券后15天以内的使用情况。

4.        提取特征(pandas,numpy)

1)        优惠券相关特征,从预测样本的discount_rate,data_received提取:

Day_of_week //优惠券领取日期属于周几,使用独热编码

Is_weekend //优惠券领取日期是否属于周末

Day_of_month //优惠券领取日期属于一月中的哪天

Days_distance //优惠券领取日期离要预测的开始日期间隔天数

Discount_man //提取满减优惠券中满多少元

Discount_jian //提取满减优惠券中减多少元

Discout_rate //优惠券折扣率

2)        商户相关特征,从训练样本的distance,date_received,date提取:

Total_sales //商户被消费次数

Sales_use_coupon //商户使用优惠券被消费次数

Total_coupon //商户发放优惠券次数

Merchant_min_distance //所有使用优惠券消费的用户与商户的最小距离

Merchant_max_distance //所有使用优惠券消费的用户与商户的最大距离

Merchant_mean_distance //所有使用优惠券消费的用户与商户的平均距离

Use_coupon_rate //商户使用优惠券消费比例,等于sales_use_coupon/total_sales

Transfer_rate //商户优惠券转化率,等于sales_use_coupon/tatal_coupon

3)        用户相关特征,从训练样本的discount_rate, distance, data_received, data提取:

Count_merchant //用户消费商户数量

Buy_use_coupon //用户使用优惠券消费次数

Buy_total //用户消费次数

Coupon_received //用户领取优惠券次数

User_min_distance //所有使用优惠券消费的商户与用户的最小距离

User_max_distance //所有使用优惠券消费的商户与用户的最大距离

User_mean_distance //所有使用优惠券消费的商户与用户的平均距离

Avg_user_date_datereceived_gap //用户从领取优惠券到消费的平均时间间隔

Min_user_date_datereceived_gap //用户从领取优惠券到消费的最小时间间隔

Max_user_date_datereceived_gap //用户从领取优惠券到消费的最大时间间隔

Buy_use_coupon_rate //用户使用优惠券消费占总消费的比例

User_coupon_transfer_rate //用户优惠券转化为实际消费比例

4)        用户-商户相关特征,从训练样本date,date_received提取特征:

User_merchant_buy_total //用户在商户消费次数

User_merchant_received //用户领取商户优惠券次数

User_merchant_buy_use_coupon //用户在商户使用优惠券消费次数

User_merchant_buy_common //用户在商户普通消费次数

User_merchant_coupon_transfer_rate //用户对商户的优惠券转化率

User_merchant_rate //用户对商户消费占总交互比例

User_merchant_common_buy_rate //用户对商户普通消费占总消费比例

User_merchant_coupon_buy_rate //用户对商户使用优惠券消费占总消费比例

5. 训练模型(xgboost, sklearn)

选择xgboost模型,xgboost是一种迭代提升方法,由多个弱分类器组成的效果较好的强分类器,其中底层的弱分类器一般是由决策树实现的,每棵树所学习的是上一棵树的残差。

它的优势主要有:

使用L1、L2范数进行正则化,防止过拟合;

实现树节点粒度的并行计算;

允许自定义损失函数和评价标准;

XGBoost会一直分裂到指定的最大深度(max_depth),然后回过头来剪枝。如果某个节点之后不再有正值,它会去除这个分裂。 这种做法的优点,当一个负损失(如-2)后面有个正损失(如+10)的时候,就显现出来了。XGBoost会继续分裂,然后发现这两个分裂综合起来会得到+8,因此会保留这两个分裂。

内置交叉验证,XGBoost允许在每一轮boosting迭代中使用交叉验证。因此,可以方便地获得最优boosting迭代次数

二:

天池O2O优惠券使用预测相关推荐

  1. 天池 O2O 优惠券使用预测思路解析与代码实战

    个人网站:redstonewill.com 前阵子因为机器学习训练营的任务安排,需要打一场 AI 比赛.然后就了解到最近热度很高且非常适合新人入门的一场比赛:天池新人实战赛o2o优惠券使用预测.今天, ...

  2. 天池o2o优惠券使用预测(入门)

    一.前言 近期学习了一下天池中o2o优惠券使用预测的学习赛,主要任务是通过分析建模,精准预测用户是否会在规定时间内使用相应优惠券.这次的参与主要是学习为主,牛刀小试. 二.解决方案 数据分析:对于给定 ...

  3. 【机器学习】天池O2O优惠券使用预测_系统性总结与心得

    Preface:上半年参加天池的O2O优惠券预测赛排名第二,同时参加了学校数据仓库老师的课程改革建设团队,于是把参赛经验总结成文,准备分享给该课程的学弟学妹.现在我把总结的参赛教程文章也发到CSDN上 ...

  4. 天池比赛:o2o优惠券使用预测

    一.比赛背景 O2O:全称Online To Offline,线上线下电子商务,是把线上的消费者带到现实的商店中去:在线支付线下商品.服务,再到线下去享受服务.通过打折(例如团购).提供信息.服务(例 ...

  5. O2O优惠券使用预测项目总结

    O2O优惠券使用预测笔记 前言 项目介绍 数据 评价方式 赛题分析 基本思路 数据集划分 特征工程 模型选取 过程及代码 导入python库 导入与划分数据集 特征工程 模型训练与调参 预测测试集 总 ...

  6. Sklearn:天池新人实战赛o2o优惠券使用预测 part1

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 阿里云官网:天池新人实战赛o2o优惠券使用预测 数据集下载链接 ...

  7. Sklearn:天池新人实战赛o2o优惠券使用预测 part2

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 阿里云官网:天池新人实战赛o2o优惠券使用预测 数据集下载链接 ...

  8. 【天池】优惠券使用预测

    代码:mirrors / wepe / o2o-coupon-usage-forecast · GitCode blog:生活大实惠:O2O优惠券使用预测_Julyaaaa的博客-CSDN博客 比赛网 ...

  9. W12 - 999、O2O优惠券使用预测

    初学耗时:999h 注:CSDN手机端暂不支持章节内链跳转,但外链可用,更好体验还请上电脑端. 『   因为要去见那个不一般的人,所以我就不能是一般人.』  W99.阿里大学征服路 - W系列总纲   ...

最新文章

  1. 遗传算法c语言程序,遗传算法c语言代码.doc
  2. 图网络究竟在研究什么?从15篇研究综述看图神经网络GNN的最新研究进展
  3. Hrefer教程【超越官方】
  4. LaTex:算法排版
  5. leetcode347 - Top K Frequent Elements - medium
  6. SSM-查询数据库获取下拉框的值并作为查询的筛选条件
  7. allocator_is_always_equal的实例
  8. 管理本地多个SSH Key
  9. bzoj2226-[Spoj5971]LCMSum【欧拉函数,GCD】
  10. Android 10 正式版本或将于 9 月 3 日推出
  11. 【数据结构amp;amp;等差数列】KMP简介和算法的实现(c++ amp;amp; java)
  12. C语言程序——math库的函数应用
  13. 如何根据一张照片判断出女孩住在几层楼?
  14. 第五章 定积分及其应用
  15. vue 报错:Templates should only be responsible for mapping the state to the UI. Avoid placing tags with
  16. 尚硅谷 硅谷外卖_关于多样性,硅谷未能想到与众不同
  17. 计算机学报是期刊论文吗,《计算机学报》北大核心电子期刊发表技巧
  18. CCS安装失败的原因
  19. unity射线检测高速飞行的子弹是否打到敌人
  20. 默认ip_各品牌路由器登录网址大全 路由器默认用户名/密码

热门文章

  1. 软件测试之SDK开发(ios)——signal捕获
  2. ROS2机器人笔记20-08-02
  3. Win11或Win10重置电脑提示“找不到恢复环境”
  4. 无法打开源文件 ctype.h和.exe 进行写入
  5. AWS KVS(Kinesis Video Streams)之WebRTC的C库测试
  6. portalv15安装 tia_安装了TIA Portal V15.1软件,所有程序里有TIAV15.1图标,怎么桌面上没有TIA V15.1的图标?-工业支持中心-西门子中国...
  7. C语言,从联合看字节序
  8. mysql 谓语提前,谓语提前的倒装句:
  9. centos 7和redhat 7的区别及如何安装
  10. Matlab图像处理入门教程(菜鸟级)