python的coupon_Python数据分析:拼多多优惠券使用预测
一、分析背景
根据拼多多的部分用户的基本信息以及过去的消费行为数据,使用Python建立逻辑回归模型,预测用户是否会在活动中使用优惠券,找到对用户使用优惠券影响较大的因素,并提出优惠券发放建议。
二、数据分析的流程
数据分析的整体流程如图所示:
(一)数据概况分析
1、调用基本包和读取数据
import pandas as pd
import matplotlib as plt
import seaborn as sns
%matplotlib inline
pdd = pd.read_csv('拼多多优惠券数据.csv')
2、数据概况分析
使用info/describe/head这3个函数查看数据的基本情况;
共有10个数据变量,为了后续分析方便,下面对这10个变量进行简单的分类和含义说明:
发现:(1)age中可能存在异常值(max是95);(2)coupon_used_in_last6_month和coupon_used_in_last_month的分布较为离散,可以尝试对数据进行分组优化;
(二)单变量分析
1、目标列分析
目标列是coupon_ind(在本次活动中是否有使用优惠券),为了后面的分析方便,这里将目标列重命名为flag,使用rename函数进行重命名操作;
# 目标列重命名为flag:在本次活动中是否有使用优惠券
pdd = pdd.rename(columns={'coupon_ind':'flag'})
统计flag中1和0的占比:
发现:使用优惠券的占比为11.7%,而未使用优惠券的占比为88.3%,说明数据存在一定程度的不平衡问题;
2、数值型变量分析
使用groupby对flag进行分组,然后分别查看在flag为0和1的情况下,各数值型变量的均值分布情况,以此来观察哪些数值型变量可能会影响优惠券的使用;
# 观察哪些变量可能影响优惠券的使用
pdd.groupby('flag').mean()
发现:age在flag=0时的均值是40.8,在flag=1时的均值是41.8,说明年龄与用户是否使用优惠券没有太大的关系;
coupon_used_in_last6_month的数据表明,用户过去6个月使用优惠券的数量越少,本次使用优惠券的概率也越高;
coupon_used_in_last_month的数据表明,用户过去1个月使用优惠券的数量越多,本次使用优惠券的概率也越高;
3、类别型变量分析
分别对job、marital、default、returned、loan与flag之间的关系进行分析;
(1)job:职业
# 查看job的整体分布情况
pdd['job'].value_counts(1)
# 查看每种job中flag为0和1的分布情况
pdd.groupby('job')['flag'].value_counts(1)
发现:retired & student更偏向于使用优惠券;
(2)marital:婚姻状态
发现:单身用户更偏向于使用优惠券;
(3)default:信用卡是否违约
发现:没有信用卡违约的用户更偏向于使用优惠券;
(4)returned:是否有过退货
发现:没有退货的用户更偏向于使用优惠券;
(5)loan:是否使用信用卡付款
发现:没有使用信用卡的用户更偏向于使用优惠券;
(三)相关与可视化
在相关性分析之前,先对ID进行处理,由于ID本身不是特征值,直接分析会产生干扰,这里可以将ID设为index,方便后面根据ID将特征值与结果一一对应;也可以直接删除这一列;
pdd = pdd.set_index('ID')
生成哑变量,将所有的类别型变量转换为数值型变量;
pdd = pd.get_dummies(pdd,drop_first=True)
pdd.head()
分析flag与其他变量的相关性;
pdd.corr()[['flag']].sort_values('flag',ascending=False)
可以看出,除了coupon_used_in_last_month(正相关)和returned_yes(负相关),其他变量与flag的相关性都很小;
(四)逻辑回归模型
1、模型建立
2、模型评估
分别对训练集和测试集建立混淆矩阵,并计算各自的准确率;
发现:训练集的准确率为0.8802,测试集的准确率为0.8847;可以看到测试数据集中共有863(862+1)人实际使用了优惠券,但预测结果中仅1人使用优惠券,说明查全率很低;模型效果并不理想,需要进一步优化;
3、模型优化
模型优化的方向有:
(1)调整参数,可以将测试集比例从0.3调整至0.5;
(2)调整变量,可以选择与更多的变量放入模型;
(3)数据处理,离群值处理,数据分组,如对年龄和职业进行分组;
三、结论说明
分析发现单身、已退休、退货少、没有用过信用卡、过去一个月内使用更多优惠券的客户在本次活动中使用优惠券的概率更高;对此提出以下消费券发放建议:
1、结合上面不同用户群体的累计消费情况,发放不同额度的优惠券;
2、结合上面不同用户群体的消费类别,可以发放不同品类的优惠券;
3、在优惠券使用引导页面进行个性化推荐,吸引用户提升消费额度。
python的coupon_Python数据分析:拼多多优惠券使用预测相关推荐
- “拼多多优惠券”测试的套路,今天让你秒懂~
前言 最近几个月都处于找工作黄金期-金九银十,所以柠檬班的学员很多都收到了 offer. 从学员的反馈回来的面试中,我们发现除了像"测试工具"."自动化测试". ...
- 能领取拼多多优惠券的微信小程序
最近优惠券很火热,太多人做了,但是你知道拼多多的商品也能领取查询大额优惠券了吗? 免费领取查询拼多多大额优惠券的微信小程序:省钱大哥 还可以申请在上面申请合伙人赚佣金的哦,自用省钱,分享赚钱!想进群的 ...
- 从10年软测人的角度,一文读懂“拼多多优惠券测试”套路
在学习咱们AI课后,咱们的学员如虎添翼在"五一"节后都陆续收到了 offer. 从学员的反馈回来的面试中,我们发现除了像"测试工具"."自动化测试&q ...
- 拼多多砍价用户福利贴:通过python模拟操作进行拼多多砍价
下文提到的所有工具都可以在这里下载:拼多多砍价神器Python教程所需软件 大家可以点下小站,给个支持~谢谢啦~ /1 前语/ 嘿,各位小伙伴们晚上好呀,今日小编又给我们带来干货内容啦,今日带来的是, ...
- 榆熙电商:拼多多优惠券都有哪些作用?
在拼多多开店,商家们肯定是希望自己的店铺销量人气蹭蹭上涨,而优惠券就具备这一功能,那作为商家的我们该如何利用优惠券来提高店铺转化呢?一起跟着榆熙电商小编来学习一下吧. 能很好促进转化的优惠券形式有两种 ...
- 一度智信|拼多多优惠券怎么取消
做拼多多店铺的小伙伴都知道,想要促进下单的一个小技巧就是给商品设置优惠券,设置优惠券之后又会想要取消,但是对于有些小伙伴而言并不知道如何取消,今天小编就给大家分享关于拼多多怎么取消优惠券. 一.店铺. ...
- 对拼多多优惠券事件的思考,理解流程为何如此重要
前言 今天IT界最火的新闻莫过于拼多多被褥羊毛事件,损失达到千万级别.新闻链接:拼多多公布"优惠券漏洞"案件进展:上海警方已成立专案组. 从披露的信息来看,此优惠券是拼多多与江苏卫 ...
- 淘宝京东拼多多优惠券,买东西省钱的秘密
淘宝京东拼多多内部优惠券领取,网上购物折扣,实惠省钱小程序,你的网购省钱小助手,帮你在网上购物省钱 文章出自我的博客:huhansome的博客 其实我以前也是在淘宝买东西,现在我才发现自己亏了好多 ...
- 成都宁源鑫成:拼多多优惠券的使用窍门
放眼任意头部电商平台,流量入口或多或少都有着一定的共同性,优惠券就是其中之一.作为重要的流量引入渠道,优惠券是商家们热衷的运营工具之一,店铺流量来源有着不小的一部分都出自优惠券的吸引力.今天成都宁源鑫 ...
最新文章
- A - Wireless Network POJ - 2236
- 64位系统matlab上安装libsvm
- 音频放大电路_集成电路技术汇总:检测技巧
- ubuntu 中wget (下载)命令用法
- 我的电脑缩略图模式盘符名字不见了
- 对于程序员来说,“选择比努力更重要”是一句屁话
- CodeMeter的功能介绍
- sublime报错信息乱码_Sublime如何解决中文乱码问题
- 【总结】仰望星空,脚踏实地 2017.09-2018.02
- 短视频直播美颜sdk可以接入其它视频社交平台吗?
- 深度学习之文本摘要自动生成
- k8s集群ClusterIP不能使用
- 防止excel单元格有效性验证因被粘贴而失效
- php 正则车架号,正则判断工具类 - 我的开源中国 - OSCHINA - 中文开源技术交流社区...
- 【HBase】HBase入门详解(一)
- linux安装卸载软件
- 基于javaweb物业管理系统的设计与实现/小区物业管理系统
- springboot+freemarker导出word
- 阿里云PolarDB云数据库帮助畅捷通,业务系统并发能力提升4倍以上
- 全国青少年软件编程等级考试内容,知识点思维导图(Scratch编程一级)