如何使用数据分析客户购买意愿
工作中是否经常遇到这样的场景:业务部门希望通过营销活动来提高产品的销量,但是预算是有限的。在预算允许范围内,如何更多的提升转化率是每个从事数据分析、数据挖掘人员需要面临的问题。
本篇将以银行营销活动相关数据为例,手把手教大家如何识别客户是否有意愿购买该银行的产品,针对高意愿客户进行精准营销来提升转化率。废话不多说,下面开始详细介绍我们的解决方案。
数据中包含客户基本信息、活动行为信息。在实际场景中,如果有客户的偏好信息,参与活动历史信息等,也可以加入其中。
数据预处理
1、 数据查看
我们可以看到数据共计 25317 行,空数据暂无,详情如下:
2、数据预处理
对源数据进行观察,可以发现分类字段有'unknown'这个类别,此时将该类别也当作缺失值,进一步查看
通常对于缺失值的处理,最常用的方法无外乎删除法、替换法和插补法。
1)删除法是指将缺失值所在的观测行删除(前提是缺失行的比例非常低,如 5%以内),或者删除缺失值所对应的变量(前提是该变量中包含的缺失值比例非常高,如 70%左右)
2)替换法是指直接利用缺失变量的均值、中位数或众数替换该变量中的缺失值,其好处是缺失值的处理速度快,弊端是易产生有偏估计,导致缺失值替换的准确性下降
3)插补法则是利用有监督的机器学习方法(如回归模型、树模型、网络模型等)对缺失值作预测,其优势在于预测的准确性高,缺点是需要大量的计算,导致缺失值的处理速度大打折扣
这里观察到 contact 和 poutcome 的'unknow'类别分别达到 28.76%和 81.67%,在展示数据后考虑进一步处理,job 和 education 的 unknown 占比较小,考虑不对这两个特征的 unknow 进行处理。
数据分析
下面我们对源数据进行数据分析,数据字段分为离散变量和连续变量,下面我们将逐一进行分析。
1、离散变量
通过可视图我们可以对每个特征情况进行初步观察,方便分析这些特征是否会影响购买率。
2、连续变量
1)age 年龄
从上图我们可以看出两类客户的购买年龄分布差异不大;
2)balance 每年账户的平均余额
3)duration 最后一次联系的交流时长
4)campaign 在本次活动中,与该客户交流过的次数
5)pdays 距离上次活动最后一次联系该客户,过去了多久(999表示没有联系过)
6)previous 在本次活动之前,与该客户交流过的次数
特征工程
通过上述对每个特征进行数据分析,我们对数据有了大致了解,下面我们从数据平衡性、数据标准化等角度进行特征工程处理。
1、从训练集查看是否平衡数据集
我们可以看到是9:1,数据集是不平衡数据集
2、连续变量即数值化数据做标准化处理
3、分类变量做编码处理
4、不平衡数据集处理
数据建模
为了方便讲解,本篇使用逻辑回归进行数据分析建模,在实际工作场景中,我们可以使用随机森林、lgb、xgboost、DNN等模型都是可以的,根据具体场景和建模效果进行选择。
roc-auc曲线
上面我们进行了数据训练、数据预测、模型性能评估等操作。
结论
至此,业务方提出的场景问题,我已给出了解决方案,接下来就是模型迭代优化了。
转载自:https://www.aaa-cg.com.cn/?xmta7
如何使用数据分析客户购买意愿相关推荐
- Bank Marketing预测一个客户购买理财产品的成功率
Bank Marketing预测一个客户购买理财产品的成功率 一.实验目的 熟悉数据预处理的基本方法,包括缺失值填充.数据编码. 熟悉 pandas.scikit 等数据分析库的使用. 熟悉机器学习算 ...
- 记住影响客户购买的3个决策关键
记住影响客户购买的3个决策关键,让你清晰知道客户想什么,要什么: 1.缺乏感,什么是缺乏感?缺乏感指引起客户焦虑.烦恼的冲突点,因为有了这样的问题及痛点客户才可能产生需求.所以我一直强调,销售员一定要 ...
- 操作系统的不确定性是指程序执行结果的不确定性_用不确定性促销策略提高用户购买意愿...
本文作者整理了关于不确定性促销策略的相关问题,结合案例对其一一展开了分析探究. 一.前言 促销玩法是电商运营的重要组成部分,我们整理了目前有关不确定性促销策略的前沿学术研究成果,希望以此解答以下问题, ...
- 客户购买软件的心理曲线分析
客户购买软件的心理曲线分析 博文导言:有近三个月没有更新博客了,不好意思,也许是工作忙,也许是不经意的淡忘,在这里对于关心我.爱护我的同事真诚的道歉,不能因为自已的懒惰,就忽略了与大家的知识和经验分享 ...
- 小白学数据分析-----从购买记录分析道具支付环节
昨天发现充值异常增高,于是准备做一次详尽的分析,但是当我开始提取数据时,发现了一件比较异常的事情,这是在查询玩家的购买记录时发现的(这是因为往往我们要分析充值时,也要辅助的去看一下当日的购买情况),截 ...
- [Kesci] 预测分析 · 客户购买预测(AUC评估要使用predict_proba)
文章目录 1. Baseline 2. AUC评估要使用predict_proba 2.1 导入工具包 2.2 特征提取 2.3 训练+模型选择 2.4 网格/随机搜索 参数+提交 2.5 测试结果 ...
- 客户购买产品的本质是什么,如何快速寻找到客户的需求,提高转化率?
销售大师博恩崔西说过:"在销售中不要推销产品,而是要推销产品带给客户的好处." 趋利避害是人类的本能,任何人都无法摆脱这一客观现实.销售员在寻找客户需求的过程中,可以从趋利这一点入 ...
- 09- 京东客户购买意向预测 (机器学习集成算法) (项目九) *
项目难点 根据用户在网站的操作(浏览, 加购, 删除, 购买, 收藏, 点击), 预测用户是否购买产品 . 主要使用 Xgboost 建模 pd.get_dummies 相当于onehot编码,常用与 ...
- python-selenium爬取摩点客户购买信息(前端分析+爬虫代码)
前言 最近公司需要摩点的用户购买数据,比如总金额最多的有礼包 但是发现网站并没有提供下载渠道(运营和我说的,如果有不是我的锅┓(;´_`)┏) 发现一个页面只有十个数据,也没有跳转,那光爬网页肯定是不 ...
- 拥有一套如何让客户购买的方法?
"你有自己的生意, 想客户数增长?利润率增长?" "你有自己的粉丝,有社群资源, 想要快速变现?" "你没有赚钱绝活, 想学习怎么在网上空手创业赚钱? ...
最新文章
- 尽快安装修补程序!微软 Word 漏洞影响上百万人
- 深度学习:语义分割网络
- 极客Python进阶训练学习手册
- java 线程组作用_Java线程组(ThreadGroup)使用
- 算法--排序--大小写字母数字分离(桶排序思想)
- 新浪uc2010官方下载
- 大咖齐聚!好好聊聊啥是AI大模型
- oc基础-protocol协议的使用
- C#使用PDF控件打开PDF
- 关于adb驱动的安装
- 《计算机网络教程》(微课版 第五版) 第二章 物理层 课后习题及答案
- c语言入门手机自学软件,C语言入门学习
- 帆软连接好数据库,字段带有中文的显示乱码解决方案
- 为Excel工作表单元格命名的两种方法
- 针对儿子买的将近一万的笔记本电脑
- 测试基本技巧与方法;
- 几种编码方式(RZ、NRZ、NRZI、曼彻斯特编码)
- 五款免费的磁盘空间使用情况报告软件
- amd 邮件 服务器,[转]免费邮件服务器hMailServer搭配SpamAssassin过滤垃圾邮件:安装和设置...
- 关于学术论文投稿中的 Cover Letter
热门文章
- Oracle备份与恢复-误删数据文件恢复(非归档模式)
- 人工智能导论期末复习重点
- 服务器蓝屏 查看系统日志文件,教你电脑查看系统蓝屏日志的具体方法
- 惠普服务器win10安装系统教程,惠普电脑如何重装系统教程 win10专业版系统安装教程...
- 车载系统模块资料整理
- 无线网络服务器网络异常,无线网络连接上但上不了网怎么解决
- 2013年中国新媒体行业的八大趋势
- 冰点还原忘记密码如何修改配置或卸载
- 软件工程导论 银行储蓄系统_银行储蓄系统.ppt
- c语言实训自我总结报告,C++实训总结报告