工作中是否经常遇到这样的场景:业务部门希望通过营销活动来提高产品的销量,但是预算是有限的。在预算允许范围内,如何更多的提升转化率是每个从事数据分析、数据挖掘人员需要面临的问题。

  本篇将以银行营销活动相关数据为例,手把手教大家如何识别客户是否有意愿购买该银行的产品,针对高意愿客户进行精准营销来提升转化率。废话不多说,下面开始详细介绍我们的解决方案。

  数据中包含客户基本信息、活动行为信息。在实际场景中,如果有客户的偏好信息,参与活动历史信息等,也可以加入其中。

  数据预处理

  1、 数据查看

  我们可以看到数据共计 25317 行,空数据暂无,详情如下:

  2、数据预处理

  对源数据进行观察,可以发现分类字段有'unknown'这个类别,此时将该类别也当作缺失值,进一步查看

  通常对于缺失值的处理,最常用的方法无外乎删除法、替换法和插补法。

  1)删除法是指将缺失值所在的观测行删除(前提是缺失行的比例非常低,如 5%以内),或者删除缺失值所对应的变量(前提是该变量中包含的缺失值比例非常高,如 70%左右)

  2)替换法是指直接利用缺失变量的均值、中位数或众数替换该变量中的缺失值,其好处是缺失值的处理速度快,弊端是易产生有偏估计,导致缺失值替换的准确性下降

  3)插补法则是利用有监督的机器学习方法(如回归模型、树模型、网络模型等)对缺失值作预测,其优势在于预测的准确性高,缺点是需要大量的计算,导致缺失值的处理速度大打折扣

  这里观察到 contact 和 poutcome 的'unknow'类别分别达到 28.76%和 81.67%,在展示数据后考虑进一步处理,job 和 education 的 unknown 占比较小,考虑不对这两个特征的 unknow 进行处理。

  数据分析

  下面我们对源数据进行数据分析,数据字段分为离散变量和连续变量,下面我们将逐一进行分析。

  1、离散变量

  通过可视图我们可以对每个特征情况进行初步观察,方便分析这些特征是否会影响购买率。


  2、连续变量

  1)age 年龄

  从上图我们可以看出两类客户的购买年龄分布差异不大;

  2)balance 每年账户的平均余额

  3)duration 最后一次联系的交流时长

  4)campaign 在本次活动中,与该客户交流过的次数

  5)pdays 距离上次活动最后一次联系该客户,过去了多久(999表示没有联系过)

  6)previous 在本次活动之前,与该客户交流过的次数

  特征工程

  通过上述对每个特征进行数据分析,我们对数据有了大致了解,下面我们从数据平衡性、数据标准化等角度进行特征工程处理。

  1、从训练集查看是否平衡数据集


  我们可以看到是9:1,数据集是不平衡数据集

  2、连续变量即数值化数据做标准化处理

  3、分类变量做编码处理

  4、不平衡数据集处理

  数据建模

  为了方便讲解,本篇使用逻辑回归进行数据分析建模,在实际工作场景中,我们可以使用随机森林、lgb、xgboost、DNN等模型都是可以的,根据具体场景和建模效果进行选择。


  roc-auc曲线

  上面我们进行了数据训练、数据预测、模型性能评估等操作。

  结论

  至此,业务方提出的场景问题,我已给出了解决方案,接下来就是模型迭代优化了。

转载自:https://www.aaa-cg.com.cn/?xmta7

如何使用数据分析客户购买意愿相关推荐

  1. Bank Marketing预测一个客户购买理财产品的成功率

    Bank Marketing预测一个客户购买理财产品的成功率 一.实验目的 熟悉数据预处理的基本方法,包括缺失值填充.数据编码. 熟悉 pandas.scikit 等数据分析库的使用. 熟悉机器学习算 ...

  2. 记住影响客户购买的3个决策关键

    记住影响客户购买的3个决策关键,让你清晰知道客户想什么,要什么: 1.缺乏感,什么是缺乏感?缺乏感指引起客户焦虑.烦恼的冲突点,因为有了这样的问题及痛点客户才可能产生需求.所以我一直强调,销售员一定要 ...

  3. 操作系统的不确定性是指程序执行结果的不确定性_用不确定性促销策略提高用户购买意愿...

    本文作者整理了关于不确定性促销策略的相关问题,结合案例对其一一展开了分析探究. 一.前言 促销玩法是电商运营的重要组成部分,我们整理了目前有关不确定性促销策略的前沿学术研究成果,希望以此解答以下问题, ...

  4. 客户购买软件的心理曲线分析

    客户购买软件的心理曲线分析 博文导言:有近三个月没有更新博客了,不好意思,也许是工作忙,也许是不经意的淡忘,在这里对于关心我.爱护我的同事真诚的道歉,不能因为自已的懒惰,就忽略了与大家的知识和经验分享 ...

  5. 小白学数据分析-----从购买记录分析道具支付环节

    昨天发现充值异常增高,于是准备做一次详尽的分析,但是当我开始提取数据时,发现了一件比较异常的事情,这是在查询玩家的购买记录时发现的(这是因为往往我们要分析充值时,也要辅助的去看一下当日的购买情况),截 ...

  6. [Kesci] 预测分析 · 客户购买预测(AUC评估要使用predict_proba)

    文章目录 1. Baseline 2. AUC评估要使用predict_proba 2.1 导入工具包 2.2 特征提取 2.3 训练+模型选择 2.4 网格/随机搜索 参数+提交 2.5 测试结果 ...

  7. 客户购买产品的本质是什么,如何快速寻找到客户的需求,提高转化率?

    销售大师博恩崔西说过:"在销售中不要推销产品,而是要推销产品带给客户的好处." 趋利避害是人类的本能,任何人都无法摆脱这一客观现实.销售员在寻找客户需求的过程中,可以从趋利这一点入 ...

  8. 09- 京东客户购买意向预测 (机器学习集成算法) (项目九) *

    项目难点 根据用户在网站的操作(浏览, 加购, 删除, 购买, 收藏, 点击), 预测用户是否购买产品 . 主要使用 Xgboost 建模 pd.get_dummies 相当于onehot编码,常用与 ...

  9. python-selenium爬取摩点客户购买信息(前端分析+爬虫代码)

    前言 最近公司需要摩点的用户购买数据,比如总金额最多的有礼包 但是发现网站并没有提供下载渠道(运营和我说的,如果有不是我的锅┓(;´_`)┏) 发现一个页面只有十个数据,也没有跳转,那光爬网页肯定是不 ...

  10. 拥有一套如何让客户购买的方法?

    "你有自己的生意, 想客户数增长?利润率增长?" "你有自己的粉丝,有社群资源, 想要快速变现?" "你没有赚钱绝活, 想学习怎么在网上空手创业赚钱? ...

最新文章

  1. 尽快安装修补程序!微软 Word 漏洞影响上百万人
  2. 深度学习:语义分割网络
  3. 极客Python进阶训练学习手册
  4. java 线程组作用_Java线程组(ThreadGroup)使用
  5. 算法--排序--大小写字母数字分离(桶排序思想)
  6. 新浪uc2010官方下载
  7. 大咖齐聚!好好聊聊啥是AI大模型
  8. oc基础-protocol协议的使用
  9. C#使用PDF控件打开PDF
  10. 关于adb驱动的安装
  11. 《计算机网络教程》(微课版 第五版) 第二章 物理层 课后习题及答案
  12. c语言入门手机自学软件,C语言入门学习
  13. 帆软连接好数据库,字段带有中文的显示乱码解决方案
  14. 为Excel工作表单元格命名的两种方法
  15. 针对儿子买的将近一万的笔记本电脑
  16. 测试基本技巧与方法;
  17. 几种编码方式(RZ、NRZ、NRZI、曼彻斯特编码)
  18. 五款免费的磁盘空间使用情况报告软件
  19. amd 邮件 服务器,[转]免费邮件服务器hMailServer搭配SpamAssassin过滤垃圾邮件:安装和设置...
  20. 关于学术论文投稿中的 Cover Letter

热门文章

  1. Oracle备份与恢复-误删数据文件恢复(非归档模式)
  2. 人工智能导论期末复习重点
  3. 服务器蓝屏 查看系统日志文件,教你电脑查看系统蓝屏日志的具体方法
  4. 惠普服务器win10安装系统教程,惠普电脑如何重装系统教程 win10专业版系统安装教程...
  5. 车载系统模块资料整理
  6. 无线网络服务器网络异常,无线网络连接上但上不了网怎么解决
  7. 2013年中国新媒体行业的八大趋势
  8. 冰点还原忘记密码如何修改配置或卸载
  9. 软件工程导论 银行储蓄系统_银行储蓄系统.ppt
  10. c语言实训自我总结报告,C++实训总结报告