一、客户流失管理过程

业务目标:预测客户流失的概率和挽留的价值-->

数据准备:数据决定结果-->

流失预警:哪些客户即将流失-->

客户价值:哪些客户更值得挽留-->

分客群挽留策略:收益和成本的平衡-->业务目标

二、目标理解

需要对客户的销卡行为和价值进行预测,制定差异化的挽留策略,实现收益和成本的最佳平衡。

典型聚类问题,将客户按销卡概率和客户价值分为四类:

1. 价值高、销卡概率低

2. 价值低、销卡概率低

3. 价值高、销卡概率高

4. 价值低、销卡概率高

三、数据准备

1. 设定目标变量Y:客户销卡概率、客户价值

2. 设定时间窗口,因为要预测,自变量X应该在应变量之前预测才有意义,变量Y取半年内客户提出销卡请求,自变量在应变量之前一年,如图

3. 设计预测变量(自变量X)

  • 身份特征:性别、年龄、职业、学历...
  • 行为习惯:消费频次、购物类型、活跃度
  • 信用历史:信贷产品逾期、拖欠、还款情况
  • 产品偏好:产品数量、产品类型、渠道喜好
  • 客户关系:持卡时长、投诉次数、营销响应、社交特征
  • 生活形态:居住环境、网络行为标签、公共数据标签

4.准备数据宽表

按客户ID准备好包含目标变量(Y)和预测变量(X)的宽表

四、流失倾向预测

典型分类问题,使用Logistic回归算法

1. 数据预处理非常重要,需要进行粗分类,比如某个变量的取值有100个,则将100个取值进行分组合并,减少变量取值的个数。原则是:组内应变量差别小,组间应变量差别大。

2. 计算分组变量的WOE和IV值(帅选变量依据)

粗分类后,全部变量为类别变量,需计算WOE和IV值了解分组结果对应变量的显著性

WOE(Weigh Of Evidence)

IV(Information Value): 体现自变量对目标变量的显著性影响,一般来说IV在0.1到0.5直接表明变量X与目标变量有一定的相关性

3. 共线性检查

检查WOE分组变量之间的相关性,对具有相关性的一批变量,可选其中的一个变量作为代表,这样可以减少变量的个数。

指标:方差膨胀因子VIF(Varience Inflation Factor),VIF=1/(1-Rsquare)

  • 0<VIF<5:存在较弱共线性
  • 5<=VIF<10:存在较强共线性
  • VIF>=10:存在强共线性

4. 模型训练:显著性检验

使用SAS Proc Logistic处理,一是得出与目标变量显著相关的自变量,一是模型对训练数据预测一致性百分比

5. 模型评估

运用验证集数据,根据模型训练计算出来的模型,进行打分。

首先,按预测概率P从大到小进行排序,将全部客户分为若干组,然后计算每组客户的实际销卡率、平均预测概率(实际上是准确率)、累计销卡率(ROC曲线)、KS、提升度

1)实际销卡率vs平均预测概率曲线(准确率曲线)

二曲线重合度越高,则模型的准确度越高,曲线陡峭下降,说明模型的区分能力强,能够将潜在的销卡客户锁定在较小的范围内,曲线平滑,说明模型稳定,无过拟合问题。

2)累计销卡率(ROC曲线)

体现模型覆盖销卡客户的能力,建设将客户随机等分20组,则每组应该还该5%的销卡客户,如果打分最高的5组客户(占客户总量的25%),覆盖了75%的销卡客户,说明只要针对这25%的客户进行挽留,就能获得全部客户挽留75%的效果

3)KS:累计销卡率-累计未销卡率

用于评价模型的区分度,KS在30%-60%之间,则说明模型具有较强的区分度,如果KS过高,需要检查变量的设计是否存在问题,或者运用跟多的验证集检查过拟合情况。

4)LIFT:提升度

相对不使用模型,运用模型能够缩小目标客户分布范围的能力,即使用模型累计销卡率/随机情况累计销卡率,如将客户随机等分20组,最高预测概率组有累计23%的销卡率,提升率为23%÷5%=4.6

五、潜在客户价值预测

预测数值,是典型的慧谷问题,线下回归是最常用的算法。这里用了Logistic回归和线性回归相结合方法,先用Logistic回归预测客户为高价值的概率Ph,再将Ph作为预测变量与其他变量X一起建立线性回归模型。

1. 高价值概率Ph预测:认为根据客户价值划分为两组,高价值客户和低价值客户,方法有二八法则,价值最高的20%的客户定义为高价值客户,也可以绘制Value分布图,将拐点作为划分依据。

然后按照流失倾向预测的方法进行建模。

2. 客户价值数值预测

线性回归模型,变量X一般为数值型变量,对于离散型变量,通常选择其他方法选择最有影响力的变量划分客户群,为每个客户群分别建立线性回归模型。或者在高价值概率Ph预测时转化为WOE变量。

3. 模型评估

两项指标:

1)R方:体现预测变量X对目标变量Y的解释能力,介于0~1之间,越接近1,模型的拟合度越好。模型拟合度好并不代表在实际应用时能够准确预测,也可能存在过拟合,所以R方是聘雇模型的必要条件,但不是充分条件。

2)拟合曲线:

根据验证集的预测结果,对比客群预测值和实际值,这样的对比很有说服力。通常根据预测值从高到低等分20组,绘制魅族平均预测值和实际值,绘制拟合曲线。曲线解读方法包括曲线拟合程度,陡峭程度、光滑性等。

六、客户细分:差异化营销服务的基础

两个模型建立之后,已经可以预测未来哪些客户更可能流失以及其潜在客户价值高低,需要做的是识别最值得挽留的客户,有效的分配营销资源

以上内容来自《SAS金融数据挖掘与建模:系统方法和案例解析》第六章

客户挽留:信用卡客户流失管理相关推荐

  1. python信用卡客户_信用卡客户画像 作业讲解1

    信用卡客户画像 作业讲解1 信用卡客户画像 作业讲解1 获取请求类型 在很多情况下面,我们需要判断当前操作的请求类型是GET.POST.PUT.DELETE或者HEAD,一方面可以针对请求类型作出不同 ...

  2. AI:人工智能实践六大场景(金融信用违约、反欺诈模型、客户偏好洞察、智能推荐、精准营销、客户流失管理)及其对应常用机器学习算法经验总结(不断更新)

    AI:人工智能实践六大场景(金融信用违约.反欺诈模型.客户偏好洞察.智能推荐.精准营销.客户流失管理)及其对应常用机器学习算法经验总结(不断更新) 目录

  3. 构建信用卡客户风险识别模型

    构建信用卡客户风险识别模型 需求说明: 为了推进信用卡业务良性发展减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作,减少坏账风险,各大银行都进行了信用卡客户风险识别的相关工作.某银行研究的风 ...

  4. R语言实训项目——信用卡客户风险分析

    实训1 处理信用卡数据异常值(数据预处理) (1)读取信用卡数据. #读取数据 credit <- read.csv('F:/R-Project/data/credit_card.csv') ( ...

  5. 抽丝剥茧谈CRM:客户获取、客户转化、客户流失、客户流失挽回

    我自从写了上一篇文章后,立刻有不少人来找. 许多人一上来就是:我的销售不力,怎么提高,给个痛快话. 我不是营销高手,当然无法从营销奇招妙术方面给出答案.可能叶茂中和史玉柱能给出这个答案. 我只属于客户 ...

  6. 浅析基于客户价值的客户关系管理

    以客户为中心的经营模式的出现带来了市场营销模式由传统的4P (product, price, place, promotion)到4C(customer, cost, convenience, com ...

  7. 基于python的银行信用卡客户等级预测系统

    目录 一.设计要求 二.技术综述 三.需求分析 四.系统实现 数据来源 一.设计要求 1.客户数据预处理.对数据集进行缺失值处理,包含删除缺失值.填充数据等,同时对数据进行归一化处理. 2.确定影响客 ...

  8. 分析企业要如何管理客户维护良好客户关系?

    点击输入图片描述(最多30字) 客户对企业的发展起着至关重要的作用.销售人员不断开拓市场.挖掘客户,希望客户群体能够不断壮大,可实际上却是获得新客户,流失老客户,归根结底是没有维护好客户关系.我们都知 ...

  9. 01_Weblogic课程之概念篇:代理服务器,web服务器,应用程序服务器,JNDI概念,JTA概念,Java消息服务,Java验证和授权(JAAS),Java管理扩展,Web客户机,客户机应用程序

     1 什么是服务器 Weblogic中服务器分为两种,一种是受管服务器,另外一种是管理服务器. Weblogic课程(Weblogic是Oracle公司的,最开始的是BEA公司的) 一 系统管理 ...

最新文章

  1. ubuntu安装和查看已安装
  2. Steve J. Luck推出最新ERPs独家视频课程
  3. thinkphp3.2.2前后台公用类架构问题
  4. 虚函数与纯虚函数的区别
  5. Jacob Java程序把Word文档直接转换成Html文件
  6. Spring5参考指南:Environment
  7. E. Party Company(树上问题)
  8. (草稿)如何判断一名UiPath开发人员是否合格?
  9. c语言block内部的实现原理,iOS中block变量捕获原理详析
  10. 计算机基础函数运用,计算机应用基础第十二讲:EXCEL中函数的实际运用.doc
  11. 不足 20 行 Python 代码,高效实现 k-means 均值聚类算法!
  12. 浮点错误的意思-PAT 、OJ
  13. WannaCry反思:传统安全理念遭遇马奇诺防线式溃败
  14. C++设计模式之Facade模式(外观模式)
  15. 【动态规划】完全背包问题:构成m的最少个数
  16. 3.5框架不能创建就加这一段代码
  17. 存储盟主将要退位云计算会是最后盟主?
  18. 数据库常用sql语句总结
  19. Linux指纹识别程序,指纹识别系统的安装
  20. vnc远程控制软件下载,四款神级能够下载的vnc远程控制软件

热门文章

  1. python编程小知识_分享Python开发中要注意的十个小贴士
  2. 屏幕输出语句_第三章 常用输入/输出函数
  3. python开发自动化创建一个任务下发到手机_如何利用Fabric自动化你的任务
  4. java线程和线程池的使用
  5. 2017年2月20日 Random Forest Classifier
  6. Robot Framework 使用1-环境配置及简单网站兼容性测试(转)
  7. NodeJs Express 4.x 入门
  8. 【转载】应广大群众的要求,今天开始连载《超容易的Linux系统管理入门书》一书...
  9. Linux学习笔记三--vim
  10. Effective Java读书笔记完结啦