在银行等金融机构的信贷业务中,围绕存量客户的数据分析与价值挖掘,始终是客户管理体系的核心思想。针对存量客户群体的类型划分与画像描述,是实现客户价值评估以及精准营销的重要前提,也是业务创益增收的必要条件。
1、客户分类与画像场景
我们经常提到的客户分类与客户画像,是数据分析任务比较熟悉的场景,二者本质上都是对存量客户样本的数据分析,但最明显的区别是客户分类结果重在“宏观”上的群体类别,而客户画像结果旨在“微观”上的特征描述。换一句话来讲,客户分类可以不需要细节总结,客户画像可以不考虑类型划分。当然,客户分类与客户画像的关系也非常密切,先“宏观”分类再“微观”画像的应用思路,在实际业务场景中更为常见且效果更佳。在具体实践过程中,客户分类相比客户画像在实现方法上往往更为复杂,不是简单的通过描述性统计分析便得到样本分类,而是需要借助于相关业务指标或者模型算法。一种情况是结合实际业务理解,选取某个或多个维度指标作为分类依据,然后选取合适的阈值划分类型;另一种情况是依靠机器学习模型来训练完成,常见的主要为聚类模型算法,例如Kmeans、DBSCAN等。当客户群体完成分类后,可以针对每类客户群体,从某些业务解释性较好的特征着手,通过简单的描述统计值来刻画出客户分布的特点,这样便实现客户群体的画像。这里简单举个例子,假设有一批存量客户数据,特征为年龄、婚姻状况、教育程度、住房类型、月收入金额等字段,可以先通过Kmeans聚类模型对样本进行聚类分析,例如定义聚类数量K=3,则可以得到3个客户簇类,接着根据每个簇类样本群体,依次统计客户特征的均值与极值等,例如第1簇类群体,平均年龄为36岁,大多数已婚,教育程度平均学历为大学本科,住房类型多数为自置有按揭,月收入平均约为2万元等。这个分析与描述过程,可以认为是客户分类与客户画像有效结合,在实际场景中有很多类似的场景应用。
2、实例样本介绍与分析
为了便于大家对客户分类与客户画像的进一步熟悉与理解,接下来我们围绕具体的实例样本数据,来完成客户样本数据的分类与画像。本文选取的样本数据包含10000条样本与9个字段,部分数据样例如图1所示。其中,id为样本客户主键,income_type、city_level、consume_index、bankcard_count等为特征变量,label为客户贷后逾期表现(1/0代表是否逾期),具体的特征字典如图2所示。

                                                              图1 样本数据样例

                                                              图2 特征字典说明

由于字段income_type、city_level的取值类型为字符型,相关数值分布如图3、图4所示,此类特征在描述性统计过程中不便于数据分析,因此这里采用label编码方式将此类特征进行取值转换,具体实现过程详见知识星球代码详情。。在特征编码过程中,结合特征在实际业务的理解,赋予取值的比较关系,例如特征income_type(月收入等级),取值L1/L2/L3代表月收入依次升高,在label转化过程可以分别赋予1/2/3。

                                                               图3特征income_type分布

                                                               图4 特征city_level分布

3、客户分类探索与实现
首先我们来对客户群体进行分类,这里不采用机器学习聚类算法来实现,而是通过某个业务解释性较好且区分度较好的特征来划分客户类别。从特征字典表可以看出,贷前信用评分score在客户综合风险的衡量维度上,可以很好的量化出客户之间的差异,从而在业务理解方面可实现客户的有效分类,因此我们将根据特征score来进行分析。这里需要注意的是,特征label(贷后逾期状态)虽然能够直接体现客户的风险程度,但将客群仅分为好坏2个分类对客户精细化管理的效果欠佳。在确定了客户分类的特征指标score之后,接下来需要明确的重点是围绕特征划分区间的具体标准。由于特征score的含义是信用风险评分,且样本观测均有好坏表现的标签label(0/1),因此可以通过不同分数区间的坏账率大小来实现客群分类。为了更全面描述信用评分的数据分布趋势,以及连续区间的坏账率变化情况,我们通过特征分箱的思想,将连续型的信用评分进行离散化,具体实现过程详见知识星球代码详情。,输出结果如图7所示。

                                                             图7 评分离散化结果

对于上图的评分分布,我们通过连续区间的数据表现可知,随着信用评分(score)的不断升高,坏账率(badrate)逐渐降低,具体分布如图8所示,单调性趋势较好,可以直接说明信用评分对用户风险的区分度效果是比较好的。

                                                                    图8 评分数据表现

根据评分score与坏账badrate的分布趋势,我们考虑将badrate较为接近的评分区间作为同一类别,同时结合区间样本量大小,将占比较大者单独成箱,占比较小着多箱合并。按照以上逻辑标准,围绕上图的客户评分表现结果,这里考虑将客户群体划分为6个类别,分别为:[382,434]、(434,460]、(460,486]、(486,513]、(513,539]、(539,644]。因此,客户群体通过信用评分score细分为6类,这里采用flag=1~6来表示,具体实现过程详见知识星球代码详情。,客户分类的频数分布如图10所示。

图10 客户分类分布
4、客户画像方案与实现
根据客户的信用风险程度高低,我们完成了客户群体的有效分类,接下来围绕每类客群的分布特征进行画像描述。虽然实例样本的特征包含8个,但字段score、label已作为客户分类的依据,因此客户画像的描述性特征将选取其他6个字段。在实际场景中,若分析变量池的字段较多,必然会选取业务解释性较强的部分特征来描述分析。样本群体分布的可解释性维度,可以优先考虑描述性统计值,例如频数、占比、平均值、最大值、最小值等,不仅便于业务理解,而且易于特征描述,因此这里通过此种方式来实现客户画像。为了快速得到各类客群的常见统计值,我们在Python环境中采用describe()函数来完成。针对某一类客群(以flag=1举例)的具体实现过程为data[data[‘flag’]==‘1’].drop(columns=[‘score’,‘label’]).describe(),结果如图11所示。为了将此客群与整体客群对比,我们输出全量样本的分布,具体如图12所示。
​在这里插入图片描述

                                                                  图11客群1特征分布

                                                            图12 全量客群特征分布

针对上图分析结果,我们重点分析count、mean、max、min等指标,这里简要描述下客群1(flag=1)的分布特点:客户群体1的数量为819,占全量样本的8.19%;平均月收入等级为L1;居住城市平均等级为B;消费能力整体系数为0.21,相比全量客群的平均系数(0.37)偏低;近12个月银行卡转账次数平均为35次,也低全量客群情况(约46次);近3个月航旅出行次数平均接近2次,明显低于全量客群的平均4次;近6个月申请贷款失败次数约为1次。这里可以初步看出,客群1的整体消费能力一般,且航旅出行的偏好程度较低。对于其他类型客群,都可以按照以上分析思路来描述客户画像,以此来了解每类客户的特点,为风险控制或精准营销等策略提供客观的信息参考。综合以上内容介绍,我们围绕一批存量客户样本,依次实现了客户分类与客户画像,较好的分析描述出客群的分布特点。此外,本文实例的客户分类,由于信用风险评分的量化,也可以理解为客户分层,但分层是分类的一种情况,可以体现出客群之间的比较差异,但需要明确的是,客户分类不一定要客户分层,但客户分层必然是客户分类。例如,通过机器学习的无监督聚类算法得到的客户分类,是一种非分层的客户分类,而采用有监督多分类模型实现的客户价值挖掘,则属于客户分层的情况。对于客户群体的分类或分层需求,具体需要结合实际业务场景。针对本文介绍的客户分类与客户画像,为了便于大家对此有进一步的理解与熟悉,本文额外附带了与以上内容同步的Python代码与样本数据,供大家参考学习,详情请移至知识星球查看相关内容。

更多详细内容,可关注:

~原创文章

客户画像分析无头绪?来试下风险评分与特征的方案与实现相关推荐

  1. 客户画像分析用于贷中监控的案例

    某月,某助贷产品的递延逾期率出现了一个近2个百分点的跳增.次月递延逾期率也是如此.显然,该产品此前较为稳定的vintage表现出现了劣化苗头. 与此同时,连续2个月的审批通过率也出现了几个百分点的下降 ...

  2. 风控必学|肘部法与客户分群——客户画像中的聚类与特征画像分析

    客户聚类分析,在信贷圈子里,是一种很常见的数据挖掘场景,对于从事金融数据分析岗位的我们,也是需要必备掌握能力之一.无论是策略分析岗,还是数据建模岗,或者是数据分析岗,客户样本的分群画像,在某些程度上来 ...

  3. 需求分析报告应该包含哪些部分_2020最新抖音用户画像分析报告:粉丝都有哪些特点和需求?...

    本文相关:抖音用户画像分析.抖音用户画像报告.2020最新抖音用户画像分析等 不管是做抖音运营还是抖音直播,了解粉丝,了解用户的需求是非常重要的!做任何事情,对症下药你才能事半功倍!比如你的粉丝想要梨 ...

  4. 客户流失及用户画像分析

    1 项目背景 在今天产品高度同质化的阶段,市场竞争不断加剧,企业与企业之间的竞争,主要集中在对客户的争夺上."用户就是上帝"促使众多企业不惜代价去争夺尽可能多的新客户.但是,在企业 ...

  5. 银行案例分析:识别个人贷款客户画像,实现精准营销与风险防范

    作为商业银行最主要的业务活动,也是收益最大的活动,贷款于银行的重要性不言而喻.又由于个人贷款是银行贷款不可或缺的一部分,那么了解个人贷款客户画像就有助于银行对客户进行精准销售和风险识别. # 选手介绍 ...

  6. python 数据分析 电信_基于Python的电信客户流失分析和预测

    一.项目背景 电信服务是生活中常见的消费服务,在现代社会,凡是使用手机打电话,或者在家看电视,都必须通过电信运营商提供的通话.网络等服务才能实现.本文采用来自kaggle平台的电信客户数据集,来分析人 ...

  7. 数据应用案例之“客户画像体系”

    01 数据标签管理和应用中的问题 数据标签是面向业务的数据资产组织方式,是数据资产为业务系统赋能的重要载体.数据标签从源系统采集.数据清洗.分层管理,到最终根据业务需求组织成可使用的标签,是一个漫长的 ...

  8. Apache Kylin在绿城客户画像系统中的实践

    前言 \\ 作为国内知名的房地产开发商,绿城经过24年的发展,已为全国25万户.80万人营造了美丽家园,并将以"理想生活综合服务提供商"为目标,持续为客户营造高品质的房产品和生活服 ...

  9. 如何做好会员用户画像分析,比消费者本身更懂自己?

    随着各平台知识付费开启,"万物付费时代"已悄然而至.线下传统的粗犷式运营模式已不再符合时代潮流.如何在这样一个付费时代做好企业的精准化会员客户策略分析管理,成为当今人们尤为关注的话 ...

最新文章

  1. 流水账之都市:我是一个客居者
  2. php 判断是否gzip,PHP网站判断页面文件或图片是否经过gzip压缩
  3. (转)Http协议经典详解
  4. Android之Caused by: java.lang.IllegalArgumentException: Failed to find configured root that contains
  5. linux 运行 chom,Hadoop安装-单节点/伪分布(2.7.3)
  6. Android官方开发文档Training系列课程中文版:分享简单数据之发送简单数据给其它APP
  7. eclipse中monokai插件的安装
  8. 工业大数据分析综述:模型与算法
  9. HP-JavaUtil: xls 操作类
  10. 229页,CMU博士张昊毕业论文~探索机器学习并行化的奥秘
  11. 手写 Object.create
  12. MyCat双机HA高可用集群搭建_HAProxy安装和配置---MyCat分布式数据库集群架构工作笔记0028
  13. python将csv文件拆分_在python中将一个csv拆分为多个文件
  14. Mac OSX上卸载Anaconda
  15. 吴昊品游戏核心算法 Round 5 —— 五子棋(无禁手)后台的判胜负AI(bfs+queue容器)(HDOJ 2699)...
  16. SDL介绍----1、SDL与SDL安全活动
  17. splits——安卓gradle
  18. 安卓APP源码和设计报告——基于Android的垃圾分类系统
  19. 哪个安卓模拟器比较好用 2023年好用的安卓模拟器推荐
  20. 90% 的前端都会使用 ES6 来简化代码,你都用过哪些?

热门文章

  1. 面向微波毫米波频段协同的共口径天线研究综述
  2. 6轴机器人jacobian矩阵
  3. 【干货】郭朝晖:工业大数据的特征、方法与价值创造
  4. R语言可视化世界地图:包含边界边框和不包含边界边框两种方案
  5. 西门子M440变频器手册
  6. 微信公众号开发系列-网页授权获取用户基本信息
  7. 雷柏8300无线鼠标就是个悲剧,占灰…
  8. react小项目 - canvas海报生成器
  9. Windows11安装方法(预览体验升级)
  10. 深度linux系统软件卸载在哪,LinuxDeepin/apt软件升级、安装、卸载与系统升级的好帮手...