RFM-Clustering

利用RFM模型建模,并通过聚类分析、分类,分别算出8中不同的价值会员

RFM模型构建会员价值标签

R:最近一次消费(Recency)

F:消费频率(Frequency)

M:消费金额(Monetary)

RFM的意义

在CRM中,经常会用到RFM模型分析去衡量以为会员的价值,和给企业带来的利润能力。这个模型是通过会员最近一次购买的时间段间隔、购买总金额,购买频率这三个因素来描述这会会员的价值状况。

基于RFM的零售行业会员聚类分析

因子:

R:会员到门店消费的到目前为止的时间段,当R的值越大说明,会员上一次到门店的时间越大,则R越来大,与公司的价值是成负相关的。

F:会员的消费频率,次数越多,利益越大,与公司的价值是成正相关的。

M:会员消费的总金额,金额越大,利益越大,与公司的价值是成正相关的。

权重:

MBA百科库中:研究邀请了被研究的某电信企业的两位地区经理、两位市场营销人员和一位长期客户应用文献的标度含义对RFM各指标权重进行比较分析。在分别得到五位评价者的两两比较矩阵后,采取取平均的方法得到下表的评价矩阵。

专家评分矩阵表

RFM

R10.710.46

F1.4110.85

M2.181.181

上表所示的两两比较矩阵的一致性比例C。 R < 0.1, 表明该判断矩阵的一致性可以接受。由上表得出RFM各指标相对权重为

其中M的权重最大,即专家们认为客户交费金额的高低是影响顾客价值高低的最主要因素。

分类

目标:使用K-means算法进行会员价值聚类,并加以RFM的指标,将具有相近终身价值的会员进行聚类。

步骤

读取数据库中的数据(12个月),并清洗数据;

将RFM中的三个指标,利用离差标准化将其数据标准化;

应用AHP层次分析法来获取权重,并将各个指标加权;运用上述专家评定的评分矩阵:

其中M的权重最大,即专家认为会员交易金额的高低是影响会员价值高低的最重要因素。

根据CRM项目组的需求文案,确认聚类的类别的类别数量为K;

将每类用户的RFM平均值和总的RFM平均值做比较,通过比较得到每类会员RFM的变动情况;

分析会员的终身价值类别 指标最小值最大值平均值标准差

近度212860.0720.191

频度0135.981.861

值度54.431499.17704.7467216.22068

由于RFM三个指标的量纲不同,因此需要消除分布差异大的影响和量纲不同的影响。

K-means数据聚类

K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。

现在使用这三个因子作为本次建模的特征值(R、F、M),每个因子有两个变化,高与低,由此确认K的值:

应用于每类价值的会员: RFMResult

000流失客户

001一般维持客户

010新客户

011潜力客户

100重要挽留客户

101重要深耕客户

110重要唤醒客户

111重要价值客户

算法的实现K-means in Python 在Python或Spark Milb包中,已经有对K-means、K-means++成熟的集成,详细的聚类算法讲解,我将放在文献和附录里面。而这里我们使用的距离公式采用默认欧的几何公式来推算:

会员终身价值得分(特征结合)

AHP层次分析法

K-means(质心)

总得分:

其中C是每一类的质心,按照总得分来进行标签逻辑

python 估值模型_利用RFM模型建模,并通过聚类分析、分类,分别算出8中不同的价值会员...相关推荐

  1. ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选

    ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选 目录 利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选

  2. 案例(一) 利用RFM模型做用户价值分析

    同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/python-python1/ 一.案例背景 在产品迭代过程中,通常需要根据用户的属性进行归 ...

  3. 决策树模型 朴素贝叶斯模型_有关决策树模型的概述

    决策树模型 朴素贝叶斯模型 Decision Trees are one of the highly interpretable models and can perform both classif ...

  4. python多元非线性回归_利用Python进行数据分析之多元线性回归案例

    线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量).例如,餐厅根据每天的营业数据(包括菜谱价格.就餐人数.预定人数.特价菜折扣等)预测就餐规 ...

  5. 如何用python制作画像_利用Python搭建用户画像系统

    用户画像是当下很多企业都会提及的概念,多数情况下会和大数据以及营销挂钩.本文将对用户画像的相关知识进行进行简单的介绍,并利用Python去实现一个简单的用户画像系统. 1.什么是用户画像 用户画像可以 ...

  6. 逻辑回归模型_逻辑回归模型

    点击"蓝字"关注我们吧 1 线性模型的局限性 在线性模型中,一个重要的条件便是响应变量 须服从正态分布.然而,实际问题往往更加复杂, 并不总是满足正态分布的假设. 不同参数的正态分 ...

  7. IBIS模型:利用IBIS模型研究信号完整性问题

    作者:Bonnie C. Baker,德州仪器 (TI) 高级应用工程师 本文是关于在印刷电路板 (PCB) 开发阶段使用数字输入/输出缓冲信息规范 (IBIS) 模拟模型的文章.本文将介绍如何使用一 ...

  8. lstm模型_基于LSTM模型的学生反馈文本学业情绪识别方法

    | 全文共8155字,建议阅读时长8分钟 | 本文由<开放教育研究>授权发布 作者:冯翔 邱龙辉 郭晓然 摘要 分析学生学习过程产生的反馈文本,是发现其学业情绪的重要方式.传统的学业情绪 ...

  9. 判刑形状模型_主动形状模型 - 作业部落 Cmd Markdown 编辑阅读器

    主动形状模型 机器学习 常见使用场景 ASM 模型是一种基于统计形变模型的分割算法.在分割图像时,综合考虑了图像的大小.灰度.大致位置和图像形状等先验知识.它使用从训练样本得到的统计模型作为初始位置, ...

最新文章

  1. 华为手机像素密度排行_2020拍照手机十大排行:华为128分破纪录,苹果无一上榜...
  2. 三星手机如何分屏_刷机基础知识三星如何手机进入ODIN模式
  3. Skin设计小组新作品发布—绿草蓝天
  4. Linux I/O模型
  5. JSON (一) JSON语法和数据类型
  6. 父表ID查询子表 所属name字符拼接 for xml path
  7. mybatis 不生效 参数_Mybatis-日志配置
  8. wireshark 过滤法则
  9. .Net之Layui多图片上传
  10. ContentObserve的基本使用方法
  11. adb shell 执行sh脚本_Shell命令脚本初步认识,Shell脚本入门
  12. 计算机关机怎么关机,电脑关机命令,电脑关机命令怎么使用?
  13. 博客内容优化的经验分享
  14. matlab画图,仅显示部分图例
  15. 超酷汇编教程-- 简明x86汇编语言教程(1)
  16. 淘宝平台搜索规则变化,怎么提升搜算转换率?
  17. linux返回上一步命令
  18. 基因、DNA、碱基、染色体之间的关系是什么?
  19. 网卡 promiscuous mode 与 MAC 的一些 filter 功能
  20. 微信小程序—写字板、手写签名(高仿毛笔效果)让汉字引领世界

热门文章

  1. 软件开发的定律:布鲁克定律
  2. 基于Python近红外光谱分析与机器学、深度学习方法融合技术
  3. 傅盛:生物学思维给我的四个启示
  4. SendMessage参数大全
  5. Aerial for Mac(mac高清鸟瞰屏幕保护程序)v2.1.3最新版
  6. BLU58小票打印机win10驱动安装
  7. Android Studio Cmake升级至最新版本
  8. 多种改变iframe的src地址方法
  9. 中国人保为深交情品牌承保产品责任险,为消费者保驾护航
  10. C# 如何实现千位分隔符(三位分隔)