数据分析入门与实战  公众号: weic2c

背景:一个会员服务的企业,有近1年约1200个会员客户的收银数据。由于公司想针对不同类别不活跃客户进行激活促销;同时,为回馈重点客户,也计划推出一系列针对重点客户的优惠活动,希望保留这些客户,维持其活跃度。因此希望利用该数据进行客户分类研究。

根据客户的需求,RFM模型相对简单并且直接,按照R(Recency-近度)、F(Frequency-频度)和M(Monetary-额度)三个维度进行细分客户群体。由于该客户的数量较少(约1200个),所以,采用3x3x3=27个魔方(1200/27=44左右)较为合适,虽然平均每类客户数量较少,考虑到集中度分布情况,数量多的分类也能够有200-300左右,适合针对会员客户进行短期的电话、短信营销或者信函营销的数量。

RFM模型原理:

RFM模型是一个简单的根据客户的活跃程度和交易金额贡献所做的分类。因为操作简单,所以,较为常用。

近度R:R代表客户最近的活跃时间距离数据采集点的时间距离,R越大,表示客户越久未发生交易,R越小,表示客户越近有交易发生。R越大则客户越可能会“沉睡”,流失的可能性越大。在这部分客户中,可能有些优质客户,值得公司通过一定的营销手段进行激活。

频度F:F代表客户过去某段时间内的活跃频率。F越大,则表示客户同本公司的交易越频繁,不仅仅给公司带来人气,也带来稳定的现金流,是非常忠诚的客户;F越小,则表示客户不够活跃,且可能是竞争对手的常客。针对F较小、且消费额较大的客户,需要推出一定的竞争策略,将这批客户从竞争对手中争取过来。

额度M:表示客户每次消费金额的多少,可以用最近一次消费金额,也可以用过去的平均消费金额,根据分析的目的不同,可以有不同的标识方法。一般来讲,单次交易金额较大的客户,支付能力强,价格敏感度低,是较为优质的客户,而每次交易金额很小的客户,可能在支付能力和支付意愿上较低。当然,也不是绝对的。

RFM的分析工具有很多,可以使用SPSS或者SAS进行建模分析,然后深度挖掘。IBM SPSS还有个Modeler,有专门的RFM挖掘算法供使用。本文为了普及,介绍使用Excel(2007版)做初步的RFM分析。

操作步骤:

第一步:数据的清洗

原始数据集:数据请参考附件Excel(模拟数据.xlsx)。大家可以下载练习。

回复 数据分析入门与实战   公众号 “RFM”获取。

该数据集共有26600多条数据,包含记录ID(数据库的primarykey)、客户编号、收银时间、销售金额、销售类型共5个字段

通过简单的筛选,可以看到,在交易金额中有0消费额,有负数消费额,继续查看交易类型,发现为“赠送”和“退货”所造成。这些数据在本次分析中用不到,所以在数据处理时需要通过筛选除去。

Excel操作:

鼠标点击第一行的行标“1”以选中第一行

菜单栏点击“数据”,快捷按钮栏点选“筛选”

鼠标点击“销售类型”筛选下拉按钮,可以看到所有数据集中有的销售类型

点选“销售金额”字段的小角标也可以看到有负数出现。

第二步:数据处理

根据分析需要,R用客户最后成交时间跟数据采集点时间的时间差(天数)作为计量标准;F根据数据集中每个会员客户的交易次数作为计量标准(1年的交易次数);M以客户平均的交易额为计量标准。通过Excel的透视表即可计算以上RFM数据。

Excel操作:

菜单栏点击“插入”

快捷按钮栏点击“透视表”

选择数据区域,确认所有的数据都被选择

选择在“新工作表”中插入数据,然后点击“确定”

将“客户编号”拖入“行标签”栏

将“收银时间”、“记录ID”、“交易金额”拖入数值计算栏

点击“收银时间”数值计算栏按钮,选择“值字段设置”

在“计算类型”中选择“最大值”

在对话框左下角,点击“数字格式”,设定时间格式为:yyyy-mm-dd,然后“确定”

点击“销售金额”数值计算栏按钮,选择“值字段设置”

在“计算类型”中选择“平均值”,然后“确定”

在“记录ID”数值计算按钮栏,选择“值字段设置”

在“计算类型”中选择“计数”,然后“确定”

在透视表顶部筛选项“销售类型”处,点击下拉按钮小角标,在“选择多项”前的小方框中打勾,然后点掉“退货”和“赠送”前的勾,然后“确定”会得到如下结果。

以上我们得到了:

1)F值:客户这1年共消费了多少次

2)M值:客户每次交易的平均消费金额

但是,R值还需要做些处理。目前R值只得到的是客户最近一次消费日期,需要计算距离数据采集日期的天数。

Excel操作:

鼠标拉选列标签ABCD,选中透视表所在的四列

按ctrl^C(复制),点击“开始”菜单栏下,快捷按钮栏“粘帖”下的小下拉三角标,选择“粘帖值”【或者点“选择性粘帖”,然后选择粘帖值】,用单纯的数据形式覆盖原有透视表。

在C1单元格中输入数据采集日期2010-09-27,格式为yyyy-mm-dd

然后选中C1单元格,复制其中内容

选中B5:B1204【快捷操作:点中B5,同时按住Shift^Ctrl后点击向下箭头,松开ctrl键,继续按住shift键,按一次向上箭头,取消数据最后一行的汇总数据】

点击“开始”菜单栏下快捷按钮栏上的“粘帖”按钮下方的下拉箭头,选择“选择性粘帖”,在对话框中勾选“减”,然后“确定”

在不取消目前选择的情况下,选择“开始”菜单栏下快捷按钮栏上的格式化下拉菜单,选择“数字”

因为得到的数据为最后交易日期减去数据采集日期的天数,是负值,所以,还需要处理。

在D1单元格中输入-1

然后ctrl^C复制D1单元格中的值(-1)

然后选中B5:B1204【快捷操作同上】

“开始”-“粘帖”下拉按钮-“选择性粘帖”-在计算部分选择“乘”,然后点击“确定”

最后得到:

到此,我们得到R,F,M针对每个客户编号的值

第三步:数据分析

R-score, F-score, M-score的值,为了对客户根据R,F,M进行三等分,我们需要计算数据的极差(最大值和最小值的差),通过对比R(或者F,M)值和极差三等分距,来确定R(或者F,M)的R-score, F-score, M-score。

所以先计算R、F、M的最大值、最小值、极差三等分距

Excel操作:

F2到H2代表R\F\M的最小值,利用公式“=min(B5:B1204)”计算(计算F时B换成C,M时B换成D即可)

F3到H3代表R\F\M的极差三等分距,利用公式“=(F1-F2)/3”计算(计算F时F换成G,M时F换成H即可)

【以上快捷操作可用,先输入F1,F2,F3单元格里的公式,选择F1:F3三个单元格,然后拉动右下角的黑色小十字叉,向右拖动复制F列公式到G和H列即可】

R-score的计算公式为:

E5单元格内输入:“=IF(ROUNDUP((B5-$F$2)/$F$3,0)=0,1,ROUNDUP((B5-$F$2)/$F$3,0)) ”

之所以使用IF判断函数,主要是考虑到当R值为最小值时,roundup(B5,0)为0,用if函数判断如果为0,则强制为1。

之所以用$F$2锁定引用的单元格,是为了后续的公式复制,最小值和极差三等分距不会发生相对引用而变化位置【锁定引用单元格除了手工添加$符号外,快捷方式是选中引用的单元格按F4快捷键,此处都比较麻烦,手工输入$符号还快些】

【另外一种简单的处理方式就是直接用公式“=ROUNDUP((B5-$F$2)/$F$3,0)”,然后用ctrl^H快捷操作,将0值替换成1即可,这个替换需要将公式复制-快捷粘帖为数值后进行】

F-score和M-score如法炮制。

F5单元格公式为:=IF(ROUNDUP((C5-$G$2)/$G$3,0)=0,1,ROUNDUP((C5-$G$2)/$G$3,0))

G5单元格公式为:=IF(ROUNDUP((D5-$H$2)/$H$3,0)=0,1,ROUNDUP((D5-$H$2)/$H$3,0))

RFM-score的计算,利用分别乘以100-10-1然后相加的方式,让R、F、M分别为一个三位数字的三个百分位、十分位和个位表达,该三位数的三个位代表了3x3x3=27魔方三个维度上的坐标。

H5单元格的公式为: =E5*100+F5*10+G5

选中E4到H4区域,双击右下角小黑色十字叉,复制E4到H4公式到所有客户数据中

得到结果如下:

接下来的步骤就是统计各个魔方上的客户数量

再次利用透视表形成统计结果

Excel操作:

“插入”菜单栏下快捷按钮栏按“透视表”,在数据表区域中选择A4:H1204【确认这个选择,自动跳出来的区域要改一下的哦】,然后点击“确定”

将RFM-Score拖入“行标签”中,将“客户编号”拖入“数值计算”栏中,点击“数值计算”栏中的“客户编号”项,选择“字段数值设置”,选择计算方法为“计数”,得到处理结果如下:

第四步:数据分析结果解读和可视化

得到这个分析结果,利用Excel的条件格式功能可以对得到的数据分析结果做简单的视觉化。

Excel操作:

将透视表中B列拉宽(如上图)

选中B5:B22列

“开始”菜单栏下快捷按钮栏点击“条件格式”下拉菜单中选择“数据条”,然后选择一个颜色即可

通过条形图的视觉化,可以直观地对比哪类客户数量较多。

用Excel对会员客户交易数据进行RFM分析相关推荐

  1. 几百万的数据查找重复值_如何快速查找出Excel中的重复数据,多角度分析

    如何多角度查找出重复数据,是数据分析中必不可少的一项.办公中经常遇到重复数据,想要标识出来,再进一步分析,避免数据出错.像人事部门,经常遇到同名不同人这种情况,如果工资发错了,很容易出现大问题,如何来 ...

  2. 用户直销分析应用---如何使用RFM分析最具价值的网游付费用户

    IBM SPSS Statistics 18 版本后,新增加了客户直销模块,该模块的操作界面简单明了,结果报告分析清晰易懂,可以广泛的应用于电信,零售,银行,保险,证券,传媒,市场研究等行业领域,是为 ...

  3. RFM分析:如何进行有效的RFM模型搭建和分析?

    本文转自公众号首席数据科学家 RFM分析,是用户精细化运营中比较常见的分析方法了. 今天和大家分享一篇历史文章,内容做了微调.是数据分析中比较常用的一个分析框架:RFM分析.该模型用的很多,说明有模型 ...

  4. Excel向数据库插入数据和数据库向Excel导出数据

    为了熟悉java里工作簿的相关知识点,所以找了"Excel向数据库插入数据和数据库向Excel导出数据"的功能来实现. 注意事项:1,mysql数据库: 2,需要导入的jar包有 ...

  5. 【唠叨两句】如何将一张树型结构的Excel表格中的数据导入到多张数据库表中...

    小弟昨天遇到一个相对比较棘手的问题,就像标题说的那样.如何将一张树型结构的Excel表格中的数据导入到多张数据库表中,在现实中实际是七张数据库表,这七张表之间有着有着相对比较复杂的主外键关系,对于我这 ...

  6. PHP将excel文件中的数据批量导入到数据库中

    2019独角兽企业重金招聘Python工程师标准>>> 这几天在做项目时,遇到了需要批量导入数据的情况,用户将excel表格提交后,需要我们后台这边将excel表格信息中的内容全部插 ...

  7. python excel增加一列_(用Python修改excel中一列数据)python新增一列

    python怎么从excel中读取数据? ⒈ #import παέτο import xlrd #Ρύθμι διαδρής path='C:\\Users\\jyjh\\Desktop\\data ...

  8. PHP 利用PHPExcel到处数据到Excel;还有导出数据乱码的解决方案。

    PHP 利用PHPExcel到处数据到Excel:还有导出数据乱码的解决方案. 参考文章: (1)PHP 利用PHPExcel到处数据到Excel:还有导出数据乱码的解决方案. (2)https:// ...

  9. java filesystem 追加_java 如何往已经存在的excel表格里面追加数据的方法

    第一步.导入jar包,两个 第二步.编写程序 package cn.com.com; import java.io.FileInputStream; import java.io.FileOutput ...

最新文章

  1. 非线性规划-三种常见参数估计算法及联系
  2. Vivotek 摄像头远程栈溢出漏洞分析及利用
  3. Docker学习笔记【一】
  4. tibco linux安装手册,TIBCO iProcess安装系列在Linux上升级Oracle9.2.0.4到9.2.0.7
  5. mysql设置索引树长度_MySQL索引-B+树
  6. Ubuntu 9.10 升级到ext4
  7. P1047 [NOIP2005 普及组] 校门外的树(python3实现)
  8. nginx安装错误:c compiler cc is not found
  9. 阿里云服务器搭建个人网站
  10. Focal Loss 简介
  11. 学习笔记之——李群与李代数的理解
  12. 一副好的平面设计作品,来自优秀的字体
  13. mount point / 挂载点
  14. 从5亿红包到千亿营收,看百度的增长曲线
  15. 如何搭建“业务化”的指标体系?
  16. Acwing---1231.航班时间
  17. vue笔记+渡一教育第一章整理
  18. 2021~2022年全国考试/考证时间表(最全)
  19. 车载以太网——DoIP协议培训
  20. 中年人的职业规划,从来都不是自己一个人(选行业/公司/岗位……)的事儿...

热门文章

  1. 读数据库所有表和表结构的sql语句了(mssql)
  2. 第一步:Spring访问数据库(jdbcTemplate)
  3. PostgreSQL的执行计划分析
  4. l2-004 这是二叉搜索树吗?_算法学习笔记(45): 二叉搜索树
  5. 湖南工商大学计算机网络原理,李小龙(湖南工商大学计算机与信息工程学院副院长)_百度百科...
  6. html画布画带百分比饼状图,echart.js如何画带百分比的饼状图
  7. python 内置函数_python的内置函数、方法
  8. 21天Jmeter打卡Day8 get/delete/put之间的请求
  9. 21天jmeter打卡day6 配置元件之HTTP信息头+Cookie管理器
  10. 测试经验谈:测试人怎么从 0—1 进化