通过Python实现RFM,并分析用户价值度,最终给到运营做分析使用。

案例数据是某企业2016年的部分抽样数据,数据来源于销售系统,主要是用户订单记录。

案例过程:

步骤1 导入所需用到的库

步骤2 读取原始数据

查看前5行数据,包含四个字段。

步骤3 数据审查和校验

主要查看数据概览、缺失值情况、异常值情况

(1)通过describe()可查看整体数据的基本描述性统计信息,由于数据集中只有AMOUNTINFO字段有查看其信息的必要,因此这边只看订单金额的情况。

根据上图的结果可以看出:订单金额最小值为0.5,而最大订单金额达3w+,极值差距很大;标准差也很大,说明数据波动非常明显;

#经过与业务方沟通后确认,最大订单的订单金额有效,为某用户一次性购买多个大家电商品;而订单金额为0.5元的订单属于促销优惠券生成的订单,这些订单用来为用户消费时提供优惠券,没有实际意义,因此这些数据需要剔除。

(2)查看空值情况

ORDERDATE、AMOUNTINFO两个字段含有空值记录;

共有10条记录含有空值情况,数据量小,因此可以直接剔除。

步骤4 数据预处理准备工作

包括数据异常处理、格式转换

数据类型转换:

此处目的是为了实现后续的时间间隔的计算,因此需要进行转换。

数据准备工作:

分别计算R、F、M三个原始变量的数据,主要通过groupby进行计算。

步骤5 计算RFM得分

通过时间间隔是计算R的基础,然后对R、F、M三个变量使用分数位法做区间划分,使用pd.cut的方法,设置5份。

根据RFM的两种得分方法分别计算出结果存入,具体如下:

#以下为本人自己的分析思路,仅供参考。

观察以上数据发现rfm_score2(组合得分)的组合方式只有14种,因此想要知道这14种RFM得分的分布频率如何;

观察上图结果得到:

(1)总体客户消费状态不太好,分布最多的五种RMF得分分别是:511、411、311、211、111,说明最近消费的客户的消费频率低、消费金额少。

(2)而我们观察到三个方面表现都很好的得分为555只有一个用户,该用户应该引起会员管理部门的重点关注。

其中书中的结论为:

基于RFM得分业务方得到这样的结论

  • 公司的会员中99%以上的客户消费状态都不容乐观,主要体现在消费频率低R、消费总金额低M。——经过分析,这里主要由于有一个用户(ID为74720)消费金额非常高,导致5分位时受到最大值的影响,区间向大值域区偏移。
  • 公司有一些典型客户的整个贡献特征明显,重点是RFM得分为555的用户,该用户不仅影响了订单金额,而且其频率和购买新鲜度、消费频率都非常高,应该引起会员管理部门的重点关注。
  • 本周变现处于一般水平以上的用户的比例(R、M、F三个维度得分均在3以上的用户数)相对上周环比增长了1.3%。这种良好趋势体现了活跃度的提升。
  • 本周低价值(111以上)用户名单中,新增了1221个新用户,这些新用户的列表已经被取出。

案例应用和部署

  • 将ID为74270的用户加入大客户名单,并实现重点关怀和管理。
  • 上周的会员工作中有关低价值群体的用户并未减少,反而新增了一些,需要会员部门重点关注和处理。目前最重要的还是通过会员渠道拉动会员再次访问网站并订单,防止客户的流失和沉默,而订单的金额是次要因素。

录入数据库的RFM得分数据已经应用到其他数据模型中,成为建模输入的关键维度特征之一。同时,该模型已经作为定时任何每周一早晨上班前运行一次。

———————————分隔符—————————————

结论中红色部分是我没看明白的部分,最后两点不知是否是经过两周的观察得出的结论,希望有心人士可以为我解答一下。

如有需要数据、代码的可以评论or 私信找我。

案例:基于RMF的用户价值度分析相关推荐

  1. 用户活跃/用户价值度分析

    用户活跃.用户价制度分析的在数据分析师的日常工作中经常会碰到,如何根据公司的业务情况对本公司的用户做活跃和价制度的划分是一种常规化的分析工作. 在用户生命周期中,对每个用户进行群体划分,有针对性地做分 ...

  2. php怎么把日志推送过去_实践 | 基于Flink的用户行为日志分析系统

    用户行为日志分析是实时数据处理很常见的一个应用场景,比如常见的PV.UV统计.本文将基于Flink从0到1构建一个用户行为日志分析系统,包括架构设计与代码实现.本文分享将完整呈现日志分析系统的数据处理 ...

  3. 基于python的情感分析案例-基于情感词典的python情感分析

    Python Python开发 Python语言 基于情感词典的python情感分析 近期老师给我们安排了一个大作业,要求根据情感词典对微博语料进行情感分析.于是在网上狂找资料,看相关书籍,终于搞出了 ...

  4. 案例:淘宝用户行为数据分析(SQL实现)

    一.项目介绍 本文针对淘宝APP的运营数据,使用阿里云天池上公开的数据集,以行业常见指标对用户行为进行分析,主要工具为MySQL,涉及分组汇总,引用变量,视图,关联查询等内容,可视化工具为excel和 ...

  5. 六种常见的「用户行为」分析方法

    日常的用户行为分析中,常用的六大分析方法有: 行为事件分析 页面点击分析 用户行为路径分析 用户健康度分析 漏斗模型分析 用户画像分析 用户分析能够更好地了解用户的行为习惯,发现产品在推广.拉新.用户 ...

  6. python 估值模型_基于Python的客户价值细分模型(RFM)

    RFM模型:是衡量客户价值和客户创利能力的重要工具和手段.在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的.该机械模型通过一个客户的近期购买行为(recency).购买的总体频率( ...

  7. 数据分析实战案例:手把手教你用 Python 分析千万级淘宝数据

    1.项目背景与分析说明 1)项目背景 网购已经成为人们生活不可或缺的一部分,本次项目基于淘宝app平台数据,通过相关指标对用户行为进行分析,从而探索用户相关行为模式. 2)数据和字段说明 本文使用的数 ...

  8. 淘宝电商用户行为数据分析及可视化—基于MySQL/Tableau/PPT(含分析报告及代码)

    本项目以阿里巴巴移动电商平台-淘宝APP的真实用户-商品行为数据 User Behavior Data on Taobao App 为基础,使用MySQL进行数据清洗,使用AARRR模型.RFM模型. ...

  9. 基于AARRR、RMF模型对淘宝用户行为进行分析

    文章目录 一.分析目的 二.数据来源 字段说明 三.数据处理 1.引入库 2.数据清理及预处理 四.用户行为分析(AARRR模型) 活跃度 双十二当天活跃度的变化 不同用户行为的活跃度变化 留存率 漏 ...

最新文章

  1. 怎样实现两个线程共享一个集合_面试高频考察点:几种线程安全的Map解析
  2. 前端一HTML:七:css初步认识
  3. yjv是电缆还是电线_YJV与VV电缆的区别你知道吗?推荐
  4. Effective C++ 学习笔记(11)
  5. 陈华钧 | 知识图谱构建,将成为智能金融的突破口
  6. Remote URL test failed: protocol ‘Remote URL test failed: Authentication failed for,不能clone,push和pul
  7. 图文并茂: 二进制与十进制间的转换方法
  8. python 类创建
  9. Git tag常用命令分享
  10. 黑马程序员入学基础测试(五)
  11. 页面指令JSP常见的指令有哪些?(面试必备)
  12. linux调度器(九)——调度器的配置参数
  13. php区块链开发游戏,php程序员如何开发区块链、以太坊、智能合约的教程
  14. 记一次隐藏动态库符号的探索过程
  15. 一文搞懂X509证书PEM DER CRT CER的区别
  16. 【教程】win10 固态硬盘卡机卡死卡顿的真正原因!
  17. 网易 产品策划( 杭州研究员) 笔试题解
  18. Android app 后台被杀恢复
  19. 联邦学习学习笔记——论文理解《Communication-Efficient Learning of Deep Networks from Decentralized Data》
  20. 轮播图的做法(更换背景图片)

热门文章

  1. KEIL软件错误代码及错误信息
  2. html中的那些炫酷吊炸天的操作
  3. 计算机病毒与防护学生反思,计算机病毒与防治教学反思
  4. dotnet 读 WPF 源代码笔记 了解 WPF 已知问题 用户设备上不存在 Arial 字体将导致应用闪退...
  5. 小南迎宾机器人使用说明
  6. java excel 判断组重复_Java判断Excel某列是否有重复值
  7. 一个人怎么写大型软件
  8. 如何做好新媒体运营推广工作,黎想首谈一位优秀新媒体运营策划人员的思维模型
  9. 【老生谈算法】matlab实现自动画玫瑰程序源码——画玫瑰
  10. 基于Matlab模拟AWGN 信道上 OFDM附完整代码