公众号后台回复“图书“,了解更多号主新书内容

作者:Rain

来源:DS数据科学之美

01

写在前面

在运营场景中, 经常需要对用户进行分层, 把整体的用户分层不同的层次的用户, 然后针对不同层次的用户采取不同的运营策略, 也被称作精细化运营。但是如何运用科学的方法对用户进行划分呢。

经常遇到的例子是这样的, 比如针对抖音的打赏的用户, 把这些用户按照不同的价值度进行划分, 然后针对不同价值的用户发放不同的优惠套路, 比如充值多少优惠多少

经常产品就会按照单一的月付费次数规则去划分, 比如如下, 我们就可以得到三种不同价值的用户, 这种划分的方法简单来看是没有大问题的, 但是对于数据分析师来说并不是科学的方法。

主要的缺点有两个, 首先是只用单一的付费次数来衡量用户的价值度, 没有考虑用户的付费金额, 一个用户假如付费的次数很频繁, 但付费的金额小, 那么他的价值度可能不如另外一个用户付费次数小于他的 但付费金额比他高很多。

另外人为定的划分的标准比如用付费次数 10, 100作为两个划分的临界点, 没有科学性, 很容易分出来的几乎绝大多数都变成高价值的用户, 这样肯定是不合理的。

一般来说, 肯定是高价值的用户的数量远远小于低价值的用户, 但这种数量是跟我们划分的标准紧密相关的, 不同的人定的划分的数值标准是不一样的, 那么定出来的高价值和低价值的差别就会较大, 所以我们需要去用一种科学的, 通用的划分方法去做用户分群。

而RFM作为用户价值的划分的经典模型, 就可以解决这种分群的问题。

02

什么是RFM

RFM 模型是利用 R, F, M 三个特征去对用户进行划分的。

其中R是表示最后一次付费的日期距离现在的时间, 比如你在 12月20号给一个主播打赏过, 那么到现在的距离的天数是5 那么R就是5, R是用来刻画用户的忠诚度, 一般来说R越小, 代表用户上一次刚刚才付费的, 这种用户的忠诚度比较高。

F是表示一段时间的付费频次, 也就是比如一个月付费了多少次, 这个是用来刻画用户付费行为的活跃度, 我们认为用户的付费行为频次越高, 一定程度上代表他的价值度

M是表示一段时间的付费金额, 比如一个月付费了10000元, M=10000, M主要是用来刻画用户的土豪程度。

以上我们就从用户的忠诚度, 活跃度, 土豪度三个方面去刻画一个用户的价值度。

根据RFM的值, 我们就可以把用户划分为以下不同的类别:

重要价值用户: R 低, F 高, M 高, 这种用户价值度非常高, 因为忠诚度高, 付费频次高, 又很土豪

重要召回用户: R 低, F 低 M 高, 因为付费频次低, 但金额高, 所以是重点召回用户

重要发展用户: R 高, F 低, M 高 因为忠诚度不够, 所以需要大力发展

重要挽留用户: R 高 F 低 M高  因为 忠诚度和活跃度都不够 很容易流失 所以需要重点挽留

还有四种其他用户就不一一列举

03

RFM如何进行用户分群

1.首先是利用sql 计算 每一个用户的 R, F, M, 最终得到的数据格式如下

2. 读取数据和查看数据

pay_data= pd.read_csv('d:/My Documents/Desktop/train_pay.csv')
# 路径名 'd:/My Documents/Desktop/train_pay.csv' 填写你自己的即可
pay_data.head()  # 查看数据前面几行

3. 选取我们要聚类的特征

pay_RFM = pay_data[['r_c','f_c','m_c']]

4. 开始聚类, 因为我们用户分群分的是八个类别, 所以k =8

# 创建模型
model_k = KMeans(n_clusters=8,random_state=1)
# 模型训练
model_k.fit(pay_RFM)
# 聚类出来的类别赋值给新的变量 cluster_labels
cluster_labels = model_k.labels_

5. 对聚类的结果中每一个类别计算 每个类别的数量 最小值 最大值 平均值等指标

rfm_kmeans = pay_RFM.assign(class1=cluster_labels)
num_agg = {'r_c':['mean', 'count','min','max'], 'f_c':['mean', 'count','min','max'],'m_c':['mean','sum','count','min','max']}
rfm_kmeans.groupby('class1').agg(num_agg).round(2)

6. 把聚类出来的类别和用户id 拼接在一起

pay_data.assign(class1=cluster_labels).to_csv('d:/My Documents/Desktop/result.csv',header=True, sep=',')

下面就是最终结果, label 表示用户是属于哪一个细分的类别

04

RFM模型的应用

重要价值客户:占比11.7%,处于正常水平,RFM都很大,对这部分优质客户要特殊保护

重要唤回客户:占比13.28%,交易金额和次数多,但最近无交易,需要运营/业务人员对其进行唤回(可用红包、奖励、优惠券等方式)

重要深耕客户:占比16.12%,该类客户占比最多,近期有交易且平均交易金额也多,交易频次低,所以需要对其识别后进行个性化推荐,增加用户付费次数,提高粘性

重要挽留客户:占比9.02%,该类客户占比最少,交易金额多于平均值,其付费能力较强,但最近无消费、消费频率低,可能是我们的潜在客户或易流失客户,可以找到该部分用户让其给出反馈建议等

潜力客户:占比11.11%,交易次数多近期也有消费,但整体消费金额低,可能是对价格较敏感或付费能力不足,可对该部分用户进行商品关联推荐

新客户:占比14.79%,最近有消费,交易频率和金额也不高,可对该部分用户增加关怀,推送优惠信息,增加粘性

一般维持客户:占比13.7%,累计单数高,近期无消费,交易金额不高,该部分客户可能快要流失,可低成本营销

流失客户:占比10.28%,三项指标均低于平均值,已经流失,有可能不是目标客户,若经费有限可忽略此类用户

◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行100-50活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢
● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗

数据分析方法和思维—RFM用户分群相关推荐

  1. 基于RFM和K-Means的用户分群

    在本项目中,我们基于用户购买数据(Transaction Data)做用户的分群,使用的方法一次是RFM模型和K-means算法. 原始数据是:http://archive.ics.uci.edu/m ...

  2. 淘宝用户日志数据集的用户行为分析与用户分群

    文章目录 数据集描述 一.数据清洗 1.读取并查看数据基本信息和数据的完整性 2.查看数据集中行的重复情况并删除 3.处理缺失值 4.合并month和day列组成时间类型的date列 5.划分子数据集 ...

  3. 数据分析方法和思维—漏斗分析

    本文来源于公众号渔好学 01 什么是漏斗分析 漏斗分析是一种可以直观地呈现用户行为步骤以及各步骤之间的转化率,分析各个步骤之间的转化率的分析方法. 比如对应我们每一次在淘宝上的购物, 从打开淘宝app ...

  4. 用户行为分析模型-(行为事件分析、用户留存分析、漏斗分析、行为路径分析、用户分群、点击分析)

    最近有些忙,但是看到了很好的分析模型也要跟大家分享的,这篇博客有些粗糙,主要是po上一些链接供大家学习,有时间的话,我也会写出自己关于用户行为分析的理解的. 下面是关于用户行为分析常见的分析维度,有助 ...

  5. 标签体系、用户分群、用户画像「玩味」解读,你沦为形式主义了吗?

    数据一直是各行各业的核心资产,蕴含巨大价值待挖掘,在数据→信息→知识的转化过程中,标签.指标是基础,它将抽象的数据转化为一个相对具象的信息中心,用户分群和用户画像都是在建立在信息中心上的综合应用手段, ...

  6. 用户增长分析——用户分群分析

    导语在产品的增长分析当中,想关注符合某些条件的一部分用户,不仅想知道这些人的整体行为(访问次数,访问时长等),还希望知道其中差异较大的细分群体.用户分群方法,能帮助我们对差异较大的群体分别进行深入分析 ...

  7. 大数据 客户标签体系_大数据场景营销之标签体系、用户分群、用户画像

    大数据一直是各行各业的核心资产,蕴含巨大价值待挖掘,在数据→信息→知识的转化过程中,标签.指标是基础,它将抽象的数据转化为一个相对具象的信息中心,用户分群和用户画像都是在建立在信息中心上的综合应用手段 ...

  8. 用户分群模型,这么建才有用

    公众号后台回复"图书",了解更多号主新书内容作者:接地气的陈老师来源: 接地气学堂 一听到用户分群呀,很多同学都来劲了,网上大量写用户分群多如牛毛.可实际工作中,经常做完分群以后被 ...

  9. 用户增长体系——用户分群分析

    导语在产品的增长分析当中,想关注符合某些条件的一部分用户,不仅想知道这些人的整体行为(访问次数,访问时长等),还希望知道其中差异较大的细分群体.用户分群方法,能帮助我们对差异较大的群体分别进行深入分析 ...

最新文章

  1. 如何使用DotNet 2.0中的应用程序配置 Settings.settings
  2. 计算机组成原理实验串行口,计算机组成原理实验2.ppt
  3. 推荐几个2021年在Redis、Go和Rust领域异军突起的技术公众号
  4. 构建freeswitch, make cd-moh-install提示文件错误
  5. 可不可以拿树莓派学python_【如何利用树莓派学习Linux及Python?】-看准网
  6. 计算机显卡怎样安装方法,台式机显卡怎么安装?教您安装方法
  7. [每天进步一点点~] px、rpx、pt之间的转换
  8. java area类用法_java反射
  9. RS232和TTL电平
  10. 浅谈设计师职业成长轨迹
  11. Chrome浏览器通过chrono下载插件设置下载断点续传
  12. c语言用二维数组遍历 “tic tac toe“ 输出游戏结果
  13. uva10056(概率+等比求和)
  14. delphi每次mysql密码BDE_关于DELPHI中BDE连接不上ORACLE数据库的問題
  15. 华为防火墙 相关命令
  16. c语言case2什么意思,switchCase2
  17. 采用JSP+Servlet+JDBC完成的一个产品信息管理系统
  18. 使用PicGo配置七牛云图床(图文步骤详细)
  19. django-registration
  20. 智能灌溉系统数字化浇水

热门文章

  1. ArUco钻石标记的检测
  2. JavaSE-Adventure(VII) Java OOP 面向对象程序设计
  3. 软件项目管理和测试题,软件项目管理第一章测试题
  4. lane是什么意思_lane是什么意思_lane的翻译_音标_读音_用法_例句_爱词霸在线词典...
  5. postgresql空间操作
  6. 又遇Trojan.PSW.Win32.QQPass,Trojan.PSW.Win32.GameOL等1
  7. 云游 Google I/O 2021——Google Cloud 硬件算力和模型新突破
  8. 基金代销-业务流程及数据交换图
  9. 如何实现脑肿瘤红黄绿分割展示
  10. CAS-认证流程详解