sim卡rfm

Recency, Frequency, & Monetary (RFM) is one of the techniques that can be used for customer segmentation and is one of the conventional ways for segmentation that been used for a long time.

新近度,频率和货币(RFM)是可用于客户细分的技术之一,并且是长期使用的传统细分方法之一。

  1. Recency refers to when the customer did the most recent transaction using our product

    近因是指当客户使用我们的产品所做的最新交易

  2. Frequency refers to how often customers do transactions using our product

    频率是指客户使用我们的产品进行交易的 频率

  3. Monetary Value refers to how much does a customer spend in our product

    货币价值是指客户在我们的产品上花费了多少

RFM method is straightforward; we only have to transform our data (usually in the shape of transactional data) into data frame consists with three variables Recent Transaction, Transaction Frequency, and Transaction Amount (Monetary Values).

RFM方法很简单; 我们只需要将我们的数据(通常以交易数据的形式)转换为包含三个变量“ 最近交易”,“交易频率”和“ 交易金额”(货币值)的数据框

Transactional data itself is the data which records or captures every transaction that been done by customers. Typically, transactional data consists of transaction time, transaction location, how much amount our customers spend, which merchant the deal took place, and every detail that can be recorded at the moment transactions were made.

交易数据本身就是记录或捕获客户完成的每笔交易的数据。 通常,交易数据包括交易时间,交易地点,我们的客户花费多少,交易发生在哪个商人以及在进行交易时可以记录的每个详细信息。

Let see our transactional dataset that later will be used as our study case. Our dataset is a 2016 credit card transactional data from every customer. Transactions dataset consist of 24 features which recorded during every transaction our customers made. Even if we have many features on our dataset; we will not use all of them and only use small numbers of features which can be transformed into Recency, Frequency, and Monetary Values instead.

让我们看看我们的交易数据集,以后将其用作我们的研究案例。 我们的数据集是来自每个客户的2016年信用卡交易数据。 交易数据集包含24个特征,这些特征记录在客户进行的每次交易中。 即使我们的数据集上有很多功能, 我们将不会全部使用它们,而只会使用少量可以转换为新近度,频率货币价值的功能

Link to dataset: https://www.kaggle.com/derykurniawan/credit-card-transaction

链接到数据集: https : //www.kaggle.com/derykurniawan/credit-card-transaction

Fig-1. Transactional Data Features
图。1。 交易数据功能

If we return to our description of RFM features; we only have to keep customerId, transactionDate, and transactionAmount to create Recency, Frequency, and Transaction Amount features in the new data frame that grouped by customerId features.

如果我们返回对RFM功能的描述; 我们只需保留customerId,transactionDatetransactionAmount即可在按customerId功能分组的新数据框中创建新近度,频率交易金额功能。

For the Recency feature, we can subtract the current date with the maximum value of transactionDate (latest transaction). Since our dataset only contains 2016 transactional data, we will set 1st January 2017 as our current date.

对于新近度功能,我们可以用transactionDate(最新交易)的最大值减去当前日期。 由于我们的数据集仅包含2016年交易数据,因此我们将2017年1月1日设置为当前日期。

For the Frequency feature, we count how many transactions were made for every customer using n() function in R.

对于频率功能,我们使用R中的n()函数计算每个客户进行了多少笔交易。

for the Transaction Amount feature, we calculate the summation of transactionAmount for every customer.

对于交易金额功能,我们计算每个客户的transactionAmount的总和。

Import and Transform Transactional Data to RFM Data
导入事务数据并将其转换为RFM数据
Fig-2. First six rows of RFM Dataset
图2。 RFM数据集的前六行

Now we have three main feature for the RFM segmentation. It is similar to any other data analytical case, the first step that we have to do is exploring our dataset, and in this case, we will check every feature distribution using histogram plot using hist() function in R.

现在,我们为RFM细分提供了三个主要功能。 类似于任何其他数据分析案例,我们要做的第一步是探索数据集,在这种情况下,我们将使用R中的hist()函数使用直方图来检查每个特征分布。

Fig-3 Histogram of RFM Features Data
图3 RFM特征数据直方图

Our RFM dataset is so right-skewed, and it will be a catastrophic problem in K-Means clustering method since this method using the distance between points as one of its calculation to determine which cluster is the points fitted the most. Log transformation can be used to handle this kind of skewed data, and since we have 0 (zero values) in the data, we will use log(n + 1) to transform our data instead of the ordinary log transformation.

我们的RFM数据集偏右,这在K-Means聚类方法中将是一个灾难性的问题,因为该方法使用点之间的距离作为其计算之一来确定哪个聚类是最适合的点。 可以使用对数转换来处理这种偏斜的数据,并且由于数据中包含0 (零值),因此我们将使用log(n + 1)来转换数据,而不是普通的对数转换。

Log-Transformation and Histogram Plot
对数变换和直方图
Fig-4. Histogram of RFM Features Data — Logarithmic Scale
图4。 RFM功能数据的直方图-对数刻度

Logarithmic transformation provides better data for K-Means method to calculate and find the best cluster for our data by getting rid much of skewed data in our RFM dataset.

通过消除RFM数据集中的大量偏斜数据,对数变换为K-Means方法提供了更好的数据,以计算和找到最佳聚类。

K均值聚类 (K-Means Clustering)

K-Means clustering method by definition is a type of unsupervised learning which been used for defining the unlabeled data into groups based on its similarity.

根据定义,K-Means聚类方法是一种无监督学习,用于基于其相似性将未标记数据定义为组。

In R, K-Means clustering can be quickly done using kmeans() function. But, we have to find the number of clusters before creating the K-Means model. There are so many ways to find the best number of groups to assign, one of them is by using our business sense and assign the number directly, or we also can use mathematical sense to calculate the similarity between each point.

在R中,可以使用kmeans()函数快速完成K-Means聚类。 但是,在创建K-Means模型之前,我们必须先找到簇的数量。 有很多方法可以找到要分配的最佳组数,其中一种方法是使用我们的业务意识并直接分配数量,或者我们也可以使用数学方法来计算每个点之间的相似度。

On this example, we will use the within-cluster sum of squares that measures the variability of the observations within each cluster. We will iteratively calculate the within-cluster sum of squares for every cluster in range of 1 to 10 and choose the group with the lowest value and no further significant changes in value for its next cluster, or often we called it as the Elbow Method.

在此示例中,我们将使用集群内平方和来衡量每个集群内观测值的变异性。 我们将迭代计算范围在1到10之间的每个群集的群集内平方和,并选择值最低且其下一个群集的值没有进一步显着变化的组,或者我们通常将其称为Elbow方法

Elbow Method in R
R中的肘部方法
Fig-5 Dataset Elbow Method Visualization (N = 4)
图5数据集肘方法可视化(N = 4)

Using the elbow method, we will assign four groups as our number of clusters. Using kmeans() function in R we only need to put cluster number in centers parameter and assign the clustering results into our dataset.

使用弯头法,我们将四个组分配为簇数。 在R中使用kmeans()函数,我们只需要将聚类数放在center参数中,并将聚类结果分配到我们的数据集中即可。

K-Means Model and Segment Summary
K均值模型和细分摘要
Fig-6. Dataset after Segment Addition
图6。 段添加后的数据集

We now have assigned every Customer ID into their groups in the segment feature. For the next step, we will check the basic RFM profile from every segment by grouping the average value of RFM features based on its segment number.

现在,我们已经在细分功能中将每个客户ID分配到了他们的组中。 下一步,我们将根据分段的编号将RFM功能的平均值分组,从而检查每个分段的基本RFM配置文件。

Fig-7. RFM Summary per Segment
图7。 每个细分的RFM摘要

So, we have four groups and let’s discuss the detail for every group:

因此,我们分为四个小组,让我们讨论每个小组的详细信息:

  1. Segment-1 (Silver): Middle-class customer with second-most considerable transactions frequency and spending amount.

    第1段(白银):交易频率和支出金额第二高的中产客户。

  2. Segment-2 (Gold): Most valuable customers who have the most significant spending amount and the one who make transactions the most

    第2部分(黄金):支出金额最高的最有价值的客户,交易最多的客户

  3. Segment-3 (Bronze): Commoner customer with low transactions frequency and low spending amount. But, this segment has the largest number of the customer.

    第3部分(铜牌):交易频率低且支出金额低的普通客户。 但是,该细分市场拥有最多的客户。

  4. Segment-4 (Inactive): Inactive/less-active customers whom latest transactions had done in more than a month ago. This segment has the lowest number of customer, transaction frequency, and transaction amount.

    分类4(不活跃):不活跃/不活跃的客户,其一个多月前进行了最新交易。 该细分市场的客户数量,交易频率和交易金额最低。

Now, we have four groups of customer with detailed RFM behaviour from each group. Usually this information can be used for arrange marketing strategy that well-targeted to the customers who share similar behaviour. Recency, Frequency, and Monetary Values segmentation is simple but useful for knowing your customer better and aiming an efficient and optimum marketing strategy.

现在,我们有四个客户群,每个客户群都有详细的RFM行为。 通常,此信息可用于安排针对具有相似行为的客户的目标明确的营销策略。 新近度,频率货币价值 细分很简单,但有助于更好地了解您的客户并制定有效和最佳的营销策略。

翻译自: https://towardsdatascience.com/rfm-clustering-on-credit-card-customers-cdec560281c0

sim卡rfm


http://www.taodudu.cc/news/show-863381.html

相关文章:

  • 需求分析与建模最佳实践_社交媒体和主题建模:如何在实践中分析帖子
  • 机器学习 数据模型_使用PyCaret将机器学习模型运送到数据—第二部分
  • 大数据平台蓝图_数据科学面试蓝图
  • 算法竞赛训练指南代码仓库_数据仓库综合指南
  • 深度学习 图像分类_深度学习时代您应该阅读的10篇文章了解图像分类
  • 蝙蝠侠遥控器pcb_通过蝙蝠侠从Circle到ML:第一部分
  • cnn卷积神经网络_5分钟内卷积神经网络(CNN)
  • 基于树的模型的机器学习
  • 数据分析模型和工具_数据分析师工具包:模型
  • 图像梯度增强_使用梯度增强机在R中进行分类
  • 机器学习 文本分类 代码_无需担心机器学习-如何在少于10行代码中对文本进行分类
  • lr模型和dnn模型_建立ML或DNN模型的技巧
  • 数量和质量评价模型_数量对于语言模型可以具有自己的质量
  • mlflow_使用MLflow跟踪进行超参数调整
  • 聊天产生器
  • 深度学习领域专业词汇_深度学习时代的人文领域专业知识
  • 图像分类
  • CSDN-Markdown基本语法
  • python3(一)数字Number
  • python3(二)Numpy
  • python3(三)Matplotlib
  • python3(四)Pandas库
  • python3(六)监督学习
  • pycharm中如何调用Anoconda的库
  • TensorFlow(四)优化器函数Optimizer
  • TensorFlow(三)常用函数
  • TensorFlow(五)常用函数与基本操作
  • TensorFlow(六)with语句
  • Pycharm如何选择自动打开最近项目
  • CSDN-Markdown编辑器如何修改图像大小

sim卡rfm_信用卡客户的RFM集群相关推荐

  1. C#两大知名Redis客户端连接哨兵集群的姿势

    前言 前面<Docker-Compose搭建Redis高可用哨兵集群>, 我的思路是将Redis.Sentinel.Redis Client App链接到同一个网桥网络,这个网桥内的Red ...

  2. 物联卡如何助力对讲机建立公网集群?如何实现公网集群管理?

    公网对讲机作为模拟集群迈向数字集群的标志性应用,通过物联网卡实现公网对讲机的通信联网服务,目前被广泛的应用在高速公路.石油石化.出租车公司等行业里,与传统的对讲机形成了竞争,加入物联卡建群的公网集群对 ...

  3. 中国移动将对SIM卡进行节能减排改造

    小小一张SIM卡,中国移动却要以此做一篇节能减排的大文章.   据悉,中国移动将从明年初开始实施推广小卡化SIM卡新包装方案,同时逐步引入6管脚封装方案SIM卡. 小卡化包装节能减排表现优异 全球环保 ...

  4. 行业分析-全球与中国SIM卡托市场现状及未来发展趋势

    根据QYR(恒州博智)的统计及预测,2021年全球SIM卡托市场销售额达到了 亿美元,预计2028年将达到 亿美元,年复合增长率(CAGR)为 %(2022-2028).地区层面来看,中国市场在过去几 ...

  5. SIM卡安全基本知识

    详细的安全规范参考TS GSM 02.09 [4] and TS GSM 03.20 [11]. 鉴权与加密的重要性 客户的鉴权和加密是通过系统提供的客户三参数组来完成的.客户三参数组的产生在GSM系 ...

  6. zookeeper专题:zookeeper集群搭建和客户端连接

    文章目录 1. Zookeeper 集群模式介绍 2. zookeeper 集群搭建 3. 使用curate客户端连接zookeeper集群 1. Zookeeper 集群模式介绍 Zookeeper ...

  7. Kubernetes的共享GPU集群调度

    问题背景 全球主要的容器集群服务厂商的Kubernetes服务都提供了Nvidia GPU容器调度能力,但是通常都是将一个GPU卡分配给一个容器.这可以实现比较好的隔离性,确保使用GPU的应用不会被其 ...

  8. Kubernetes的共享GPU集群调度 1

    问题背景 全球主要的容器集群服务厂商的Kubernetes服务都提供了Nvidia GPU容器调度能力,但是通常都是将一个GPU卡分配给一个容器.这可以实现比较好的隔离性,确保使用GPU的应用不会被其 ...

  9. 云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据

    摘要: 使用过开源HBase的人都知道,运维HBase是多么复杂的事情,集群大的时候,读写压力大,配置稍微不合理一点,就可能会出现集群状态不一致的情况,糟糕一点的直接导致入库.查询某个业务表不可用, ...

最新文章

  1. Android WebView与js交互通信
  2. C++ 中的 IO流
  3. 技术的本质 2月23日摘抄
  4. “2011年度IT博客大赛”支持fangmin的。请投下您最宝贵的一票
  5. linux运行python乱码_linux下python中文乱码解决方案详解
  6. 【STM32】窗口看门狗
  7. mysql 8.0.22_最新版MySQL 8.0.22下载安装超详细教程(Windows 64位)
  8. aspect spring_使用Aspect和Spring Profile进行电子邮件过滤
  9. android 北斗定位代码_iPhone 11 确认支持北斗导航,真相来了!
  10. php strip_tags 少,详解PHP函数 strip_tags的用法不足之处
  11. CSS的三种引入方式(行内样式、内部样式、外部样式)
  12. vue微信内h5页面微信授权登录
  13. wamp如何升级php版本,wamp升级php
  14. 编写一个主函数和子函数char *tran(int x, int r), 要求是:函数tran将十进制整数x转换成r进制数y(r在2~16之间), x和r的值由主调函数(即主函数)传入,y的值需要返
  15. 对android layout_wight属性和weight_sum属性的深入理解
  16. 简述https的几种加密方式
  17. excel表格拆分多个表
  18. 区块链金融中的python应用--LSM定价
  19. 计算机网络基础之传输介质
  20. C语言无符号与有符号之间的比较

热门文章

  1. iOS自定义弹出视图、收音机APP、图片涂鸦、加载刷新、文件缓存等源码
  2. telnet 查看端口是否可访问
  3. 开源会议系统openmeetings安装
  4. URAL 题目1297. Palindrome(后缀数组+RMQ求最长回文子串)
  5. Windows-Qt-EclipseCDT 环境问题集
  6. ffmpeg文档2:输出到屏幕
  7. 在线日志文件丢失的恢复(笔记)
  8. linux进程管理 pdf,高效与精细的结合--Linux的进程管理.pdf
  9. java hasmoreelements_Java IOException.hasMoreElements方法代码示例
  10. 游客显示的html代码,html5游客总数柱状图代码