航空公司客户价值分析

  • 项目背景

    • 信息时代的到来注定营销焦点从产品中心转到了用户中心,客户关系管理成为企业的核心问题。
    • 客户关系管理的关键问题则是客户分类,通过分类区分客户价值的有无和高低,针对不同类别的用户制定个性化服务方案,采取不同营销方案,集中营销资源于高价值用户。
    • 对于航空公司而言,建立合理的客户价值评估模型,对客户进行分群,进行分价值处理是必要的。
  • 挖掘目标
    • 借助航空公司数据,进行客户分类。
    • 对不同客户类别进行特征分析,比较不同类别的客户价值。
    • 对不同价值的客户提供个性化服务,制定相应的营销策略。
  • 分析过程
    • 目标是用户价值识别,一般客户价值识别最广泛的模型是三个指标(最近消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别高价值用户,这就是RFM模型。
    • 这里需要注意,显然使用消费金额是不合理的(一个长距离的普通舱用户和一个短距离的高级舱用户价值显然不一样)。所以采用累积里程M和乘坐舱位对应的折扣系数的平均值C两个指标代替消费金额。
    • 此外,这种会员制的公司一般入会时间也影响价值判断,所以引入客户关系长度L,作为另一指标。
    • 最终这个模型的指标5个分别是客户关系长度L、消费时间间隔R、消费频率F、飞行里程M、折扣系数平均数C。
  • 处理过程
    • 显然,得到了需要的处理指标了,我们就要进行分析,如果使用传统的RFM的属性分箱方法(依据平均值分析),可以识别,但是分类结果群太多,企业不可能花费这么多的针对性营销成本。
    • 所以很明显,这是一个聚类分析的案例,不妨使用K-Means聚类分析。
    • 数据获取
      • 数据给出。
    • 数据探索 - 主要目标发现缺失值和异常值(如票价为0,可能原因是兑换或者0折)
    • 数据预处理
      • 数据清洗

        • 显然,通过探索已经得知数据存在异常值、缺失值,但是原始数据量太大,这类异常数据占比太少,直接丢弃即可。
        • 属性规约
        • 显然,原始数据中的数据属性太多了,根据需求指标,删除不相干的或者弱相关或者冗余的属性列。
        • 数据变换
      • 属性构造
        • 构造出不存在的指标
        • L = LOAD_TIME - FFP_DATE
        • R = LAST_TO_END
        • F = FLIGHT_COUNT
        • M = SEG_KM_SUM
        • C = AVG_DISCOUNT
      • 数据标准化
        • 不同属性之间取值范围差距过大,理论上影响程度应该一致。
    • 数据挖掘建模
      • 聚类分群(根据5个指标)
      • 采用K-Means聚类分群
      • 特征分析每个群,进行群组排序(依据价值)
      • 不难看出,基本上每一类都有明显的优势和弱势特征,企业需要做的就是根据这些修改营销方案。
    • 后续处理
      • 根据用户特征区间,分策略进行营销。
  • 补充说明
    • 参考书《Python数据分析与挖掘》

这里只列出建模代码,预处理代码可以查看我的github。

# -*- coding: UTF-8 -*-
'''
使用K-Means进行聚类
'''
import pandas as pd
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as pltdef leida(data, kmodel):'''画出雷达图:return:'''plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus'] = Falselabels = data.columnsprint(labels)k = 5plot_data = kmodel.cluster_centers_color = ['b', 'g', 'r', 'c', 'y']angles = np.linspace(0, 2*np.pi, k, endpoint=False)plot_data = np.concatenate((plot_data, plot_data[:, [0]]), axis=1)angles = np.concatenate((angles, [angles[0]]))fig = plt.figure()# polar参数ax = fig.add_subplot(111, polar=True)for i in range(len(plot_data)):# 画线ax.plot(angles, plot_data[i], 'o-', color=color[i], label=u'客户群'+str(i), linewidth=2)ax.set_rgrids(np.arange(0.01, 3.5, 0.5), np.arange(-1, 2.5, 0.5), fontproperties="SimHei")ax.set_thetagrids(angles * 180/np.pi, labels, fontproperties="SimHei")plt.legend(loc=4)plt.show()if __name__ == '__main__':inputfile = './data/data_standard.csv'k = 5# 读取数据并进行聚类分析data = pd.read_csv(inputfile, encoding='utf-8')# 调用k-means算法,进行聚类分析# n_jobs是并行数,一般等于CPU数较好kmodel = KMeans(n_clusters=k, n_jobs=4)kmodel.fit(data)# 查看聚类中心kmodel.cluster_centers_# 查看各样本对应的类别kmodel.labels_leida(data, kmodel)

数据分析与挖掘实战-航空公司客户价值分析相关推荐

  1. python数据分析与挖掘实战(航空公司客户价值分析)

    一.引言 企业在面向客户制定运营策略.营销策略时,希望能够针对不同的客户推行不同的策略,实现精准化运营,以期获取最大的转化率.客户关系管理是精准化运营的基础,而客户关系管理的核心是客户分类.通过客户分 ...

  2. 《Python数据分析与挖掘实战》第7章——航空公司客户价值分析(kmeans)

    本文是基于<Python数据分析与挖掘实战>的实战部分的第七章的数据--<航空公司客户价值分析>做的分析. 旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码. 1)在 ...

  3. (七)Python数据分析与挖掘实战(实战篇)——航空公司客户价值分析

    这个专栏用来记录我在学习和实践<Python数据分析与挖掘实战>一书时的一些知识点总结和代码实现. 文章目录 背景和目标 数据 客户基本信息 乘机信息 积分信息 脚本 data_explo ...

  4. 数据分析实战:航空公司客户价值分析

    一.背景目标 通过对航空公司客户数据分析,对客户进行分类: 比较不同客户的客户价值,并制定不同的服务和营销策略 二.数据探索分析 2.1 数据概况 数据时间范围: 2012年4月1日至2014年3月3 ...

  5. python客户价值分析_Python数据分析与应用航空公司客户价值分析.ppt

    Python数据分析与应用航空公司客户价值分析.ppt 大数据,成就未来 * 大数据挖掘专家 * 大数据挖掘专家 大数据,成就未来 航空公司客户价值分析 * 目录 分析航空公司现状 1. 行业内竞争 ...

  6. 毕业设计之 ---基于大数据分析的航空公司客户价值分析

    文章目录 0 前言 1 数据分析背景 2 分析策略 2.1 航空公司客户价值分析的LRFMC模型 2.2 数据 2.3 分析模型 3 开始分析 3.1 数据预处理 3.1.1 数据预览 3.1.2 数 ...

  7. 【毕业设计】大数据分析的航空公司客户价值分析 - python

    文章目录 0 前言 1 数据分析背景 2 分析策略 2.1 航空公司客户价值分析的LRFMC模型 2.2 数据 2.3 分析模型 3 开始分析 3.1 数据预处理 3.1.1 数据预览 3.1.2 数 ...

  8. 航空公司客户价值分析python实战

    航空公司客户价值分析(K_Means聚类分析) 最近在看黄红梅.张良均老师主编的<Python数据分析与应用>,拿书里的案例练练手. 本案例将使用航空公司客户数据,结合RFM模型,采用K_ ...

  9. python数据挖掘与分析实战pdf_《Python数据分析与挖掘实战》PDF+完整源码

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 本书共15章,分两个部分:基础篇.实战篇.基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例 ...

最新文章

  1. 一起学DNS系列(一)基础、概览
  2. 使用Flink时从Kafka中读取Array[Byte]类型的Schema
  3. 玩客云如何设置文件存储到副盘_如何存储自己的资料:低成本的小型存储方案...
  4. js实现网页防止被iframe框架嵌套及几种location.href的区别
  5. troubleshoot之:用control+break解决线程死锁问题
  6. 物联网技术渐趋成熟 车联网应用或成市场主驱力
  7. php通过实现excel导入,php实现excel导入数据
  8. Kafka(六)Kafka基本客户端命令操作
  9. 一步一步搭建客服系统 (7) 多人共享的电子白板、画板
  10. 百度地图隐藏LOGO显示
  11. 如何切换计算机用户界面,让我来教大家从WIN10界面切换到WIN 7界面吧!嘻嘻
  12. EMC -- DFS篇(Documentum Foundation Services)
  13. 塞班、libc.lib、系统错误-1、KErrNotFound、内嵌sis、embedded sis
  14. 树梅派输入法黑块问题
  15. 《计算机系统:核心概念及软硬件实现(原书第4版)》——3.1 无符号二进制表示...
  16. Linux系统的优点小结
  17. 帝国cms发布文章对哪些数据表做了操作
  18. 神经网络入门经典书籍,人工神经网络书籍推荐
  19. 微信小程序 -语音合成:将文字转为语音(小程序插件:微信同声传译)
  20. 学习iPhone UIKit 9

热门文章

  1. SpringMVC的请求-获得请求参数-获得POJO类型参数
  2. Spring源码(1)
  3. elasticsearch客户端介绍
  4. plsql编程语言定义变量
  5. SpringCloud 配置安全验证、服务消费端处理、无状态 Session 配置、定义公共安全配置程序类
  6. cfg桩设备型号_试桩、试验桩、工程桩是一回事吗?
  7. Activemq实战
  8. linux删除文件夹提示没找到,Win10中遇到删除文件夹提示找不到该项目的解决过程...
  9. DotNetTextBoxV3.0在线编辑器控件Ver3.4.1 Open Source开源版(附商业试用版下载)
  10. 一起撸个朋友圈吧(step5) - 控件篇【评论控件优化】