原文:https://zhuanlan.zhihu.com/p/55686050

本文为原文基础上的练习作

数据来源:https://www.kaggle.com/blastchar/telco-customer-churn

数据分析的基本步骤
        1、提出问题(有时,会在清洗完数据后,根据数据的描述性分析,再提出合理的问题。本数据集,即在清洗后,提出了问题)
        2、理解数据列名,各个字段会出现的值的意义
        3、数据清洗(缺失、内容错误、逻辑错误、不需要的数据)
        4、数据分析(excel下,就是简单构建数据透视图,做一些描述性分析。更高级的话,应该应用一些数据挖掘的算法,本例中,就应当用分类算法,决策树、KNN等)
        5、数据可视化及报告

一.提出问题/理解数据字段含义

该数据集为电信运营商流失数据表,含一些可能会对流失有影响的变量。希望通过分析,知道那些用户群最需要最先被采取干预措施;了解哪些变量,是对客户流失起着重要作用的变量;以及,试图做出预测,识别那个客户,最有可能是下一个流失的客户。

二.清洗数据

知乎网链接:https://zhuanlan.zhihu.com/p/20571505

三.提出问题

1、什么人群客户流失最多。

2、什么因变量,会对电信用户的流失会有影响。

四.数据分析

1.InternetService流失用户描述分析

运用数据透视表,将Churn,InternetService放入透视表并且生成一张圆环图表:

能发现,有约1/4的用户流失了。

接下来看再哪一个消费额度区间的流失量最大:

能发现,月充值在78.25~98.25之间的用户最易流失。但是,若是这个区间的用户量基数本身就是最大的呢?可以做一张各个区间保留和流失用户的占比:

能看出,78.25~98.25这个区域流失的用户的比重相较其他区间更易流失。通过这个图表能得出结论,需对这个区间内的客户进行干预,挽回。

摘自原文:

这里我们做出几个猜测:

a、可能流失的客户由于服务商提供了某个高消费的服务(宽带网络、电话服务等),但服务质量并不让用户满意,从而用户流失。

b、人群的本身属性(是否老人、是否配偶等),与用户流失呈相关。

c、提供服务时长对用户流失也会有影响(从用户侧考虑,使用越长,用其他产品替换本电信服务成本越高)。

2、流失用户因素推测

a、产品使用时长

可以看出,使用时长越长的用户流失率越低。

b.用户性别

由此可以看出来,用户性别对于流失率没有显著影响。

c.是否老年人

可以看出,流失率在年老人群、与非年老人群中可能存在显著差异(是否的确差异显著,还需要再做假设检验)。同样的方法,还可以再初步估计是否有配偶、有家属、是否订阅电话服务、是否有多重号码、是否接通宽带等服务,与流失情况之间的关系。

d、是否与某个宽带服务有关

这里是值得重点关注的:接入光纤(Fiber optic)的用户,接近4成的用户流失了。已经高于了全体用户的流失用户占比(26%)。

因而,我们可以猜测接入光纤(Fiber optic),与用户流失有相关。但至于是否是接入光纤就导致了用户流失,还应该探究更多的因变量。因为,可能某个因变量C,与接入光纤高度相关,但这个因变量C,才是导致用户流失的原因。

excel数据分析案例——电信运营商用户流失分析相关推荐

  1. 电信运营商用户流失分析

    数据集来源: Telco Customer Churn | KaggleFocused customer retention programshttps://www.kaggle.com/datase ...

  2. 通信运营商用户流失分析与预测

    1.通信运营商现状与需求 随着业务的快速发展.移动业务市场的竞争愈演愈烈.如何最大程度地挽留在网用户.吸取新客户,是电信企业最关注的问题之一.竞争对手的促销.公司资费软着陆措施的出台和政策法规的不断变 ...

  3. Python 数据分析实战之电商用户行为分析(万字干货)

    作者:freedom_lime https://juejin.im/post/6844904202590748679#heading-0 1 项目背景 项目对京东电商运营数据集进行指标分析以了解用户购 ...

  4. excel数据分析案例——美国全国牛油果销售状况分析

    本文是基于文章→https://zhuanlan.zhihu.com/p/45877488 下的练习作. 数据源:https://www.kaggle.com/neuromusic/avocado-p ...

  5. python数据建模案例源代码_一个完整的数据分析案例 | 用Python建立客户流失预测模型(含源数据+代码)...

    原标题:一个完整的数据分析案例 | 用Python建立客户流失预测模型(含源数据+代码) 来源:数据分析不是个事儿 作者:启方 原文: https://mp.weixin.qq.com/s/_20MN ...

  6. Excel数据分析案例三——预测销量

    Excel数据分析案例三--预测销量 题目:有某服装实体店5.1~5.24每天的销售数据表,要求根据现有的销量数据预测接下来一星期,也就是5.25 ~ 5.30的销量,图表大致信息如下 此时需要用到E ...

  7. Excel数据分析案例四——留存预测

    Excel数据分析案例四--留存预测 题目:一个社交APP,它的新增用户次日留存率.七日留存率.30日留存率分别是52%.25%.14%,请模拟出如果每天新增6万用户量,那么第三十天,它的日活跃用户回 ...

  8. 运营商线路细分_电信运营行业细分领域分析

    电信运营行业细分领域分析 第一节 eSMI 卡时代 一.发展现状 (一) eSIM 卡介绍 SIM 卡向着微型化发展,但始终需与运营商绑定. SIM ( Subscriber Identity Mod ...

  9. Flink_大数据技术之电商用户行为分析

    大数据技术之电商用户行为分析 第1章 项目整体介绍 1.1 电商的用户行为 电商平台中的用户行为频繁且较复杂,系统上线运行一段时间后,可以收集到大量的用户行为数据,进而利用大数据技术进行深入挖掘和分析 ...

最新文章

  1. 获取指定日期之间的各个周和月
  2. System Landscape Recommendations for SAP Customer Activity Repository
  3. Java为什么我们现在有时不用环境变量就可以运行了
  4. 虚拟机 centos 6.5 扩展根目录分区大小
  5. 【转载保存】Lucene 实战教程第六章 Lucene 的精确、包含、集合查询 Query 的简单使用
  6. 【英语学习】【医学】Unit 09 The Respiratory System
  7. adam算法效果差原因_信电学院本科生提出AI新算法:速度比肩Adam,性能媲美SGD,ICLR领域主席赞不绝口...
  8. php5.4连接mysql_PHP5.4+连MySQL数据库
  9. Python爬虫实战源码合集(持续更新)
  10. Object-C---gt;Swift之(十一)属性观察者
  11. [Project Euler] Problem 48
  12. 潘多拉系统虚拟服务器,潘多拉服务器节点配置
  13. allennlp0.9.0问题
  14. 人体姿态估计之CPN中文文献翻译
  15. 苹果ppt_熬夜看完苹果发布会,我居然学会了用PPT做霓虹灯特效?!
  16. 极兔一面:10亿级ES海量搜索狂飙10倍,该怎么办?
  17. 初次爬虫:读取PDF转成图片,再提取图片里的文字信息
  18. 个人对银行知识的几点认识和理解
  19. Excel收纳箱:记录下如何通过VBA代码获取当前列
  20. [生存志] 第46节 秦穆公任贤霸西戎

热门文章

  1. 如何解决不能绘制网络模型,报错protobuf
  2. python函数运行加速
  3. 分布式矩阵和分布式kvm的区别
  4. 谷歌code访问_Google Code-in任务和青少年奖励
  5. ibm3650m4服务器找不到硬盘,ibmx3650m4服务器报错:不识别内存
  6. 时至今日,写字依然是很好的职场“捷径”
  7. ExtJs之Text文本框Text和文本域TextArea
  8. 学习Oracle的三种境界
  9. 如何设计一个结构合理的java项目
  10. Excel数据处理函数实践整理