excel数据分析案例——电信运营商用户流失分析
原文:https://zhuanlan.zhihu.com/p/55686050
本文为原文基础上的练习作
数据来源:https://www.kaggle.com/blastchar/telco-customer-churn
数据分析的基本步骤:
1、提出问题(有时,会在清洗完数据后,根据数据的描述性分析,再提出合理的问题。本数据集,即在清洗后,提出了问题)
2、理解数据列名,各个字段会出现的值的意义
3、数据清洗(缺失、内容错误、逻辑错误、不需要的数据)
4、数据分析(excel下,就是简单构建数据透视图,做一些描述性分析。更高级的话,应该应用一些数据挖掘的算法,本例中,就应当用分类算法,决策树、KNN等)
5、数据可视化及报告
一.提出问题/理解数据字段含义
该数据集为电信运营商流失数据表,含一些可能会对流失有影响的变量。希望通过分析,知道那些用户群最需要最先被采取干预措施;了解哪些变量,是对客户流失起着重要作用的变量;以及,试图做出预测,识别那个客户,最有可能是下一个流失的客户。
二.清洗数据
知乎网链接:https://zhuanlan.zhihu.com/p/20571505
三.提出问题
1、什么人群客户流失最多。
2、什么因变量,会对电信用户的流失会有影响。
四.数据分析
1.InternetService流失用户描述分析
运用数据透视表,将Churn,InternetService放入透视表并且生成一张圆环图表:
能发现,有约1/4的用户流失了。
接下来看再哪一个消费额度区间的流失量最大:
能发现,月充值在78.25~98.25之间的用户最易流失。但是,若是这个区间的用户量基数本身就是最大的呢?可以做一张各个区间保留和流失用户的占比:
能看出,78.25~98.25这个区域流失的用户的比重相较其他区间更易流失。通过这个图表能得出结论,需对这个区间内的客户进行干预,挽回。
摘自原文:
这里我们做出几个猜测:
a、可能流失的客户由于服务商提供了某个高消费的服务(宽带网络、电话服务等),但服务质量并不让用户满意,从而用户流失。
b、人群的本身属性(是否老人、是否配偶等),与用户流失呈相关。
c、提供服务时长对用户流失也会有影响(从用户侧考虑,使用越长,用其他产品替换本电信服务成本越高)。
2、流失用户因素推测
a、产品使用时长
可以看出,使用时长越长的用户流失率越低。
b.用户性别
由此可以看出来,用户性别对于流失率没有显著影响。
c.是否老年人
可以看出,流失率在年老人群、与非年老人群中可能存在显著差异(是否的确差异显著,还需要再做假设检验)。同样的方法,还可以再初步估计是否有配偶、有家属、是否订阅电话服务、是否有多重号码、是否接通宽带等服务,与流失情况之间的关系。
d、是否与某个宽带服务有关
这里是值得重点关注的:接入光纤(Fiber optic)的用户,接近4成的用户流失了。已经高于了全体用户的流失用户占比(26%)。
因而,我们可以猜测接入光纤(Fiber optic),与用户流失有相关。但至于是否是接入光纤就导致了用户流失,还应该探究更多的因变量。因为,可能某个因变量C,与接入光纤高度相关,但这个因变量C,才是导致用户流失的原因。
excel数据分析案例——电信运营商用户流失分析相关推荐
- 电信运营商用户流失分析
数据集来源: Telco Customer Churn | KaggleFocused customer retention programshttps://www.kaggle.com/datase ...
- 通信运营商用户流失分析与预测
1.通信运营商现状与需求 随着业务的快速发展.移动业务市场的竞争愈演愈烈.如何最大程度地挽留在网用户.吸取新客户,是电信企业最关注的问题之一.竞争对手的促销.公司资费软着陆措施的出台和政策法规的不断变 ...
- Python 数据分析实战之电商用户行为分析(万字干货)
作者:freedom_lime https://juejin.im/post/6844904202590748679#heading-0 1 项目背景 项目对京东电商运营数据集进行指标分析以了解用户购 ...
- excel数据分析案例——美国全国牛油果销售状况分析
本文是基于文章→https://zhuanlan.zhihu.com/p/45877488 下的练习作. 数据源:https://www.kaggle.com/neuromusic/avocado-p ...
- python数据建模案例源代码_一个完整的数据分析案例 | 用Python建立客户流失预测模型(含源数据+代码)...
原标题:一个完整的数据分析案例 | 用Python建立客户流失预测模型(含源数据+代码) 来源:数据分析不是个事儿 作者:启方 原文: https://mp.weixin.qq.com/s/_20MN ...
- Excel数据分析案例三——预测销量
Excel数据分析案例三--预测销量 题目:有某服装实体店5.1~5.24每天的销售数据表,要求根据现有的销量数据预测接下来一星期,也就是5.25 ~ 5.30的销量,图表大致信息如下 此时需要用到E ...
- Excel数据分析案例四——留存预测
Excel数据分析案例四--留存预测 题目:一个社交APP,它的新增用户次日留存率.七日留存率.30日留存率分别是52%.25%.14%,请模拟出如果每天新增6万用户量,那么第三十天,它的日活跃用户回 ...
- 运营商线路细分_电信运营行业细分领域分析
电信运营行业细分领域分析 第一节 eSMI 卡时代 一.发展现状 (一) eSIM 卡介绍 SIM 卡向着微型化发展,但始终需与运营商绑定. SIM ( Subscriber Identity Mod ...
- Flink_大数据技术之电商用户行为分析
大数据技术之电商用户行为分析 第1章 项目整体介绍 1.1 电商的用户行为 电商平台中的用户行为频繁且较复杂,系统上线运行一段时间后,可以收集到大量的用户行为数据,进而利用大数据技术进行深入挖掘和分析 ...
最新文章
- 获取指定日期之间的各个周和月
- System Landscape Recommendations for SAP Customer Activity Repository
- Java为什么我们现在有时不用环境变量就可以运行了
- 虚拟机 centos 6.5 扩展根目录分区大小
- 【转载保存】Lucene 实战教程第六章 Lucene 的精确、包含、集合查询 Query 的简单使用
- 【英语学习】【医学】Unit 09 The Respiratory System
- adam算法效果差原因_信电学院本科生提出AI新算法:速度比肩Adam,性能媲美SGD,ICLR领域主席赞不绝口...
- php5.4连接mysql_PHP5.4+连MySQL数据库
- Python爬虫实战源码合集(持续更新)
- Object-C---gt;Swift之(十一)属性观察者
- [Project Euler] Problem 48
- 潘多拉系统虚拟服务器,潘多拉服务器节点配置
- allennlp0.9.0问题
- 人体姿态估计之CPN中文文献翻译
- 苹果ppt_熬夜看完苹果发布会,我居然学会了用PPT做霓虹灯特效?!
- 极兔一面:10亿级ES海量搜索狂飙10倍,该怎么办?
- 初次爬虫:读取PDF转成图片,再提取图片里的文字信息
- 个人对银行知识的几点认识和理解
- Excel收纳箱:记录下如何通过VBA代码获取当前列
- [生存志] 第46节 秦穆公任贤霸西戎