拓端tecdat|决策树算法建立电信客户流失模型
原文链接:http://tecdat.cn/?p=1603
Consumers will subscribe to multiple telecom services (televisions, paid programs, games, etc.) today. However, the degree of differentiation provided by telecom providers is not high, and customer loyalty becomes a problem.
As a result, it is becoming increasingly important for telecom companies to proactively identify lax-minded customers and take precautions to keep these customers.
Based on the above background, tecdat researchers analyzed the loss of data for 16 years to date and established a prediction model to identify customer groups with high probability of loss and to identify which user characteristics ("X") were lost to users (" Y ") will have a significant impact.
▼
▍数据概览
使用收视服务的用户最多,订阅付费节目其次,订阅游戏业务用户数量最少。
订阅收视业务的用户增长最快,其次是订阅游戏业务的用户,而订阅付费节目的用户增长缓慢,同时流失严重。
相比较16年,用户净增长37%,然而17年上半年的流失比例相比较去年增加8%。
▍不同维度的流失率比较
我们比较了不同营业厅和是否发放数字机顶盒的用户流失情况。
可以看到相比较发放了数字机顶盒的用户来说,没有发放机顶盒的用户更容易流失。
从不同营业厅的流失情况来看,沙河站和南口站的流失率最高,昌平站和小汤山站的流失率较低。
▍用户流失预测模型
然后,我们使用DT算法分析电信客户特征的特点,并获得流失客户的基本特征,分析客户的行为特征,采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。
▍技术
DT(decision tree)用于构建、验证和测试数据集的模型。
在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。
▍结果
模型预测客户流失的精度精度达到93.2%。
影响客户流失或对“Y”产生重大影响的关键变量有:
营业厅的位置
是否发放数字机顶盒
在分析客户的行为特征之后,我们采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。
拓端tecdat|决策树算法建立电信客户流失模型相关推荐
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- Kaggle数据集之电信客户流失数据分析(三)之决策树分类
一.导入数据 import pandas as pd df=pd.read_csv(r"D:\PycharmProjects\ku_pandas\WA_Fn-UseC_-Telco-Cust ...
- 电信客户流失数据分析(二)
任务3 如何判别客户是否为潜在流失对象? 数据集的基本背景以及各特征之间的关系分析可见 上一篇博文:电信客户流失数据分析(一) 数据集的输入与预处理(后续所有程序的基础): import seabor ...
- R语言_电信客户流失数据分析
1 引言 近年来,各行各业往往都会不可避免地面临用户流失的问题.研究表明,发展新用户所花费的宣传.促销等成本显然高于维持老用户的成本,因此,做好"客户流失预警"可以有效降低营销成本 ...
- 【Clemetine】基于二项Logistic回归的电信客户流失预测
一.实验目的及要求 1.掌握Logistic回归分析的基本步骤.原理.软件实现.结果分析: 2.理解多重共线性的概念.原理及岭轨迹的软件实现: 3.了解高维数据分析的应用领域及分析方法. 二.实验仪器 ...
- 鱼佬:电信客户流失预测赛方案!
Datawhale干货 作者:鱼佬,武汉大学硕士 2022科大讯飞:电信客户流失预测挑战赛 赛事地址(持续更新): https://challenge.xfyun.cn/topic/info?type ...
- Kaggle数据集之电信客户流失数据分析(一)
分析背景 某电信公司市场部为了预防用户流失,收集了已经打好流失标签的用户数据.现在要对流失用户情况进行分析,找出哪些用户可能会流失? 理解数据 采集数据 本数据集描述了电信用户是否流失以及其相关信息, ...
- 电信客户流失数据分析(一)
目录 来做个数据分析项目^-^ 任务1:探索数据集 任务2:哪些输入特征与顾客流失具有关联性? 来做个数据分析项目- 背景:在kaggle网站上发现了这个数据集,就顺手拿来做个数据分析的项目,希望发现 ...
- Kaggle数据集之电信客户流失数据分析
分析背景 某电信公司市场部为了预防用户流失,收集了已经打好流失标签的用户数据.现在要对流失用户情况进行分析,找出哪些用户可能会流失? 理解数据 采集数据 本数据集描述了电信用户是否流失以及其相关信息, ...
最新文章
- 为什么python注释不能中文_python中输入中文注释是无法编译
- M2Crypto/__m2crypto.so: undefined symbol: SSLv3_method
- dubbo官方文档_不可忽视的Dubbo线程池
- 关于 IE 模态对话框的两个问题
- 狡兔死,良弓藏-每个王朝都一样
- 【渝粤教育】国家开放大学2018年秋季 0714-21T建筑识图与CAD 参考试题
- 无法创建新虚拟机: 无法打开配置文件“E:\vmware\Windows7.vmx”: 拒绝访问。
- openstack学习之路-python运维(user)
- Sprd平台添加Camera驱动(SL8521E/SC9820E)
- 企业级代码静态测试工具Helix QAC——从应用层级保证代码质量和安全
- OpenKG 祝大家 2021 新年快乐 —「2020 精选文章汇编」
- python中temp是什么意思_.temp(temp是什么意思?)
- 抖音CEO张一鸣:大学四年收获及工作感悟
- C语言1.5e10什么意思,汽车排量1.5e是什么意思
- 贪心算法解决商场买赠问题(最简单,通俗易懂,附C++代码
- Spring笔记通俗易懂版
- 图像处理之卷积和积分运算
- 关于MSP430 FET-430UIF仿真器
- Windows10系统只有一个C盘,如何扩展D盘等
- 计算机一级2021excel,2021年计算机一级EXCEL操作题-20210514115911.doc-原创力文档