原文链接:http://tecdat.cn/?p=1603

Consumers will subscribe to multiple telecom services (televisions, paid programs, games, etc.) today. However, the degree of differentiation provided by telecom providers is not high, and customer loyalty becomes a problem.

As a result, it is becoming increasingly important for telecom companies to proactively identify lax-minded customers and take precautions to keep these customers.

Based on the above background, tecdat researchers analyzed the loss of data for 16 years to date and established a prediction model to identify customer groups with high probability of loss and to identify which user characteristics ("X") were lost to users (" Y ") will have a significant impact.

▍数据概览

使用收视服务的用户最多,订阅付费节目其次,订阅游戏业务用户数量最少。

订阅收视业务的用户增长最快,其次是订阅游戏业务的用户,而订阅付费节目的用户增长缓慢,同时流失严重。

相比较16年,用户净增长37%,然而17年上半年的流失比例相比较去年增加8%。

▍不同维度的流失率比较

我们比较了不同营业厅和是否发放数字机顶盒的用户流失情况。

可以看到相比较发放了数字机顶盒的用户来说,没有发放机顶盒的用户更容易流失。

从不同营业厅的流失情况来看,沙河站和南口站的流失率最高,昌平站和小汤山站的流失率较低。

▍用户流失预测模型

然后,我们使用DT算法分析电信客户特征的特点,并获得流失客户的基本特征,分析客户的行为特征,采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。

▍技术

DT(decision tree)用于构建、验证和测试数据集的模型。

在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。

▍结果

模型预测客户流失的精度精度达到93.2%。

影响客户流失或对“Y”产生重大影响的关键变量有:

营业厅的位置

是否发放数字机顶盒

在分析客户的行为特征之后,我们采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。

拓端tecdat|决策树算法建立电信客户流失模型相关推荐

  1. 拓端tecdat荣获2022年度51CTO博主之星

    相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...

  2. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  3. Kaggle数据集之电信客户流失数据分析(三)之决策树分类

    一.导入数据 import pandas as pd df=pd.read_csv(r"D:\PycharmProjects\ku_pandas\WA_Fn-UseC_-Telco-Cust ...

  4. 电信客户流失数据分析(二)

    任务3 如何判别客户是否为潜在流失对象? 数据集的基本背景以及各特征之间的关系分析可见 上一篇博文:电信客户流失数据分析(一) 数据集的输入与预处理(后续所有程序的基础): import seabor ...

  5. R语言_电信客户流失数据分析

    1 引言 近年来,各行各业往往都会不可避免地面临用户流失的问题.研究表明,发展新用户所花费的宣传.促销等成本显然高于维持老用户的成本,因此,做好"客户流失预警"可以有效降低营销成本 ...

  6. 【Clemetine】基于二项Logistic回归的电信客户流失预测

    一.实验目的及要求 1.掌握Logistic回归分析的基本步骤.原理.软件实现.结果分析: 2.理解多重共线性的概念.原理及岭轨迹的软件实现: 3.了解高维数据分析的应用领域及分析方法. 二.实验仪器 ...

  7. 鱼佬:电信客户流失预测赛方案!

    Datawhale干货 作者:鱼佬,武汉大学硕士 2022科大讯飞:电信客户流失预测挑战赛 赛事地址(持续更新): https://challenge.xfyun.cn/topic/info?type ...

  8. Kaggle数据集之电信客户流失数据分析(一)

    分析背景 某电信公司市场部为了预防用户流失,收集了已经打好流失标签的用户数据.现在要对流失用户情况进行分析,找出哪些用户可能会流失? 理解数据 采集数据 本数据集描述了电信用户是否流失以及其相关信息, ...

  9. 电信客户流失数据分析(一)

    目录 来做个数据分析项目^-^ 任务1:探索数据集 任务2:哪些输入特征与顾客流失具有关联性? 来做个数据分析项目- 背景:在kaggle网站上发现了这个数据集,就顺手拿来做个数据分析的项目,希望发现 ...

  10. Kaggle数据集之电信客户流失数据分析

    分析背景 某电信公司市场部为了预防用户流失,收集了已经打好流失标签的用户数据.现在要对流失用户情况进行分析,找出哪些用户可能会流失? 理解数据 采集数据 本数据集描述了电信用户是否流失以及其相关信息, ...

最新文章

  1. 为什么python注释不能中文_python中输入中文注释是无法编译
  2. M2Crypto/__m2crypto.so: undefined symbol: SSLv3_method
  3. dubbo官方文档_不可忽视的Dubbo线程池
  4. 关于 IE 模态对话框的两个问题
  5. 狡兔死,良弓藏-每个王朝都一样
  6. 【渝粤教育】国家开放大学2018年秋季 0714-21T建筑识图与CAD 参考试题
  7. 无法创建新虚拟机: 无法打开配置文件“E:\vmware\Windows7.vmx”: 拒绝访问。
  8. openstack学习之路-python运维(user)
  9. Sprd平台添加Camera驱动(SL8521E/SC9820E)
  10. 企业级代码静态测试工具Helix QAC——从应用层级保证代码质量和安全
  11. OpenKG 祝大家 2021 新年快乐 —「2020 精选文章汇编」
  12. python中temp是什么意思_.temp(temp是什么意思?)
  13. 抖音CEO张一鸣:大学四年收获及工作感悟
  14. C语言1.5e10什么意思,汽车排量1.5e是什么意思
  15. 贪心算法解决商场买赠问题(最简单,通俗易懂,附C++代码
  16. Spring笔记通俗易懂版
  17. 图像处理之卷积和积分运算
  18. 关于MSP430 FET-430UIF仿真器
  19. Windows10系统只有一个C盘,如何扩展D盘等
  20. 计算机一级2021excel,2021年计算机一级EXCEL操作题-20210514115911.doc-原创力文档

热门文章

  1. 关于struts2漏洞问题及解决办法
  2. dsp 链接命令文件的写法
  3. Linux文件系统Ext2,Ext3,Ext4性能大比拼
  4. Visualizing and Understanding Convolutional Networks论文解读
  5. 数据--第46课 - 图算法课后练习
  6. 简易RAM的C++实现
  7. [原创]mac终端前面的计算机名怎么改??
  8. 关于通用配置管理模块的思考-续(用XmlDocument 还是DataSet)
  9. Hosts 文件切换工具
  10. linux新手记录;可执行文件直接运行