python数据挖掘商业案例_Python数据科学-技术详解与商业实践-第八讲作业
作者:Ben,著有《Python数据科学:技术详解与商业实践》、《用商业案例学R语言数据挖掘》、《胸有成竹-数据分析的SAS EG进阶》作者。2005年进入数据科学领域,先后在亚信、德勤、百度等企业从事电信、金融行业数据挖掘工作。专注于消费信贷和财富管理方面的数据治理、客户智能与风险智能领域。
配套视频教程:Python数据科学-技术详解与商业实践(第二期)课程链接: https://edu.hellobi.com/course/280
涉及内容:信用卡客户流失预警模型-CRISP_DM建模流程、数据清洗、变量压缩、模型开发与评估
1、背景介绍:
随着信用卡市场的成熟,人均持卡量不断增加,加上第三方支付牌照的持续发放,人们可选择的支付手段不断丰富,信用卡客户流失(销卡)呈现常态化。C银行在国内信用卡市场中处于领先地位,管理层非常重视客户生命周期管理并取得了良好的回报,为进一步完善对客户流失及挽留环节的管理,管理层要求建立大数据模型,基于对客户销卡决心和预期价值的准确预测,制定差异化挽留策略,实现收益与成本的最佳平衡。具体来说,当客户打进电话提出销卡时,将客户的销卡决心、预期价值以及相应的应对策略,展示在客服人员的工作指导窗口上,在客户挽留环节改进客户体验,加强对潜在高价值客户的挽留力度。。
本次作业根据提供的数据(“CSR_CHURN_Samp.csv”,引用自陈春宝等出版的《SAS金融数据挖掘与建模》)信用卡客户流失预警模型。
2、本案例涉及的部分变量说明如下:
STA_DTE 数据提取时间
Evt_Flg 是否流失
Age年龄
Gen性别,1=男
Buy_Type近一个月主要的购物类型
R3m_Avg_Cns_Amt近3个月月均消费金额
R6m_Avg_Rdm_Pts近6个月月均兑换积分
R12m_Avg_Cns_Cnt近12个月月均消费次数
R6m_Cls_Nbr近半年还款拖欠次数
Ilt_Bal_Amt当前分期未还余额
Lmth_Fst_Ilt累计分期产品办理次数
Lmth_Fst_Int累计小额信贷申请次数
Csr_Dur累计持卡时长
R6m_Call_Nbr近半年投诉次数
Total_Call_Nbr累计投诉次数
Net_Cns_Cnt累计网上交易次数
Ovs_Cns_Amt累计境外交易次数
其他略:学习到这个阶段,已经可以适应不需要知道变量含义,凭借数据分析工序建立分类模型的状态。
3、作业安排:
3.1 基础知识:
1)分箱的作用,WOE和IV的作用;
2)比较IV法和统计检验法筛选变量重要性之间的异同。
3.2 案例解答步骤如下:
1)根据STA_DTE字段进行拆分,分出建模和测试数据集
2)对涉及的X进行分箱,计算分箱后X的WOE值和IV值。考虑数据清洗和缺失值处理
3)进行解释变量X之间的信息压缩。
4)使用逻辑回归建模并检验
python数据挖掘商业案例_Python数据科学-技术详解与商业实践-第八讲作业相关推荐
- python数据科学课后答案_Python数据科学-技术详解与商业实践-第五讲作业
作者:Ben,著有<Python数据科学:技术详解与商业实践>.<用商业案例学R语言数据挖掘>.<胸有成竹-数据分析的SAS EG进阶>作者.2005年进入数据科学 ...
- Python数据科学-技术详解与商业实践视频教程
Python数据科学-技术详解与商业实践(八大案例) 网盘地址:https://pan.baidu.com/s/13QrR_5Er6LgWCWzSb7qOrQ 提取码:s7vw 备用地址(腾讯微云): ...
- python读取遥感 dat_基于python批量处理dat文件及科学计算方法详解
摘要:主要介绍一些python的文件读取功能,文件内容修改,文件名后缀更改等操作. 批处理文件功能 import os path1 = 'C:\\Users\\awake_ljw\\Documents ...
- 《ONAP技术详解与应用实践》中奖名单来了!
上周,我们进行了第二轮的赠书活动(传送门),将在活动成功参与者中抽取5位粉丝,每人赠送一本由机械工业出版社提供的<ONAP技术详解与应用实践>. 下面,我们来看看本次中奖名单吧. 5位幸运 ...
- python数据科学常国珍_python数据科学:技术详解与商业实践
前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...
- python推荐算法课程_Python数据科学:全栈技术详解4-推荐算法
作者:Ben,多本数据科学畅销书作家,先后在亚信.德勤.百度等企业从事电信.金融行业数据挖掘工作. 配套学习教程:数据科学实战:Python篇 https://edu.hellobi.com/cour ...
- python数据结构包括什么_Python中的数据结构详解
概述 在深入研究数据科学和模型构建之前,Python中的数据结构是一个需要学习的关键内容 了解Python提供的不同数据结构,包括列表.元组等 介绍 数据结构听起来是一个非常直截了当的话题,但许多数据 ...
- python做插件应用_Python插件机制实现详解
插件机制是代码/功能反向依赖注入到主体程序的一种方法,编译型语言通过动态加载动态库实现插件.对于Python这样的脚本语言,实现插件机制更简单. 机制 Python的__import__方法可以动态地 ...
- python插件使用教程_Python插件机制实现详解
插件机制是代码/功能反向依赖注入到主体程序的一种方法,编译型语言通过动态加载动态库实现插件.对于Python这样的脚本语言,实现插件机制更简单. 机制 Python的__import__方法可以动态地 ...
最新文章
- arcgis for android 学习 - (4) 了解mapView的一些方法和事件
- asp.net弹出div层,并把弹出层上的值赋值给界面
- C#学习 小知识_多态的简单实现_2018Oct
- JVM学习笔记之-堆,年轻代与老年代,对象分配过程,Minor GC、Major GC、Full GC,堆内存大小与OOM,堆空间分代,内存分配策略,对象分配内存,小结堆空间,逃逸分析,常用调优工具
- 创建非矩形的Windows 窗体
- MySQL_日期时间处理函数及应用
- node.js——麻将算法(五)胡牌算法的一些优化处理方案(有赖子版)
- 016医疗项目 数据字典(概念和在本系统中的应用)
- OpenStack之Nova模块
- opkg-utils的PKGBUILD文件,参考自OE的opkg-utils_git.bb
- BOOTCAMP U盘安装WIN7一直显示无法创建可引导的USB驱动器
- php 字符串首字母ucfirst函数转换成大写
- 【离散数学】搜集、并搜集、交搜集、求A = {{Φ, 2}, {2}}的并搜集和交搜集
- 工厂模式 (简单工厂、工厂方法、抽象工厂)
- A - 可以教学姐画画嘛QAQ
- CountDownLatch--等待多线程计数器
- mysql取前一个月时间戳_mysql中获取一天、一周、一月时间数据的各种sql语句写...
- 使用office这么多年,但知道什么是office365吗?
- linux最大文件名,linux和windows文件名长度限制
- cv2.cv2.findContours opencv-python
热门文章
- 妖人柴:国外lead好做吗,从EMU的角度说点看法
- 教师计算机学业水平测试,2020年全国教师资格考试信息技术学科知识与能力练习题...
- PCB各层的含义 (solder 和 paste 区别)
- ACDC隔离电源设计手机适配器智能家居供电5V1A设计方案
- 中国大城市政治地位综合实力排名
- multi_match 查询
- 职业生涯之“一个萝卜一个坑”
- sap生产工单报工_SAP中单张工单报工完成还能入库吗
- U盘启动盘安装Ubuntu 17.10麒麟
- Jobs乔布斯传总结