作者:Ben,著有《Python数据科学:技术详解与商业实践》、《用商业案例学R语言数据挖掘》、《胸有成竹-数据分析的SAS EG进阶》作者。2005年进入数据科学领域,先后在亚信、德勤、百度等企业从事电信、金融行业数据挖掘工作。专注于消费信贷和财富管理方面的数据治理、客户智能与风险智能领域。

配套视频教程:Python数据科学-技术详解与商业实践(第二期)课程链接: https://edu.hellobi.com/course/280

涉及内容:信用卡客户流失预警模型-CRISP_DM建模流程、数据清洗、变量压缩、模型开发与评估

1、背景介绍:

随着信用卡市场的成熟,人均持卡量不断增加,加上第三方支付牌照的持续发放,人们可选择的支付手段不断丰富,信用卡客户流失(销卡)呈现常态化。C银行在国内信用卡市场中处于领先地位,管理层非常重视客户生命周期管理并取得了良好的回报,为进一步完善对客户流失及挽留环节的管理,管理层要求建立大数据模型,基于对客户销卡决心和预期价值的准确预测,制定差异化挽留策略,实现收益与成本的最佳平衡。具体来说,当客户打进电话提出销卡时,将客户的销卡决心、预期价值以及相应的应对策略,展示在客服人员的工作指导窗口上,在客户挽留环节改进客户体验,加强对潜在高价值客户的挽留力度。。

本次作业根据提供的数据(“CSR_CHURN_Samp.csv”,引用自陈春宝等出版的《SAS金融数据挖掘与建模》)信用卡客户流失预警模型。

2、本案例涉及的部分变量说明如下:

STA_DTE 数据提取时间

Evt_Flg 是否流失

Age年龄

Gen性别,1=男

Buy_Type近一个月主要的购物类型

R3m_Avg_Cns_Amt近3个月月均消费金额

R6m_Avg_Rdm_Pts近6个月月均兑换积分

R12m_Avg_Cns_Cnt近12个月月均消费次数

R6m_Cls_Nbr近半年还款拖欠次数

Ilt_Bal_Amt当前分期未还余额

Lmth_Fst_Ilt累计分期产品办理次数

Lmth_Fst_Int累计小额信贷申请次数

Csr_Dur累计持卡时长

R6m_Call_Nbr近半年投诉次数

Total_Call_Nbr累计投诉次数

Net_Cns_Cnt累计网上交易次数

Ovs_Cns_Amt累计境外交易次数

其他略:学习到这个阶段,已经可以适应不需要知道变量含义,凭借数据分析工序建立分类模型的状态。

3、作业安排:

3.1 基础知识:

1)分箱的作用,WOE和IV的作用;

2)比较IV法和统计检验法筛选变量重要性之间的异同。

3.2 案例解答步骤如下:

1)根据STA_DTE字段进行拆分,分出建模和测试数据集

2)对涉及的X进行分箱,计算分箱后X的WOE值和IV值。考虑数据清洗和缺失值处理

3)进行解释变量X之间的信息压缩。

4)使用逻辑回归建模并检验

python数据挖掘商业案例_Python数据科学-技术详解与商业实践-第八讲作业相关推荐

  1. python数据科学课后答案_Python数据科学-技术详解与商业实践-第五讲作业

    作者:Ben,著有<Python数据科学:技术详解与商业实践>.<用商业案例学R语言数据挖掘>.<胸有成竹-数据分析的SAS EG进阶>作者.2005年进入数据科学 ...

  2. Python数据科学-技术详解与商业实践视频教程

    Python数据科学-技术详解与商业实践(八大案例) 网盘地址:https://pan.baidu.com/s/13QrR_5Er6LgWCWzSb7qOrQ 提取码:s7vw 备用地址(腾讯微云): ...

  3. python读取遥感 dat_基于python批量处理dat文件及科学计算方法详解

    摘要:主要介绍一些python的文件读取功能,文件内容修改,文件名后缀更改等操作. 批处理文件功能 import os path1 = 'C:\\Users\\awake_ljw\\Documents ...

  4. 《ONAP技术详解与应用实践》中奖名单来了!

    上周,我们进行了第二轮的赠书活动(传送门),将在活动成功参与者中抽取5位粉丝,每人赠送一本由机械工业出版社提供的<ONAP技术详解与应用实践>. 下面,我们来看看本次中奖名单吧. 5位幸运 ...

  5. python数据科学常国珍_python数据科学:技术详解与商业实践

    前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...

  6. python推荐算法课程_Python数据科学:全栈技术详解4-推荐算法

    作者:Ben,多本数据科学畅销书作家,先后在亚信.德勤.百度等企业从事电信.金融行业数据挖掘工作. 配套学习教程:数据科学实战:Python篇 https://edu.hellobi.com/cour ...

  7. python数据结构包括什么_Python中的数据结构详解

    概述 在深入研究数据科学和模型构建之前,Python中的数据结构是一个需要学习的关键内容 了解Python提供的不同数据结构,包括列表.元组等 介绍 数据结构听起来是一个非常直截了当的话题,但许多数据 ...

  8. python做插件应用_Python插件机制实现详解

    插件机制是代码/功能反向依赖注入到主体程序的一种方法,编译型语言通过动态加载动态库实现插件.对于Python这样的脚本语言,实现插件机制更简单. 机制 Python的__import__方法可以动态地 ...

  9. python插件使用教程_Python插件机制实现详解

    插件机制是代码/功能反向依赖注入到主体程序的一种方法,编译型语言通过动态加载动态库实现插件.对于Python这样的脚本语言,实现插件机制更简单. 机制 Python的__import__方法可以动态地 ...

最新文章

  1. arcgis for android 学习 - (4) 了解mapView的一些方法和事件
  2. asp.net弹出div层,并把弹出层上的值赋值给界面
  3. C#学习 小知识_多态的简单实现_2018Oct
  4. JVM学习笔记之-堆,年轻代与老年代,对象分配过程,Minor GC、Major GC、Full GC,堆内存大小与OOM,堆空间分代,内存分配策略,对象分配内存,小结堆空间,逃逸分析,常用调优工具
  5. 创建非矩形的Windows 窗体
  6. MySQL_日期时间处理函数及应用
  7. node.js——麻将算法(五)胡牌算法的一些优化处理方案(有赖子版)
  8. 016医疗项目 数据字典(概念和在本系统中的应用)
  9. OpenStack之Nova模块
  10. opkg-utils的PKGBUILD文件,参考自OE的opkg-utils_git.bb
  11. BOOTCAMP U盘安装WIN7一直显示无法创建可引导的USB驱动器
  12. php 字符串首字母ucfirst函数转换成大写
  13. 【离散数学】搜集、并搜集、交搜集、求A = {{Φ, 2}, {2}}的并搜集和交搜集
  14. 工厂模式 (简单工厂、工厂方法、抽象工厂)
  15. A - 可以教学姐画画嘛QAQ
  16. CountDownLatch--等待多线程计数器
  17. mysql取前一个月时间戳_mysql中获取一天、一周、一月时间数据的各种sql语句写...
  18. 使用office这么多年,但知道什么是office365吗?
  19. linux最大文件名,linux和windows文件名长度限制
  20. cv2.cv2.findContours opencv-python

热门文章

  1. 妖人柴:国外lead好做吗,从EMU的角度说点看法
  2. 教师计算机学业水平测试,2020年全国教师资格考试信息技术学科知识与能力练习题...
  3. PCB各层的含义 (solder 和 paste 区别)
  4. ACDC隔离电源设计手机适配器智能家居供电5V1A设计方案
  5. 中国大城市政治地位综合实力排名
  6. multi_match 查询
  7. 职业生涯之“一个萝卜一个坑”
  8. sap生产工单报工_SAP中单张工单报工完成还能入库吗
  9. U盘启动盘安装Ubuntu 17.10麒麟
  10. Jobs乔布斯传总结