关注公众号“ 番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。

  因为之前开发这套催分模型的时候,走过了很多弯路,进行总结和归纳,真心希望大家少踩过一些坑。毕竟这些浪费的时间,够你去做许多事情。以下把踩过的坑做了些梳理:
  非常容易把y变量来预测y变量。贷后的数据,其实是自家公司的数据居多,也最能反映自家公司的客群的行为和质量的。因为最容易拿到源数据,所以在使用的过程中,就能做各种数据的时间切片。
  关于这个数据的取法,反而非常需要你仔细分析业务逻辑。比如在入模的变量里,经常需要用到近一期的作为一个时间切分的数据。
  如:近一期下P的数量。在训练样本中,一般都会将数据的完整度做每个期的切片,做完之后再将数据进行规整制。比如:

  我们会将客户的还款时间表做一个横向的划分。做完这个之后时间切片后,就可以按照每一期的时间横向取数。
1.如果我卡的时间窗口,刚好不够一个period,那是否应该延长时间窗口?
  这个问题主要是针对建模样本的而言,一般来说都是需要保证每个建模的样本都有同样的时间表现窗口,这样处理后每个样本才有相同的周期可言。但有时候会发现卡的时间比较尴尬,总会导致某些客户之间的时间取值不公平。
  比如在上图中对A客户的,截止取数时间是6.2日,他的前一个dual_day是5.10日,如果对于B客户而言,前一个dual_day如果是5月30日。粗略计算都可以知道B客户会比A客户部分时间窗口。
  所以一般我们在处理数据时候,除了观察期、表现期,还需要一个时间缓冲期。
2.当我模型的坏样本不够的时候,一般实际的业务场景会怎么处理?
  这个问题在的建模的过程中是非常常见的,建模的人永远都怀疑自己的坏样本不够多。一般我们在建模的处理的时候,要不就采用上采样,就是在增大坏样本比例的时候,缩减好样本的个数,这种情况是在你数据量比较多的时候,才可以采样这样的方式处理。
  另一种方法是下采样,下采样是增大坏样本的比例,就是采用随机的方式增大怀样本的数量。原理是类似于采用类似欧几何距离的方式来增加怀样本。
  然而在这我们会介绍另一种更实用的方法,我在实际业务上就是这样处理的。在处理催收卡的样本时,我会按照按照时间切片的方式选取出一批客户,然后再按照上个时间切片来取出客群,最后再取出上上个时间切片的客群。一般会按照这样的方式处理三次样本。在处理的过程中,有一些在第一批取出来的客群,到了第二批取值的时候会变成怀样本。于是将这批标签标记为坏样本的这批客群留下来,放进到总样本池里,并且记为坏样本。紧接着,在第二次做的客群筛选的时候,就少了第一批是坏客群时候的客户,依然把这批客群的坏客户留下来,以备第三期时候的筛客群做准备。
  具体的思路是是这样:

  为了取数方便,我们会设置一个总的样本池,来存放总的好坏样本数据。
  因为每一期的客群的数据,都会有些许变动。所以每一期的数据里,你都应该另外计算。
3.催收卡的分类
  催收模块,因为其业务的特殊性,其实分类主要有三种类型,分别失联模型、还款率模型、和迁徙率模型。对这三种模型的解释分别是;
 a.迁徙率模型
  迁徙率模型主要是预测客户从一个状态迁徙到另一种状态的概率;


 b.还款率模型是预测客户是否会迁徙正常还款;
  预测经催收后,最终催收回的欠款的比率
 c.失联模型是预测一个用户失联的机会;


4.当我公司还没有准备开发一张催收卡的时候,我该选择哪个
  如果你公司还没有一张卡,建议先开发一张迁徙率模型评分卡。


  十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,欢迎加他一起学习一起聊(暗号:fanqie666+个人名字)。

催收评分卡(二)关于催收评分卡的血泪史相关推荐

  1. 风控建模系列(六):催收评分卡卡跟贷前申请卡关于目标变量的定义

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   在评分卡的所有的开发流程里,我一直在强调最重要的就是关于Y变量的定义了.目标的定义是重中之重.定义一旦 ...

  2. 评分卡模型(二)基于评分卡模型的用户付费预测

    评分卡模型(二)基于评分卡模型的用户付费预测 小P:小H,这个评分卡是个好东西啊,那我这想要预测付费用户,能用它吗 小H:尽管用- (本想继续薅流失预测的,但想了想这样显得我的业务太单调了,所以就改成 ...

  3. 金融风控-- >申请评分卡模型-- >申请评分卡介绍

    从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...

  4. Idea(二) 解决IDEA卡顿问题及相关基本配置

    Idea(二) 解决IDEA卡顿问题及相关基本配置 参考文章: (1)Idea(二) 解决IDEA卡顿问题及相关基本配置 (2)https://www.cnblogs.com/zhenghengbin ...

  5. 125KHz 100cm ID 读卡电路_二维码门禁读卡器动态二维码扫描器二维码刷卡读头介绍...

    二维码门禁读卡器 产品介绍 二维码门禁读卡器是新一代智能门禁读卡器,产品金属外观高端大气,扫描速度快,识别率高,兼容性强.可接任意支持维根输入的门禁控制器,适应各种应用场景,目前广泛应用办公楼访客进出 ...

  6. 动态二维码刷卡触摸按键门禁一体机性能与选型攻略

    二维码门禁设备涉及到动态二维码.静态二维码.涉及IC卡.CPU卡.身份证等多种感应卡的刷卡功能.以及相关门禁控制器.门禁闭门器.磁力锁.电插锁.电控锁.开门按钮.门禁电源等多配件的搭配与选型,本文章主 ...

  7. 在线考勤签到打卡二维码,如何制作?

    因为疫情原因,居家办公.居家上课.线上会议.线上活动等都成了常态.因此常规的上班上课签到打卡方式也都改为线上进行.虽说是特殊时期的无奈之举,但不得不承认,在线签到打卡已经是一种非常流行的考勤方式了. ...

  8. 2021年春节过年支付宝集福神器,支付宝额外福卡二维码扫福器

    下载地址:https://www.lanzoui.com/b01br9o6j 2021年春节过年支付宝集福神器,支付宝额外福卡二维码扫福器,一年一度的集福工具又来啦! 如有杀毒软件误报,请添加信任即可 ...

  9. 微信电子健康卡——获取健康卡二维码接口

    静态二维码 通过调用barcodeJs生成二维码 <%@ Page Language="C#" AutoEventWireup="true" CodeBe ...

  10. 磁卡感应卡二合一读写器|写卡器Z100-RF

    磁卡&感应卡二合一读写器|写卡器Z100-RF是一款磁卡和RFID卡二合一阅读器,支持全三轨磁条卡数据读取,支持RFID 卡数据读写.闪付卡UID号读取,通过USB 接口能实现同PC 机及相关 ...

最新文章

  1. java-执行流程控制语句
  2. 如何将SAP云平台Neo环境的Subaccount注册到IAS服务里
  3. ORACLE复杂查询之连接查询
  4. 八大排序:Java实现八大排序及算法复杂度分析
  5. 揭秘政企安全加速解决方案的架构与应用场景实践
  6. 漫话:如何给女朋友解释什么是2PC(二阶段提交)?
  7. OpenCV:透视变换
  8. 网站登录JWT的实现
  9. 放纵的感觉其实没有想象的那么好!
  10. 正在导出系统过程对象和操作 卡住_开会时CPU 飙升100%同事们都手忙脚乱记一次应急处理过程
  11. [golang note] 工程组织
  12. python_while 循环_珠穆朗玛峰
  13. 浏览器渲染机制面试_前端面试大全:浏览器渲染原理-文件无法渲染
  14. python批量修改文件名称及文件属性
  15. Ubuntu系统 USB设备端口绑定
  16. 大数据开发工程师前景如何?
  17. 反向索引和自增索引区别_深度解析 百度收录与百度索引有什么区别?
  18. linux c语言文件锁,Linux下glibc库文件锁:协同锁(advisory lock)和强制锁(mandatory lock)...
  19. 在亚洲最HOT的地方做最IN的事
  20. 【Java学习0331】多线程

热门文章

  1. python字符串代码对象_Python源码剖析 - Python中的字符串对象
  2. html 设置两个标签的相对距离_如何准确计算一div相对另一div的相对距离?
  3. php方法参数,关于PHP方法参数的那一些事
  4. 实数集r用区间表示为_七大实数理论与互推
  5. linux windows死机,linux死机的处理方式
  6. 用友U8审核凭证出现列前缀tempdb无效未指定表名的对话框的解决方法
  7. Mongo 用户创建及权限管理
  8. CSS基础之清除浮动
  9. Web_add_cookie的作用
  10. lenovo X230热键功能