关注公众号“ 番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。

  在评分卡的所有的开发流程里,我一直在强调最重要的就是关于Y变量的定义了。目标的定义是重中之重。定义一旦出错,之后的一切都白干了。

  在催收评分卡跟贷前评分卡里,目标变量的定义非常不一样。其实在信贷模型里,评分卡放置的位置不一样,哪怕是提前一个节点,模型的定义就需要稍微修改,起码有些数据就不能用了。比如在贷前卡里,反欺诈的强变量数据反而是不能用的。这些大家是否理解透?

  好的,下面我们就来关于A卡跟C的定义展开详细的讨论:

  当然我知道很多同学都看过A卡的定义,那C卡的定义,是否有了解过?

第一部分:先来介绍A卡:

  分析A卡前,需要看两个表vintage跟flow rateVintage表—账龄表

  这个是根据客群的资产表现做的一张表:
清洗步骤是:
1)先将每个月的booking的金额做一个统一的规整,得到一张booking金额表·
2)将每个月charge_off,逐一统计
3)最后将步骤2中的进行cumulative,得到一张表
4) 根据前三个步骤得到的值,进行一个汇总得到资产表现情况表
(下图依次对应步骤1、2、3)



  计算的方式是cumulative的charge_off跟每个月的booking的金额一一做商,最后根据资产表现,我们需要获取的信息有下面几点:
(先看一下资产表的趋势图)

  1. 理解下账期是多长时间的产品(产品周期)
  2. 这一波资产是在多长时间内趋于稳定(产品的稳定周期)
  3. 如何结合vingtage应用到建模的数据里(结合建模)

    (思考:为什么要费这么大的周章做这样的一个vintage表?vintage是将所有的不同时期的放款的客群,公平拉回同一起跑线的处理方式)

flow rate:
  关于迁徙率的概率就不再叙述了,如果不太明白他计算原理,可以参考下之前的文章:催收字典。我们主要看一下在观察recovery的数在哪个时期,变成接近charge_off,也就是任凭人工怎么催收都不能回落在前一个状态。

  (Flow_rate是贷后催收的一个重要监控表格,添加官微获取数据联练习下。)

  说完业务逻辑,我们来看一下建模的要求:建模关于变量的定义需要明确的两个指标,观察期跟表现期:

  观察期就是我们观察的样本在这段时间内是否能作为我们数据建模历史数据的参考的时期,可以理解为X变量;表现期就是客群会发现出他的好坏状态的时间窗口,也就是Y变量。

  那这个跟vintage跟flow rate又有什么关系?
  1.观察vintage,一个是想看一下资产在什么时间窗口稳定,一般只有当一个产品表现趋于稳定,他的历史数据才具有统计意义,波动性太强的数据,压根是没有规律的,这在统计学上也是这样要求的;
  2.观察flow rate,是想从另一个方面观测表现期大概是需要多长时间的窗口

  另外更重要的是:
  1.观察vintage,大大缩短了我们选取样本的时间窗口,比如一个36期的产品,选择mob12作为观察期就行了,比如在上面我贴的那个例子中,压根不用等产品走完36个月,有时候等整个产品周期都跑完再来建模,黄花菜都凉了。当然对于某些现金贷产品,周期特别短的,观察期就不是这样的一个选择方式
  2.观察flow rate,同样大大缩短了选取样本的表现期的窗口,同样是上面的那个例子,压根不用等到坏账再来统计。
  3.观察期跟表现期是两个圈,他们有交叉或者叫重叠的时候。有些坏样本MOB12内就可以看到起表现期。
  4.所以基于上面的分析我们只要分析mob12里客群就行了,并charge—off只要坏账时间在2个月,就可以界定为坏样本了。

  (关于A卡时 间窗口的选择的样本,是否理解透了?如果有问题,要不在后台获取数据练习下?此部分知识点重要,也会在后期的视频中着重涉及)

第二部分:关于C卡的样本定义

  C卡同样有表现期跟观察期的概念,不同的是C卡的表现期的选择会更灵活些。下面将以迁徙率模型为例说明下:
  在迁徙率模型里,你要做的模型是为了预测客户从M0迁徙到DPD5+的状态的概率。
  之前我就说过,你需要把这段时间划分为两个窗口看待,一个是前一个period为M0,经近一期的催收后,在下一个period表现为DPD5+。


  在这里,观察期可以选取客群近一年的状态作为历史数据,也可以选择截取时间点前整个生命周期的作为历史数据;但是表现期是比较固定的,在你截取时间点的下一个period是什么状态直接关系他作为好样本or坏样本。

  在梳理好坏样本的步骤里,是需要把客户对于每一期的period展开,以此往里面填充各种维度的数据。比如关于DPD的数据,你最少清洗完应该是类似这样的数据:


  十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎加入一起学习一起聊!

风控建模系列(六):催收评分卡卡跟贷前申请卡关于目标变量的定义相关推荐

  1. 迁移率 计算方法及用途 风控建模系列 02

    迁移率 计算方法及用途 风控建模系列 02 在上一篇博客中,我们讲解了vintage分析的原理及方法(https://blog.csdn.net/weixin_44239904/article/det ...

  2. vintage分析 风控建模系列 01

    vintage分析 风控建模系列 01 在工作中发现,目前没有一个很好的系列帖子对风控建模中的各项细节做讲解,本人为一个金融科技公司的风控算法建模师,希望在此将风控建模的知识成体系.有深度.易吸收地分 ...

  3. 【金融申请评分卡】目标变量界定

    一.目标变量是什么? 目标变量就是假定申请客户的好坏,逻辑回归公式里的Y,先来看下逻辑回归公式 y=11+e−zy=11+e−z y=\frac{1}{1+e^{-z}}\qquad z=a1x1+a ...

  4. 风控建模(七):催收评分卡的流程—上(所有评分模型与机器学习模型同样适用)

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   说了那么久的建模,今天应该跟大家分享一下实际建模的流程步骤了.   整套建模代码我分别用sas跟pyt ...

  5. (信贷风控十)催收评分卡的介绍

    (十)催收评分卡的介绍 评分卡可分为申请评分卡(A卡).行为评分卡(B卡).催收评分卡(C卡).不同的卡使用场景不一样,A卡用于贷前申请环节,用来区分客户好坏:B卡用于贷中环节,根据观察行为预测未来一 ...

  6. 风控建模:催收评分卡(四)--变量整理除了跟数据获取相关外还跟什么有关系?

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   之前被一篇叫<你有什么资格嘲笑毛坦厂中学的学生>的文章刷屏,中国的阶级固化的趋势在可预见的 ...

  7. tvpvar模型的建模步骤_风控建模六部曲

    这期开始咱们聊聊风控建模的事情.在借贷这个场景下,建立风控模型的目的大都是为了预测某个客户未来逾期的概率.主要的逻辑就是根据过去预测未来,逾期客户的行为是相似的.先收集历史上已经逾期到一定阶段的客户, ...

  8. 风控建模六:变量相关性分析及筛选方法

    风控建模六:变量相关性分析及筛选方法 一.变量相关性分析 二.变量相关性筛选 三.代码实现 不论是开发逻辑回归评分卡,还是GBM机器学习模型,变量的相关性分析和筛选都是必不可少的一步,因为这个过程会帮 ...

  9. 手把手系列|风控建模中共线性的影响和处理(上)

    序言: 所谓的多重共线性是指一些自变量之间存在较强的线性关系.这种情况在实际应用中非常普遍,如研究高血压与年龄.吸烟年限.饮白酒年限等因素的关系,这些自变量通常是相关的. 如果当我们发现有多个变量存在 ...

最新文章

  1. NumPy学的还不错?来试试这20题
  2. 微信小程序-自定义picker选择器
  3. 一个管理者的反思(太深刻了!)
  4. [原创].图解一招搞定UCWEB@Nokia S60v5无法在博客园手机版发闪存的问题
  5. 复数域上x^n ±1=0的解
  6. JAVA NIO 实例
  7. Ajax Control Toolkit 出新版了
  8. 拥抱创新二十载,微软“创新杯”持续孵化中国青年开发者智慧创意
  9. class.sitemap.php
  10. python for循环 内存_Python for循环中的内存错误
  11. python seo百度_Python与seo,百度关键词相关搜索关键词采集源码
  12. 图像处理之双线性插值法
  13. 16G DWDM SFP+光模块特性及解决方案
  14. springboot publish event 事件机制demo
  15. hdu 2044 一只小蜜蜂...
  16. 如何看待何恺明最新一作论文Masked Autoencoders?
  17. win10下用VMware workstation pro安装Ubuntu 16.04图解
  18. 数学学习方法:直观思维的重要性
  19. RISCV学习笔记5.3--ubuntu18.04芯片设计软件(vcs、verdi)的简单使用
  20. Java岗面试:java技术面试问题

热门文章

  1. anaconda安装keras_一定要看的Tensorflow-GPU+Keras安装教程
  2. Android监听作用,Android开发之CheckBox的简单使用与监听功能示例
  3. oracle能不能改外键属性,CSS_小议Oracle外键约束修改行为(五), Oracle的外键用来限制子表 - phpStudy...
  4. .net单点登录demo_图文并茂,为你揭开“单点登录“的神秘面纱
  5. 2018结束,新的开始 - CMU学弱走上技术之路
  6. chrome插件:实现任意窗口,显示特定icon
  7. css img 等比例平铺怎么个屏幕
  8. ospf多区域路由实验
  9. [置顶]献给写作者的 Markdown 新手指南
  10. Linux利用list_head结构实现双向链表