序言:
很多关注番茄风控的老铁们都知道,番茄风控的开篇就是从系统性的贷后评分卡开始的,关于贷后相关的内容,番茄不敢说是元老级别的公众号,但再怎么说也是先行者,之前的文章比如这些经典内容,您是否都看过了:

①风控建模:催收评分卡——浅显理解模型一个非常重要的验证指标
②再谈谈贷后分类场景及模型变量解析等内容
③贷后催收评分卡的全流程开发

内容太多,不胜枚举。
随着风控精细化的管理,我们也逐步就贷后迁徙率模型的内容进一步迭代与更新。今天我们综合了星球同学的一些新需求,给大家梳理了这样一篇关于贷后迁徙率模型的文章,希望对所有的风控人员在贷后相关的模型开发的上都有所启发。文章虽然大部分是关于模型开发的细节,但其中也不乏关于贷后迁徙率应用的内容,相信对贷后策略和相关风控领域的同学也会有所启发。
因为完整内容较长,本次整体的内容将分成上下部分跟大家介绍,特别是下部分,我们更会在知识星球上为大家提供本次内容所涉及的实操数据与代码,带领大家领略整个贷后迁徙率模型内容,整体目录如下:

PART 1.迁徙率模型的业务背景
1.1…业务背景
1.2.迁徙率模型的简单介绍
PART 2.迁徙率模型的设计思路

PART 3.迁徙率模型的特征开发

PART 4.迁徙率模型开发应用
PART 5.实操—迁徙率的模型特征开发

Part1.迁徙率模型的业务背景

一.业务背景
风控模型的整个体系主要由反欺诈模型,申请准入模型(A卡),贷中行为模型(B卡),贷后催收模型(C卡),网上对于反欺诈,AB卡的资料较多,但对于C卡的介绍却比较少,原因在于以前很多公司没有专门的催收团队,且人的因素对催收结果影响很大,大部分公司在用户发生M1(逾期30+)后就会进行委外催收处理。
但随着目前信贷行业的发展,委外催收慢慢被淘汰,各家公司开始搭建并重视起自己的催收团队,为了提高催回率,减少坏账损失,催收也朝着精细化的方向发展,催收策略和模型变得越来越重要,基于此背景,本文将介绍贷后模型中的迁徙率模型,介绍其开发的思路,过程和应用方式。

二.迁徙率模型的简单介绍
1:迁徙率:

表示用户从当前的逾期状态过渡到下一个逾期状态的比率

贷后中逾期状态分为这么几类:
M0:表示未处于在逾状态,在逾天数等于0
M1:表示处于在逾状态,在逾天数为1-30天
M2:在逾天数为31-60天
M3:在逾天数为61-90天
M4:在逾天数为91-120天
以此类推…

上述的逾期状态是业界常用的,有些的公司的定义可能会有差别,例如会把M0定义成在逾1-3天(还款的宽限时间),还有考虑到用户可能有多笔在逾订单,一个订单中又有很多期是在逾的,所以这里面的在逾天数通常表示为“最大在逾天数"(算出每期的在逾天数取其中最大值)。另外计算在逾天数时要确定观察点,例如用户在今天算的在逾天数为15,那到了明天如果他还不还,在逾天数就变为了16。下面来拟计算2月-3月的迁徙率:

Step1:在2月28号那天标记样本中每个用户的逾期状态
Step2:因为每个逾期状态之间都间隔了30天,所以迁徙的表现期为30天,观察在3月30号这一天样本中每个用户的逾期状态
Step3:计算各个迁徙率的值
按照上述步骤模拟的结果如下:

图中可以看出,2月28号处于M0的人,30天后有33%的人迁移到了M1,67%的人仍处在M0阶段,2月28号处于M3的人,只有12%的人还清所有欠款,回到了M0阶段,而有33%的人仍然不还恶化到了M4阶段

2.迁徙率模型的分类

从上述的迁徙率结果可以看出,每个逾期阶段的风险是不一样的,逾期阶段越长,催回的概率越小,在每个阶段的样本都充足的情况下,为了精细化的催收策略,可以分阶段构建迁徙率模型,例如M0-M1,M1-M2,M2-M3模型,来提高各个阶段的催回率。有些公司可能不会分的这么细,会分成短账龄迁徙模型(<=M1阶段的用户迁移到M2+)及长账龄迁徙模型(M3阶段用户迁移到M4+),所以要根据样本量,业务目标具体来定做什么样的迁徙率模型。

Part2.迁徙率模型的设计思路
一.目标定义和预测群体
以M1-M2迁徙模型为例,那预测群体为观察点处在M1阶段的用户,预测这些人30天后迁移到M2的概率。样本定义在用户维度,即计算用户的最大在逾天数作为逾期状态。

二.观察点,观察期,表现期的定义
我们先看一下申请准入模型(A卡)的观察点,观察期,表现期是怎么定义的,笔者画了下面这张图来表示,设定表现期为90天以上,坏用户定义为最大逾期天数>=30天,好用户定义为最大逾期天数<=3天。观察点即为用户的申请日,每个用户的申请日不同,观察点自然也不一样。我们从建模的时点来观察,要求用户到期日和建模时点的间隔至少在90天以上(表现期),然后在建模时点计算这些人的最大逾期天数,这里的逾期天数包含“逾期还款”和“在逾”两种状态,将最大逾期天数>=30标记为坏用户,<=3天为好用户。观察点之前则为用户的观察期,一般观察期设为360天或720天,观察期内采集的数据来构造特征,通过这些特征来预测用户申请之后的逾期表现。

从A卡的定义中可以看出,每个用户的观察点不一样,且只要满足表现期,用户的标签不会随着建模时点改变而变化,举个例子,如果把今天作为建模时点,用户X只有在逾订单,且最大逾期天数>=30天,那他的标签是个坏用户,那如果把建模时点推到后天,这时候用户X已经把在逾订单都给还了,那他只有逾期还款订单,最大逾期天数还是>=30天,仍然是个坏用户,因为逾期天数包含“逾期还款”和“在逾”两种状态。
那对于迁徙率模型,表现期是很容易定的,模型是预测M1-M2的迁徙情况,那表现期就为30天,观察期的话也跟A卡类似,设为360天或720天,主要研究的是两个问题:
1)怎么确定观察点?
2)在什么时点计算逾期天数?

先说第一个问题,迁徙率模型不像A卡有明显的触发动作(申请行为)时间作为观察点,贷后用户的逾期还款行为每天都在发生,如果建模时点为2021年12月31日,那么往前推30天(表现期),2021年12月1日之前每天都可以作为观察点来建模,那到底选哪天呢?笔者的想法是观察点越近越好,但也要留出足够多的时间外样本(OOT)来验证模型效果,因为观察点不固定,所以验证模型跨时间稳定性非常重要。我们可以分析近一年的数据做迁徙率分析,计算每天M1-M2的迁徙率变化,选择迁徙率稳定,客群稳定,催收动作无大变动的一段时间作为建模和模型验证的时间窗口,假设2021年9-12月份样本比较稳定,那可以将2021/8/31作为建模的观察点,用建模观察点后每隔1个月作为验证样本的观察点,这样验证样本有三部分,验证的观察点分别为2021/10/1,2021/11/1,2021/12/1。
建模观察点2021/8/31确定好后,第二个问题就容易解决了,先在建模观察点计算用户的最大在逾天数,将处在M1阶段的用户挑选出来,这些用户就是建模样本,然后经过30天表现期,在2021/9/30这个时点再计算这些人的最大在逾天数,将处在<=M1阶段的标记为好用户,迁移到M2的标记为坏用户。

从刚才的建模思路中可以发现申请准入模型和迁徙率模型的不同点:
1)申请准入模型用户观察点不固定,迁徙率模型所有用户用同一个观察点
2)申请准入模型在建模时点计算逾期天数,且包含“逾期还款”和“在逾”,迁徙率模型是在观察点和表现期满的时间点计算逾期天数,且只考虑“在逾”
3)申请准入模型每个用户的表现时间不一样,观察点越靠前,表现时间越长,而迁徙率模型所有用户表现时间都一致
4)迁徙率模型由于观察点固定,所以更看重跨时间的稳定性。

三.如何评估迁徙率模型的效果
1)建模样本中随机划分出验证集计算KS,AUC指标,然后在跨时间样本上验证KS,AUC的稳定性,这是线下评估的方式。
2)模型刚上线时还没积累到期样本,这时候可以通过催收员使用模型的反馈来评估,例如高分段的用户催回率是较高的,用户是比较配合催收的,催收员可通过与用户的接触来判断模型预测的准确性。

Part3.迁徙率模型的特征开发
做特征开发之前,我们可以思考下哪些行为或数据对用户还款有影响:
1)催收行为:根据历史上对用户的催收手段,催收强度,催收频率等可以反应用户的还款意愿和好催程度,如果一个用户电催经常打不通,失联天数长,动用过催收函,冻结账户等手段,那有理由相信这个人有大概率从M1迁移到M2
2)历史逾期还款行为:包括本平台和其他平台上的贷后行为,如果用户提前还款次数多,说明手上资金比较充足,且重视诚信记录,如果习惯性的逾期,逾期天数又长,说明还款意愿比较低,不重视诚信记录。
3)负债情况:用户若在其他平台上有多头共债现象,说明负债压力比较大,很可能出现拆东墙补西墙,哪家催的急就先还哪家,这种人不还的风险比较高。
4)收入能力:直接反映用户的还款能力,收入包括工资,公积金,固定资产等。

根据以上的这些维度,结合可用的数据,我们可以开发四类特征
1)催收行为特征,包含电催,短信,催收函记录等。
2)逾期还款特征,在本平台的还款记录,逾期记录等
3)内部负债特征,在本平台的在贷,在逾笔数,金额等
4)外部三方特征,包含风险名单,多头共债,逾期行为等

在风控中,我们常从时间维度提取用户在不同时间点的行为特征,所以时间窗口类特征占到了绝大部分,在特征衍生时,我们可根据时间窗口+行为维度+统计对象+统计函数 这个定式来衍生出大量的时间窗口特征。例如对电话催收数据:

时间窗口维度可分为近7天,近15天,近30天,近90天,近180天…

行为维度包括催收员呼叫,用户回电,呼叫中又可分为未接通和已接通
统计对象包含通话次数,通话时间
统计函数就是对通话时间进行加总,取平均等

另外除了统计类特征,还可生成趋势类,占比类,稳定性类的时间窗口特征,基于以上的特征开发思路,笔者整理了一些特征明细供读者参考:

催收行为特征

2.逾期还款特征

3.内部负债特征

4.第三方数据

Part4.迁徙率模型开发应用
PART 5.实操—迁徙率的模型特征开发

…剩下第四与第五部分,因篇幅关系,详情可以请到知识星球参考完整详版内容~

另外,关于近期番茄风控关于模型相关的实操内容,更可以同步至知识星球后台,查看完整版本数据集+代码内容,欢迎星球同学移步到知识星球查收完整内容:

关于模型相关内容,更系统性的可以关注《全线条训练营》:

~原创文章

end

手把手实操系列|贷后迁徙率模型开发(上篇)相关推荐

  1. 手把手实操系列|贷中逾期风险预测模型开发流程(上)

    序言: 随着新客的获客成本越来越高,贷中客户的管理越来越受到放贷机构的重视,其中包括用户流失预测,营销响应预测,逾期风险预测,额度利率管理等. B卡,又称为行为评为卡,它的作用对象是老客,根据其在账户 ...

  2. 手把手实操系列|信贷风控中的额度管理和额度模型设计

    序言: 如今的个人信贷行业步入合规发展阶段后,额度管理和差异化定价成为金融机构是否能最大化盈利的核心竞争力,其中额度管理包括贷前阶段的授信额度,贷中阶段的提额,降额等,本文将着重讲解这两个阶段的额度设 ...

  3. 手把手系列|贷后评分(C)卡模型开发实操(全)

    序言: 随着风控精细化的管理,番茄风控也就将现有的内容进一步迭代,更新贷后迁徙率模型的内容,同时也综合了星球社区中同学的一些新需求,给大家梳理了贷后迁徙率模型的文章. 希望对所有的风控人员在贷后相关的 ...

  4. 手把手实操|深度剖析电商贷款风控相关细节(电商贷模型)

    序言: 在电商领域中,一直都有这样的场景:对于电商企业而言,资金短缺是经常出现的问题,尤其是在目前疫情状况下,经济下行,营业额逐渐降低,现金流紧张,企业这时就会考虑去借贷融资. 有需求就有供给,目前许 ...

  5. 华为交换机实操系列(资源)

    一.华为实操系列 | 怎样远程登录设备–telnet方式 1.应用场景 用户可以通过telnet远程登录设备,对设备进行远程管理和维护. 用户希望使用AAA验证方法登录远程设备,进而可以方便地对其进行 ...

  6. 【直播回顾及资料下载】小程序云应用入门实操系列课程第一讲...

    直播详情:小程序云应用入门实操系列课程第一讲:https://yq.aliyun.com/articles/698244 直播时间:2019年4月16日 20:30 直播专家: 白宦成 - Linux ...

  7. 不同网段的局域网怎么互通_华为实操系列 | 交换机在局域网中是怎么应用的,看完你肯定懂了!...

    编辑 | 排版 | 制图 | 测试 | ©瑞哥 此文用时0小时48分钟,原创不易,坚持更不易,希望我的每一份劳动成果都可以得到大家的一个[在看] 交换机在局域网中的应用 交换机在局域网中的应用分为两种 ...

  8. 催收评分卡(三)迁徙率模型

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   本文主要介绍迁徙率模型和还款率模型,至于失联模型,其实也不难做,难点是在于每家公司对失联客户的定义,主 ...

  9. 超硬核的 OCR 开发利器推荐:从场景案例到实操演示,快速掌握OCR模型训练

    现如今OCR能力已经在众多场景中落地应用: 像是常见的身份证.驾驶证.行驶证等卡证识别: 又如出租车发票.增值税发票.火车票等财务票据识别: 再如医疗费用结算单.病案首页.保险单等医疗票据识别: -- ...

最新文章

  1. java cglib jar包_Java面试题|反射必看的4道面试题
  2. Oracle安装部署之rhel 5.8下静默安装oracle11gr2
  3. 解决Linux安装过程中不能安装Grub的问题
  4. python工作-Python工作五年月薪23K,记录一下我的学习经历建议
  5. Java设计模式(一) -- 工厂方法模式
  6. sketch钢笔工具_Sketch和Figma,不同的工具等于不同的结果
  7. 业务配置开发平台qMISPlat 2.0 产品介绍
  8. 阿里文娱技术专家战獒: 领域驱动设计详解之What, Why, How?
  9. 信息学奥赛一本通(1130:找第一个只出现一次的字符)
  10. 获取Authorize.Net Transaction Key ( Getting Your Authorize.Net Transaction Key )
  11. 一张图讲清M0中断请求
  12. oracle没报错 开不了库,oracle 数据库无法启动,报错 terminating the instance due to error 16014...
  13. net core 2 读取appsettings.json
  14. 用一句话阐明epoll跟Windows IOCP之间的区别
  15. DSP及海思嵌入式板实现gb28181
  16. 极限理论总结04:Delta方法
  17. python 使用GDAL实现栅格tif转矢量shp
  18. C#显示和隐藏 Excel 工作表及工作表中的行与列
  19. 汇编---串传送指令MOVS
  20. java 截取视频_2种方式获取视频时长、截取视频帧作为封面(java or H5)

热门文章

  1. 【时间序列】时间序列中如何进行交叉验证
  2. 【PHP】快递100API查询快递接口
  3. python实现召回率、精度、f1代码
  4. 关于软件部门任务管理机制构建的感想
  5. 关于GPU上进程杀不死的解决
  6. jitsiMeet与Callkit的对接心得
  7. Android dlna 投屏
  8. linux mysql5.6 单向 同步 配置 2014_MySql 5.6 数据单向同步详细步骤(亲测成功同步)...
  9. “跨链太火”竟然是加密货币Defi史上最大盗窃案的根本原因
  10. matlab dpsk,Matlab之DPSK