评分卡模型监控(后端分析)
1.评分卡模型监控主要可以分为前端分析(Front-End)和后端分析(Back-End)
2.后端分析包含账龄分析(Vintage)和组合分析(Portfolio)
3.Vintage有三个维度,行、列、对角线
4.Vinatge的行表明用户生命周期效应,体现了用户成熟过程中发生的变化
5.Vinatge的列表明了新账户效应,体现了拥有相同账龄用户随时间而发生的变化
6.Vinatge的对角线表明了组合效应,体现了相同时期拥有不同账龄用户的组合变化
7.Vintage分析可以找到用户风险释放期和分析风险变化的因素
8.组合分析包括逾期分布和转移矩阵
9.逾期分布提供总览的作用,反映了当前情况下的风险分布
10.转移矩阵是描述逾期分布在时间上发生变化具体的转移情况,包括滚动率(Roll Rate)和迁徙率(Flow Rate)
11.滚动率侧重于分析客户逾期程度的变化,迁移率侧重于分析客户状态的发展变化路径
12.滚动率分析是从某个观察点之前的一段时间(称为观察期)的最坏状态向观察点之后的一段时间(称为表现期)的最坏状态的发展变化情况
13.滚动率分析还可以定义客户好坏程度
14.从迁徙率可以估算资产损失
评分卡模型监控主要可以分为前端分析(Front-End)和后端分析(Back-End),其中前端分析主要关注人群的稳定性,后端分析主要关注模型的影响和表现。本文介绍后端分析。
后端分析主要是对模型表现进行监控,观察资产的变化情况,主要包括账龄分析(Vintage)和组合分析(Portfolio),这其中会介绍关联的两个重要指标迁徙率(Flowrate)和滚动率(Roll Rate)。
1.账龄分析(Vintage)
介绍Vintage前,需要对一些风控概念做介绍。
概念1:MOB(Month on Book):在账月份
也叫做账龄,通常上,可以分两种定义。方法一是MOB0为放宽日至当月月底,MOB1是放款后第二完成的月份,以此类推;方法二是以放宽日开始的一个月(通常30天)作为一个周期。
例如放款日是20190506,按照方法一,MOB0就是20190506~20190531,MOB1是20190601~20190630,以此类推;按照方法二,MOB1是20190506~20190606.
方法一的统计方法关注的是固定时间节点的用户的具体表现,方法二的统计方法关注的是用户具有统一的表现期。
概念2:FPD(First Payment Deliquency):首次还款逾期
用户放款通过后,首笔需要还款的账单的逾期情况。比如FPD7+表示用户首期还款日到期后逾期7天及以上。在反欺诈上,通常用FPD15+或FPD30+作为训练指标
概念3:DPD(Days Past Due):逾期天数
自还款日次日起到实还日期间的天数。
这里需要注意的是,在统计逾期时,还细分为期中ever逾期和期末时间点逾期两种。期中ever逾期是指,如果用户在该周期内发生过M1(M2,M3等),不管到期末时间点是否结清,都认为该用户在该周期内逾期了。期末时间点逾期是指统计用户在期末这个时间点是否处于M1(M2,M3等)状态。
一句话总结,期中ever逾期表示周期动态过程的指标,期末时间点逾期表示周期期末静态的指标。
举个例子,某个8月10号放款的用户,在MOB1(9月)期间内逾期8天(应还9月10号,实还9月18号),那么ever逾期就是DPD8,期末观察DPD为0,即处于非逾期状态。
概念4:M0,M1,M2,...,Mn:逾期期数
MO表示当前未逾期(也用C表示),M1表示逾期1-30天,M2表示逾期31-60天,M3表示61-90天,M4+表示逾期90天以上。
概念5:逾期金额
统计口径也有两种:某期发生逾期时,一种是计提所有剩余未还本金作为逾期金额;另一种是只计提截止到该期的未还本金
基于这些概念,我们构造Vinage指标,一般以一张二维表和一张图展示,下面给出示例:
Vintage的三维度:
行:表明用户生命周期效应,体现了用户成熟过程中发生的变化
列:表明了新账户效应,体现了拥有相同账龄用户随着时间改变而发生的变化
对角线:表明了组合效应,体现了相同时期拥有不同账龄用户的组合变化
从Vintage解析风控:
找到用户风险释放期:从MOB8开始,大部分月份的逾期率趋于稳定,这说明8个月的表现期,用户的风险基本都暴露完全了。这对我们建模过程中确定样本表现期具有指导作用,也确定数据测试样本的周期选取跨度
分析风险变化的因素:201803月份的账龄曲线明显高于其他月份,可能是因为环境发生了变化,也可能是因为公司放松了政策或者遭受欺诈事件,导致风险升高;再观察5~7月份逾期指标降低,说明可能是因为政策收紧或风控水平提升导致的
一般会结合风控大事记寻根溯源,分析波动异常的原因,从而找到对策。
2.组合分析(Portfolio)
组合分析包括逾期分布(Delinquency Distribution)和转移矩阵(Transition Matrix)
逾期分布主要是用能体现风险的指标描述账户分布
注:数据属于捏造,如有雷同,纯属巧合
逾期分布主要提供总览的作用,反映了当前情况下的风险分布。是其他后端分析的基础,其内容可做滚动率分析(Roll Rate)。我们下面介绍一下。
滚动率分析是从某个观察点之前的一段时间(称为观察期)的最坏状态向观察点之后的一段时间(称为表现期)的最坏状态的发展变化情况
来源:Vintage、滚动率、迁移率的应用
举个例子:
从该表可以看出:
1、正常的客户,在未来6个月里,有94%会保持正常状态;
2、逾期1期的客户,未来有63%会回到正常状态,即从良率为63%,有22%会恶化;
3、逾期2期的客户,从良率为41%,有36%会恶化;
4、逾期3期的客户,从良率为13%,有39%会恶化;
5、逾期4期及以上的客户,从良率仅为1%,有95%会继续此状态。
由此,滚动率分析还可以对客户好坏程度进行定义.
因为M4+用户逾期程度减轻的概率非常低,只有4.8%,所以在建模的过程中,坏客户可以定义为M4+
转移矩阵是描述逾期分布在时间上发生变化具体的转移情况。
滚动率分析其实就是一种特殊的转移矩阵情况。滚动率分析就是在给定两个时间窗口(观察期和表现期)的情况下,观察用户违约程度的变化(保持、变好、变差)
迁徙率分析(Flowrate)和滚动率一样,也是一种转移矩阵情况。滚动率侧重于分析客户逾期程度的变化,迁移率侧重于分析客户状态的发展变化路径。
举一个例子说明:
来源:Vintage、滚动率、迁移率的应用
迁徙率计算公式:Mi~Mj:当期的Mj/上期的Mi
比如2018年7月M0~M1的迁移率=41110122/171325636=24%。
观察这张表可以发现,M3~M4的迁移率较高,应该是逾期超过90天,过了黄金催收期,所以逾期恶化程度较高,但M4~M5的迁移率突然降低了不少,有可能是委外催收起到了一定效果所致。
基于迁徙率,可以进一步算出损失率(假定M7将以10%的价格收回):
周期 | 迁徙率平均值 | 损失率 | 净损失率 |
M0 | 16.06%(M0~M1) | 0.61% | 0.55% |
M1 | 29.27%(M1~M2) | 3.79% | 3.41% |
M2 | 42.28%(M2~M3) | 12.94% | 11.64% |
M3 | 81.71%(M3~M4) | 30.60% | 27.54% |
M4 | 52.75%(M4~M5) | 37.45% | 33.70% |
M5 | 82.51%(M5~M6) | 71.00% | 63.89% |
M6 | 86.05%(M6~M7) | 86.05% | 77.44% |
其中0.61%=16.06%*29.27%*42.28%*81.71%*52.75%*82.51%*86.05%;
3.79%=29.27%*42.28%*81.71%*52.75%*82.51%*86.05%。其他以此类推。
根据资产损失率可以估计资产预计损失
比如2018年12月的预计损失(M0~M6资产和净损失率的加权求和):
367162809*0.55%+47230430*3.41%+14848678*11.64%+6011499*27.54%+4614038*33.70%+2326454*63.89%+1586471*77.44%=11273470
故拨备率 = 11273470/443823814 = 2.54%
参考资料:
https://zhuanlan.zhihu.com/p/95800018
https://mp.weixin.qq.com/s/KefG_8krBBaFl0LCi2L2WA
评分卡模型监控(后端分析)相关推荐
- 标准评分卡分数计算原理_评分卡模型监控(前端分析)
1.评分卡模型监控主要可以分为前端分析(Front-End)和后端分析(Back-End) 2.前端分析关注样本人群的稳定性,指标主要有PSI和CSI 3.PSI用来衡量分数在开发样本和近期样本上的分 ...
- python信用评分卡_基于Python的信用评分卡模型分析(二)
上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...
- woe分析_评分卡模型剖析之一(woe、IV、ROC、信息熵)
评分卡模型剖析之一(woe.IV.ROC.信息熵) 信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后 ...
- 3分钟搞明白信用评分卡模型模型验证
2019独角兽企业重金招聘Python工程师标准>>> 信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量W ...
- 基于Python的信用评分卡模型-give me some credit数据集,AUC 0.93 KS 0.71
信用风险计量模型可以包括跟个人信用评级,企业信用评级和国家信用评级.人信用评级有一系列评级模型组成,常见是A卡(申请评分卡).B卡(行为模型).C卡(催收模型)和F卡(反欺诈模型). 今天我们展示的是 ...
- ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解
ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解 目录 基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分 ...
- 尚未整理【风控】互联网金融-构建评分卡模型部分知识点
模型部署方式:将模型转为PMML文件或者框架.服务器方式做接口调用. 特点是:笔数多,单笔金额小,数据维度丰富 信用评分做准入,行为评分做调额,贷中管理,或者提前催收 催收评分卡,可以预测M1转到M2 ...
- 评分卡模型剖析之一(woe、IV、ROC、信息熵)
信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广 ...
- 信用评分卡模型开发及评估指标
版权声明:本文为博主原创文章,未经博主允许不得转载. 一.信用风险评级模型的类型 信用风险计量体系包括主体评级模型和债项评级两部分.主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用&qu ...
- 评分卡模型开发(八)--主标尺设计及模型验证
转自:https://blog.csdn.net/lll1528238733/article/details/76601930 上一步中开发的信用风险评分卡模型,得到的是不同风险等级客户对应的分数,我 ...
最新文章
- mysql字段定义成text类型的严重影响查询性能
- 为什么到处都在推python_Python为什么能取得越来越超然的地位
- 右键菜单管理---右键管家
- Flink的waterMark概念解释
- HA应用之 -- corosync+pacemaker
- DevExpress LookUpEdit 初始化(数据加载) 底层类
- 关键词组合工具_8大工具组合出击,解决扩量难题
- 扫描仪支持linux驱动,开源扫描仪驱动sane支持的扫描仪列表
- python修改pdf元信息 metadata
- 互联网大数据时代下亚马逊是如何解决数据存储的
- IEEE754 16进制浮点型 转为十进制
- 二叉树高度 [log2n]+1与log2(n+1)是否相等
- iframe内嵌标签
- 自然常数e(无理数)探究
- dede采集插件自动采集文章图片自定义接口
- vive定位器突然闪红灯
- python编程水上行走_普通人如何水上行走,只要速度足够的快,何愁不能水上漂...
- 小米6弹HTML查看器,小米6浏览器远程代码执行(CVE-2019-13322)
- Ae:常用表达式及应用(01)
- 如何方便的在Office(powerpoint、word)中输入数学公式?