模型稳定度指标PSI与IV
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。公式如下:
这里的AC与EX为不同时间段的模型输出分数,如果PSI过大,说明模型输出的分数分布变化很大了,需要更新模型。
PSI实际应用范例:
1)样本外测试
针对不同的样本测试一下模型稳定度,比如训练集与测试集,也能看出模型的训练情况,我理解是看出模型的方差情况。
2)时间外测试
测试基准日与建模基准日相隔越远,测试样本的风险特征和建模样本的差异可能就越大,因此PSI值通常较高。至此也可以看出模型建的时间太长了,是不是需要重新用新样本建模了。
变量的PSI计算:
PSI:检验变量的稳定性,当一个变量的psi值大于0.0001时,变量不稳定。一个变量,将它的取值按照分位数来分组一下,每一组中测试模型的客户数占比减去训练模型中的客户数占比再乘以这两者相除的对数,就是这一组的稳定性系数psi,然后变量的psi系数就是把这个变量的所有组的psi相加总起来。
https://blog.csdn.net/sinat_26917383/article/details/51721107
IV与WOE:
IV表示一个变量的预测能力:
<=0.02,没有预测能力,不可用
0.02~0.1 弱预测性
0.1~0.2 有一定预测能力
0.2+高预测性
IV还可以用来挑选变量,IV就越大,它就越应该进入到入模变量列表中。
WOE计算公式:
要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱等等,说的都是一个意思)。分组后,对于第i组,WOE的计算公式如下:
IV计算公式:
IV和woe参考:https://blog.csdn.net/kevin7658/article/details/50780391
转载于:https://www.cnblogs.com/gczr/p/9073096.html
模型稳定度指标PSI与IV相关推荐
- python计算模型psi_模型稳定度指标PSI与IV
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...
- [机器学习] 模型稳定度指标PSI
群体稳定性指标(population stability index) 由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(populati ...
- 模型稳定度指标PSI 释义及计算示例
稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针.其实PSI表示的就是按分数分档后,针对不同样本, ...
- 信用评分卡模型稳定度指标PSI
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...
- 模型稳定度指标PSI
群体稳定性指标PSI(Population Stability Index)是衡量模型的预测值与实际值偏差大小的指标. PSI = sum((实际占比-预期占比)* ln(实际占比/预期占比)) 举例 ...
- ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介、使用方法、案例应用之详细攻略
ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介.使用方法.案例应用之详细攻略 目录 PSI(稳定度指标)的简介 1.如何计算PSI? (1).PSI计算过程
- 模型稳定性指标—PSI
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...
- kmeans及模型评估指标_模型评估常用指标
一. ROC曲线和AUC值 在逻辑回归.随机森林.GBDT.XGBoost这些模型中,模型训练完成之后,每个样本都会获得对应的两个概率值,一个是样本为正样本的概率,一个是样本为负样本的概率.把每个样本 ...
- 风控业务-模型稳定性评价指标PSI
在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线.如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性, ...
最新文章
- 杏树林孙文亮:在线医疗数据驱动实战
- Unicode(UTF-8, UTF-16)令人混淆的概念
- oracle回退脚本怎么写_直播间脚本要怎么写?李佳琦、薇娅直播间直播脚本解析!...
- Python无法导入Cython的.pyx文件
- c++代码健壮性_复活Navex-使用图查询进行代码分析(上)
- 我们常说的CDN到底是什么?
- 线性判别分析LDA解析2
- 二、Arduino软件下载-安装-测试教程
- Cause: java.lang.ArrayIndexOutOfBoundsException: 8
- 基于深度学习智能问答笔记
- 命令top动态监控进程所占系统资源
- 为什么需要每年重新签发SSL证书?
- C语言 | 将字符串中的元音字母复制到另一个字符串中
- 网吧游戏下载期,内置超10000G游戏!
- 书写历史的甲骨文--ORACLE公司传奇(转)
- 狂神redis笔记_狂神说redis笔记(一)
- 在Linux下运行你的第一个汇编程序
- 如何在WPS中启用WebDAV连接到穿越派·派盘
- scrapy框架之分布式爬虫
- 多媒体发布系统(捷先)
热门文章
- java面试——集合(ArrayList、lterator、LinkedList)源码理解
- 有意思的java工具——Retroweaver和ProGuard
- Xilinx原语使用方法
- 秒杀系统架构设计思路
- 草莓柿子文案:草莓柿子水果店文案,草莓柿子水果朋友圈文案
- 机器学习实验:使用sklearn的决策树算法对葡萄酒数据集进行分类
- locvps的自动注册(图形和短信验证码的自动识别获取)
- 中国图形图象学报和计算机科学,lbrack;中国图象图形学报rsqb;参考文献格式
- Flink SQL JSON Format 源码解析
- 初一数学计算机教案,人教版初中数学教案 初中数学教案范文精选