稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化

PSI小于0.1时候模型稳定性很高,0.1-0.2一般,需要进一步研究,大于0.2模型稳定性差,建议修复。

psi计算公式为:psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))

示例:

有一个模型主要生成用户分组,输出参数为group01-group10,我们需要统计该模型是否稳定,以验证我们的建模是否合适

第一步:统计总进件量(数据库统计),如总进件量为3400条数据

第二步:将总进件量按区间统计出各分区间量

假如统计出的结果如下:

group01 100
group02 200
group03 300
group04 500
group05 700
group06 800
group07 100
group08 100
group09 500
group10 100

第三步:算出各区间占比(本区间数/总进件数)

实际占比
2.94%
5.88%
8.82%
14.71%
20.59%
23.53%
2.94%
2.94%
14.71%

2.94%

第四步:我们自己有一个期望占比

预期占比
2%
8%
13%
17%
18%
6%
11%
9%
13%
3%

第五步:计算各区间psi并最终进行求和,从结果来看我这个模型应该重做哈哈哈。不过我的预期占比是随便写的,所以才有这个结果。整体的计算流程就是这样了,psi的计算公式为:psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))

模型稳定度指标PSI 释义及计算示例相关推荐

  1. python计算模型psi_模型稳定度指标PSI与IV

    由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...

  2. [机器学习] 模型稳定度指标PSI

    群体稳定性指标(population stability index) 由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(populati ...

  3. 模型稳定度指标PSI与IV

    由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...

  4. 模型稳定度指标PSI

    群体稳定性指标PSI(Population Stability Index)是衡量模型的预测值与实际值偏差大小的指标. PSI = sum((实际占比-预期占比)* ln(实际占比/预期占比)) 举例 ...

  5. 信用评分卡模型稳定度指标PSI

    由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...

  6. ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介、使用方法、案例应用之详细攻略

    ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介.使用方法.案例应用之详细攻略 目录 PSI(稳定度指标)的简介 1.如何计算PSI? (1).PSI计算过程

  7. 模型稳定性指标—PSI

    由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知.稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发 ...

  8. kmeans及模型评估指标_模型评估常用指标

    一. ROC曲线和AUC值 在逻辑回归.随机森林.GBDT.XGBoost这些模型中,模型训练完成之后,每个样本都会获得对应的两个概率值,一个是样本为正样本的概率,一个是样本为负样本的概率.把每个样本 ...

  9. 风控业务-模型稳定性评价指标PSI

    在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线.如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性, ...

最新文章

  1. 余弦距离(Cosine距离)与编辑距离分别是什么?各有什么优势和使用场景?
  2. iCOM组件(iComponent,应用或学习组件)
  3. html语言机标记椒用来调字体的,HTML语言 之 字体标记
  4. Bailian2804 词典【map+字典树】
  5. liunx 环境下docker安装mysql
  6. 控制理论中的几种稳定性介绍
  7. Delphi FireMonkey 的动画以及多线程
  8. 基于HTML5实现五彩连珠小游戏
  9. PAT乙级1055 集体照
  10. 计算机组成原理——计算机的工作过程
  11. 众数问题c语言编程,众数问题
  12. 畅通工程2(prim模拟链表结构体建图+kru)
  13. 03.C 语言实现3.5寸虚拟软盘
  14. 基于RTP/RTCP的无线视频传输自适应带宽控制
  15. Spring系列九:Spring 事务
  16. 微信公众号开发系列三:响应关注和取关事件
  17. Excel 学习心得2
  18. 虚幻引擎4中的实时GI技术
  19. C++中流控制函数 setw() setfill() setbase() setprecision()
  20. oracle 删除用户 ora-00604,删除用户ORA-00604和ORA-00054

热门文章

  1. Jenkins实现微服务自动化部署_Jenkins环境设置完整版 (二)
  2. java留言板_java实现留言板功能实例
  3. 医学研究人员为什么要学习R语言?哪本书最适合学习?
  4. 黑桃8形式的c语言编程,C语言的随机发牌程序(红桃、黑桃、梅花、方块)
  5. LiveRTMP内置IPCamera实现RTMP直播摄像机功能
  6. Flag壁纸生成器诞生记
  7. 重庆邮电大学计算机2019湖北分数线,2019重庆邮电大学录取分数线及历年专业分数线统计表【文科 理科】...
  8. 基于JAVA星星电影购票网站计算机毕业设计源码+系统+数据库+lw文档+部署
  9. ios开发读取剪切板的内容_iOS开发_iphone 实现剪贴板操作_iphone 复制粘贴功能(转)...
  10. GNOME Shell加速演进:BoxPointer, AppMenu和Magnifier