前言:

当一张评分卡构建完成时,筛选出一组特征生成了分数,我们会想要知道这个分数是否靠谱,即是否可以依赖这个分数将好坏客户区分开来,这个时候就需要评判评分卡有效性的指标。

测量评分卡好坏区分能力的指标有许多,本文就为大家介绍几个常用的定量指标:

1. 散度(分数为连续函数)与信息比率(IV);

2. KS值

在这篇文章当中,花了极大的笔墨从数学的角度证明了KS值的存在性和函数性质问题:

  • 为什么F(s|B)为凹函数、F(s|G)为凸函数?

  • 为什么F(s|B)-F(s|G)存在极大值(最大值)?

  • 为什么F(s|B)曲线在F(s|G)曲线之上?

3. ROC曲线、AUROC值与GINI系数。

----------------------------------------------------------------------------------

一、 散度与IV值

1.1 散度

散度为信息比率的连续版本。而评分卡分数是基于有限样本计算出的分数分布,并不一定是完全连续函数,所以就衍生出了离散版本的散度----信息比率IV。

1.3 IV值的应用

在实际应用当中,IV值通常用来筛选变量,IV值越大,该变量的好坏区分能力越强。在评分卡建模的过程中,利用IV值筛选变量也是非常重要的一个环节。

从IV值的公式中,易得变量的分组越多,IV值越大。但是分组分的太多,就会使得每个分组的数据量变少,导致细项分组的分布不稳定。所以,我们在使用IV值筛选变量的时候,不能为了提高IV值一味地将分箱的数目提高,也要兼顾变量的业务含义和分布的稳定性。

实际计算过程如下表:

----------------------------------------------------------------------------------

如下图所示,KS统计量是F(s|G)和F(s|B)间距离最大的那条红线的长度。

仔细观察图形,存在如下两个问题:

1. 为什么F(s|B)为凹函数、F(s|G)为凸函数?

2. 为什么F(s|B)-F(s|G)存在极大值(最大值)?

3. 为什么F(s|B)曲线在F(s|G)曲线之上?

在解释这3个问题之前,让我们先来做个完美假设:

上述图形描述的是一个理想的评分卡系统的好坏客户累计分布情况:即分数越高,好客户占比越大,分数越低,坏客户占比越小。

理想假设:假设存在一个完美的评分卡,使得随机变量score分别在好客户下的条件概率分布函数f(s|G)严格单调递增、即分数越高,f(s|G)=P(score=s|G)的概率越来越大,在坏客户下的条件概率分布函数f(s|B)严格单调递减,即分数越低,f(s|B)=P(score=s|B)的概率越来越大。

现在,我们来看在实际应用当中的计算过程,如下表:

----------------------------------------------------------------------------------

三、 ROC曲线与AUROC值;

3.1. ROC曲线

ROC曲线也是评分卡度量指标中常用的指标工具,在介绍KS统计量的时候,其分布函数是由好客户和坏客户对应的累计概率密度函数F(s|B)与F(s|G)随着分数s变化的图形,而ROC曲线是好客户的累计概率密度相对于坏客户的累计概率密度函数的图形,如下图所示:

-------------------------------------------End-----------------------------------

0

热爱生活,热爱学习。

永远年轻,永远热忱

知乎:金融建模

微信号:cutewendan

公众号:风控汪的数据分析之路

分计算iv值_一文读懂评分卡的IV、KS、AUC、GINI指标相关推荐

  1. 继电器rc吸收电路取值_一文读懂继电器的工作原理以及驱动电路

    继电器是一种电子控制器件,它具有控制系统(又称输入回路)和被控制系统(又称输出回路),通常应用于自动控制电路中,它实际上是用较小的电流去控制较大电流的一种"自动开关".故在电路中起 ...

  2. java中date类型如何赋值_一文读懂java中的Reference和引用类型

    简介 java中有值类型也有引用类型,引用类型一般是针对于java中对象来说的,今天介绍一下java中的引用类型.java为引用类型专门定义了一个类叫做Reference.Reference是跟jav ...

  3. gps导航原理与应用_一文读懂角速度传感器(陀螺仪)的应用场景

    前文我们大致了解陀螺仪的来历,原理和种类,那么,它与我们的日常生活有怎样的关系呢? 陀螺仪器最早是用于航海导航,但随着科学技术的发展,它在航空和航天事业中也得到广泛的应用.陀螺仪器不仅可以作为指示仪表 ...

  4. python输入什么就输出什么_一文读懂Python的输入和输出

    本文介绍了Python的输入和输出,既然是Python代码,那么就一定有输出量,那么,Python是如何输出的呢? 输出 用print()在括号中加上字符串,就可以向屏幕上输出指定的文字.比如输出'h ...

  5. mysql 默认事务隔离级别_一文读懂MySQL的事务隔离级别及MVCC机制

    回顾前文: <一文学会MySQL的explain工具> <一文读懂MySQL的索引结构及查询优化> (同时再次强调,这几篇关于MySQL的探究都是基于5.7版本,相关总结与结论 ...

  6. stata 求输出相关系数矩阵命令_一文读懂结果输出命令大全(上)

    目录 描述统计量 help tabstat   //Stata 官方命令 描述统计量组间均值差异检验 help ttest help ttable2 help estout 相关分析命令 help p ...

  7. psm倾向得分匹配法举例_一文读懂倾向得分匹配法(PSM)举例及stata实现(一)

    原标题:一文读懂倾向得分匹配法(PSM)举例及stata实现(一) 一.倾向匹配得分应用之培训对工资的效应 政策背景:国家支持工作示范项目( National Supported Work,NSW ) ...

  8. 超融合和服务器关系_一文读懂超融合服务器

    原标题:一文读懂超融合服务器 1.什么叫超融合服务器 融合基础架构(Hyper-Converged Infrastructure)是一种集成了虚拟计算资源和存储设备的信息基础架构.在这样的架构环境中, ...

  9. python读取枚举_一文读懂Python 枚举

    enum是一组绑定到唯一常数值的符号名称,并且具备可迭代性和可比较性的特性.我们可以使用 enum 创建具有良好定义的标识符,而不是直接使用魔法字符串或整数,也便于开发工程师的代码维护. 创建枚举 我 ...

最新文章

  1. 启动root用户 银河麒麟_【高新区企业在行动】面向华为openEuler优麒麟UKUI正式发布 文件管理器从底层开始进行重构...
  2. 拯救乳房:乳腺癌AI诊断系统
  3. flutter offset_Flutter 仿微信界面聊天室 | 基于 (Flutter+Dart) 聊天实例
  4. mysql创建备份表脚本_MySQL 备份脚本(单库/分库分表)
  5. 无限循环python代码_python - 代码遇到意外的无限循环? - SO中文参考 - www.soinside.com...
  6. 视图可以修改表数据吗_Excel-数据透视表、数据透视图
  7. Ubuntu 18.04 下搭建 C/C++编译开发环境及GCC多版本切换
  8. VC6.0代码移植到VS2008运行时乱码问题解决
  9. C++ 原子操作 std::atomic<int>
  10. Java如何将html转换成word,java poi html 转换word
  11. Apache——阿帕奇简介
  12. 20190926-win10电脑声音麦克风设置里没有增强属性怎么办听语音
  13. 【电脑小白】提高ppt矢量图导出分辨率
  14. 深度学习#1.有监督学习和无监督学习
  15. 一定能用到的简单但实用的五种按钮样式(HTML+CSS步骤详解,含详细注释)
  16. php cookie 注入,LiveZilla 'setCookieValue()'函数PHP对象注入漏洞
  17. Linux挂载新硬盘【保姆级教程】
  18. 一维有限差分算法推导及MATLAB代码
  19. springboot连接mysql8.x: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents
  20. 解决Error: ENOENT: no such file or directory, scandir 安装node-sass报错

热门文章

  1. 可以让SQL针对某个错误信息号抓DUMP的命令组合
  2. 解决卸载时残留目标文件夹的问题
  3. Java事务处理总结【JDBC事务|JTA事务|容器事务】
  4. mysql 中文列索引_MYSQL多列索引
  5. antd table设置表格一个单元格的字体颜色_开源 UI 库中,唯一同时实现了大表格虚拟化和树表格的 Table 组件
  6. 在matlab中怎么录制音频_怎么录制淘宝页面中的视频?简单方法,轻松搞定
  7. 虚拟机拷贝数据到服务器,虚拟机文件拷到u盘上
  8. 点钞机语音怎么打开_微信语音怎么转发?原来方法这么简单,你还不知道吗
  9. *PAT_B_1014_Java(20分)
  10. CF思维联系–CodeForces - 222 C Reducing Fractions(数学+有技巧的枚举)