KS和IV近期都有较多接触,为深入了解两个指标,个人分析了两者的异同:

总体比较

异同 KS IV
计算

两者都需要用到分组中好坏样本数量与总体好坏样本数量的比值。

KS计算需要的是好坏比率的累计值之差,

IV用到的是同一分组好坏比率比值的对数。

用法

两者都可以衡量变量的区分能力。

IV一般使用在变量的区分能力上。

KS一般用于模型的区分能力上。

分箱影响

两者的数值都收到分箱数量的影响

IV:具有分箱数量越多IV值越大的趋势。

KS:具有分箱数量越多IV值越大的趋势,但波动较大。

其他        

KS:在保证整体好坏比率不变情况,最佳KS前或后改变区间好坏比,不会影响KS值。

IV:在保证整体好坏比率不变情况下,最佳KS前或后改变区间好坏比,会影响IV值。

在保证整体好坏比率不变情况下,最佳分组前后都改变区间好坏比,会影响IV和KS值。

关于分箱数量对KS和IV的影响

分箱数量增加,KS和IV都有着增加的趋势,在前期比较明显,但是KS的波动较大,IV波动较小。

关于数值调整对KS和IV的影响

1.这是按照一定分组和好坏设定下的IV和KS值。

2.修改第1组和第2组的好坏比例,第1组坏样本减少10个,第2组增加10个。KS的值没有变化,但是IV的数值却有所增加。

3.修改第1组和第8组好坏分布,第1组坏样本减少10个,第8组增加10个。kS和IV都发生了变化。

KS和IV的区分比较相关推荐

  1. 分类模型评价指标KS与IV的比较

    KS与IV均是用来衡量分类模型准确度的方法,在平常的实验中,用这两种方法得出来的结果往往表现一致.但是,这种一致并不是绝对的,在分析场景时,两个指标发生互相偏离的结果还是存在的.这种偏离的存在主要来自 ...

  2. 个人金融借贷场景下,大数据风控的行业分析及应用分析

    一.大数据风控是什么? 大数据风控按照通俗的概念解析:通过运用大数据构建模型的方法对借款人进行风险控制和风险提示. 这句话涵盖大数据风控必要的4个要素: 1. 原材料:大数据 2. 实现方式:技术模型 ...

  3. 逻辑回归模型小结--基于评分模型

    逻辑回归模型 一.优点和不足 二.对变量的要求 当用逻辑回归模型来构建评分模型时,入模变量需要满足以下条件: 1.变量间不存在较强的线性相关性和多重共线性.可在单变量分析和多变量分析过程中予以解决,删 ...

  4. python机器学习-sklearn挖掘乳腺癌细胞(五)

    python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=10 ...

  5. 来FAL学风控|风控策略分析师的日常是怎样的?(案例+代码详解篇)

    风控策略分析师的日常是怎样的?(案例+代码详解篇) FAL金科应用研究院 做了5年的金融,3年的数据分析工作,从17年6月才真正接触代码,算不到熟练,但在不断的学习和工作实践中目前是可以解决任何问题的 ...

  6. 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告)

    ​ 心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发动机" 心脏是一个强壮的.不知疲倦. ...

  7. 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告,收藏)

    作者Toby,来自心脏病_冠心病智能预测模型 ​ 心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发 ...

  8. 用Greasymonkey实现密码自动填充

    为什么要实现密码自动填充? 密码多了记不住怎么办?每次录入太麻烦怎么办? 自己动手丰衣足食!根据应用场景不同,高度定制密码自动填充策略.在这里我将介绍如何使用Firefox的Greasemonkey插 ...

  9. python 分箱函数_Python子框,python,分箱

    为便于工作中计算KS和IV等值,编写一套可以沿用的代码,方便随时使用. #第一步,读取数据 import pandas as pd import numpy as np df=pd.read_exce ...

最新文章

  1. Java有哪些从业方向?分享这9个
  2. windows+caffe(三)——求取图片的均值
  3. Java与iOS对话:Java对象与Apple plist序列化
  4. java gzip delphi_delphi 利用indy解码Gzip的网页
  5. yolo v3 pytorch版本(转载)
  6. 数据库连接工具sqldbx、dbvisualizer使用笔记
  7. 谈ISO9000-3内容及其与CMM关系
  8. Linux安装MySQL5.7
  9. 游戏编程入门学习笔记17——网络篇——显示本机IP
  10. ICGC:国际肿瘤基因组协会简介
  11. 请编写一个程序,输入一个由小写字母和其他字符构成的序列字符串保存在tt中,统计“a”到“z”26个字母各自出现的次数,并依次保存在pp数组中,并输出pp数组内容。
  12. 快速查找MySQL数据库中表编码字符集,再修改为指定字符集
  13. mysql生成序列_mysql 自动生成编号函数
  14. a16z 合伙人:Web3 的新思维、新策略和新指标
  15. python图片修改过、有原图、怎么得到改动的地方_Python-根据照片信息获取用户详细信息(微信发原图或泄露位置信息)...
  16. DPDK入门(环境搭建以及小demo)
  17. [VOT15](2021CVPR)Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box Estimation
  18. 射频标签技术特征的分类
  19. java 对象构造函数_20.Java基础_对象的构造函数
  20. Elasticsearch Compound queries 学习总结

热门文章

  1. 混沌工程之ChaosBlade(一):建立混沌工程思想
  2. Matlab中的FCM算法代码及中文详解
  3. Agile敏捷开发管理Salesforce项目(第一篇)- 4大核心价值观+12条原则
  4. 点击扫描仪老提示操作无法完成(0x00000015 )设备未就绪
  5. 赶集网否认倒闭:是不是好公司,两三年后见分晓
  6. gss1_GSS简介:网格样式表
  7. MMA-清除所有变量的方法
  8. Java开发入门教程!java开发架构师职责
  9. SystemC time
  10. Linux网络与配置