KS和IV的区分比较
KS和IV近期都有较多接触,为深入了解两个指标,个人分析了两者的异同:
总体比较
异同 | KS | IV |
计算 |
两者都需要用到分组中好坏样本数量与总体好坏样本数量的比值。 KS计算需要的是好坏比率的累计值之差, IV用到的是同一分组好坏比率比值的对数。 |
|
用法 |
两者都可以衡量变量的区分能力。 IV一般使用在变量的区分能力上。 KS一般用于模型的区分能力上。 |
|
分箱影响 |
两者的数值都收到分箱数量的影响 IV:具有分箱数量越多IV值越大的趋势。 KS:具有分箱数量越多IV值越大的趋势,但波动较大。 |
|
其他 |
KS:在保证整体好坏比率不变情况,最佳KS前或后改变区间好坏比,不会影响KS值。 IV:在保证整体好坏比率不变情况下,最佳KS前或后改变区间好坏比,会影响IV值。 在保证整体好坏比率不变情况下,最佳分组前后都改变区间好坏比,会影响IV和KS值。 |
关于分箱数量对KS和IV的影响
分箱数量增加,KS和IV都有着增加的趋势,在前期比较明显,但是KS的波动较大,IV波动较小。
关于数值调整对KS和IV的影响
1.这是按照一定分组和好坏设定下的IV和KS值。
2.修改第1组和第2组的好坏比例,第1组坏样本减少10个,第2组增加10个。KS的值没有变化,但是IV的数值却有所增加。
3.修改第1组和第8组好坏分布,第1组坏样本减少10个,第8组增加10个。kS和IV都发生了变化。
KS和IV的区分比较相关推荐
- 分类模型评价指标KS与IV的比较
KS与IV均是用来衡量分类模型准确度的方法,在平常的实验中,用这两种方法得出来的结果往往表现一致.但是,这种一致并不是绝对的,在分析场景时,两个指标发生互相偏离的结果还是存在的.这种偏离的存在主要来自 ...
- 个人金融借贷场景下,大数据风控的行业分析及应用分析
一.大数据风控是什么? 大数据风控按照通俗的概念解析:通过运用大数据构建模型的方法对借款人进行风险控制和风险提示. 这句话涵盖大数据风控必要的4个要素: 1. 原材料:大数据 2. 实现方式:技术模型 ...
- 逻辑回归模型小结--基于评分模型
逻辑回归模型 一.优点和不足 二.对变量的要求 当用逻辑回归模型来构建评分模型时,入模变量需要满足以下条件: 1.变量间不存在较强的线性相关性和多重共线性.可在单变量分析和多变量分析过程中予以解决,删 ...
- python机器学习-sklearn挖掘乳腺癌细胞(五)
python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=10 ...
- 来FAL学风控|风控策略分析师的日常是怎样的?(案例+代码详解篇)
风控策略分析师的日常是怎样的?(案例+代码详解篇) FAL金科应用研究院 做了5年的金融,3年的数据分析工作,从17年6月才真正接触代码,算不到熟练,但在不断的学习和工作实践中目前是可以解决任何问题的 ...
- 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告)
心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发动机" 心脏是一个强壮的.不知疲倦. ...
- 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告,收藏)
作者Toby,来自心脏病_冠心病智能预测模型 心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发 ...
- 用Greasymonkey实现密码自动填充
为什么要实现密码自动填充? 密码多了记不住怎么办?每次录入太麻烦怎么办? 自己动手丰衣足食!根据应用场景不同,高度定制密码自动填充策略.在这里我将介绍如何使用Firefox的Greasemonkey插 ...
- python 分箱函数_Python子框,python,分箱
为便于工作中计算KS和IV等值,编写一套可以沿用的代码,方便随时使用. #第一步,读取数据 import pandas as pd import numpy as np df=pd.read_exce ...
最新文章
- Java有哪些从业方向?分享这9个
- windows+caffe(三)——求取图片的均值
- Java与iOS对话:Java对象与Apple plist序列化
- java gzip delphi_delphi 利用indy解码Gzip的网页
- yolo v3 pytorch版本(转载)
- 数据库连接工具sqldbx、dbvisualizer使用笔记
- 谈ISO9000-3内容及其与CMM关系
- Linux安装MySQL5.7
- 游戏编程入门学习笔记17——网络篇——显示本机IP
- ICGC:国际肿瘤基因组协会简介
- 请编写一个程序,输入一个由小写字母和其他字符构成的序列字符串保存在tt中,统计“a”到“z”26个字母各自出现的次数,并依次保存在pp数组中,并输出pp数组内容。
- 快速查找MySQL数据库中表编码字符集,再修改为指定字符集
- mysql生成序列_mysql 自动生成编号函数
- a16z 合伙人:Web3 的新思维、新策略和新指标
- python图片修改过、有原图、怎么得到改动的地方_Python-根据照片信息获取用户详细信息(微信发原图或泄露位置信息)...
- DPDK入门(环境搭建以及小demo)
- [VOT15](2021CVPR)Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box Estimation
- 射频标签技术特征的分类
- java 对象构造函数_20.Java基础_对象的构造函数
- Elasticsearch Compound queries 学习总结