模型ks_风控建模 模型指标篇
根据自己做风控模型(A卡)的经验;汇总风控模型中的重要指标;
其中部分指标加上了个人见解;有不同意见欢迎讨论;
先来看混淆矩阵:
- TP: 预测为正实际为正
- FN: 预测为负实际为正
- FP: 预测为正实际为负
- TN: 预测为负实际为负
Accuracy: 准确率 (TP+TN) / (TP+FN+FP+TN) 判断正确的占所有样本的比例
Precision: 精准率 TP/(TP+FP) 判断为真的正例占所有预测为正的比例
Recall: 召回率 TP/(TP+FN) 判断为真的正例占所有真实为正的比例
ROC曲线:
TPR = TP / TP+FN
FPR = FP / FP+TN
以FPR横坐标, TPR为纵坐标;所描绘出的曲线就叫ROC曲线
AUC(重要指标):ROC曲线下的面积;根据项目的实际情况,训练集一般要在0.8以上,测试集和OOT可以略低一点;
KS(重要指标):MAX(TPR - FPR) ;反应模型的区分能力,在风控场景下,一般要求KS值不能低于0.35,当然看项目实际情况(数据量, 数据范围, 坏样本占比等因素), 像大银行的话,数据量比较大,而且也能拿到比较全面的数据,包括外部数据,这时候就对KS的要求比较高,可能需要达到0.5左右;再提一下,正常情况下,尽可能的把训练集与OOT的KS值差距控制在0.05以内,这样才能保证模型足够稳定;
PSI(重要指标):模型的稳定性,一般在我做过的项目中都是要求模型在OOT上的psi小于0.05; 值越小代表模型越稳定;这个其实还是要看项目实际情况,但是psi肯定是要控制在0.1以内;超过0.1就不能用了;
计算方法如下: psi = sum((实际占比-预期占比)/ln(实际占比/预期占比))
排序性:另外还有模型训练完之后,一般会根据他的违约概率给用户一个评分;然后对这个分数向量进行等频分箱之后,查看模型从低分区间到高分区间坏样本所占坏是否递减:
如图:
用以确定模型排序性;
题外:
OOT(OUT OF TIME)时间外数据,训练风控模型都是需要定表现期,观察期的;使用表现期内的数据进行建模;拿OOT只是为了验证模型是否好坏,以及是否稳定;
关于不用测试集:
之前有跟同事讨论过,建模的时候需要用到训练集、测试集、OOT;那么能不能把测试集去掉,直接使用OOT来进行验证;
结论是不行,原因如下:为了防止训练出来的模型过拟合,我们在训练完之后会用测试集的数据进行验证,然后可以根据在测试集上面的表现,对模型进行优化调参;而OOT只是单纯的验证模型在未来的时间内的表现,如果利用OOT来进行调参的话,那么就会涉及到数据泄露的问题;
训练集测试集划分:
根据小弟的项目经验,发现测试集、训练集二八分训练出来的模型往往比三七分效果要好;
模型ks_风控建模 模型指标篇相关推荐
- 风控建模七:拒绝推断
风控建模七:拒绝推断 1.为什么要做拒绝推断 解决建模时的样本偏差问题 方便策略下探时风险评估 2.拒绝推断的几种方法 开放部分测试集 借助外部数据 简单数据扩充 打包法 模糊扩增法 聚类法 3.如何 ...
- python风控建模实战(分类器模型+回归模型)
在全球数字经济时代,有一种金融优势,那就是基于消费者大数据的纯信用! 我们不妨称之为数据信用,它是一种面向未来的财产权,它是数字货币背后核心的抵押资产,它决定了数字货币时代信用创造的方向.速度和规模. ...
- 风控建模(七):催收评分卡的流程—上(所有评分模型与机器学习模型同样适用)
关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货. 说了那么久的建模,今天应该跟大家分享一下实际建模的流程步骤了. 整套建模代码我分别用sas跟pyt ...
- tvpvar模型的建模步骤_风控建模六部曲
这期开始咱们聊聊风控建模的事情.在借贷这个场景下,建立风控模型的目的大都是为了预测某个客户未来逾期的概率.主要的逻辑就是根据过去预测未来,逾期客户的行为是相似的.先收集历史上已经逾期到一定阶段的客户, ...
- 【模型开发】风控评分模型开发流程
[博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...
- Lesson 5.分类模型决策边界与模型评估指标
Lesson 5.分类模型决策边界与模型评估指标(上) 在逻辑回归的算法基础内容结束之后,我们还需要补充一些关于分类模型的基础知识,包括观察分类模型判别性能的决策边界基本的概念与实现方法,同时也包括对 ...
- 风控评分模型全流程的开发及应用
风控评分模型全流程的开发及应用 信用评分卡的应用场景有申请评分卡(A卡).行为评分卡(B卡).催收评分卡(C卡)和反欺诈评分卡(F卡). 用户申请信用贷款的流程依次是基本信息核查.强规则校验. ...
- 风控业务-模型稳定性评价指标PSI
在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线.如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性, ...
- 计量经济学建模_浅谈统计学模型(兼计量经济学模型)
计量经济学模型是从统计学模型中衍生出来的,故将它们一并放在此处进行说明. 实际上,很多人在很久之前就督促我写一篇统计学和计量经济学模型的文章,但我太懒惰,一直拖到现在,也是十分汗颜. 先讲一些统计学上 ...
最新文章
- jmeter测试java接口测试_简单易学的测试攻略:JMeter测试Java请求示例
- 给VIM安装YouCompleteMe插件
- 【Android 高性能音频】Oboe 音频流打开后 耳机 / 音箱 插拔事件处理 ( 设置 Oboe 音频设备 ID | setDeviceId 函数原型 | AudioStream 音频流 )
- 计算机验证型数学实验报告,精心设计论文,关于精心设计数学实验培养学生数学能力相关参考文献资料-免费论文范文...
- dos系统重启计算机名,dos系统重启的命令是是
- 算法设计 分治, 归并排序, 快速排序
- 前端如何实现网络速度测试功能_如何通过fiddler的断点功能,来实现不同场景的测试...
- JAVA责任链设计模式
- 浅谈JavaScript函数重载
- 西门子 1200PLC全额补贴课程
- 认识影片版本(CAM、TS、TC、DVD、HD、BD、TVRIP等)
- 模拟CMOS集成电路设计 学习笔记(三)
- Android 解决华为手机图片底色变绿问题
- 树莓派Zero 2 W的自带WiFi性能测试,仅40Mbps左右
- 就业季必看的职业规划
- Python练习task2:条件与循环
- 简单方法解决火狐浏览器主页被篡改/挟持,主页变成垃圾网站的问题
- Go会否给Java带来冲击?
- CGLib中类Enhancer介绍
- 明伟LRS-350-24方案,送BOM表,原理图、PCB
热门文章
- android系统一直显示通知栏_Android8以上 显示通知栏简单实现
- java服务器端socket,java 服务器端socket
- css设置图标居左_学会这几种方法css居中很简单
- layui第三方插件引入_插件分享 | 可以进行web爬虫的Xray插件(文章末尾有福利)...
- java函数改变参数值_Java函数参数值正在改变
- 第五章:Redis持久化-AOF持久化
- HTTPS那些事(三)攻击实例与防御(转载)
- CentOS Yum 命令详解
- JS魔法堂之实战:纯前端的图片预览
- YII 框架使用之——创建应用