根据自己做风控模型(A卡)的经验;汇总风控模型中的重要指标;

其中部分指标加上了个人见解;有不同意见欢迎讨论;

先来看混淆矩阵:

  • TP: 预测为正实际为正
  • FN: 预测为负实际为正
  • FP: 预测为正实际为负
  • TN: 预测为负实际为负

Accuracy: 准确率 (TP+TN) / (TP+FN+FP+TN) 判断正确的占所有样本的比例

Precision: 精准率 TP/(TP+FP) 判断为真的正例占所有预测为正的比例

Recall: 召回率 TP/(TP+FN) 判断为真的正例占所有真实为正的比例

ROC曲线

TPR = TP / TP+FN

FPR = FP / FP+TN

以FPR横坐标, TPR为纵坐标;所描绘出的曲线就叫ROC曲线

AUC(重要指标):ROC曲线下的面积;根据项目的实际情况,训练集一般要在0.8以上,测试集和OOT可以略低一点;

KS(重要指标):MAX(TPR - FPR) ;反应模型的区分能力,在风控场景下,一般要求KS值不能低于0.35,当然看项目实际情况(数据量, 数据范围, 坏样本占比等因素), 像大银行的话,数据量比较大,而且也能拿到比较全面的数据,包括外部数据,这时候就对KS的要求比较高,可能需要达到0.5左右;再提一下,正常情况下,尽可能的把训练集与OOT的KS值差距控制在0.05以内,这样才能保证模型足够稳定;

PSI(重要指标):模型的稳定性,一般在我做过的项目中都是要求模型在OOT上的psi小于0.05; 值越小代表模型越稳定;这个其实还是要看项目实际情况,但是psi肯定是要控制在0.1以内;超过0.1就不能用了;

计算方法如下: psi = sum((实际占比-预期占比)/ln(实际占比/预期占比))

排序性:另外还有模型训练完之后,一般会根据他的违约概率给用户一个评分;然后对这个分数向量进行等频分箱之后,查看模型从低分区间到高分区间坏样本所占坏是否递减:

如图:

用以确定模型排序性;

题外

OOT(OUT OF TIME)时间外数据,训练风控模型都是需要定表现期,观察期的;使用表现期内的数据进行建模;拿OOT只是为了验证模型是否好坏,以及是否稳定;

关于不用测试集:

之前有跟同事讨论过,建模的时候需要用到训练集、测试集、OOT;那么能不能把测试集去掉,直接使用OOT来进行验证;

结论是不行,原因如下:为了防止训练出来的模型过拟合,我们在训练完之后会用测试集的数据进行验证,然后可以根据在测试集上面的表现,对模型进行优化调参;而OOT只是单纯的验证模型在未来的时间内的表现,如果利用OOT来进行调参的话,那么就会涉及到数据泄露的问题;

训练集测试集划分:

根据小弟的项目经验,发现测试集、训练集二八分训练出来的模型往往比三七分效果要好;

模型ks_风控建模 模型指标篇相关推荐

  1. 风控建模七:拒绝推断

    风控建模七:拒绝推断 1.为什么要做拒绝推断 解决建模时的样本偏差问题 方便策略下探时风险评估 2.拒绝推断的几种方法 开放部分测试集 借助外部数据 简单数据扩充 打包法 模糊扩增法 聚类法 3.如何 ...

  2. python风控建模实战(分类器模型+回归模型)

    在全球数字经济时代,有一种金融优势,那就是基于消费者大数据的纯信用! 我们不妨称之为数据信用,它是一种面向未来的财产权,它是数字货币背后核心的抵押资产,它决定了数字货币时代信用创造的方向.速度和规模. ...

  3. 风控建模(七):催收评分卡的流程—上(所有评分模型与机器学习模型同样适用)

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   说了那么久的建模,今天应该跟大家分享一下实际建模的流程步骤了.   整套建模代码我分别用sas跟pyt ...

  4. tvpvar模型的建模步骤_风控建模六部曲

    这期开始咱们聊聊风控建模的事情.在借贷这个场景下,建立风控模型的目的大都是为了预测某个客户未来逾期的概率.主要的逻辑就是根据过去预测未来,逾期客户的行为是相似的.先收集历史上已经逾期到一定阶段的客户, ...

  5. 【模型开发】风控评分模型开发流程

    [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...

  6. Lesson 5.分类模型决策边界与模型评估指标

    Lesson 5.分类模型决策边界与模型评估指标(上) 在逻辑回归的算法基础内容结束之后,我们还需要补充一些关于分类模型的基础知识,包括观察分类模型判别性能的决策边界基本的概念与实现方法,同时也包括对 ...

  7. 风控评分模型全流程的开发及应用

    风控评分模型全流程的开发及应用   信用评分卡的应用场景有申请评分卡(A卡).行为评分卡(B卡).催收评分卡(C卡)和反欺诈评分卡(F卡).   用户申请信用贷款的流程依次是基本信息核查.强规则校验. ...

  8. 风控业务-模型稳定性评价指标PSI

    在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线.如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性, ...

  9. 计量经济学建模_浅谈统计学模型(兼计量经济学模型)

    计量经济学模型是从统计学模型中衍生出来的,故将它们一并放在此处进行说明. 实际上,很多人在很久之前就督促我写一篇统计学和计量经济学模型的文章,但我太懒惰,一直拖到现在,也是十分汗颜. 先讲一些统计学上 ...

最新文章

  1. jmeter测试java接口测试_简单易学的测试攻略:JMeter测试Java请求示例
  2. 给VIM安装YouCompleteMe插件
  3. 【Android 高性能音频】Oboe 音频流打开后 耳机 / 音箱 插拔事件处理 ( 设置 Oboe 音频设备 ID | setDeviceId 函数原型 | AudioStream 音频流 )
  4. 计算机验证型数学实验报告,精心设计论文,关于精心设计数学实验培养学生数学能力相关参考文献资料-免费论文范文...
  5. dos系统重启计算机名,dos系统重启的命令是是
  6. 算法设计 分治, 归并排序, 快速排序
  7. 前端如何实现网络速度测试功能_如何通过fiddler的断点功能,来实现不同场景的测试...
  8. JAVA责任链设计模式
  9. 浅谈JavaScript函数重载
  10. 西门子 1200PLC全额补贴课程
  11. 认识影片版本(CAM、TS、TC、DVD、HD、BD、TVRIP等)
  12. 模拟CMOS集成电路设计 学习笔记(三)
  13. Android 解决华为手机图片底色变绿问题
  14. 树莓派Zero 2 W的自带WiFi性能测试,仅40Mbps左右
  15. 就业季必看的职业规划
  16. Python练习task2:条件与循环
  17. 简单方法解决火狐浏览器主页被篡改/挟持,主页变成垃圾网站的问题
  18. Go会否给Java带来冲击?
  19. CGLib中类Enhancer介绍
  20. 明伟LRS-350-24方案,送BOM表,原理图、PCB

热门文章

  1. android系统一直显示通知栏_Android8以上 显示通知栏简单实现
  2. java服务器端socket,java 服务器端socket
  3. css设置图标居左_学会这几种方法css居中很简单
  4. layui第三方插件引入_插件分享 | 可以进行web爬虫的Xray插件(文章末尾有福利)...
  5. java函数改变参数值_Java函数参数值正在改变
  6. 第五章:Redis持久化-AOF持久化
  7. HTTPS那些事(三)攻击实例与防御(转载)
  8. CentOS Yum 命令详解
  9. JS魔法堂之实战:纯前端的图片预览
  10. YII 框架使用之——创建应用