本文是对《智能风控实践指南》中模型策略分析方法这一小节中交换集分析(又叫换入换出分析)中的拒绝推断部分展开谈谈。这个方法正好之前一位做模型的朋友详细和我说过,这次在书中看到确实有产生一些共鸣。

交换集分析,是指利用新旧模型通过和拒绝的客户不一致的情况,通过分析这些不一致客户的坏账率和通过率以评价模型策略的效果。换出是新模型拒绝而旧模型通过的客群,换入是新模型通过而旧模型拒绝的客群。通常,我们希望新模型能换出更多的不良用户,换入更多的好客户,从而用好客户代替不良客户,以降低整体坏账率。

换入客群是新模型通过而旧模型拒绝的客群,这部分是之前被拒绝的客户,其好坏标签未知,需要采用拒绝推断的方式进行预估。其实不止模型策略分析时会采用换入换出分析,在做策略替换的时候也会用到。这里的拒绝推断不等同于模型部分的拒绝推断。因为模型部分的拒绝推断,是对模型拒绝的样本作推断,而这里是需要对旧模型拒绝、新模型通过的样本作推断,是从拒绝的客户中再挑一部分出来推断。

书中介绍的一种方法,是利用新模型各分数段在有表现样本上的坏账率来估算旧模型拒绝样本上的坏账率。

如上图,左侧是新模型在有表现样本上的坏账率排序,右边是旧模型拒绝的样本,用新模型打分之后的分布情况。黄色线以下B-C就是旧模型拒绝、新模型通过的样本,也就是要估算这部分客群的坏账。这里假设新旧模型在同分数段的坏账率是一样的,因此估出来的坏账就是:

(20*8.63%+10*9.44%+10*8.33%+...)/(20+10+10+...)=8.04%

这里的前提假设很重要,实际上新模型的效力应该比旧模型好,也就是同分端下通过部分的坏账率会更低。所以上面以新模型通过部分的坏账率来对老模型的拒绝样本做评估时,实际上存在了低估拒绝样本的坏账情况。实际业务中还需要对上面的结果做修正,比如按1.1、1.2的倍数去拍,再结合测试数据来修正。

如何修正,书里介绍了三种方法。主要的一个方法还是旧模型决策时留出一小部分测试样本不作拒绝,以大致预估这部分客群的坏账率。

1、全局测试推断

为了持续验证风控策略的有效性,有时会设置0.5%-1%的流量空跑策略,命中策略标签但是不拒绝。所以会有一小部分换入客群的表现,可以得到坏账率。

2、A/B测试组推断

若旧模型上线初期采用了A/B测试,会有一部分客户只打分不拒绝,也可以用来作为拒绝客户坏账率的预估值。本人理解,一和二其实是同一种方法,由于只有一小部分样本,因此估计会有偏,可以作为参考值。

3、线性拟合判断

适用于没有一、二的情况。一二这种情况,需要从漏放的样本再挑出新模型通过的样本。而第三种方法更像是模型决策时的拒绝推断,只能推断出拒绝样本的坏账,而无法再进一步对旧模型拒绝、新模型通过的样本进行推断。

以分箱序号作横轴,逾期率为纵轴,绘制坏账率拟合曲线。上图中第8、9箱旧模型拒绝的客户,而换入客群是新模型从这些里面挑出较好的客群,因此应该是对第8箱且靠近第7箱的这部分客群进行预估(前提是旧模型对拒绝客户仍有一定排序性)。

正常情况下,换入客群的坏账率要低于换出客群,根据经验前者一般是后者的60%-90%,会由于实际业务和模型效果的不同而略有差异。

【作者】:Labryant  
【原创公众号】:风控猎人  
【简介】:做一个有规划的长期主义者。
【转载说明】:转载请说明出处,谢谢合作!~

《智能风控实践指南》笔记(二)相关推荐

  1. css中怎么加入立体模型,CSS学习笔记二:css 画立体图形

    继上一次学了如何去运用css画平面图形,这一次学如何去画正方体,从2D向着3D学习,虽然有点满,但总是一个过程,一点一点积累,然后记录起来. Transfrom3D 在这一次中运用到了一下几种属性: ...

  2. qml学习笔记(二):可视化元素基类Item详解(上半场anchors等等)

    原博主博客地址:http://blog.csdn.net/qq21497936 本文章博客地址:http://blog.csdn.net/qq21497936/article/details/7851 ...

  3. oracle直查和call哪个更快,让oracle跑的更快1读书笔记二

    当前位置:我的异常网» 数据库 » <>读书笔记二 <>读书笔记二 www.myexceptions.net  网友分享于:2013-08-23  浏览:9次 <> ...

  4. 【Visual C++】游戏开发笔记二十七 Direct3D 11入门级知识介绍

    游戏开发笔记二十七 Direct3D 11入门级知识介绍 作者:毛星云    邮箱: happylifemxy@163.com    期待着与志同道合的朋友们相互交流 上一节里我们介绍了在迈入Dire ...

  5. [转载]dorado学习笔记(二)

    原文地址:dorado学习笔记(二)作者:傻掛 ·isFirst, isLast在什么情况下使用?在遍历dataset的时候会用到 ·dorado执行的顺序,首先由jsp发送请求,调用相关的ViewM ...

  6. PyTorch学习笔记(二)——回归

    PyTorch学习笔记(二)--回归 本文主要是用PyTorch来实现一个简单的回归任务. 编辑器:spyder 1.引入相应的包及生成伪数据 import torch import torch.nn ...

  7. tensorflow学习笔记二——建立一个简单的神经网络拟合二次函数

    tensorflow学习笔记二--建立一个简单的神经网络 2016-09-23 16:04 2973人阅读 评论(2) 收藏 举报  分类: tensorflow(4)  目录(?)[+] 本笔记目的 ...

  8. 趣谈网络协议笔记-二(第十九讲)

    趣谈网络协议笔记-二(第十九讲) HttpDNS:网络世界的地址簿也会指错路 自勉 勿谓言之不预也 -- 向为祖国牺牲的先烈致敬! 引用 dns缓存刷新时间是多久?dns本地缓存时间介绍 - 东大网管 ...

  9. 趣谈网络协议笔记-二(第十八讲)

    趣谈网络协议笔记-二(第十八讲) DNS协议:网络世界的地址簿 自勉 勿谓言之不预也 -- 向为祖国牺牲的先烈致敬! 正文 DNS用于域名解析,但也不仅仅是用于域名解析,不仅仅是将域名转换成IP. 在 ...

  10. 趣谈网络协议笔记-二(第十七讲)

    趣谈网络协议笔记-二(第十七讲) P2P协议:我下小电影,99%急死你 自勉 逃离舒适区! 正文 一. P2P协议 整个篇章讲的就是这两个协议之间的区别.P2P协议就是迅雷下载数据时所用的协议, 众所 ...

最新文章

  1. awk 6.0 — awk模式之二
  2. springboot过滤器排除掉一些url_理解这9大内置过滤器,才算是精通Shiro
  3. 使用Intel VTune性能分析器分析.NET模块运行时间
  4. POJ3757 01分数规划
  5. jvm性能调优 - 17案例实战_每日上亿请求量的电商系统 老轻代垃圾回收参数如何优化
  6. GPS 气压计高度测量
  7. 18春《c语言》在线作业3,18春福师《C++语言程序设计》在线作业二【参考答案】...
  8. 百度、头条、网易 Android 等社招面试题目
  9. C#医疗挂号系统试题
  10. New directions in automated traffic analysis论文解读
  11. 服务器性能发挥,浪潮服务器发挥性能优势,算力“焦虑”问题被解决
  12. Unity脚本运行时更新带来了什么?
  13. 【Java学习笔记之二十六】深入理解Java匿名内部类
  14. PHP连接mysql8.0出错“SQLSTATE[HY000] [2054] The server requested authentication method unknow........
  15. 先爆火再遇冷 元宇宙能否托起梦想?
  16. 一个简单的HTML网页 、个人主页网页设计(HTML+CSS)
  17. Excel功能逻辑结构图
  18. linux命令键盘快捷键,如何将Linux命令设置成键盘快捷键
  19. Ubuntu下deb包的安装方法
  20. the little schemer 笔记(9)

热门文章

  1. linux技能包【6】:内核升级
  2. 将Excel表数据拆分为多个Sheet表
  3. 计算机附件计算器的用法,(计算机附件中的计算器使用方法.doc
  4. 量化投资学习——一些牛比的量化投资公司
  5. Jmeter线程组间传递参数
  6. ELM——一种适用于经济学和大数据的机器学习方法
  7. 中国芯片设计行业发展机遇与投资潜力分析报告2022版
  8. 医院网络预约系统咨询预约登记系统医院OA网络登记系统源码
  9. commons-lang 简介、中文文档、中英对照文档 下载
  10. 如何查看git version多少(两种方法)