格子大法与换入换出分析
做风控策略的时候,大家应该都听说过这两个词。格子法就是用画列联表的方式来进行交叉变量分析,一般用于两个评分之间的交叉;换入换出又叫Swap Set分析,用于对比新旧策略的差异,详细介绍可以参看求是汪知乎:《利用Swap Set分析风控模型更替的影响》。
本文是我前几天在番茄的一份培训课件中看到的案例,讲解的是用格子法对白名单筛选策略进行调整,并通过换入换出来分析策略调整的影响。
目录
一、格子大法
二、换入换出
三、其它
一、格子大法
首先,通过一些硬规则和软规则筛选出白名单客群,并剔除近60天人行查询客群,选定B卡分>640分为cutoff,得到老白名单。现需要加入一个大额现金贷准入评分,来替换软规则,通过换出高风险客群换入低风险客群的方法来达到增加白名单范围的目的。
如上图,图中第一个表格是分数交叉后的个数比例情况,第二个表格是分数交叉后的风险情况。以B卡分大于640分对应的边际风险1.9%进行换入换出。图中黄色部分为新白名单换入的部分,灰色部分为新白名单换出的部分。因此新白名单应为白色区域+黄色区域。新的策略如下:
(Bscore>660&大额现金分>620)且(Bscore介于640和659之间&大额现金分>640)且(Bscore介于620和639之间&大额现金分>680)且(Bscore介于600和619之间&大额现金分>700)且(Bscore介于580和599之间&大额现金分>720)
在实际操作过程中,有一部分客户会被Bscore这一节点之前的硬规则拒绝,所以会导致没有Bscore分,这是上面没有考虑到的。这里选的1.9%作为风险容忍线,实际情况中这个取值可以根据公司的风险偏好来设定,考虑到评分缺失的客户,阈值可以适当更低一点,留出一些风险缓释垫以确保策略效果和线上效果更为接近。
二、换入换出
根据上图中的新旧白名单切分后的结果,统计相应的客户数量、风险表现,对比新旧白名单的效果(实际与上图有些不符,上图换出3%的客户换入1%的客户)。
旧白名单:800万客户,不良率0.72%;
新白名单:900万客户,不良率0.56%。
新白名单较于旧白名单,在扩充白名单客户数量的同时,降低了风险,因此新白名单效果更好。
实际工作中,对于老模型拒绝的客户,往往并不知道其风险表现,也就是上图中cutoff下面的部分。这部分可以通过拒绝推断或者只打分不决策的方式来获取样本的表现,以便评估模型在整体客群上的效果。拒绝推断相关的介绍可以参考求是汪的另一篇文章:《风控建模中的样本偏差与拒绝推断》
三、其它
这部分是我在实际工作中遇到的一个问题,当时和几位同行朋友也进行了交流,有一些收获,写出来和各位交流探讨一下。
模型上线后(A分数),对每月的线上样本进行监控,看KS指标的变化情况。另外,由于新接了一个外部数据分(B分数),还没有用于作策略,因此就把这个分数在线上样本上的ks也看了下,结果发现外部数据分每个月的ks都比自有模型好。这种情况比较少见,于是就有一个疑问:是否这个外部数据分就比自建模型的效果好?
一般这种情况不多见的原因是,自建模型是融合了外部数据、用户数据,选用历史进件样本进行建模,而外部数据可能是基于某一类数据进行建模,所以效果上应该是自建模型的效果更好。线上样本A分数的ks比B低,说明在线上样本上B的区分度更好,下图中红色虚线右半部分。
当然,在线上样本上区分度好,并不能说明在全量样本上区分度也更好。如果反过来,用B分做决策,A分空跑,那么如果B分换出(A分换入)的客户比换入(A分换出)的客户风险表现低,那么用B作主模型决策的表现会比原来差。因此有两种做法:
1.进行拒绝推断。预估全量样本上两个分数的表现。
2.两个分数做交叉选择。
拒绝推断,除了常用的那些方法之外,实际操作中还有一个方法:把自有模型拒绝外部分通过的样本按照一定系数分给外部分的各个等级,预估用外部分做决策时的风险情况。
上图分别是同一批样本上,自有模型和外部数据分对应的各评分段的风险情况,可以看到自有模型的ks比外部分低,然后模拟用外部数据分作为主模型,通过率及坏账的变化。
in_in:自有模型和外部分都通过
swap_in:外部分通过,自有模型拒绝
上图中黄色的一列,为坏账预估系数,需要结合测试数据和经验来拍一个值。然后就可以得到外部数据分通过样本上做cutoff对应的通过率和坏账。但是这里是只对外部分通过、自有模型拒绝的样本进行了推断,也就是基于外部分通过的样本进行模拟,外部分拒绝的样本其实表现仍然未知。
所以如果出现线上样本的外部数据分区分度更好的情况下,用外部数据分来作主模型的话会是什么效果,这是值得深入思考的一个问题。在此抛转引玉,各位可以思考一下。
【作者】:Labryant
【原创公众号】:风控猎人
【简介】:做一个有规划的长期主义者。
【转载说明】:转载请说明出处,谢谢合作!~
格子大法与换入换出分析相关推荐
- 【OS笔记 11】三级调度模型——作业调度、进程调度、中级调度(换入/换出)
在多道批处理系统中,一个作业从提交到获得CPU执行,直到作业运行完毕,可能需要经历多级处理机调度. 一.处理机调度的层次 1. 高级调度(作业调度 / 长程调度) 调度对象: 作业 功能: 根据某种算 ...
- 4、操作系统内存管理——页面的换入换出
注:参考哈工大李治军老师公开课. 对于用户而言,用户看到的是一个整体的内存入4G,而且用户可以随便访问4G内存空间的任意位置:但是对于真实的物理内存可能只有1G大小,当用户访问内存时,如果内存里面有需 ...
- linux 进程 内存 换入换出,linux - 在从bash进程替换完成输入后,如何继续发送到stdin? - 堆栈内存溢出...
这听起来像是期待的工作. 特定 #include int main() { char *cp = NULL; size_t n = 0; while(getline(&cp, &n, ...
- 操作系统内存换入-请求调页---14
操作系统内存换入-请求调页---14 引言 段.页同时存在 用户眼里的内存! 用换入.换出实现"大内存" 请求调页 一个实际系统的请求调页 处理中断page fault do_no ...
- TheDAO悲剧重演,SpankChain重入漏洞分析
前言 在10月8日,区块链项目方SpankChain在medium上发表了一篇文章, 并表明其受到了攻击,导致损失了160多个ETH和一些Token,这次攻击事件,相对来说损失金额是较小的,约4万美元 ...
- 用python怎么赚钱-Python躺赚大法!月入1W外快不在话下!!
原标题:Python躺赚大法!月入1W外快不在话下!! 今天达妹就开门见山的说说赚钱的事儿 在这个人人都想暴富的时代,如何有效率的赚钱显得十分重要了! 而现在人的终极目标是躺赚无疑了 躺赚 躺赚 顾名 ...
- Android 换肤原理分析
当了解了一些知识,应该用文字记录它,再抽个时间再看它,永远记住它 Android 换肤的理论知识和文章已经很多了,这里记录一下自己对这块的理解.本文效果如下: 工程:一键换肤的快乐 一.换肤的由来 首 ...
- 高数——定积分计算大法之换元法
定积分的换元法,计算方法与不定积分类似,但是因为定积分是有积分限的,积分变量变化以后积分限也是要相应改变的,所以大家一定要记住: 换元必换限,不换元则不换限! 使用换元法,要记住"三换&qu ...
- 业余学Python是如何挣钱的?Python躺赚大法!月入1W外快不在话下!
学习Python如何赚钱呢?能躺赚吗? 虽然没有躺赚那么夸张,但是!!随时随地都是可以赚钱的!!!(对,说的就是不用去公司上班的那种) 具体怎么赚? 一起来看: 以我差不多四年的Python 使用经验 ...
最新文章
- SURF算法与SIFT算法的性能比较——图像特征点检测与提取算法分析
- 王贻芳院士:我们的科技管理过度强调竞争,缺乏稳定支持
- freemarker第三篇
- 静态网页与动态网页区别
- 中导入pygame_Pygame(二)--线条的艺术
- Lucene.net站内搜索—5、搜索引擎第一版实现
- 电脑表格日期怎么修改原有日期_为何电脑系统时间常出错或无法修改?怎么解决?...
- c include 多层目录_python+C、C++混合编程的应用
- xpath安装与下载
- 初创公司 经营_LibreCorps指导人道主义初创公司如何运行开源方式
- Win10怎么打开或关闭自动维护功能
- Leetcode 48 Rotate Image
- 无法在此iPhone激活面容ID怎么办?
- 有他人的梦想,才会让人觉得更有意义!
- 阿里云盘进场,安全星球何以成为云盘界的一股清流
- python的下载安装以及两种打开方式
- Nginx 服务器配置域名证书
- 华为鸿蒙os的内核是Linux,谈华为鸿蒙内核和操作系统
- Spark物理计划和CBO和AQE
- 朗强科技HDMI网线延长器
热门文章
- 如何备考上海市高等学校计算机一级,如何备考全国计算机一级等级考试
- php中使用json做api,JSONAPI在PHP中的应用
- php什么框架性能高,主流PHP框架性能比较
- C++ new和delete(C++动态分配和释放内存)
- 82. Leetcode 23. 合并K个升序链表 (排序)
- spark读取hbase数据
- 有负权重边的图可以有拉普拉斯矩阵吗?
- (经典)Hibernate多对一关系映射(四)
- python怎么把程序封装成函数_PYTHON中如何把固定格式代码,封装成一个函数?
- 抓取豆瓣上的《长津湖》的热评,我发现了这些