评分卡Bad rate单调性问题
评分卡Bad rate单调性问题
文章转载自https://blog.csdn.net/shenxiaoming77/article/details/79548807
Bad Rate:
坏样本率,指的是将特征进行分箱之后,每个bin下的样本所统计得到的坏样本率
bad rate 单调性与不同的特征场景:
在评分卡模型中,对于比较严格的评分模型,会要求连续性变量和有序性的变量在经过分箱后需要保证bad rate的单调性。
1. 连续性变量:
在严格的评分卡模型中,对于连续型变量就需要满足分箱后 所有的bin的 bad rate 要满足单调性,只有满足单调新的情况下,才能进行后续的WOE编码
2. 离散型变量:
离散化程度高,且无序的变量:
比如省份,职业等,我们会根据每个省份信息统计得到bad rate 数值对原始省份信息进行编码,这样就转化为了连续性变量,进行后续的分箱操作,对于经过bad rate编码后的特征数据,天然单调。
只有当分箱后的所有的bin的bad rate 呈现单调性,才可以进行下一步的WOE编码
离散化程度低,且无序的变量:
比如婚姻状况,只有四五个状态值,因此就不需要专门进行bad rate数值编码,只要求出每个离散值对应的bin的bad rate比例是否出现0或者1的情况,若出现说明正负样本的分布存在极端情况,需要对该bin与其他bin进行合并, 合并过程完了之后 就可以直接进行后续的WOE编码
有序的离散变量:
对于学历这种情况,存在着小学,初中,高中,本科,硕士,博士等几种情况,而且从业务角度来说 这些离散值是有序的, 因此我们在分箱的时候,必须保证bin之间的有序性,再根据bad rate 是否为0 或者1的情况 决定是否进行合并,最终将合并的结果进行WOE编码
因此bad rate单调性只在连续性数值变量和有序性离散变量分箱的过程中会考虑。
bad rate要求单调性的原因分析:
1. 逻辑回归模型本身不要求特征对目标变量的单调性。之所以要求分箱后单调,主要是从业务角度考虑,解释、使用起来方便一点。如果有某个(分箱后的)特征对目标变量不单调,会加剧模型解释型的复杂化
2. 对于像年龄这种特征,其对目标变量往往是一个U型或倒U型的分布,有些公司/部门/团队是允许变量的bad rate呈(倒)U型的。
---------------------
作者:Michael_Shentu
来源:CSDN
原文:https://blog.csdn.net/shenxiaoming77/article/details/79548807
版权声明:本文为博主原创文章,转载请附上博文链接!
评分卡Bad rate单调性问题相关推荐
- 评分卡分箱原则及单调性
1.分箱的原则 (1)最小分箱占比不低于5% (2)箱内不能全部是好客户 (3)连续箱单调 2.单调性 评分卡模型之特征工程中的BadRate单调与特征分箱之间的联系_Michael_Shentu的博 ...
- 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风
金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...
- 数据挖掘项目:银行信用评分卡建模分析(下篇)
以下是银行信用评分卡建模分析下篇的内容,包括特征工程,构建模型,模型评估,评分卡建立这四部分.其中如果有一些地方分析的不正确,希望大家多多指正,感谢! 上篇文章的链接:数据挖掘项目:银行信用评分卡建模 ...
- 金融风控-- >申请评分卡模型-- >特征工程(特征分箱,WOE编码)
这篇博文主要讲在申请评分卡模型中常用的一些特征工程方法,申请评分卡模型最多的还是logsitic模型. 先看数据,我们现在有三张表: 已加工成型的信息: Master表 idx:每一笔贷款的uniqu ...
- (信贷风控九)行为评分卡模型python实现
python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...
- 机器学习之金融信贷风控(二)申请评分卡中的数据预处理和特征衍生(未完待续)
申请评分卡中的数据预处理和特征衍生 模型处理的一般流程: 构建信用风险模型的特征 获取数据 链接:https://pan.baidu.com/s/1CsY11ArZ6YK3o1icghWj2w 提取码 ...
- (信贷风控七)申请评分卡模型Python实现(图文+代码实现)
(七)申请评分卡模型Python实现(图文+代码实现) 贷前准入环节流程图大致如下 为什么需要建立评分卡? 所有的模型一定是服务于业务的,那么业务上到底出现了什么问题,需要用到评分卡模型去解决呢?我们 ...
- (信贷风控九)行为评分卡模型python实现(详细代码+注释+讲解)
(九)行为评分卡模型python实现(详细代码+注释+讲解) 浅谈行为评分卡 我们知道行为评分卡只要用在信贷的贷中环节,贷中指的是贷款发放之后到期之前的时间段,其实行为评分卡和申请评分卡在实现上没有太 ...
- 金融申请评分卡(2)
金融申请评分卡的数据预处理和特征衍生 1.模型处理的一般流程 以上为模型的一般处理办法:在本次数据字段有: 字段 名称 member_id ID loan_amnt 申请额度 term 产品期限 in ...
最新文章
- 下载MySQL数据库
- AI大牛周明打造的轻量“孟子模型”开源!靠10亿参数冲上CLUE榜第三,可用于新闻分类、文案生成...
- 把女友升级为老婆的时候发生的BUG
- java基础----Java的格式化输出
- java里类包含对象对不对_Java类中的对象
- 在ASP.NET Core 2.2 中创建 Web API并结合Swagger
- 在浏览器地址栏输入url的后的过程
- 时间的几种格式以及它们之间的相互转换 (js)
- ApacheCN 翻译/校对/笔记整理活动进度公告 2019.10.11
- adb 查看浏览器内核
- [业务流程图]与[数据流程图]的比较
- Python AutoCAD 绘图
- (2020.11)OAI搭建eNB without S1 usrpx310 (usrp2944)
- 武汉男人一个月要赚多少钱,老婆才不用上班?心碎成渣……
- TypeScript配置、tsconfig.json配置文件,TypeScript使用详解
- 计算机绘图读后笔记3000字,0921计算机绘图0.doc
- JAVASCRIPT网页特效实例大全pdf
- 服务器上的环境迁移到另一台服务器上(采用克隆方式)
- HTML5教程实例-用Canvas制作线性渐变图形
- RTP/RTSP/RTCP 协议详解
热门文章
- 在被线上大量日志输出导致性能瓶颈毒打了很多次之后总结出的经验
- 计算机第一启动设置u盘启动,如何进入bios,设置优盘为电脑第一启动顺序
- python知道章节答案_智慧树知道Python数据分析与数据可视化答案,章节期末教程考试网课答案...
- 对Autorun.inf类U盘病毒的攻防
- 未明学院:12个惊艳的数据可视化经典案例
- dsb调制与解调的matlab,DSB调制与解调的MATLAB实现及.pptx
- win10没有hosts文件解决方法
- python画简便的图片-用python简单处理图片(5):图像直方图
- android 图片字体涂鸦,Android 编辑图片 Canvas画图,涂鸦,马赛克等(一)
- python爬虫爬取淘宝网页