WOE(Weight of Evidence)证据权重
WOE 全拼 Weight of Evidence,即证据权重,用于风险评估、授信评分卡等。
i表示第i分段。也可转换后得到.
从上公式可知,WOE 实际展现的是 “该分段下的好用户数和坏用户数的比值” 与 “好用户总数与坏用户总数的比值” 的差异。WOE 越大,差异越大,好用户的可能性越大。
同时 WOE 变换常应用于特征工程,当我们对某些特征变量进行等频或等距等分箱后发现,发现每级分段 WOE 不满足单调性时(大部分为离散型变量),进行 WOE 变换,即采用对应每分段的 WOE 值替换掉特征原始值,此时该特征的分布将会是单调的。
通过 WOE 变换,同时保持 WOE 曲线具备单调性,带来的好处在于特征值与 y 值具备正(负)相关性,例如我们定义坏用户为 1 时,特征值越大,预测为坏人的概率将越高。
另外,银行的笔试考试中,有出现该指标。
参考:https://www.jianshu.com/p/103b4d70fbfd
WOE(Weight of Evidence)证据权重相关推荐
- WOE(weight of evidence, 证据权重)
1. WOE(weight of evidence, 证据权重) WOE是一种衡量正常样本( Good)和违约样本( Bad)分布的差异方法 WOE=ln(Distr Good/Distr Bad) ...
- python最优分箱计算iv值_GitHub - zhaoxingfeng/WOE: Weight of Evidence,基于iv值最大思想求最优分箱...
WOE WOE Transformation常用于信用风险评分卡(Credit Risk Scorecard)模型中,采用分箱的方式对原始特征进行非线性映射.常见的分箱方法有等宽分箱.等频分箱.最优分 ...
- R语言基于信息价值IV(Information Value)和证据权重WOE(Weights of Evidence)进行特征筛选(feature selection)
R语言基于信息价值IV(Information Value)和证据权重WOE(Weights of Evidence)进行特征筛选(feature selection) 对一个学习任务来说,给定属性集 ...
- woe分析_WOE(证据权重)为何这样计算?
更多大数据分析.建模等内容请关注公众号<bigdatamodeling> 先简单回顾一下WOE的含义.假设x是类别变量或分箱处理过的连续变量,含R个类别或分段,取值为{C1, ..., C ...
- 评分卡模型、WOE(Weight of Evidence)和IV(Information Value)
WOE(Weight of Evidence) IV(Information Value) 在机器学习的二分类问题中,IV值(Information Value)主要用来对输入变量进行编码和预测能力评 ...
- 证据权重 (WOE) 与信息价值 (IV)
在本文中,我们将介绍证据权重和信息价值的概念,以及如何在预测建模过程中使用它们,以及如何使用 SAS.R 和 Python 计算它们的详细信息. 逻辑回归模型是解决二分类问题最常用的统计技术之一.这是 ...
- Stochastic Weight Averaging (SWA) 随机权重平均
文章目录 相关链接 基础 思路 主要内容 概括 SWA图示 SWA算法 LR The Algorithm Batch normalization 在PyTorch中使用swa 最佳实践 Demo 最近 ...
- 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风
金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...
- WOE,IV ,PSI,单变量PSI,KS值,capture rate
1.WOE Weight of Evidence,证据权重. 要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(离散化,分箱等).分组后,对于第i组,这个组中响应客户站样本中所有响应客户的比 ...
最新文章
- 醉没醉,带上智能手机走两步就知道
- 24 个你应该了解的 PHP 库
- hadoop的实现-序
- java facade dao_java – 在Facade模式中放置用于创建namedQuer...
- 工作流实战_10_flowable 流程实例的删除
- 怎么管理Websphere应用服务器?
- MongoDB CRUD命令操作
- 强连通分量[trajan]
- ARMv8的OP-TEE源代码的获取和编译
- spark的数三角形算法_腾讯开源全栈机器学习平台 Angel 3.0,支持三大类型图计算算法...
- ie浏览器中图片被拉长
- 15、Kanzi插件——通过Kanzi Engine插件创建自定义消息类型+代码解析
- EXCEL函数篇01 按间隔符提取数据,实现分列功能
- 使用Excel获取数据
- 从初学者的角度看Solr概述
- 运放的信号叠加电路与求差电路
- 【OpenCV】01-OpenCV的数据类型
- 同感,在另外一个小华为待过,也差不多是这样的
- VMware虚拟机的安装、创建及CentOS 7的安装
- google支持本地ajax,360chrome,google chrome浏览器使用jquery.ajax加载本地html文件