WOE 全拼 Weight of Evidence,即证据权重,用于风险评估、授信评分卡等。

i表示第i分段。也可转换后得到.

从上公式可知,WOE 实际展现的是 “该分段下的好用户数和坏用户数的比值” 与 “好用户总数与坏用户总数的比值” 的差异。WOE 越大,差异越大,好用户的可能性越大。

同时 WOE 变换常应用于特征工程,当我们对某些特征变量进行等频或等距等分箱后发现,发现每级分段 WOE 不满足单调性时(大部分为离散型变量),进行 WOE 变换,即采用对应每分段的 WOE 值替换掉特征原始值,此时该特征的分布将会是单调的。

通过 WOE 变换,同时保持 WOE 曲线具备单调性,带来的好处在于特征值与 y 值具备正(负)相关性,例如我们定义坏用户为 1 时,特征值越大,预测为坏人的概率将越高。

另外,银行的笔试考试中,有出现该指标。

参考:https://www.jianshu.com/p/103b4d70fbfd

WOE(Weight of Evidence)证据权重相关推荐

  1. WOE(weight of evidence, 证据权重)

    1. WOE(weight of evidence, 证据权重) WOE是一种衡量正常样本( Good)和违约样本( Bad)分布的差异方法 WOE=ln(Distr Good/Distr Bad) ...

  2. python最优分箱计算iv值_GitHub - zhaoxingfeng/WOE: Weight of Evidence,基于iv值最大思想求最优分箱...

    WOE WOE Transformation常用于信用风险评分卡(Credit Risk Scorecard)模型中,采用分箱的方式对原始特征进行非线性映射.常见的分箱方法有等宽分箱.等频分箱.最优分 ...

  3. R语言基于信息价值IV(Information Value)和证据权重WOE(Weights of Evidence)进行特征筛选(feature selection)

    R语言基于信息价值IV(Information Value)和证据权重WOE(Weights of Evidence)进行特征筛选(feature selection) 对一个学习任务来说,给定属性集 ...

  4. woe分析_WOE(证据权重)为何这样计算?

    更多大数据分析.建模等内容请关注公众号<bigdatamodeling> 先简单回顾一下WOE的含义.假设x是类别变量或分箱处理过的连续变量,含R个类别或分段,取值为{C1, ..., C ...

  5. 评分卡模型、WOE(Weight of Evidence)和IV(Information Value)

    WOE(Weight of Evidence) IV(Information Value) 在机器学习的二分类问题中,IV值(Information Value)主要用来对输入变量进行编码和预测能力评 ...

  6. 证据权重 (WOE) 与信息价值 (IV)

    在本文中,我们将介绍证据权重和信息价值的概念,以及如何在预测建模过程中使用它们,以及如何使用 SAS.R 和 Python 计算它们的详细信息. 逻辑回归模型是解决二分类问题最常用的统计技术之一.这是 ...

  7. Stochastic Weight Averaging (SWA) 随机权重平均

    文章目录 相关链接 基础 思路 主要内容 概括 SWA图示 SWA算法 LR The Algorithm Batch normalization 在PyTorch中使用swa 最佳实践 Demo 最近 ...

  8. 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风

    金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...

  9. WOE,IV ,PSI,单变量PSI,KS值,capture rate

    1.WOE Weight of Evidence,证据权重. 要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(离散化,分箱等).分组后,对于第i组,这个组中响应客户站样本中所有响应客户的比 ...

最新文章

  1. 醉没醉,带上智能手机走两步就知道
  2. 24 个你应该了解的 PHP 库
  3. hadoop的实现-序
  4. java facade dao_java – 在Facade模式中放置用于创建namedQuer...
  5. 工作流实战_10_flowable 流程实例的删除
  6. 怎么管理Websphere应用服务器?
  7. MongoDB CRUD命令操作
  8. 强连通分量[trajan]
  9. ARMv8的OP-TEE源代码的获取和编译
  10. spark的数三角形算法_腾讯开源全栈机器学习平台 Angel 3.0,支持三大类型图计算算法...
  11. ie浏览器中图片被拉长
  12. 15、Kanzi插件——通过Kanzi Engine插件创建自定义消息类型+代码解析
  13. EXCEL函数篇01 按间隔符提取数据,实现分列功能
  14. 使用Excel获取数据
  15. 从初学者的角度看Solr概述
  16. 运放的信号叠加电路与求差电路
  17. 【OpenCV】01-OpenCV的数据类型
  18. 同感,在另外一个小华为待过,也差不多是这样的
  19. VMware虚拟机的安装、创建及CentOS 7的安装
  20. google支持本地ajax,360chrome,google chrome浏览器使用jquery.ajax加载本地html文件

热门文章

  1. LINUX64位版本ECLIPSE下载
  2. 半年时间,拍摄8省市10个案例,我们见到了这样的智能中国
  3. 谈谈JavaEye这个技术圈子
  4. 汽车减速器设计及三维建模
  5. 多旋翼无人机控制器设计入门
  6. PS磨皮神器更新为Portraiture V3中文汉化版(仅64位) 。
  7. 拓事件|拓保软件一举斩获两项数字大奖,引领数字服务再创新辉煌
  8. 移动端开发框架选择及实践
  9. centos在线下载mysql出现404_Centos下载mysql遇到的问题及步骤(rpm)
  10. Firefox火狐浏览器关闭之后再也打不开了 怎么破?