在数据维度”泛滥”成灾的现代,如果不对特征进行筛选直接来建模的话不但会造成模型复杂度的提升,增加计算压力,同时也会因为数据的冗余浪费没有必要的数据费用支出。特别是在金融领域内,因为要求对模型的复杂度和可解释性都有很高的要求,所以在建模前的特征选择是及其重要的。因为每个人在建模时的习惯和方式有差别,所以在选择特征筛选方法的时候也会略有差异,以下会列举使用比较多的方法,你可以根据自己的需求进行使用。需特别说明一下特征选择没有固定的标准和尺度,这一部分需要读者根据自己的实际情况进行设计,但是总的宗旨是”降冗余”。

目录

1.缺失值删除

2.独值删除

3.相关性

4.多重共线性

5.P_value

6.系数法

6.不相关特征

8.特征重要性

9.PCA

10.方差筛选

11.过滤法(Filter)

12.包裹法(Wrapper)

13.嵌入法(Embedding)

一,缺失值删除

这部分对金融风控模型至关重要,我们不但要排查缺失值问题,而且还要解释缺失值问题。对于缺失不严重的数据,在金融风控建模的过程中基本上就是根据缺失的含义进行处理,或者填充一个特殊值。但是对于缺失比较严重(80%以上)的特征一般是不进入模型,但是这个特征如果效果很好,可以用作策略规则。

data_select.isnull().sum()/data_select.shape[0]

金融风控建模评分卡系列:机器学习特征选择方法相关推荐

  1. 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风

    金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...

  2. 金融风控实战-金融风控与评分卡基础

    金融风控与评分卡基础-b站视频

  3. 【科技金融】专家评分卡和机器学习评分卡的差异化和必要性

      对数据分析.机器学习.数据科学.金融风控等感兴趣的小伙伴,需要数据集.代码.行业报告等各类学习资料,可添加微信:wu805686220(记得要备注喔!),也可关注微信公众号:风控圏子(别打错字,是 ...

  4. 基于逻辑回归的金融风控模型评分卡

    2022年1月报名了单位组织参加的传智教育线上Python数据分析培训班,一共五天.前三天主要介绍了一些Python和机器学习的基础知识.包括pandas库的使用.若干机器学习经典算法.基于机器学习的 ...

  5. 金融风控-申请评分卡模型-申请评分卡介绍

    从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...

  6. 浅谈最广泛应用的金融风控算法-评分卡

    背景 信用是一切社会金融体系的根本,有了每个人的信用我们才可以进行放贷.共享充电宝.共享单车等业务.如果可以准确的给每个社会成员的信用做一个打分,将对金融业务的推进有很大作用,很多相关业务的企业也在探 ...

  7. python金融应用的好书推荐卡_【荐书】智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著)...

    原标题:[荐书]智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著) 图书简介 风险管理是金融的核心,信贷场景下的风险,很大程度上取决于贷款人的信用风险.因此,如何对贷款用户的信用风险 ...

  8. 玩转大数据风控—利用评分卡模型实现信用评级

    玩转大数据风控-利用评分卡模型实现信用评级 一.算法介绍 1. 什么是逻辑回归? 2. 逻辑回归为何逻辑 ? 3. 逻辑回归怎么回归? 二.构建流程 1.数据处理 1.1 数据清理 1.2 缺失值处理 ...

  9. python风险评分卡系统_智能风控:Python金融风险管理与评分卡建模(梅子行毛鑫宇著)...

    推荐序 前言 第1章 信用管理基础 /1 1.1 信用与管理 /2 1.2 风控术语解读 /3 1.2.1 信贷基础指标 /4 1.2.2 信贷风险指标 /5 1.3 企业信贷风控架构 /7 1.4 ...

  10. 风控建模 python 知乎_智能风控:Python金融风险管理与评分卡建模

    推荐序 前言 第1章 信用管理基础 /1 1.1 信用与管理 /2 1.2 风控术语解读 /3 1.2.1 信贷基础指标 /4 1.2.2 信贷风险指标 /5 1.3 企业信贷风控架构 /7 1.4 ...

最新文章

  1. 和push的区别_还没有理解let 和 const的用法和区别吗,几百字让你立马搞懂
  2. 开源贡献 计算_公司如何帮助员工为开源做出贡献
  3. jQuery中将表格以交替颜色显示
  4. android listview 行高度自适应,Android ListView 长度自适应item的内容 计算listview的高度...
  5. 税务计算机类考试题型,税务师考试题型分值分配、计算器要求及2020年考试时间安排...
  6. element ui 框架的优势_Element UI 框架
  7. dwg如何转换成pdf?
  8. win7怎么看计算机Mac地址,Win7怎么查看MAC地址?Win7查看MAC地址的两种方法
  9. 【历史上的今天】11 月 22 日:PHP 创始人诞生;2020 年图灵奖得主出生;IE 2.0 发布
  10. SuperMemo 15.1
  11. 使用80percent开发rails程序:gem的了解。(kaminari)
  12. [魅族Degao]Android客户端性能优化
  13. 壳聚糖导管复合辛伐他汀/泊洛沙姆407水凝胶/负载转化生长因子β1温敏性壳聚糖水凝胶的制备
  14. 人人商城提示“app被您禁用啦,可以访问lbsyun.baidu.com/apiconsole/key#”
  15. PC博物馆(番外01)-城会玩,初中生开发实体尺规大航海游戏
  16. 网络安全中接口测试的解决方案
  17. 0pyqt获取textEdit控件的文本
  18. C++嵌套类的使用及对外部类的访问权限
  19. 深度学习如何应用在广告、推荐及搜索业务?阿里妈妈实践案例解读
  20. 软件实验室 计算机配置,《软件测试实验室》管理规定

热门文章

  1. 草图大师su安装程序无法进行的解决办法。
  2. 饥荒联机版Mod开发——制作简单的物品(三)
  3. gis 数据框裁剪_【更新80篇】地理数据科学技术文章合集,欢迎大家点赞、在看、转发三连!...
  4. ubantu网络调试助手的安装以及打开
  5. 三维激光雷达点云处理分类
  6. 安装vs2015 、如何创建MFC项目
  7. Netty学习之读netty权威指南(三)
  8. excel 自定义宏所有excel可用
  9. WEB前端经典笔试/面试题
  10. 王垠:对TAOCP的真正看法