组合模型在信贷风控中的应用

简介:在包括违约预测在内的诸多场景中,越来越多的建模人员将模型集成的方式应用在实际工作中,并且取得了不错的成效。本节课将介绍三种基本的集成方式:Bagging,boosting,stacking。

目录:

1.元模型与集成模型

2.多模型的bagging

3.多模型的boosting

4.多模型的stacking

1.元模型与集成模型

什么是集成模型:把多种单一问题组合起来共同解决一个问题

集成模型的必要性

  1. 能够为风控模型提供更为广阔的空间
  2. 能够为风控评估的准确性、稳健性最优选择问题给出了答案
  3. 能够提高风控模型的效率

集成模型原理:

单一分类器:基学习模型或称为元模型(base learner) 相应的算法:基学习算法(base learning algorithm) 组合方法:Boosting , Bagging&Stacking

集成模型中的元模型的选择

根据元模型之间的种类关系可以把集成模型划分为异态集成与同态集成两种。

异态集成

使用不同的分类、回归算法建立单一模型并进行集成

同态集成

使用同一算法(参数不同或者建立在不同的训练集上)建立单一模型并进行集成

单一模型需要满足以下基本要求

• 单一模型之间的数据或者假设要求要基本相同

• 单一模型的分类错误率要低于0.5

• 单一模型之间要保证相互独立

• 单一模型的复杂度也要适度

• 单一模型的数量并非越多越好

2.多模型的bagging

• 集成方式一:Bagging

Bagging的代表是随机森林模型。这种集成方式的步骤是

案例 我们使用三种模型来作为Bagging的元模型:逻辑回归模型、XGBoost模型和人工神经网络模型。对于每个模型,我们都从原始训练集中有放回地抽取样本形成同样大小的集合作为元模型的训练集。得到的每一个模型的结果是概率,求平均值后作为Bagging集成的输出。这是典型的异态集成。

在我们的案例中,元模型的AUC以及集成模型的AUC见下表。数据预处理和特征衍生参考评分卡模型的处理方法。

3.多模型的boosting

4.多模型的stacking

第九章 组合模型在信贷风控中的应用相关推荐

  1. 二代征信报告解读及信贷风控中的应用

    今年一月中旬起,征信中心面向社会公众和金融机构提供二代格式信用报告查询服务,相比一代征信系统,二代征信系统又做了哪些升级?提供的信用报告又有哪些变化?相对于一代征信报告,大家更加急切地想知道二代征信报 ...

  2. 972信息检索 | 第九章 网络信息检索与利用中的有关问题

    文章目录 第九章 网络信息检索与利用中的有关问题 网络信息的选择与评价 网络信息选择与评价的主体 网络信息选择与评价的客体 网络信息选择和评价的标准 已制定的标准 网络信息资源的评价标准 网络性能的评 ...

  3. 电商支付数据在信贷风控中的应用

    笔者在之前的工作经历中,曾做过针对电商/支付数据开发信用资质分的一个项目,下面我会介绍这两类数据是如何应用在信贷风控中的,内容包括电商支付数据的使用场景,做风险特征衍生的思路,以及在策略及模型上的应用 ...

  4. 破局:滚动率知识在信贷风控中的系统总结

    在信贷风控场景下,信用评分卡模型是最常见的风控手段之一,而根据模型的使 用场景(如A.B.C卡),明确模型的目标变量,是模型开发流程的一个重要前置工 作.目标变量的确定,即如何定义"好&qu ...

  5. 信贷风控中Vintage、滚动率、迁移率

    风控业务背景 信贷风险管理是一门艺术,更是一门科学.资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期.变化规律等. 滚动率分析(Roll Rate ...

  6. 基础篇|信贷风控中的外部数据(百行)

    序言: 外部数据源作为金融机构判客群风险最重要的征信维度,其作用不需多言,在信贷行业最风控的时候,某家机构公司数据成本占比居高不下,甚至是成本中较重的支出,比如在某集团公司里就会接入以下这些数据源: ...

  7. 信贷风控中Vintage、滚动率、迁移率的理解

    风控业务背景 信贷风险管理是一门艺术,更是一门科学.资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期.变化规律等. 滚动率分析(Roll Rate ...

  8. 手把手实操系列|信贷风控中的额度管理和额度模型设计

    序言: 如今的个人信贷行业步入合规发展阶段后,额度管理和差异化定价成为金融机构是否能最大化盈利的核心竞争力,其中额度管理包括贷前阶段的授信额度,贷中阶段的提额,降额等,本文将着重讲解这两个阶段的额度设 ...

  9. linux编写驱动后write已杀死_《Linux4.0设备驱动开发详解》笔记--第九章:Linux设备驱动中的异步通知与同步I/O...

    在设备驱动中使用异步通知可以使得对设备的访问可进行时,由驱动主动通知应用程序进行访问.因此,使用无阻塞I/O的应用程序无需轮询设备是否可访问,而阻塞访问也可以被类似"中断"的异步通 ...

最新文章

  1. quick check
  2. 高性能分布式计算与存储系统设计概要——暨2012年工作3年半总结
  3. PHP中不用第三个变量交换两个变量的值
  4. java url headers,Java CloseableHttpResponse.getHeaders方法代码示例
  5. Python Day15 jQuery
  6. 马云、马化腾任职清华;微软将数据保存在玻璃中;Visual Studio Online 上线 | 极客头条...
  7. 关于表、栈、队列的几种操作
  8. 一、配置etcd数据库
  9. 2021全国研究生数学建模竞赛C题思路
  10. java poi excel 图表_Java用POI实现根据Excel表格模板生成新的Excel并实现数据输出
  11. ret-sync插件:windbg/ollydbg+ida逆向调试神器
  12. paly()方法和pause()方法
  13. python如何对两个矩阵进行拼接_Python:合并两个numpy矩阵的实现
  14. Dijskra迪杰斯特拉算法
  15. 一键生成IOS App Icon工具
  16. tornado源码分析-Application
  17. Mybatis框架创建逆向工程步骤
  18. 怎么知道本台计算机的用户名和密码,访问其它电脑时“开始-运行-\输入要连接的电脑的IP,用户名和密码输入什么?...
  19. python能开发小程序吗_搭建小程序用Python语言可以搭建吗?
  20. MacBook安装Nginx

热门文章

  1. 《现代操作系统》(第4版)文件系统 课后习题解答
  2. as3 访问远程计算机,Flash AS3中数据发送与接收
  3. Linux中目录结构
  4. web应用如何确定能同时允许多少用户连接?_Web测试环境搭建+测试要点汇总
  5. docker web程序本地化_Docker教程
  6. oracle没有groupby,oraclegroupby之后还可以groupby么
  7. c++的引用是什么意思?怎么回事?
  8. pymongo insert_many 批量插入
  9. Attention-OCR(Attention-based Extraction of Structured Information from Street View Imagery)
  10. 168. Excel Sheet Column Title