背景

信用是一切社会金融体系的根本,有了每个人的信用我们才可以进行放贷、共享充电宝、共享单车等业务。如果可以准确的给每个社会成员的信用做一个打分,将对金融业务的推进有很大作用,很多相关业务的企业也在探索如何实现信用分。

目前业内最通用的方案是评分卡算法,这个算法底层其实就是简单地二分类模型,将逻辑回归或者xgboost进行封装。但是为什么不能直接使用xgboost甚至深度学习算法做信用评估呢?因为金融业务有自己的特殊性,要求模型需要有强解释性,所以评分卡解决方案经常包含分箱和评分两个模块。就是为了做到每个分数的强解释性。

评分卡模型解释性

通过一个例子介绍什么叫强解释性。以下图为例:

这是一个评分卡算法的部分特征数据展示,有年龄、性别、婚姻状况、学历、月收入。评判每个人的分数也很容易:

客户分=基准分+年龄分+性别分+婚姻状况分+学历分+月收入分

所以在评分卡体系中,每个人的分数都会拆分成很多子模块,这些子模块的分数的和,跟基准分加到一起就是信用评分。接下来介绍下评分卡的执行流程。

评分卡流程

1.数据准备

通常评分卡模型的数据需要包含四个方面,分别是客户统计信息、账户属性、消费行为和还款行为。

根据数据目标的不同,可以分为ABC三种评分卡:

  • 贷前:申请评分卡(Application score card),又称为A卡
  • 贷中:行为评分卡(Behavior score card),又称为B卡
  • 贷后:催收评分卡(Collection score card),又称为C卡

2.分箱

分箱算法是将每个字段按照不同的模式进行离散化处理。分箱有很多模式,分为有监督模式和无监督模式。

  • 有监督分箱:通过训练二叉树模型,将IV大的切分点找出来实现分箱
  • 无监督分箱:利用等频、等距等模式进行分箱

分箱出来的分箱结果需要进行评估,并且不断调整分箱。评估方式是要计算WOE和IV指标。

WOE指的是该组好的客户和所有好的客户的比例,WOE的值最终会影响IV的值,IV的公式:

IV的值越大,说明这个分箱模式对结果的预测越重要,所以分箱的目的是尽可能的提升每组分箱结果的IV值。

通常分箱算法会提供一个WOE和IV的展示图:

3.评分算法

评分算法相对就比较简单,其实就是训练一个逻辑回归或者XGboost模型,将模型系数跟对应的分箱的WOE值做加权。

其中A是个基准分,B为常量,模型系数和WOE值组合成了剩下的变量和。最终通过评分算法将每个人的分数映射到一个合理的区间,所以评分区间的设定主要是调整A的取值,比如我们希望每个人的信用分都是500左右,就可以把A调整为500。最终的评分卡方案就是分箱+打分模型。

参考文献:

[1]https://zhuanlan.zhihu.com/p/36539125

[2]https://blog.csdn.net/ISMedal/article/details/89380396

[3]https://www.jianshu.com/p/c3fa53c54cca

浅谈最广泛应用的金融风控算法-评分卡相关推荐

  1. 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风

    金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...

  2. 金融风控实战-金融风控与评分卡基础

    金融风控与评分卡基础-b站视频

  3. 基于逻辑回归的金融风控模型评分卡

    2022年1月报名了单位组织参加的传智教育线上Python数据分析培训班,一共五天.前三天主要介绍了一些Python和机器学习的基础知识.包括pandas库的使用.若干机器学习经典算法.基于机器学习的 ...

  4. 金融风控-申请评分卡模型-申请评分卡介绍

    从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...

  5. 浅谈深度学习的基础——神经网络算法(科普)

    浅谈深度学习的基础--神经网络算法(科普) 神经网络算法是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助 ...

  6. python金融应用的好书推荐卡_【荐书】智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著)...

    原标题:[荐书]智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著) 图书简介 风险管理是金融的核心,信贷场景下的风险,很大程度上取决于贷款人的信用风险.因此,如何对贷款用户的信用风险 ...

  7. 玩转大数据风控—利用评分卡模型实现信用评级

    玩转大数据风控-利用评分卡模型实现信用评级 一.算法介绍 1. 什么是逻辑回归? 2. 逻辑回归为何逻辑 ? 3. 逻辑回归怎么回归? 二.构建流程 1.数据处理 1.1 数据清理 1.2 缺失值处理 ...

  8. 浅谈自适应滤波器---(快速RLS算法)

    在上一篇博客中(浅谈自适应滤波器)我给大家介绍了关于自适应滤波器的一些入门级的知识,并分析了常规RLS算法单次迭代的计算量级为O[N2],当阶数N增大时相应的计算量显著增大,为了将计算量级降低到O[N ...

  9. 【风控建模】互联网金融-机器学习及评分卡构建

    [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...

最新文章

  1. 【Python】tqdm创建进度条
  2. visual studio code python插件下载_visual studio code 的必装推荐插件plugin, vscode, vsc
  3. cv2.bitwise_not(主要讲这个)
  4. 看django视频笔记
  5. 数据库面试题【七、InnoDB索引和MyISAM索引的区别】
  6. Python zip() 函数--多个迭代器取元素组合成一个新的迭代器
  7. 题目241-字母统计
  8. Android保存照片到相册
  9. UCSC Xena:癌症基因组学数据分析平台
  10. mac桌面存在顽固文件无法删除?怎么办?
  11. 修行一定要在寺院里吗,出家人离开寺院修行,都属邪门外道吗?
  12. windows 下搭建git服务器,及问题处理。
  13. 100天python、github_GitHub - 1977950729/Python-100-Days: Python - 100天从新手到大师
  14. 如何删除重复项只保留最新项
  15. 埃默里大学计算机值得读吗,Emory的Mathematics and Computer Science「埃默里大学数学与计算机科学系」...
  16. 人工智能作用现代认知战探析
  17. 首个非逆向,不需要手机!的微信视频号采集方案
  18. Android 中自定义ViewGroup实现流式布局的效果
  19. 你长得真帅,咱俩生个孩子吧
  20. 1688api 图片搜索功能

热门文章

  1. 走进语音识别中的WFST(一)
  2. 美团面试官:MySQL主备、主从、读写分离你知道多少?
  3. 二次拟合r方_拟合R语言中的多项式回归
  4. 【杰理ac63系列】串口使用
  5. 学习方法升级及思维模式学习(2)
  6. 2022年蓝桥杯b组c++省赛填空题全部代码
  7. Java架构师成长直通车(一):学习指南
  8. 制作高大上宣传片的方法
  9. Qt之实现移动的方块(蚂蚁线)
  10. 生活随记 - 某快车平台定位错误导致的不愉快的出行体验