浅谈最广泛应用的金融风控算法-评分卡
背景
信用是一切社会金融体系的根本,有了每个人的信用我们才可以进行放贷、共享充电宝、共享单车等业务。如果可以准确的给每个社会成员的信用做一个打分,将对金融业务的推进有很大作用,很多相关业务的企业也在探索如何实现信用分。
目前业内最通用的方案是评分卡算法,这个算法底层其实就是简单地二分类模型,将逻辑回归或者xgboost进行封装。但是为什么不能直接使用xgboost甚至深度学习算法做信用评估呢?因为金融业务有自己的特殊性,要求模型需要有强解释性,所以评分卡解决方案经常包含分箱和评分两个模块。就是为了做到每个分数的强解释性。
评分卡模型解释性
通过一个例子介绍什么叫强解释性。以下图为例:
这是一个评分卡算法的部分特征数据展示,有年龄、性别、婚姻状况、学历、月收入。评判每个人的分数也很容易:
客户分=基准分+年龄分+性别分+婚姻状况分+学历分+月收入分
所以在评分卡体系中,每个人的分数都会拆分成很多子模块,这些子模块的分数的和,跟基准分加到一起就是信用评分。接下来介绍下评分卡的执行流程。
评分卡流程
1.数据准备
通常评分卡模型的数据需要包含四个方面,分别是客户统计信息、账户属性、消费行为和还款行为。
根据数据目标的不同,可以分为ABC三种评分卡:
- 贷前:申请评分卡(Application score card),又称为A卡
- 贷中:行为评分卡(Behavior score card),又称为B卡
- 贷后:催收评分卡(Collection score card),又称为C卡
2.分箱
分箱算法是将每个字段按照不同的模式进行离散化处理。分箱有很多模式,分为有监督模式和无监督模式。
- 有监督分箱:通过训练二叉树模型,将IV大的切分点找出来实现分箱
- 无监督分箱:利用等频、等距等模式进行分箱
分箱出来的分箱结果需要进行评估,并且不断调整分箱。评估方式是要计算WOE和IV指标。
WOE指的是该组好的客户和所有好的客户的比例,WOE的值最终会影响IV的值,IV的公式:
IV的值越大,说明这个分箱模式对结果的预测越重要,所以分箱的目的是尽可能的提升每组分箱结果的IV值。
通常分箱算法会提供一个WOE和IV的展示图:
3.评分算法
评分算法相对就比较简单,其实就是训练一个逻辑回归或者XGboost模型,将模型系数跟对应的分箱的WOE值做加权。
其中A是个基准分,B为常量,模型系数和WOE值组合成了剩下的变量和。最终通过评分算法将每个人的分数映射到一个合理的区间,所以评分区间的设定主要是调整A的取值,比如我们希望每个人的信用分都是500左右,就可以把A调整为500。最终的评分卡方案就是分箱+打分模型。
参考文献:
[1]https://zhuanlan.zhihu.com/p/36539125
[2]https://blog.csdn.net/ISMedal/article/details/89380396
[3]https://www.jianshu.com/p/c3fa53c54cca
浅谈最广泛应用的金融风控算法-评分卡相关推荐
- 金融风控--申请评分卡模型--特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融风
金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码) 标签: 金融特征分箱-WOE编码 2017-07-16 21:26 4086人阅读 评论(2) 收藏 举报 分类: 金融 ...
- 金融风控实战-金融风控与评分卡基础
金融风控与评分卡基础-b站视频
- 基于逻辑回归的金融风控模型评分卡
2022年1月报名了单位组织参加的传智教育线上Python数据分析培训班,一共五天.前三天主要介绍了一些Python和机器学习的基础知识.包括pandas库的使用.若干机器学习经典算法.基于机器学习的 ...
- 金融风控-申请评分卡模型-申请评分卡介绍
从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...
- 浅谈深度学习的基础——神经网络算法(科普)
浅谈深度学习的基础--神经网络算法(科普) 神经网络算法是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助 ...
- python金融应用的好书推荐卡_【荐书】智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著)...
原标题:[荐书]智能风控:Python金融风险管理与评分卡建模(梅子行 毛鑫宇 著) 图书简介 风险管理是金融的核心,信贷场景下的风险,很大程度上取决于贷款人的信用风险.因此,如何对贷款用户的信用风险 ...
- 玩转大数据风控—利用评分卡模型实现信用评级
玩转大数据风控-利用评分卡模型实现信用评级 一.算法介绍 1. 什么是逻辑回归? 2. 逻辑回归为何逻辑 ? 3. 逻辑回归怎么回归? 二.构建流程 1.数据处理 1.1 数据清理 1.2 缺失值处理 ...
- 浅谈自适应滤波器---(快速RLS算法)
在上一篇博客中(浅谈自适应滤波器)我给大家介绍了关于自适应滤波器的一些入门级的知识,并分析了常规RLS算法单次迭代的计算量级为O[N2],当阶数N增大时相应的计算量显著增大,为了将计算量级降低到O[N ...
- 【风控建模】互联网金融-机器学习及评分卡构建
[博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...
最新文章
- 【Python】tqdm创建进度条
- visual studio code python插件下载_visual studio code 的必装推荐插件plugin, vscode, vsc
- cv2.bitwise_not(主要讲这个)
- 看django视频笔记
- 数据库面试题【七、InnoDB索引和MyISAM索引的区别】
- Python zip() 函数--多个迭代器取元素组合成一个新的迭代器
- 题目241-字母统计
- Android保存照片到相册
- UCSC Xena:癌症基因组学数据分析平台
- mac桌面存在顽固文件无法删除?怎么办?
- 修行一定要在寺院里吗,出家人离开寺院修行,都属邪门外道吗?
- windows 下搭建git服务器,及问题处理。
- 100天python、github_GitHub - 1977950729/Python-100-Days: Python - 100天从新手到大师
- 如何删除重复项只保留最新项
- 埃默里大学计算机值得读吗,Emory的Mathematics and Computer Science「埃默里大学数学与计算机科学系」...
- 人工智能作用现代认知战探析
- 首个非逆向,不需要手机!的微信视频号采集方案
- Android 中自定义ViewGroup实现流式布局的效果
- 你长得真帅,咱俩生个孩子吧
- 1688api 图片搜索功能