风控评分模型全流程的开发及应用

  信用评分卡的应用场景有申请评分卡(A卡)、行为评分卡(B卡)、催收评分卡(C卡)和反欺诈评分卡(F卡)。

  用户申请信用贷款的流程依次是基本信息核查、强规则校验、反欺诈审核、评分模型和评分授信。最后通过评分决定对高风险客户拒绝,低风险客户自动审批,中风险的客户进入人工审批。

评分卡开发流程

特殊进件排除

确定观察期和表现期

  观察期是计算变量的时期,表现期是预测的时间长度。比如预测客户未来12个月内出现违约的概率,则表现期为12个月。

好坏客户定义

  可以通过迁徙率和Vintage两张图来看。

  从迁徙率来看,M2-M3的迁徙率达到85%,所以定义坏客户为M2+以上;
  从Vintage图看,7期之后开始变得平稳,说明逾期客户基本全部表现,所以定义表现期为7期;于是,坏客户的定义就是未来7个月内出现M2以上的逾期。

样本区分

  为了达到最好的预测效果,通常会依据客群或者产品做样本区分,针对不同的客群开发子评分卡,可以提高模型的预测效果。

数据源准备

  1. 运营商数据
    运营商通话详单、注册时间、缴费信息、流量使用信息、短信信息等
  2. 设备数据
    通过手机SDK获取的设备及通讯相关信息,包括设备信息、通讯录、通话记录、短信、APP信息等
  3. 短信数据
    第三方短信供应商积累的用户数据。
  4. 第三方支付数据
    第三方支付供应商积累的用户数据。包括身份证号码、贷款金额、分期还款金额等。
  5. 手机号码标签
    是否多头借贷、是否命中黑名单
  6. 第三方爬虫
    运营商数据、淘宝数据、社保公积金数据、网银银行卡流水数据。
  7. 个人征信
    个人征信数据,包括信用卡、住房贷款、逾期贷款笔数等
  8. 个人基本信息
    通过身份证获取的性别、年龄、籍贯地,通过手机号获取的运营商、手机号码所在地区等。

建模流程

  主要包括描述性统计分析、采样、数据清洗、特征工程、变量分箱、WOE编码、特征选择、计算IV值、建模、卡方检验、方差膨胀系数检验、分数转换,本文不再展开。

注意几个点:

  1. 离散性变量做转换的两种方法。
      第一,作独热编码,即哑变量转换。第二,根据离散变量分组后的目标变量的均值排序,转化为有序数值变量。第二点是我没怎么注意过的方法。

  2. 变量分箱。

  • 不同分箱好坏比率要有差异。
  • 每个分箱中的好坏数量至少大于30。
  • 每个分箱中的账户百分比至少大于2%。
  • 每个分箱的好坏比率排序需要和业务常识一致。
  • 分箱的取值符合业务常识。例如账龄的分析一般为3的整数倍。

3.拒绝推断
  由于建立的模型的样本均来自于已经核准的案件,这些案件质量相对较好,这样会造成模型偏误。
  事实上案件被拒绝后无法观察其实际的绩效表现,所以采用拒绝推断的方法来预测被拒绝案件好坏从而修正模型。常用的两种方法:

  • 简单扩充法
    以初始模型计算出拒绝客户的违约概率,设定阈值,决定客户的好坏。
  • 分群法
    以初始模型计算违约概率,将审核通过的客户划分为n个群,拒绝客户依然预测的概率归类到某个分群。然后以该群体的正常违约比随机分配拒绝客户的好坏。

模型评估

  不展开介绍模型评估的指标了,之前的文章有写过。详见
风控指标详解

注意几点:

  • AUC值一般大于0.7以上可应用
  • KS值大于0.2可认为有较好的预测效果
  • PSI小于10%可认为是高稳定模型

模型监控

  模型实施后,要建立多个报表对模型的有效性、稳定性进行监控。

  • 稳定性监控报表
      比较评分卡上线后与建模训练样本客户的分值分布,监控模型的有效性
  • 特征分析报表
      比较评分卡上线后和建模训练间每个特征的分布,监控特征的变化趋势,评估模型的有效性。
      可以从缺失值比率、特征分组后的占比、特征分组后的稳定性、特征分组后的IV值、平均数、中位数、众数等监控。
  • 不良贷款分析报表
      评估不同分数段的不良贷款,并与训练样本进行比较,监控客户信贷质量。
      比如,训练样本分数段100-300,M1的占比为10%,M2的占比为30%;上线后的样本,分数段100—300,M1的占比为9%,M2的占比为34%。当发生显著变化的时候,需要考虑分数是否适用。
  • 拒绝原因分析报表
    分析被评分卡拒绝的原因分布。
      基于单个变量,按照取值平均分为3-5组,计算每个组别的平均得分。对于用户的各个变量,划入对应的组别。再将所有组别的最大值减去该组的平均得分,取差值,将各个变量对应的差值从高到低进行排序,输出头三个不同的拒绝原因。

评分截取点选取

  截取点可根据净收入以及预期的逾期率来进行选择,资金成本+数据成本+引流成本+运营成本。

【作者】:Labryant
【原创公众号】:风控猎人
【简介】:某创业公司策略分析师,积极上进,努力提升。乾坤未定,你我都是黑马。
【转载说明】:转载请说明出处,谢谢合作!~

风控评分模型全流程的开发及应用相关推荐

  1. R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告、knitr常用参数

    R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告.knitr常用参数 目录

  2. 【模型开发】风控评分模型开发流程

    [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...

  3. 信用评分模型建模流程

    信用评分模型是消费信贷管理中先进的技术手段,是现在金融行业常用的信用风险评估方法,本文从宏观上介绍评分模型的建模开发流程. 1. 明确问题 明确业务要解决的问题,确定时间窗口.标签的定义规则,以及模型 ...

  4. Win10平台训练Yolo-Fastest模型全流程

    一.环境准备 安装vs2015 根据显卡驱动安装相应版本的CUDA和cuDNN 安装OpenCV 4.4.0 安装CMake 安装Anaconda 以上所有安装均可轻易找到大量教程,此处不再赘述. 二 ...

  5. 【采用】【评分卡开发】信用评分模型构建流程

    https://blog.csdn.net/sunyaowu315/article/details/101619723

  6. 从零开始学视觉Transformer(4):ViT模型全流程解析

    Vision Transformer打卡营

  7. 一文解锁华为云新技能-AIOT开发全流程【设备接入-ESP端侧数据收集[MQTT]-实时数据分析】(步步截图较详细)

    一文解锁华为云新技能-AIOT开发全流程[设备接入-ESP端侧数据收集[MQTT]-实时数据分析](步步截图较详细) 在这篇你将会接触到:从物联网工程师从硬件层-通信层到应用层全流程:开发华为云最基本 ...

  8. 使用PaddleX实现车辆检测模型训练到服务化部署落地全流程

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 1. 项目背景 随着AI技术的快速发展,深度学习技术在各个领域的应用越来越广泛.作为一种革命性的机 ...

  9. 天云大数据_【案例分享】天云大数据最佳实践系列之——信用评分模型

    本文为天云大数据原创 大数据能力特有的性质,使其正在成为大型银行真正的核心竞争力.银行大数据能力表现在多方面,但大数据思维和数据挖掘能力是最关键.也是最重要的.天云大数据自成立以来,一直深耕于金融领域 ...

最新文章

  1. encodeURI 和 encodeURIComponent
  2. 【知识星球】分组卷积最新进展,全自动学习的分组有哪些经典模型?
  3. 合作伙伴说 | 一人行快,众人行远,与网易共建万亿新生态
  4. 小米新机将搭载鸿蒙,小米新機將搭載鴻蒙係統?還得等鴻蒙進一步的消息!
  5. poj 1845 Sumdiv (算数基本定理+逆元)
  6. Ionic3 环境搭建以及基础配置实现(更新中)
  7. c语言函数大全doc,c语言函数大全.doc
  8. 默写标准答案0917
  9. Android ContentProvider 内容提供者
  10. 关于MyEclips新导入项目报错问题,解决方法!(基础)
  11. nginx离线安装_做一个属于自己的离线下载服务器原来这么简单
  12. linux里面的perl脚本怎么调用函数,如何在我的Perl脚本中包含另一个文件的函数?...
  13. Java架构-CAS SSO单点登录框架介绍
  14. 使用禅道管理项目流程
  15. mysqlclient和pymysql如何选择?_gevent_waiter的使用
  16. 5G使用随笔-华为5G模块MH5000-31
  17. 微信小程序 车轮之 滑动删除
  18. ChatGPT大封号,注册功能关闭!亚洲成重灾区,网友喊话:不要登录,不要登录...
  19. ANSYS workbench数值分析 新手教程(1)
  20. 复制、浅拷贝、深拷贝

热门文章

  1. android 之适配器与json对象解析技术的联用的进一步优化(解决图片错位)
  2. vector的元素不仅仅可以使int,double,string,还可以是结构体
  3. vuex模块化 怎么引用state_[Vuex系列] - 细说state的几种用法
  4. Character-level Convolutional Networks for Text Classification
  5. MATLAB中简单的数据库操作
  6. c++结构体定义和使用_[day day go]结构体amp;给结构定义方法
  7. matplotlib-pie-绘制饼状图
  8. 基于面板数据的熵值法
  9. 如何上传应用到百度应用(图解攻略)
  10. 今日头条算法原理(全文)【转】