模型是对策略的补充,可以具体量化每一位客户的风险值。信贷评分卡是风控领域应用最广泛的模型,不论是零售信贷、小微信贷还是对公等的众多业务领域,都试着想用评分模型来量化客群的风险。
但想要开发相关的评分模型,其中最关键的一个维度就是数据量的问题。然而,数据缺乏是困扰着各位建模同学最关键的问题之一。特别在小微企业中,数据不足更是最常见的问题。“要我建模可以,得给我数据啊”。然而巧妇难为无米之炊。基于在普遍的情况中,数据匮乏的问题。今天我们引入了启发式的评分模型,试着帮大家在冷启动阶段就能开发好一张评分模型。
在启发式评分模型中通常有两个常见场景,以下分别来介绍下。

一.基于好坏比的多个单变量模型的启发式组合建模
1、第一步是数据驱动的建模过程
在数据驱动过程中,我们运用评分模型最重要的一个分数映射公式,好坏比:score=ln odds*a+b
利用好坏比来计算,首先计算各变量各分箱的好坏比,并设定评分上下限,对应求出各个变量回归模型的a和b(如果有9个特征变量,则有9组a、b系数)。

2、在第二步确认每个变量中权重分配方案
对第一步中的多个单变量回归模型进行权重分配,此步是高度人工参与的启发式权重归一化分配。

二.AHP层次分析模型
层次分析法中,也是在整个冷启动阶段用得最多的算法(Analytic Hierarchy Process,简称AHP)。
把复杂问题中的各种因素通过划分为相互联系的有序层次,使之条理化,根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来,将一层次元素两两比较的重要性进行定量描述。
然后,计算反映每一层次元素的相对重要性次序的权值,通过所有层次之间的总排序计算所有元素的相对权重并进行排序。
在层次分析模型中,需要定性分析与定量分析相结合。层次分析模型可解释性较强,样本要求低。但层次分析方法也存在缺点,即:在变量数量较多与变量之间存在相关性时较难处理。
层析分析法中,需要用到专家经验判断的就是标度法标识不同维度的重要性。通常我们会用到1~9标度法:对特征变量进行两两相对权重判断,其数值构成原始数据判断矩阵A。

【用标度法来标识工作满意度的方法】

另外在整个层析分析法中,需要涉及三个维度的内容,,搞清楚这个三个维度基本就能弄清楚层析分析法的逻辑了,分别是:
1、模型权重系数生成
2、最大特征值计算

3、特征一致性判断

在相关的层次分析法中,我们会展开以小微企业与供应链金融作为实际的应用案例来讲解:

关于本文中所提到的启发式评分模型的内容,更全面的系统知识内容,可关注:

~原创文章

end

评分模型前奏:启发式评分模型开发相关推荐

  1. DataScience:风控场景之金融评分卡模型的构建(逻辑回归)开发(转评分卡)、使用过程(线上实现)之详细攻略

    DataScience:风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡).使用过程(线上实现)之详细攻略 目录 风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡) ...

  2. 信用卡评分模型(数据获取+数据预处理+探索分析+变量选择+模型开发+模型评估+信用评分+建立评分系统)

    最近两次遇到关于信用卡评分的题目,遂了解一波. Reference: 基于python的信用卡评分模型(超详细!!!) https://www.jianshu.com/p/f931a4df202c h ...

  3. 信用风险模型(申请评分、行为评分)与数据准备(违约期限、WOE转化)

    笔记︱信用风险模型(申请评分.行为评分)与数据准备(违约期限.WOE转化) 原创 2016年06月20日 20:09:51 标签: 申请评分 / 行为评分 / 违约期限 / WOE 14299 巴塞尔 ...

  4. 金融风控-- >申请评分卡模型-- >申请评分卡介绍

    从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...

  5. 分类模型的可视化评分技术

    准确度统计数据(例如整体准确度)量化了机器学习模型在没有任何对照参考(例如随机猜测或现有模型)的新数据上的预期性能. 这就是为什么我们还需要可视化模型评估 - 或评分 - 技术来在更广泛的背景下显示模 ...

  6. ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选

    ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选 目录 利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选

  7. 因果模型五:用因果的思想优化风控模型——因果正则化评分卡模型

    因果模型五:用因果的思想优化风控模型--因果正则化评分卡模型 一.模型中的因果和相关 二.不可知样本选择偏差 三.因果推断 四.因果与评分卡的融合 五.模型效果评估 5.1 人工合成数据效果测试 5. ...

  8. R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、估计(Propensity score)、预测倾向性评分并可视化不同分组倾向性评分的分布

    R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).预测倾向性评分并可视化不同分组倾向性评分的分布 目录

  9. R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、使用predict函数预测倾向性评分并将结果整合到dataframe中

    R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).使用predict函数预测倾向性评分并将结果整合到da ...

最新文章

  1. System commands can run from cmd
  2. python数字组合算法_面试宝典_Python.常规算法.0001.在圆圈和框框分别填入1~8数字各一次?...
  3. PostgreSQL 10.1 手册_部分 III. 服务器管理_第 16 章 从源代码安装_16.5. 安装后设置...
  4. Prism For WPF Login对话框又简单又合理的方案之一
  5. 哈希桶 entry_哈希表代码实现
  6. 哨兵2号波段_分布式框架之高性能:Redis哨兵模式
  7. 【软件工程】--软工文档总结
  8. PaaS安全:降低企业风险的四条规则
  9. Atitit webdav 的问题 -------------大文件传输问题 在某些版本的 Windows 操作系统中,WebDAV 驱动器的最大文件大小被限制为 50MB。如果你试图复制超过 5
  10. OpenCV——LBP特征
  11. Excel如何批量设置行高
  12. 计算机cad运行缓慢怎样处理,win7系统提高CAD运行速度的方法
  13. 学习笔记(02):3华为工程师 ,带你实战C++(2018版)-02仿函数与智能指针的自实现...
  14. Elasticsearch - Indices stats 获取索引级别的统计信息之三 【indexing】索引操作信息
  15. 啃完这本阿里手册,应届七面进阿里
  16. 惠普打印机故障代码_HP打印机故障代码
  17. 雷电网络(一):厘清雷电网络的原理
  18. word饼图如何画引导线_#excel表格饼状图制作#如何在饼形图中添加引导线(Excel)...
  19. 华中科技大学计算机专业排名2018,2018华中科技大学专业排名及分数线 王牌专业有哪些...
  20. sde for Oracle 与 shp 、oralce spatial 的数据读写

热门文章

  1. word文件名后自动加1_如何批量快速提取文件名
  2. logstash java插件_[logstash-input-log4j]插件使用详解
  3. php function curl token_最全PHP代码规范
  4. FinTech领域实践:乐维监控助力西南某上市城商行IT运维转型升级!
  5. ubuntu14.04升级以及gitlab升级
  6. 流程控制库async
  7. Linux内存调试工具初探-MEMWATCH
  8. 图片加载库Glide
  9. Android自动化测试 monkey 工具学习3
  10. sql server数据库性能的优化