评分模型前奏:启发式评分模型开发
模型是对策略的补充,可以具体量化每一位客户的风险值。信贷评分卡是风控领域应用最广泛的模型,不论是零售信贷、小微信贷还是对公等的众多业务领域,都试着想用评分模型来量化客群的风险。
但想要开发相关的评分模型,其中最关键的一个维度就是数据量的问题。然而,数据缺乏是困扰着各位建模同学最关键的问题之一。特别在小微企业中,数据不足更是最常见的问题。“要我建模可以,得给我数据啊”。然而巧妇难为无米之炊。基于在普遍的情况中,数据匮乏的问题。今天我们引入了启发式的评分模型,试着帮大家在冷启动阶段就能开发好一张评分模型。
在启发式评分模型中通常有两个常见场景,以下分别来介绍下。
一.基于好坏比的多个单变量模型的启发式组合建模
1、第一步是数据驱动的建模过程
在数据驱动过程中,我们运用评分模型最重要的一个分数映射公式,好坏比:score=ln odds*a+b
利用好坏比来计算,首先计算各变量各分箱的好坏比,并设定评分上下限,对应求出各个变量回归模型的a和b(如果有9个特征变量,则有9组a、b系数)。
2、在第二步确认每个变量中权重分配方案
对第一步中的多个单变量回归模型进行权重分配,此步是高度人工参与的启发式权重归一化分配。
二.AHP层次分析模型
层次分析法中,也是在整个冷启动阶段用得最多的算法(Analytic Hierarchy Process,简称AHP)。
把复杂问题中的各种因素通过划分为相互联系的有序层次,使之条理化,根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来,将一层次元素两两比较的重要性进行定量描述。
然后,计算反映每一层次元素的相对重要性次序的权值,通过所有层次之间的总排序计算所有元素的相对权重并进行排序。
在层次分析模型中,需要定性分析与定量分析相结合。层次分析模型可解释性较强,样本要求低。但层次分析方法也存在缺点,即:在变量数量较多与变量之间存在相关性时较难处理。
层析分析法中,需要用到专家经验判断的就是标度法标识不同维度的重要性。通常我们会用到1~9标度法:对特征变量进行两两相对权重判断,其数值构成原始数据判断矩阵A。
【用标度法来标识工作满意度的方法】
另外在整个层析分析法中,需要涉及三个维度的内容,,搞清楚这个三个维度基本就能弄清楚层析分析法的逻辑了,分别是:
1、模型权重系数生成
2、最大特征值计算
3、特征一致性判断
在相关的层次分析法中,我们会展开以小微企业与供应链金融作为实际的应用案例来讲解:
关于本文中所提到的启发式评分模型的内容,更全面的系统知识内容,可关注:
~原创文章
…
end
评分模型前奏:启发式评分模型开发相关推荐
- DataScience:风控场景之金融评分卡模型的构建(逻辑回归)开发(转评分卡)、使用过程(线上实现)之详细攻略
DataScience:风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡).使用过程(线上实现)之详细攻略 目录 风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡) ...
- 信用卡评分模型(数据获取+数据预处理+探索分析+变量选择+模型开发+模型评估+信用评分+建立评分系统)
最近两次遇到关于信用卡评分的题目,遂了解一波. Reference: 基于python的信用卡评分模型(超详细!!!) https://www.jianshu.com/p/f931a4df202c h ...
- 信用风险模型(申请评分、行为评分)与数据准备(违约期限、WOE转化)
笔记︱信用风险模型(申请评分.行为评分)与数据准备(违约期限.WOE转化) 原创 2016年06月20日 20:09:51 标签: 申请评分 / 行为评分 / 违约期限 / WOE 14299 巴塞尔 ...
- 金融风控-- >申请评分卡模型-- >申请评分卡介绍
从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...
- 分类模型的可视化评分技术
准确度统计数据(例如整体准确度)量化了机器学习模型在没有任何对照参考(例如随机猜测或现有模型)的新数据上的预期性能. 这就是为什么我们还需要可视化模型评估 - 或评分 - 技术来在更广泛的背景下显示模 ...
- ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选
ML之FE:风控场景之金融评分卡模型之利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选 目录 利用LoR模型权重变量系数正负符号结合p-value/P值大小实现变量筛选
- 因果模型五:用因果的思想优化风控模型——因果正则化评分卡模型
因果模型五:用因果的思想优化风控模型--因果正则化评分卡模型 一.模型中的因果和相关 二.不可知样本选择偏差 三.因果推断 四.因果与评分卡的融合 五.模型效果评估 5.1 人工合成数据效果测试 5. ...
- R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、估计(Propensity score)、预测倾向性评分并可视化不同分组倾向性评分的分布
R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).预测倾向性评分并可视化不同分组倾向性评分的分布 目录
- R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、使用predict函数预测倾向性评分并将结果整合到dataframe中
R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).使用predict函数预测倾向性评分并将结果整合到da ...
最新文章
- System commands can run from cmd
- python数字组合算法_面试宝典_Python.常规算法.0001.在圆圈和框框分别填入1~8数字各一次?...
- PostgreSQL 10.1 手册_部分 III. 服务器管理_第 16 章 从源代码安装_16.5. 安装后设置...
- Prism For WPF Login对话框又简单又合理的方案之一
- 哈希桶 entry_哈希表代码实现
- 哨兵2号波段_分布式框架之高性能:Redis哨兵模式
- 【软件工程】--软工文档总结
- PaaS安全:降低企业风险的四条规则
- Atitit webdav 的问题 -------------大文件传输问题 在某些版本的 Windows 操作系统中,WebDAV 驱动器的最大文件大小被限制为 50MB。如果你试图复制超过 5
- OpenCV——LBP特征
- Excel如何批量设置行高
- 计算机cad运行缓慢怎样处理,win7系统提高CAD运行速度的方法
- 学习笔记(02):3华为工程师 ,带你实战C++(2018版)-02仿函数与智能指针的自实现...
- Elasticsearch - Indices stats 获取索引级别的统计信息之三 【indexing】索引操作信息
- 啃完这本阿里手册,应届七面进阿里
- 惠普打印机故障代码_HP打印机故障代码
- 雷电网络(一):厘清雷电网络的原理
- word饼图如何画引导线_#excel表格饼状图制作#如何在饼形图中添加引导线(Excel)...
- 华中科技大学计算机专业排名2018,2018华中科技大学专业排名及分数线 王牌专业有哪些...
- sde for Oracle 与 shp 、oralce spatial 的数据读写