拓端tecdat|使用SAS Enterprise Miner进行数据挖掘:信用评分构建评分卡模型
原文链接:http://tecdat.cn/?p=3348
原文出处:拓端数据部落公众号
标签:
- 数据挖掘
- 风险管理
- 技巧和窍门
信用记分卡一直是信用评分的标准模型,因为它们易于理解,使您能够轻松评分新数据-即计算新客户的信用评分。本文将指导您完成使用Credit Scoring for SAS® EnterpriseMiner™开发的信用记分卡的基本步骤,这是我将在信用评分中发布的一系列技巧中的第一个。
建立记分卡用于构建信用记分卡的基本流程图中的节点包括:输入数据源,数据分区,交互式分组和记分卡。在本例中,您可以使用SAS Enterprise Miner的“帮助”菜单中提供的德语信用数据集。单击Help-> Generate Sample Data Source - > German Credit。该数据集具有二元目标good_bad,其指示客户是否默认其每月付款(指定为值'BAD'),以及与作为输入或特征的人口统计和信用局相关的若干其他变量。
交互式分组节点简而言之,交互式分组节点是一个非常灵活的工具,用于对变量进行分箱或分组。这个节点:
- 使用您可以轻松调整的选项来分类输入变量
- 计算每个输入变量的箱的证据权重
- 计算基尼和信息值,并拒绝具有这些统计值的低值的输入变量
在幕后运行的过程可以根据您可以轻松定制的某些约束找到相对于目标的输入的最佳分级。确保使用节点的交互式应用程序直观地确认事件计数和证据权重趋势对您的分箱有意义。如有必要,您可以合并箱,创建新组或手动调整证据权重。
手动调整证据权重
对于某些变量输入,您可能需要手动调整证据权重(WOE)。例如,可变采用总结了信用申请人在当前工作中受雇的年数。一般而言,当前工作的年数往往与信用违约成反比。对于该数据集,证据权重不会因第1组至第5组单调减少这一事实可能是由于多种原因。例如,这个数据集可能是样本偏向的,因为许多使用<2的应用程序是手动选择或“挑选”,并且它们的良好行为反映在低事件数和低权重证据中。要防止此样本偏差影响您的记分卡,您可以使用交互式应用程序中“分组”选项卡的“粗略详细信息”视图上的“手动WOE”列。对于组1,将WOE从0.1283更改为0.7,对于组2,将WOE从-0.13131更改为-0.5。新的WOE和信息值被重新计算为新信息值。
记分卡节点对使用“交互式分组”节点找到的箱或组感到满意后,运行“记分卡”节点以使用分组输入对逻辑回归进行建模。然后,它将创建每个输入组或属性的赔率的预测日志的线性变换,使其更易于解释。
默认情况下,每增加20个得分点,事件的几率就会翻倍。您正在建模的事件是付款默认值,这意味着例如,与得分为150的应用程序相比,得分为130分的应用程序的违约几率要高一倍。
在结果中,有几个有用的图表和表格,包括记分卡,分数分布,KS图,权衡图和许多其他。
输出变量和不利特征请注意,从导出的数据集中,记分卡节点会创建多个变量。带有前缀SCR_的变量是记分卡中每个变量的记分卡点,SCORECARD_POINTS是每个应用程序的总点数。
当您指定记分卡属性生成报告=是以输出不良特征时,您的结果还将包括每个观察结果降低得分最多的变量。您最多可以选择5种不利特征。作为如何解释此列的示例,对于下面数据集的第一次观察,扣除了14个得分点,因为贷款的目的标记为1,3,8,缺失或未知。
▍需要帮助?联系我们
最受欢迎的见解
1.R语言多元Logistic逻辑回归 应用案例
2.面板平滑转移回归(PSTR)分析案例实现
3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
4.R语言泊松Poisson回归模型分析案例
5.R语言回归中的Hosmer-Lemeshow拟合优度检验
6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现
7.在R语言中实现Logistic逻辑回归
8.python用线性回归预测股票价格
9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标
拓端tecdat|使用SAS Enterprise Miner进行数据挖掘:信用评分构建评分卡模型相关推荐
- 使用SAS Enterprise Miner进行数据挖掘:信用评分构建评分卡模型
标签: 数据挖掘 风险管理 技巧和窍门 最近我们被客户要求撰写关于信用记分卡的研究报告. 信用记分卡一直是信用评分的标准模型,因为它们易于理解,使您能够轻松评分新数据-即计算新客户的信用评分.本文将指 ...
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- 拓端tecdat|bilibili视频流量数据潜望镜
最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...
- 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...
- 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...
- 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例
最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- Lending Club Data For Scorecard Development in SAS Enterpise Miner
使用SAS Enterprise Miner构建信用评分卡 组件 Credit Exchange Node Interactive Grouping Node Reject Inference Nod ...
- Adaptec by PMC 联合希捷公司现场演示高性能端到端12Gb/s SAS存储解决方案
采用 PMC8063 RoC芯片演示最新12Gb SAS RAID技术 中国北京, 2013年4月8日--引领大数据连接.传送以及存储,提供创新半导体解决方案的PMC®公司(纳斯达克代码:PMCS)今 ...
最新文章
- 深度学习发展下的“摩尔困境”,人工智能又将如何破局?
- Pheatmap热图的绘制及如何调整图片
- (文末有福利)口罩检测覆盖公有云、私有化及SDK等形态,拿来即用精准高效
- 一段树状无限制级代码
- 微课|玩转Python轻松过二级:第3章课后习题解答6
- 【Java从0到架构师】Redis 基础 - 数据类型
- Python 小白学习
- vue-项目完成的项目报告
- python excel 颜色填充 excel样式
- C++取字符串长度函数三种方法
- CC++初学者编程教程(6) 配置WindowsXP虚拟机与VC6.0
- 流媒体直播协议与比较
- 微信小程序-从相册获取图片,视频 使用相机拍照,录像上传+服务器(nodejs版)接收
- css中图片在div中的位置,纯CSS实现任意图片在div中垂直居中
- 单利模式的优缺点和使用场景
- 《信用管理》--信用评分方法
- etax导入账户不让勾选_勾选认证详解及常见问题分析
- 服务器管理员账号sa,一次利用MSSQL的SA账户提权获取服务器权限
- 报错:Module parse failed: ‘return‘ outside of function (4:1) You may need an appropriate loader
- 使用Web前端技术实现的梦幻VR虚拟现实效果