使用逻辑回归制作评分卡
1、什么是评分卡?
在银行借贷场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,一般来说,评分卡打出的分数越高,客户的信用越好,风险越小。
2、评分卡怎么使用?
对于需要借贷的个人或者公司,在借贷时需要填写一张表格,表格内容包括年龄,收入,家庭人口数量等等。评分卡将每个特征划分为几个区间,每个区间有一个分数。根据客户所填信息对照评分卡,为客户所填的每一个特征赋一个分数,最后相加计算这个用户的总得分。依据总得分评估他的信用程度。
3、怎么使用逻辑回归制作评分卡?
制作评分卡需要大量客户所填的信息(特征矩阵X),以及该客户是否违约的信息(标签Y)。
(1)对特征矩阵X进行数据预处理。包括去除重复值,填补缺失值(仅有极少数样本缺失该特征可考虑直接删除该特征,可使用均值填补家庭人数,随机森林填补收入等),处理异常值,处理样本不均衡问题(使用过采样和欠采样的方法),但是我们一般不对数据进行标准化处理(这是因为我们给出的评分卡是给业务人员看的,而客户所填信息天生就是量纲不统一的)。
(2)找出每个特征最佳分箱数和箱子边界。最佳分箱数就是使得该特征的IV值尽量在最佳IV值区间的箱子个数(尽量提高每个特征的重要性),并且使得该特征的箱内相似,箱间差异大。因此步骤是这样的:首先确定一个较大的分箱数,进行等频分箱,计算各箱WOE值和特征的IV值,然后依据卡方检验值合并相似箱子,再次计算各箱WOE值以及该特征IV值,直到箱子数量变为一个较小值。画出分箱数-IV值曲线,找出最佳分箱数和各箱边界。
(3)对各个特征依据最佳分箱边界进行分箱。分箱后得到特征的各箱边界以及WOE值。
(4)处理训练集和测试集的特征矩阵X。将特征矩阵中的值全部替换为对应箱子的WOE值。
(5)使用训练集进行建模,使用测试集计算模型得分,并且利用学习曲线调整正则化系数C和最大迭代次数max_iter提高模型得分。
(6)制作评分卡。根据该公式的值计算出系数A和B的值,根据逻辑回归得到的截距lr.intercept_、各特征系数lr_coef_。用base_score = A - B*lr.intercept_公式计算该评分卡的基准值,用col_score = woeall["i_colName"] * (-B*lr.coef_[0][i])计算各特征的分数列表(每个箱子对应一个分数),其中woeall["i_colName"]是i特征的箱子边界列表和对应的WOE值列表。
4、为什么要使用逻辑回归制作评分卡?
评分卡制作其实就是将连续的特征离散化(分箱),且为每一个离散值赋一个分数(该箱的WOE值)。其中逻辑回归的截距用于计算评分卡基准值;逻辑回归系数表示各个特征在判别标签时的重要程度;各箱的woe值用于逻辑回归建模时代替特征矩阵X原始值带入计算。
转载于:https://www.cnblogs.com/simpleDi/p/10227472.html
使用逻辑回归制作评分卡相关推荐
- sklearn_逻辑回归制作评分卡_菜菜视频学习笔记
逻辑回归制作评分卡 3.0 前言 逻辑回归与线性回归的关系 消除特征间的多重共线性 为什么使用逻辑回归处理金融领域数据 正则化的选择 特征选择的方法 分箱的作用 3.1导库 3.2数据预处理 3.2. ...
- 案例:用逻辑回归制作评分卡
文章目录 1. 探索数据与数据预处理 (1)去重 (2)填补缺失值 用平均值来填补家庭成员 用随机森林填补MonthlyIncome字段 (3)描述性统计处理异常值 (4)为什么不统一量纲,也不标准化 ...
- python机器学习之用逻辑回归制作评分卡(个人消费类贷款数据案例实战)
评分卡 本文所用数据下载地址-->点这里下载个人消费类贷款数据 一个完整的模型开发流程,需要有以下流程: 一.数据清洗 1.导库,获取数据 import numpy as np import p ...
- sklearn专题五:用逻辑回归制作评分卡
目录 3.1 导库,获取数据 3.2 探索数据与数据预处理 3.2.1 去除重复值 3.2.2 填补缺失值 3.2.3 描述性统计处理异常值 3.2.4 为什么不统一量纲,也不标准化数据分布? 3.2 ...
- 用逻辑回归制作评分卡
目录 一.评分卡 二.导库,获取数据 三.探索数据与数据预处理 1.去除重复值 2.填补缺失值 3.描述性统计处理异常值 4.为什么不统一量纲,也不标准化数据分布 5.样本不均衡问题 6.分训练集和测 ...
- 【菜菜的sklearn课堂笔记】逻辑回归与评分卡-用逻辑回归制作评分卡-分箱
视频作者:菜菜TsaiTsai 链接:[技术干货]菜菜的机器学习sklearn[全85集]Python进阶_哔哩哔哩_bilibili 分训练集和测试集 from sklearn.model_sele ...
- sklearn实战-----5.逻辑回归与评分卡
1 概述 1.1 名为"回归"的分类器 在过去的四周中,我们接触了不少带"回归"二字的算法,回归树,随机森林的回归,无一例外他们都是区别于分类 算法们,用来处理 ...
- 《如何搭建小微企业风控模型》第十一节 逻辑回归与评分卡 节选
<如何搭建小微企业风控模型>第十一节 逻辑回归与评分卡 节选 第一章 小微企业数据风控技术的框架 小微企业数据贷发展情况概述 搭建小微企业风控模型所需知识 风控模型概览 第二章 强相关变量 ...
- sklearn实战之逻辑回归与制作评分卡
sklearn实战系列: (1) sklearn实战之决策树 (2) sklearn实战之随机森林 (3) sklearn实战之数据预处理与特征工程 (4) sklearn实战之降维算法PCA与SVD ...
最新文章
- Java 线程状态之 WAITING
- VMware提示:已将该虚拟机配置为使用 64 位客户机操作系统。但是,无法执行 64 位操作。解决方案...
- 6月8号=》105页-110页
- leetcode题目整数颠倒
- asp.net中条件查询+分页
- java规则表达式_Java基础--正则表达式的规则
- MS SQL Server 常用操作
- 多次访问redis造成redis连接总是断开的解决方案
- 关于parseInt()里的一些小坑
- mysql和python先学哪个_Python数据库操作 初识mysql和mysql基本操作#学习猿地
- 自动化测试框架selenium+java+TestNG——配置篇
- jBridge避开云服务器让AI算力落地的桥联框架技术
- tomcat访问html文件
- 计算机空格键作用,笔记本电脑键盘上的空格键和Enter键不起作用. 怎么办?
- python抓取网站数据并图形化显示(二)
- vnc远程控制软件7款,盘点7款好用的vnc远程控制软件
- 基于Microhard P900无人机PIX飞控远距离数传解决方案
- pytorch安装(离线包)
- Codeforces 1179C Serge and Dining Room 线段树
- elementUI表格头添加图标-鼠标移入显示el-tooltip提示信息
热门文章
- MIT最新课程:一文看尽深度学习各领域最新突破(附视频、PPT)
- 《机器学习实战》配套代码下载
- 两种方式带你爬点你想要的东西
- caffe to pytorch
- 如何远程访问Jetson Xavier/TX2
- 向程序发送命令失败_java程序员进阶:Redis分布式技术问题集锦
- 两个pv挂一个vg_两个pv挂一个vg_VG解散LOL分部,LPL官网提前改名,下赛季被“RA”收购...
- POI EXCEL读取 性能问题
- mac在命令行里获取root权限
- JBox2D For Android - hello box2d