1、什么是评分卡?

在银行借贷场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,一般来说,评分卡打出的分数越高,客户的信用越好,风险越小。

2、评分卡怎么使用?

对于需要借贷的个人或者公司,在借贷时需要填写一张表格,表格内容包括年龄,收入,家庭人口数量等等。评分卡将每个特征划分为几个区间,每个区间有一个分数。根据客户所填信息对照评分卡,为客户所填的每一个特征赋一个分数,最后相加计算这个用户的总得分。依据总得分评估他的信用程度。

3、怎么使用逻辑回归制作评分卡?

制作评分卡需要大量客户所填的信息(特征矩阵X),以及该客户是否违约的信息(标签Y)。

(1)对特征矩阵X进行数据预处理。包括去除重复值,填补缺失值(仅有极少数样本缺失该特征可考虑直接删除该特征,可使用均值填补家庭人数,随机森林填补收入等),处理异常值,处理样本不均衡问题(使用过采样和欠采样的方法),但是我们一般不对数据进行标准化处理(这是因为我们给出的评分卡是给业务人员看的,而客户所填信息天生就是量纲不统一的)。

(2)找出每个特征最佳分箱数和箱子边界。最佳分箱数就是使得该特征的IV值尽量在最佳IV值区间的箱子个数(尽量提高每个特征的重要性),并且使得该特征的箱内相似,箱间差异大。因此步骤是这样的:首先确定一个较大的分箱数,进行等频分箱,计算各箱WOE值和特征的IV值,然后依据卡方检验值合并相似箱子,再次计算各箱WOE值以及该特征IV值,直到箱子数量变为一个较小值。画出分箱数-IV值曲线,找出最佳分箱数和各箱边界。

(3)对各个特征依据最佳分箱边界进行分箱。分箱后得到特征的各箱边界以及WOE值。

(4)处理训练集和测试集的特征矩阵X。将特征矩阵中的值全部替换为对应箱子的WOE值。

(5)使用训练集进行建模,使用测试集计算模型得分,并且利用学习曲线调整正则化系数C和最大迭代次数max_iter提高模型得分。

(6)制作评分卡。根据该公式的值计算出系数A和B的值,根据逻辑回归得到的截距lr.intercept_、各特征系数lr_coef_。用base_score = A - B*lr.intercept_公式计算该评分卡的基准值,用col_score = woeall["i_colName"] * (-B*lr.coef_[0][i])计算各特征的分数列表(每个箱子对应一个分数),其中woeall["i_colName"]是i特征的箱子边界列表和对应的WOE值列表。

4、为什么要使用逻辑回归制作评分卡?

评分卡制作其实就是将连续的特征离散化(分箱),且为每一个离散值赋一个分数(该箱的WOE值)。其中逻辑回归的截距用于计算评分卡基准值;逻辑回归系数表示各个特征在判别标签时的重要程度;各箱的woe值用于逻辑回归建模时代替特征矩阵X原始值带入计算。

转载于:https://www.cnblogs.com/simpleDi/p/10227472.html

使用逻辑回归制作评分卡相关推荐

  1. sklearn_逻辑回归制作评分卡_菜菜视频学习笔记

    逻辑回归制作评分卡 3.0 前言 逻辑回归与线性回归的关系 消除特征间的多重共线性 为什么使用逻辑回归处理金融领域数据 正则化的选择 特征选择的方法 分箱的作用 3.1导库 3.2数据预处理 3.2. ...

  2. 案例:用逻辑回归制作评分卡

    文章目录 1. 探索数据与数据预处理 (1)去重 (2)填补缺失值 用平均值来填补家庭成员 用随机森林填补MonthlyIncome字段 (3)描述性统计处理异常值 (4)为什么不统一量纲,也不标准化 ...

  3. python机器学习之用逻辑回归制作评分卡(个人消费类贷款数据案例实战)

    评分卡 本文所用数据下载地址-->点这里下载个人消费类贷款数据 一个完整的模型开发流程,需要有以下流程: 一.数据清洗 1.导库,获取数据 import numpy as np import p ...

  4. ​sklearn专题五:用逻辑回归​制作评分卡

    目录 3.1 导库,获取数据 3.2 探索数据与数据预处理 3.2.1 去除重复值 3.2.2 填补缺失值 3.2.3 描述性统计处理异常值 3.2.4 为什么不统一量纲,也不标准化数据分布? 3.2 ...

  5. 用逻辑回归制作评分卡

    目录 一.评分卡 二.导库,获取数据 三.探索数据与数据预处理 1.去除重复值 2.填补缺失值 3.描述性统计处理异常值 4.为什么不统一量纲,也不标准化数据分布 5.样本不均衡问题 6.分训练集和测 ...

  6. 【菜菜的sklearn课堂笔记】逻辑回归与评分卡-用逻辑回归制作评分卡-分箱

    视频作者:菜菜TsaiTsai 链接:[技术干货]菜菜的机器学习sklearn[全85集]Python进阶_哔哩哔哩_bilibili 分训练集和测试集 from sklearn.model_sele ...

  7. sklearn实战-----5.逻辑回归与评分卡

    1 概述 1.1 名为"回归"的分类器 在过去的四周中,我们接触了不少带"回归"二字的算法,回归树,随机森林的回归,无一例外他们都是区别于分类 算法们,用来处理 ...

  8. 《如何搭建小微企业风控模型》第十一节 逻辑回归与评分卡 节选

    <如何搭建小微企业风控模型>第十一节 逻辑回归与评分卡 节选 第一章 小微企业数据风控技术的框架 小微企业数据贷发展情况概述 搭建小微企业风控模型所需知识 风控模型概览 第二章 强相关变量 ...

  9. sklearn实战之逻辑回归与制作评分卡

    sklearn实战系列: (1) sklearn实战之决策树 (2) sklearn实战之随机森林 (3) sklearn实战之数据预处理与特征工程 (4) sklearn实战之降维算法PCA与SVD ...

最新文章

  1. Java 线程状态之 WAITING
  2. VMware提示:已将该虚拟机配置为使用 64 位客户机操作系统。但是,无法执行 64 位操作。解决方案...
  3. 6月8号=》105页-110页
  4. leetcode题目整数颠倒
  5. asp.net中条件查询+分页
  6. java规则表达式_Java基础--正则表达式的规则
  7. MS SQL Server 常用操作
  8. 多次访问redis造成redis连接总是断开的解决方案
  9. 关于parseInt()里的一些小坑
  10. mysql和python先学哪个_Python数据库操作 初识mysql和mysql基本操作#学习猿地
  11. 自动化测试框架selenium+java+TestNG——配置篇
  12. jBridge避开云服务器让AI算力落地的桥联框架技术
  13. tomcat访问html文件
  14. 计算机空格键作用,笔记本电脑键盘上的空格键和Enter键不起作用. 怎么办?
  15. python抓取网站数据并图形化显示(二)
  16. vnc远程控制软件7款,盘点7款好用的vnc远程控制软件
  17. 基于Microhard P900无人机PIX飞控远距离数传解决方案
  18. pytorch安装(离线包)
  19. Codeforces 1179C Serge and Dining Room 线段树
  20. elementUI表格头添加图标-鼠标移入显示el-tooltip提示信息

热门文章

  1. MIT最新课程:一文看尽深度学习各领域最新突破(附视频、PPT)
  2. 《机器学习实战》配套代码下载
  3. 两种方式带你爬点你想要的东西
  4. caffe to pytorch
  5. 如何远程访问Jetson Xavier/TX2
  6. 向程序发送命令失败_java程序员进阶:Redis分布式技术问题集锦
  7. 两个pv挂一个vg_两个pv挂一个vg_VG解散LOL分部,LPL官网提前改名,下赛季被“RA”收购...
  8. POI EXCEL读取 性能问题
  9. mac在命令行里获取root权限
  10. JBox2D For Android - hello box2d