参考:https://www.kuxiao.cn/course/pc-course-learning.html?cid=C59acca6fa17eb456c650e849

一、商业理解

信用,对个人和企业都是无比重要的品质。比如有了信用,个人可以向银行申请信用卡,可以透支国际长途电话费、汽车保险打折等。对于企业,则可以大量透支和贷款。所以,银行考查客户的信用状况是非常重要的事情。

信用评分

  • 信用评分的方法是什么?
    信用评分是使用统计模型的方法来对潜在客户和已有客户进行贷款风险评价的方法。
  • 怎样计算客户的信用评分?
    随着这种统计建模的方法的成熟应用,其思路已被广泛推广,诸如欺诈评分、市场响应评分等领域。
  • 怎样考查客户的信用?
    在美国,客户信用评分系统主要由FICO公司推出。FICO的评分系统得出,信用评分范围在300-850分之间,评分越高,违约率越低。在我国银行业,比较通用的方法也是类似的形式 。评分特别低和特别高的客户很少,大多数评分中等。
  • 信用评分卡优缺点:
    优点 :便于理解和使用,容易被各层次的人员了解和使用;
    缺点 :假定各项因素对信用的影响关系是线性组合的。该假定在现实中并不普遍成立。

二、数据理解

  • QUESTION 1:怎样将贷款风险问题转化为数据挖掘问题?
    ►小额贷款问题可以理解为有目标变量的预测问题,根据目标变量是否违约,来预测信贷帐号是否有风险。
    ►客户是否按期归还贷款?
    ►银行把按期归还贷款理解为”好“的信贷帐号,对应的客户为”好“客户
    ►把不能按期归还贷款的理解为”坏“的信贷帐号,对应的客户为”坏“客户。
  • QUESTION 2:如何获取数据?
    银行可以从系统中提取大量关于贷款人的资金使用、消费、以及还贷款的情况数据,这些数据包括(但不限于)以下变量:
    ►帐户存在时间
    ►过去12个月最严重的拖欠行为(没有拖欠、1个月拖欠、两个月拖欠等)
    ►过去12个月的平均贷款金额
    ►过去6个月的还款占欠款比例
    ►过去6个月现金提取占交易金额比例
    ►过去6个月平均刷卡额
    ►过去6个月消费(刷卡)类型。。。。。
实验采用数据 — 小额贷款.csv

三、数据准备

离散化

►离散化可以降低异常数值的影响
►离散化使贝叶斯评分模型更易理解

四、建立模型

4.1 建立模型与模型评估

  • 建立什么模型?
    朴素贝叶斯模型,预测违约评分(0~1)
  • 朴素贝叶斯模型有什么问题?
    对于违约的预测能力差:违约类的查全率很小,接近0
  • 为什么存在这个问题?
    在朴素贝叶斯模型中,判定违约的后验概率confidence(1)的阈值设定为0.5
  • 如何解决这个问题?
    ♦ 修改confidence(1)的阈值
    ♦ 修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小
  • 修改方法:
    ♦ 从0开始,每次将阈值加1%
    ♦ 计算阈值对应的分类代价,取最小的分类代价及其对应的阈值

4.2 建立朴素贝叶斯违约评分模型

  1. Declare Missing Value
    将“收入”字段中值为100000.0判定为缺失值
    将“在现住址时间”和在现工作时间“值为999判定为缺失值
  1. Discretize
    离散化,记得将离散化类型定为标量化属性interval,用于后期贝叶斯分类,同时remove useless

  2. Loop
    子过程- 循环计算分类代价
    生成变量iteration,从1开始每次循环加1,直到50

    1)Generate Macro
    function description: threadhold=%{iteration}*0.01
    2)Validation

    3)Generate Attributes
    function description: threshold=%{threshold}

  3. append
    将每次循环得到的结果整合在一起

要使修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小,选取分数最低值的threadhold,即最佳阈值

4.3 保存朴素贝叶斯模型

五、模型应用

1)Generate Attributes
记得将模型训练时的离散化结果应用到测试集,这样模型才能有效运行

2)Create Threadhold
应用模型训练时得到的最佳阈值

银行信用风险预测分析相关推荐

  1. 利用预测分析改进欠款催收策略,控制欺诈风险和信贷风险

    前提摘要 在数字经济新时代,金融服务主管正在寻求方法去细分他们的产品和市场,保持与客户的联系,寻找能够推动增长和收入的新市场,并利用可以增加优势和降低风险的新技术. 在拥有了众多可用数据之后,金融机构 ...

  2. 疯狂的机器学习实战-银行营销预测

    机器学习实战-银行营销预测 问题: 数据集: 链接:https://pan.baidu.com/s/1TUOLr8jFbT38p_iUh1iBsQ 提取码:1234 银行营销数据集 这些数据与葡萄牙银 ...

  3. 银行流失用户分析及预测模型

    自学的一个银行流失客户预警的小项目 0.引言-银行流失用户分析 银行客户流失是指银行的客户终止在该行的所有业务,并销号.但在实际运营中,对于具体业务部门,银行客户流失可以定位为特定的业务终止行为. 商 ...

  4. 8大预测分析工具比较

    什么是预测分析工具? 预测分析工具融合了人工智能和业务报告.这些工具包括用于从整个企业收集数据的复杂管道,添加统计分析和机器学习层以对未来进行预测,并将这些见解提炼成有用的摘要,以便业务用户可以对此采 ...

  5. 银行股价预测——基于pytorch框架RNN神经网络

    银行股价预测--基于pytorch框架RNN神经网络 任务目标 数据来源 完整代码 流程分析 1.导包 2.读入数据并做预处理 3.构建单隐藏层Rnn模型 4.设计超参数,训练模型 5.加载模型,绘图 ...

  6. 2022-2028年中国手机配件行业发展前景战略及投资风险预测分析报告

    [报告类型]产业研究 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了手机配件行业相关概述.中国手机配件行业运行环境.分析了中国手机配件行 ...

  7. LL(1)预测分析表的构造

    LL(1)分析法(即预测分析法)是自上而下文法中的一种,使用这种方法需要用到LL(1)预测分析表. 前提:掌握了FIRST集和FOLLOW集的构造. 步骤:对于每一个产生式A→α (1) 对每个终结符 ...

  8. 营销自动化的4大预测分析错误

    预测分析是数字营销的新领域.许多专家已经讨论了将预测分析与营销自动化工具(如HubSpot和Marketo)合并的好处. 将预测分析整合到用户的营销自动化策略中可能非常有益,但也很难执行.以下是可能会 ...

  9. 计算机书籍-数据挖掘与预测分析

    书名:数据挖掘与预测分析(第2版) 作者:[美]Daniel T. Larose,Chantal D. Larose 出版社:清华大学出版社 出版时间:2017年02月 鼠标

最新文章

  1. 每日一篇——lodash—array——differenceBy
  2. 超详细解读ORB-SLAM3 单目初始化过程(上篇)
  3. 如何查找计算机开机项,怎么查看电脑启动项 电脑开
  4. 5新标签中超链接_一环路新标签——“市井生活圈” 正在更新中......
  5. 使用Mysql工具进行数据清洗
  6. Leetcode每日一题:290.word-pattern(单词规律)
  7. web容器 Spring容器 SpringMVC容器 的关系
  8. 2018年高教社杯全国大学生数学建模竞赛A题解题思路
  9. RSA 非对称加密之 PKCS8 格式秘钥
  10. 使用python根据图片链接下载图片
  11. kali linux wine乱码,Kali安装Wine
  12. 前端实现base64解码编码
  13. ZUCC计算机网络 网络层(一)
  14. Millet谷仓:新型电商势在必行
  15. LBS 是什么服务?
  16. 天荒地老修仙功-第六部:Spring Cloud Eureka——服务发现
  17. 通过PowerShell管理Office 365的网站
  18. 解除linux中文件被锁状态,linux – 为什么即使文件被锁定,File :: FcntlLock的l_type总是“F_UNLCK”?...
  19. android compose webview视频播放横竖屏切换
  20. MyCat是什么?为什么要用MyCat?

热门文章

  1. Linux 命令(68)—— realpath 命令
  2. git不用每次输入用户名和密码
  3. 简单对数不等式的证明
  4. C语言:判断100-999中哪些数为水仙花数以及拓展应用
  5. 去哪找到高薪工作怎么找
  6. 江南大学c语言课程绩点评分,江南大学本科生学分绩点制实施办法.doc
  7. 省钱兄游戏陪玩小程序APP源码uniapp前端源码适配支持(APP+小程序+H5)
  8. Keras之model.fit_generator()的使用
  9. 2022-2028年中国水玻璃行业竞争格局分析及投资发展研究报告
  10. 新手追高,熟手突破,老手抄底,高手回撤,庄家筹码,机构算法!