上一篇主要用了LR,SVM,DecisionTree三种模型进行预测。这一篇将用随机森林,GBDT,XGBoost,LightGBM四种模型解决这个问题。

所需的包的安装

这里需要我们去安装xgboost和lightgbm的包。这里我用的开发环境是VScode+anacoda。下面先安装xgboost。可以在下面的地址中找到.whl文件         

https://www.lfd.uci.edu/~gohlke/pythonlibs/

可以在这个网站中找到Xgboost的相关包,选择合适的操作系统和python版本进行下载

接下来打开Anacoda Prompt进入存放下载的 .whl文件的目录,接下来键入

pip install xgboost‑0.81‑cp37‑cp37m‑win_amd64.whl

后面的一大串就是文件名记得要打完整,LightGBM可以在这个网站内下载https://pypi.org/project/lightgbm/2.0.3/#files。后序的安装也是上述步骤类似的

数据划分

这一部分和上次的一样,需要导入相关的包。并获取训练集

import pandas as pd
from xgboost import XGBClassifier
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import GradientBoostingClassifier
from lightgbm import LGBMClassifierdata_all = pd.read_csv('D:\\data_all.csv',encoding='gbk')#features = [x for x in data_all.columns if x not in ['status']]
#X = data_all[features]
X = data_all.drop(['status'],axis = 1)
y = data_all['status']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,random_state=2018)

数据标准化

#数据标准化
scaler = StandardScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

四种模型的训练和评分

接下来分别构建四种模型,并对其评分

#RandomForest
rft = RandomForestClassifier()
rft.fit(X_train,y_train)
#GBDT
gb = GradientBoostingClassifier()
gb.fit(X_train,y_train)
#XGBoost
xgb_c = XGBClassifier()
xgb_c.fit(X_train,y_train)
#LightGBM
lgbm_c = LGBMClassifier()
lgbm_c.fit(X_train,y_train)
#打印四种模型的得分
print(rft.score(X_test,y_test))
print(gb.score(X_test,y_test))
print(xgb_c.score(X_test,y_test))
print(lgbm_c.score(X_test,y_test))

最后我们得到了四种模型的得分

0.7771548703573932
0.7792571829011913
0.7841625788367204
0.7834618079887876

转载于:https://www.cnblogs.com/mambakb/p/10146865.html

金融贷款逾期的模型实现(二)相关推荐

  1. 金融贷款逾期的模型构建6——特征选择

    文章目录 一.IV值 1.概述 2.IV计算 (1)WOE (2)IV 计算 二.实现 0.相关模块 1.IV值 2.Random Forest 3.特征合并 4.模型构建 5.模型评估 数据传送门( ...

  2. 金融贷款逾期的模型构建5——数据预处理

    文章目录 一.相关库 二.数据读取 三.数据清洗--删除无关.重复数据 四.数据清洗--类型转换 1.数据集划分 2.缺失值处理 3.异常值处理 4.离散特征编码 5.日期特征处理 6.特征组合 五. ...

  3. 金融贷款逾期的模型构建1

    数据 data_all.csv文件是非原始数据,已经处理过了.数据是金融数据, 我们要做的是预测贷款用户是否会逾期.表格中, status是标签: 0表示未逾期, 1表示逾期. 任务--模型构建 给定 ...

  4. 金融贷款逾期的模型构建7——模型融合

    文章目录 一.集成学习 1.Bagging 2.Boosting 3.Stacking (1)核心图解 a.构建新的训练集 b.构建新的测试集 c.最终的训练与预测 (2)示例 a.构建新的训练集 b ...

  5. 金融贷款逾期的模型构建4——模型调优

    文章目录 一.任务 二.概述 1.参数说明 2.常用方法 二.实现 1.模块引入 2.模型评估函数 3.数据读取 4.Logistic Regression (1)调参部分 (2)模型评估 5.SVM ...

  6. 金融贷款逾期的模型构建3——模型评估

    文章目录 一.评价指标 1.基本概念 2.准确率(accuracy) 3.精确率(precision) 4.召回率(recall) 5.F1值 6.roc曲线 和 auc值 二.模型评估 1.Logi ...

  7. 金融贷款逾期的模型构建2——集成模型

    任务--模型构建 构建随机森林.GBDT.XGBoost和LightGBM这4个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值. 1.相关安装资源 随机森林.GBDT均在sklear ...

  8. 一周算法实践---金融贷款逾期模型

    金融贷款逾期模型 1.读取数据 import pandas as pd data_all = pd.read_csv('../data/data_all.csv')` 2.划分数据集 from skl ...

  9. 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析

    数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 目录 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 1.引言 2.基本知识点 2.1缺失值(Missing data) 2.1.1缺失 ...

  10. 【机器学习】数据挖掘实战:金融贷款分类模型和时间序列分析

    今天给大家带来一个企业级数据挖掘实战项目,金融贷款分类模型和时间序列分析,文章较长,建议收藏! 如果本文对你有所帮助,记得文末点赞和在看,也可分享给你需要的朋友- 项目背景 银行和其他金融贷款机构经常 ...

最新文章

  1. 2022-2028年中国安防视频行业市场前景分析预测报告
  2. [转]ASP.NET 缓存(十六)--检索缓存项的值
  3. [toolchains]-ARM ToolChains介绍
  4. 【机器学习】分类算法-K-近邻算法
  5. 深度阅读之《Concurrency in Go》
  6. python图书管理系统
  7. LeetCode--85.最大矩形(单调栈)
  8. 计算机术语列是,计算机术语-RAM ROM
  9. 教你怎样做项目开发总结报告[转]
  10. 今日头条正式发布小程序
  11. 计算机职称考试试题 操作题,2018职称计算机考试Excel备考试题及答案9-excel操作练习题...
  12. 计算机字体安装按钮灰色,win10系统无法安装字体安装按钮灰色的的解决方法
  13. RestSharp是什么?
  14. ffmpeg sdk 的一些资料博客地址
  15. Spring GA、PRE、SNAPSHOT 版本含义及区别
  16. Windows下编译语音识别引擎Wenet
  17. 计算机操作基础知识软件,计算机操作基础知识题库.pdf
  18. Linux—系统关机命令详解
  19. AquaMoon and Strange Sort CodeForces - 1546C(思维)
  20. 世界观、认识论、方法论与知识

热门文章

  1. 2-13 搭建LAMP环境并部署Ucenter和Ucenter-home网站
  2. Android Beacon开发
  3. [蓝牙 Mesh Zephyr]-[001]-Mesh beacon
  4. [thrift] thrift基本原理及使用
  5. 不容错过 食材VRay材质球素材推荐
  6. 1.4版走迷宫小游戏
  7. openldap中的Mirror mode模式中的主主同步
  8. Python黑客攻防(十六)编写Dos脚本,进行简单攻击演示
  9. 一文搞懂如何兼容苹果HomeKit?智汀助你轻松打造智慧家庭
  10. 计算机读研的收获和遗憾