金融贷款逾期的模型实现(二)
上一篇主要用了LR,SVM,DecisionTree三种模型进行预测。这一篇将用随机森林,GBDT,XGBoost,LightGBM四种模型解决这个问题。
所需的包的安装
这里需要我们去安装xgboost和lightgbm的包。这里我用的开发环境是VScode+anacoda。下面先安装xgboost。可以在下面的地址中找到.whl文件
https://www.lfd.uci.edu/~gohlke/pythonlibs/
可以在这个网站中找到Xgboost的相关包,选择合适的操作系统和python版本进行下载
接下来打开Anacoda Prompt进入存放下载的 .whl文件的目录,接下来键入
pip install xgboost‑0.81‑cp37‑cp37m‑win_amd64.whl
后面的一大串就是文件名记得要打完整,LightGBM可以在这个网站内下载https://pypi.org/project/lightgbm/2.0.3/#files。后序的安装也是上述步骤类似的
数据划分
这一部分和上次的一样,需要导入相关的包。并获取训练集
import pandas as pd from xgboost import XGBClassifier from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import GradientBoostingClassifier from lightgbm import LGBMClassifierdata_all = pd.read_csv('D:\\data_all.csv',encoding='gbk')#features = [x for x in data_all.columns if x not in ['status']] #X = data_all[features] X = data_all.drop(['status'],axis = 1) y = data_all['status'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,random_state=2018)
数据标准化
#数据标准化 scaler = StandardScaler() scaler.fit(X_train) X_train = scaler.transform(X_train) X_test = scaler.transform(X_test)
四种模型的训练和评分
接下来分别构建四种模型,并对其评分
#RandomForest rft = RandomForestClassifier() rft.fit(X_train,y_train) #GBDT gb = GradientBoostingClassifier() gb.fit(X_train,y_train) #XGBoost xgb_c = XGBClassifier() xgb_c.fit(X_train,y_train) #LightGBM lgbm_c = LGBMClassifier() lgbm_c.fit(X_train,y_train) #打印四种模型的得分 print(rft.score(X_test,y_test)) print(gb.score(X_test,y_test)) print(xgb_c.score(X_test,y_test)) print(lgbm_c.score(X_test,y_test))
最后我们得到了四种模型的得分
0.7771548703573932 0.7792571829011913 0.7841625788367204 0.7834618079887876
转载于:https://www.cnblogs.com/mambakb/p/10146865.html
金融贷款逾期的模型实现(二)相关推荐
- 金融贷款逾期的模型构建6——特征选择
文章目录 一.IV值 1.概述 2.IV计算 (1)WOE (2)IV 计算 二.实现 0.相关模块 1.IV值 2.Random Forest 3.特征合并 4.模型构建 5.模型评估 数据传送门( ...
- 金融贷款逾期的模型构建5——数据预处理
文章目录 一.相关库 二.数据读取 三.数据清洗--删除无关.重复数据 四.数据清洗--类型转换 1.数据集划分 2.缺失值处理 3.异常值处理 4.离散特征编码 5.日期特征处理 6.特征组合 五. ...
- 金融贷款逾期的模型构建1
数据 data_all.csv文件是非原始数据,已经处理过了.数据是金融数据, 我们要做的是预测贷款用户是否会逾期.表格中, status是标签: 0表示未逾期, 1表示逾期. 任务--模型构建 给定 ...
- 金融贷款逾期的模型构建7——模型融合
文章目录 一.集成学习 1.Bagging 2.Boosting 3.Stacking (1)核心图解 a.构建新的训练集 b.构建新的测试集 c.最终的训练与预测 (2)示例 a.构建新的训练集 b ...
- 金融贷款逾期的模型构建4——模型调优
文章目录 一.任务 二.概述 1.参数说明 2.常用方法 二.实现 1.模块引入 2.模型评估函数 3.数据读取 4.Logistic Regression (1)调参部分 (2)模型评估 5.SVM ...
- 金融贷款逾期的模型构建3——模型评估
文章目录 一.评价指标 1.基本概念 2.准确率(accuracy) 3.精确率(precision) 4.召回率(recall) 5.F1值 6.roc曲线 和 auc值 二.模型评估 1.Logi ...
- 金融贷款逾期的模型构建2——集成模型
任务--模型构建 构建随机森林.GBDT.XGBoost和LightGBM这4个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值. 1.相关安装资源 随机森林.GBDT均在sklear ...
- 一周算法实践---金融贷款逾期模型
金融贷款逾期模型 1.读取数据 import pandas as pd data_all = pd.read_csv('../data/data_all.csv')` 2.划分数据集 from skl ...
- 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析
数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 目录 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 1.引言 2.基本知识点 2.1缺失值(Missing data) 2.1.1缺失 ...
- 【机器学习】数据挖掘实战:金融贷款分类模型和时间序列分析
今天给大家带来一个企业级数据挖掘实战项目,金融贷款分类模型和时间序列分析,文章较长,建议收藏! 如果本文对你有所帮助,记得文末点赞和在看,也可分享给你需要的朋友- 项目背景 银行和其他金融贷款机构经常 ...
最新文章
- 2022-2028年中国安防视频行业市场前景分析预测报告
- [转]ASP.NET 缓存(十六)--检索缓存项的值
- [toolchains]-ARM ToolChains介绍
- 【机器学习】分类算法-K-近邻算法
- 深度阅读之《Concurrency in Go》
- python图书管理系统
- LeetCode--85.最大矩形(单调栈)
- 计算机术语列是,计算机术语-RAM ROM
- 教你怎样做项目开发总结报告[转]
- 今日头条正式发布小程序
- 计算机职称考试试题 操作题,2018职称计算机考试Excel备考试题及答案9-excel操作练习题...
- 计算机字体安装按钮灰色,win10系统无法安装字体安装按钮灰色的的解决方法
- RestSharp是什么?
- ffmpeg sdk 的一些资料博客地址
- Spring GA、PRE、SNAPSHOT 版本含义及区别
- Windows下编译语音识别引擎Wenet
- 计算机操作基础知识软件,计算机操作基础知识题库.pdf
- Linux—系统关机命令详解
- AquaMoon and Strange Sort CodeForces - 1546C(思维)
- 世界观、认识论、方法论与知识