[转载] 机器学习 scikit-learn1 预测贷款用户是否会逾期
参考链接: 使用Scikit-Learn在Python中减少维度
scikit-learn 一周算法实践集训
简介代码说明代码目录结构代码使用方法
个人总结参考文档任务1. 逻辑回归模型实践【2018.11.14 - 2018.11.15】任务2.支持向量机和决策树模型实践 【2018.11.15 - 2018.11.16】任务3.构建xgboost和lightgbm模型进行预测【2018.11.16 - 2018.11.18】任务4.模型评分【2018.11.19 - 2018.11.20】任务5. 特征工程 - 数据预处理【2018.11.20 - 2018.11.21】
简介
12个人的小组练习任务 - 提升算法实践能力.
【数据】数据是金融数据, 我们要做的是预测贷款用户是否会逾期. 表格中, status是标签: 0表示未逾期, 1表示逾期. 【学习过程】: 构建模型 - 模型融合 - 模型评估 - 交叉验证 - 模型调参 - 特征工程 【遵循】一次只做一件事, 先实现再优化 【期望目标】掌握数据挖掘的流程, 提升合作的能力.
代码说明
代码目录 https://github.com/spareribs/kaggleSpareribs/tree/master/Overdue
代码目录结构
Overdue
├─dl: 深度学习 TODO
├─ml: 机器学习
│ ├─code
│ │ ├─ sklearn_config.py: 模型配置文件
│ | ├─ sklearn_gcv.py: 模型配置 网络搜索
│ | └─ sklearn_train.py: 模型训练
│ ├─data: 数据存放的目录
│ ├─features:
│ | └─ base.py: 数据预处理
│ └─for beginner: TODO
└─config.py: 全局配置
代码使用方法
【必须】config.py 设置文件存放的路径【必须】先执行 features 中的 base.py 先把数据处理好 [PS:需要根据实际情况修改]【可选】再通过 code 中的 sklearn_gcv.py 搜索模型的最佳配置【必须】最后通过 code 中的 sklearn_train.py 训练模型输出结果
个人总结
机器学习 scikit-learn2 模型实践 - 逻辑回归机器学习 scikit-learn3 模型实践 - 支持向量机和决策树机器学习 scikit-learn4 模型实践 - xgboost和lightgbm机器学习 scikit-learn5 模型评分 - AUC ROC机器学习 scikit-learn6 特征工程 - 数据预处理机器学习 scikit-learn7 网络搜索 - CV & Gird Search
参考文档
任务1. 逻辑回归模型实践【2018.11.14 - 2018.11.15】
爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission1-lr.ipynb Ash:https://blog.csdn.net/truffle528/article/details/84072452 憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84111934 黑桃,等到的过去:https://blog.csdn.net/lgy54321/article/details/84101357 排骨 https://blog.csdn.net/q370835062/article/details/84173260 面朝大海 https://blog.csdn.net/zhangyunpeng0922/article/details/84106715 大范先生,月光疾风:https://blog.csdn.net/weixin_40671804/article/details/84111029 jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb 李碧涵:https://blog.csdn.net/a786150017/article/details/84138846
任务2.支持向量机和决策树模型实践 【2018.11.15 - 2018.11.16】
爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission2-svm-dt.ipynb 憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84169197 Ash:https://blog.csdn.net/truffle528/article/details/84168200 黑桃:https://blog.csdn.net/Heitao5200/article/details/84141345 等到的过去:https://blog.csdn.net/lgy54321/article/details/84145213 面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84136003 排骨:https://blog.csdn.net/q370835062/article/details/84311268 大范先生:https://blog.csdn.net/weixin_40671804/article/details/84144980 月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue/ jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb 李碧涵:https://blog.csdn.net/a786150017/article/details/84138846
任务3.构建xgboost和lightgbm模型进行预测【2018.11.16 - 2018.11.18】
爖:https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission3-xgboost-lightgbm.ipynb 憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84204927 Ash:https://blog.csdn.net/truffle528/article/details/84200976 黑桃:https://blog.csdn.net/Heitao5200/article/details/84196023 等到的过去:https://blog.csdn.net/lgy54321/article/details/84202770 面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84193403 排骨:https://blog.csdn.net/q370835062/article/details/84436395 大范先生:https://blog.csdn.net/weixin_40671804/article/details/84186625 月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue_XGBoost&LightGBM/ jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb 李碧涵:https://blog.csdn.net/a786150017/article/details/84138846
任务4.模型评分【2018.11.19 - 2018.11.20】
记录五个模型关于precision,rescore,f1,auc,roc的评分表格,画出auc和roc曲线图
爖:https://blog.csdn.net/l75326747/article/details/84233247 https://github.com/LongJH/ALittleTarget/blob/master/Mission1/mission4-metrics.ipynb 憨宝宝:https://blog.csdn.net/qq_41205464/article/details/84311363 Ash:https://blog.csdn.net/truffle528/article/details/84310726 黑桃:https://blog.csdn.net/Heitao5200/article/details/84299290 等到的过去:https://blog.csdn.net/lgy54321/article/details/84309512 面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84257426 排骨:https://blog.csdn.net/q370835062/article/details/84436428 大范先生:https://blog.csdn.net/weixin_40671804/article/details/84305384 月光疾风:https://yezuolin.com/2018/11/TheModelofUserLoanOverdueEvaluation/ jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb 李碧涵:https://blog.csdn.net/a786150017/article/details/84138846
任务5. 特征工程 - 数据预处理【2018.11.20 - 2018.11.21】
关于数据类型转换以及缺失值处理(尝试不同的填充看效果)以及你能借鉴的数据探索
爖:https://blog.csdn.net/l75326747/article/details/84326897 憨宝宝 https://blog.csdn.net/qq_41205464/article/details/84348766 Ash:https://blog.csdn.net/truffle528/article/details/84337769 黑桃:https://blog.csdn.net/Heitao5200/article/details/84322187 等到的过去:https://blog.csdn.net/lgy54321/article/details/84330070 面朝大海:https://blog.csdn.net/zhangyunpeng0922/article/details/84346663 排骨:https://blog.csdn.net/q370835062/article/details/84436445 大范先生:https://blog.csdn.net/weixin_40671804/article/details/84346853 月光疾风:https://yezuolin.com/2018/11/UserLoanOverdue_FeatureEngineering/ jepson:https://github.com/JepsonWong/Algorithm_Competition/blob/master/客户逾期分析/test.ipynb 李碧涵:https://blog.csdn.net/a786150017/article/details/84348205
[转载] 机器学习 scikit-learn1 预测贷款用户是否会逾期相关推荐
- 机器学习 scikit-learn1 预测贷款用户是否会逾期
scikit-learn 一周算法实践集训 简介 代码说明 代码目录结构 代码使用方法 个人总结 参考文档 任务1. 逻辑回归模型实践[2018.11.14 - 2018.11.15] 任务2.支持向 ...
- 预测贷款用户是否会逾期
数据信息: 这是本次实践数据的下载地址 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 说明:这份数据集是金融数据(非原始数据,已经处理过了),要做的是 ...
- (预测贷款用户是否会逾期)支持向量机和决策树的模型建立
(预测贷款用户是否会逾期)支持向量机和决策树的模型建立 数据是金融数据,我们要做的是预测贷款用户是否会逾期,表格中,status是标签:0表示未逾期,1表示逾期.[今天的任务]构建支持向量机和决策树模 ...
- 机器学习 scikit-learn8 - 预测贷款用户是否会逾期 - Stacking模型融合【调包】
Stacking模型融合 1 简介 2 模型融合的原理 2.1 StackingClassifier 概述 2.2 StackingCVClassifier 概述 3 代码使用方法 4 核心代码说明 ...
- 预测贷款用户是否逾期:数据清洗与预处理
任务一 做一个项目的第一步是数据清洗与预处理,也是对数据进行探索和分析.这份数据集是金融数据,我们的目标是要预测贷款用户是否会逾期,其中status表示标签,1表示逾期,0表示未逾期. 1.查看数据 ...
- 模型优化———预测贷款用户是否逾期
一.学习要求 对一份金融数据,我们在之前的博客中用各种模型完成了预测贷款用户是否会逾期的工作,接下来我们要介绍网格搜索和交叉验证的方法,来提高模型的准确率. 二.基础知识 什么是网格搜索 通过循环遍历 ...
- 逻辑回归预测贷款用户是否会逾期
学习笔记(二)逻辑回归预测贷款用户是否会逾期 算法实践能力的[整个思路]:构建模型-->模型融合-->模型评估-->交叉验证-->模型调参-->特征工程.[遵循]一次只做 ...
- 预测贷款用户是否逾期-数据预处理
1.本项目为预测贷款用户是否逾期的数据预处理部分,主要包括特征处理.数据类型分析.数据类型转换以及缺失值处理. 一.数据查看 选择的IDE为pycharm,首先导入pandas库与numpy库,查看数 ...
- 特征筛选———贷款用户是否会逾期
一.学习要求 分别对前面预处理的数据使用IV值和随机森林进行特征筛选 二.基础知识 1.IV值 计算过程是根据该特征所命中黑白样本的比率与总黑白样本的比率,来对比和计算其关联程度 IV 值的取值范围是 ...
最新文章
- JavaScript 中的有限状态机
- 各种flash的不同
- c语言 简单编程题,c语言简单编程练习题.doc
- python笔记-列表和元组
- leetcode111. 二叉树的最小深度
- 编译原理0909的作业
- Empire C:Basic 4
- gevent 协程 使用
- eclipse快捷键 自动生成get set方法,转到所调用的方法
- 括号匹配算法Java实现
- 论文评析-Incremental Boosting Convolutional Neural Network for Facial Action Unit Recognition,NIPS, 2016
- 20200816每日一句
- sql2005下载地址
- 北京服务器机房位置,北京服务器机房
- 国考省考申论:归纳概括多个主体身上的优秀品质,透过动词现象(怎么做的),找到名词(精神品质)本质
- python-Django【初级】10天到精通学不会全额退-张子夜-专题视频课程
- PostOffice
- 【pyhon】理想论坛爬虫1.05版,将读取和写DB分离成两个文件
- Aurora 8b/10b AXI4-ST回环测试
- Git push的常见用法
热门文章
- 【BZOJ2296】随机种子(构造)
- java页面分页显示代码_通用分页jsp页面显示
- 为什么运行review manager很卡顿_手机明明没坏,为什么声音开到最大依然很小?原来问题在这里...
- .net core 应用程序“default web site”中的服务器错误_Net程序员讲JAVA系列——Spring Boot“科普篇”...
- Python入门--闭包,工程函数
- SPOJ DQUERY D-query--线段树解法
- 穿上马甲就没认出polya定理之典型题目手环
- 计算机组成原理—cpu于主存的连接(例题)
- eclipse中怎么复制错误提示
- error:LNK2005 函数已经在*.obj中定义