home credit default risk(捷信违约风险)机器学习模型复现(论文_毕业设计_作业)
你能预测每个申请人偿还贷款的能力吗?由于信用记录不足或不存在,许多人难以获得贷款。而且,不幸的是,这些人经常被不可靠的贷方利用,例如高利贷,校园贷。
捷信努力为没有银行账户的人群扩大金融包容性。为了确保这些服务不足的人群获得积极的贷款体验,捷信利用各种替代数据(包括电信和交易信息)来预测客户的还款能力。
Home Credit捷信目前正在使用各种统计和机器学习方法进行这些预测,以帮助他们释放数据的全部潜力。这样做将确保有能力还款的客户不会被拒绝,并且贷款的本金、到期日和还款日历将使他们的客户获得成功。
我们团队提供此项目数据集和机器学习复现代码。
数据集变量上百,样本量超过30万,是各种机器学习实验理想的数据集。
我们训练的模型性能良好,AUC高于0.76.
我们团队能打破机器学习不可解释的黑箱,提供变量可解释性,下图是top10重要变量。图中可见ext_source_3,ext_source_2,ext_source_1是非常重要变量捷信的数据集中,对外部数据源的依赖是非常高的。
我们团队能提供变量相关性矩阵,如下图,诸多变量呈现高相关性。模型没必要采用所有变量,为节约成本可以删除部分变量。
我们团队提供变量描述性统计,下图是各个变量的分布图汇总。我们可见有的变量呈现正态分布,有的是左偏态,有的是右偏态。有的变量还需要进一步细分。
用户不需要了解数学,统计学,机器学习,编程等知识即可获取想要结果。
我们团队根据十年多建模积累专业经验自动帮助用户寻找最优算法,自动化数据预处理;自动化调参;专业化多角度模型验证;生成专业模型报告,图文并茂;
我方团队还可提供远程支持,远程协助小白用户搭建和调试好编程环境,用于应付老师代码抽查。这节省用户大量调研时间,省时省事。
home credit default risk(捷信违约风险)机器学习模型复现(论文
版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
home credit default risk(捷信违约风险)机器学习模型复现(论文_毕业设计_作业)相关推荐
- home credit default risk捷信消费金融违约风险模型复现(论文_毕业设计_作业)
你能预测每个申请人偿还贷款的能力吗?由于信用记录不足或不存在,许多人难以获得贷款.而且,不幸的是,这些人经常被不可靠的贷方利用,例如高利贷,校园贷. 捷信努力为没有银行账户的人群扩大金融包容性.为了确 ...
- Home Credit Default Risk 违约风险预测,kaggle比赛,初级篇,LB 0.749
Home Credit Default Risk 结论 背景知识 数据集 数据分析 平衡度 数据缺失 数据类型 离群值 填充缺失值 建模 Logistic Regression LightGBM Fe ...
- Kaggle竞赛介绍: Home Credit default risk(一)
请点击上方"AI公园",关注公众号 本文选自Kaggle 作者:Will Koehrsen 编译:ronghuaiyang Kaggle的信用卡违约风险预测竞赛,非常有参考价值,做 ...
- Kaggle:Home Credit Default Risk 特征工程构建及可视化(2)
博主在之前的博客 Kaggle:Home Credit Default Risk 数据探索及可视化(1) 中介绍了 Home Credit Default Risk 竞赛中一个优秀 kernel 关于 ...
- kaggle竞赛 - Home Credit Default Risk金牌心得
转自:知乎 https://zhuanlan.zhihu.com/p/43323121 正文 最优单模已在kaggle分享,本地CV为7993,线上最终的私榜成绩为7996,我们最终融合的成绩为801 ...
- Home Credit Default Risk(1) — 背景介绍
总体介绍 Home Credit Default Risk是Home Credit公司在kaggle上的一个信贷风险评估竞赛.其提供的数据文件描述及文件间关联关系如下: 有些金融专有名词尤其是一些 ...
- kaggle数据挖掘竞赛Home Credit Default Risk讲解
1.从常理来说这种预测的结果应该是0,1,也就是分为欺诈和不欺诈两种,一般衡量指标为accuracy,但是如果这样会有缺点,因为可以预测所有人都是不欺诈的,这时accuracy的值就会很大,但这样的方 ...
- Home Credit Default Risk(2) —初步探索
上篇中已经给出了application_{train|test}.csv数据表字段的基本含义,本篇对其进行基本的数据分析,包活异常数据处理,特征变换等,最后给出仅考虑此数据文件,应用logisti ...
- COLING 2018 最佳论文解读:序列标注经典模型复现
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
最新文章
- Android 使用git 忽略文件
- p187让元素垂直居中
- Python学习笔记:开始Python编程
- POJ1083 Moving Tables
- 【Python进阶】Python进阶专栏、编程与开源框架知识星球上线,等你来follow
- bitcount java_java-Long.bitCount()如何找到设置的位数?
- eigrp配置实验_EIGRP负载均衡的实现
- Charles 映射本地文件map local
- 智能优化算法:未来搜索算法-附代码
- DFX 9.303 for QQMusic 2010
- 使用Spine软件制作骨骼动画供Cocos2d-x使用
- MYSQL 命令行大全
- 数字小人时钟windows电脑屏幕保护
- 微信小程序云开发之实时监听数据库某集合数据条数
- 台式计算机电源接线图,​台式机硬盘电源线接法【图解】
- CSAPP第四章家庭作业参考答案
- rog手机计算机测试,荣耀V8体验测试:降低分辨率的ROG模式真能省电?
- 四川省计算机应用教材,四川省电子科技大学计算机应用技术
- 在线ico图标制作、python代码实现ico格式转换
- SQLException:null, message from server: “Host ‘xx‘ is not allowed to connect to this MySQL server“