你能预测每个申请人偿还贷款的能力吗?由于信用记录不足或不存在,许多人难以获得贷款。而且,不幸的是,这些人经常被不可靠的贷方利用,例如高利贷,校园贷。

捷信努力为没有银行账户的人群扩大金融包容性。为了确保这些服务不足的人群获得积极的贷款体验,捷信利用各种替代数据(包括电信和交易信息)来预测客户的还款能力。

Home Credit捷信目前正在使用各种统计和机器学习方法进行这些预测,以帮助他们释放数据的全部潜力。这样做将确保有能力还款的客户不会被拒绝,并且贷款的本金、到期日和还款日历将使他们的客户获得成功。
我们团队提供此项目数据集和机器学习复现代码。

数据集变量上百,样本量超过30万,是各种机器学习实验理想的数据集。
我们训练的模型性能良好,AUC高于0.76.
我们团队能打破机器学习不可解释的黑箱,提供变量可解释性,下图是top10重要变量。图中可见ext_source_3,ext_source_2,ext_source_1是非常重要变量捷信的数据集中,对外部数据源的依赖是非常高的。
我们团队能提供变量相关性矩阵,如下图,诸多变量呈现高相关性。模型没必要采用所有变量,为节约成本可以删除部分变量。
我们团队提供变量描述性统计,下图是各个变量的分布图汇总。我们可见有的变量呈现正态分布,有的是左偏态,有的是右偏态。有的变量还需要进一步细分。
用户不需要了解数学,统计学,机器学习,编程等知识即可获取想要结果。

我们团队根据十年多建模积累专业经验自动帮助用户寻找最优算法,自动化数据预处理;自动化调参;专业化多角度模型验证;生成专业模型报告,图文并茂;
我方团队还可提供远程支持,远程协助小白用户搭建和调试好编程环境,用于应付老师代码抽查。这节省用户大量调研时间,省时省事。

home credit default risk(捷信违约风险)机器学习模型复现(论文

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

home credit default risk(捷信违约风险)机器学习模型复现(论文_毕业设计_作业)相关推荐

  1. home credit default risk捷信消费金融违约风险模型复现(论文_毕业设计_作业)

    你能预测每个申请人偿还贷款的能力吗?由于信用记录不足或不存在,许多人难以获得贷款.而且,不幸的是,这些人经常被不可靠的贷方利用,例如高利贷,校园贷. 捷信努力为没有银行账户的人群扩大金融包容性.为了确 ...

  2. Home Credit Default Risk 违约风险预测,kaggle比赛,初级篇,LB 0.749

    Home Credit Default Risk 结论 背景知识 数据集 数据分析 平衡度 数据缺失 数据类型 离群值 填充缺失值 建模 Logistic Regression LightGBM Fe ...

  3. Kaggle竞赛介绍: Home Credit default risk(一)

    请点击上方"AI公园",关注公众号 本文选自Kaggle 作者:Will Koehrsen 编译:ronghuaiyang Kaggle的信用卡违约风险预测竞赛,非常有参考价值,做 ...

  4. Kaggle:Home Credit Default Risk 特征工程构建及可视化(2)

    博主在之前的博客 Kaggle:Home Credit Default Risk 数据探索及可视化(1) 中介绍了 Home Credit Default Risk 竞赛中一个优秀 kernel 关于 ...

  5. kaggle竞赛 - Home Credit Default Risk金牌心得

    转自:知乎 https://zhuanlan.zhihu.com/p/43323121 正文 最优单模已在kaggle分享,本地CV为7993,线上最终的私榜成绩为7996,我们最终融合的成绩为801 ...

  6. Home Credit Default Risk(1) — 背景介绍

    总体介绍   Home Credit Default Risk是Home Credit公司在kaggle上的一个信贷风险评估竞赛.其提供的数据文件描述及文件间关联关系如下: 有些金融专有名词尤其是一些 ...

  7. kaggle数据挖掘竞赛Home Credit Default Risk讲解

    1.从常理来说这种预测的结果应该是0,1,也就是分为欺诈和不欺诈两种,一般衡量指标为accuracy,但是如果这样会有缺点,因为可以预测所有人都是不欺诈的,这时accuracy的值就会很大,但这样的方 ...

  8. Home Credit Default Risk(2) —初步探索

      上篇中已经给出了application_{train|test}.csv数据表字段的基本含义,本篇对其进行基本的数据分析,包活异常数据处理,特征变换等,最后给出仅考虑此数据文件,应用logisti ...

  9. COLING 2018 最佳论文解读:序列标注经典模型复现

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

最新文章

  1. Android 使用git 忽略文件
  2. p187让元素垂直居中
  3. Python学习笔记:开始Python编程
  4. POJ1083 Moving Tables
  5. 【Python进阶】Python进阶专栏、编程与开源框架知识星球上线,等你来follow
  6. bitcount java_java-Long.bitCount()如何找到设置的位数?
  7. eigrp配置实验_EIGRP负载均衡的实现
  8. Charles 映射本地文件map local
  9. 智能优化算法:未来搜索算法-附代码
  10. DFX 9.303 for QQMusic 2010
  11. 使用Spine软件制作骨骼动画供Cocos2d-x使用
  12. MYSQL 命令行大全
  13. 数字小人时钟windows电脑屏幕保护
  14. 微信小程序云开发之实时监听数据库某集合数据条数
  15. 台式计算机电源接线图,​台式机硬盘电源线接法【图解】
  16. CSAPP第四章家庭作业参考答案
  17. rog手机计算机测试,荣耀V8体验测试:降低分辨率的ROG模式真能省电?
  18. 四川省计算机应用教材,四川省电子科技大学计算机应用技术
  19. 在线ico图标制作、python代码实现ico格式转换
  20. SQLException:null, message from server: “Host ‘xx‘ is not allowed to connect to this MySQL server“

热门文章

  1. 协作乐高 All In One:DAO工具大全
  2. 商业银行房贷业务节后骤然下降
  3. 常见的继电接触器控制线路总结
  4. 【视频码率相关笔记】
  5. c语言rand函数源码路径,C语言中的rand()函数
  6. 3D-2D三维重建:PnP
  7. 量子计算机技术难,量子计算机是什么工作原理运行的?现在制造还存在什么技术上的难...
  8. redis 高可用(持久化、主从复制、哨兵、集群)以及集群的三种模式
  9. GPS的一些浅显知识兼介绍一下GPS测试仪
  10. win10系统之下字母与数字间隔变大的解决办法