task1赛题理解

1.1 学习目标

理解赛题数据和目标,清楚评分体系。
报名+下载数据+提交示例结果

1.2了解赛题

  • 赛题概况
  • 数据概况
  • 预测指标
  • 分析赛题

1.2.1 赛题概况

任务:预测金融风险
数据来源:某信贷平台的贷款记录

1.2.2 数据概况

  • 数据总量:120w+
  • 字段数:47个(15个为匿名变量)
    (匿名变量:即未告知数据列所属的性质的特征列)
  • 训练集以及测试集的划分:
    训练集:80万条
    测试集A: 20万条
    测试集B:20万条
  • 脱敏字段:employmentTitle、purpose、postCode和title等
    数据说明:
    id 为贷款清单分配的唯一信用证标识
    loanAmnt 贷款金额
    term 贷款期限(year)
    interestRate 贷款利率
    installment 分期付款金额
    grade 贷款等级
    subGrade 贷款等级之子级
    employmentTitle 就业职称
    employmentLength 就业年限(年)
    homeOwnership 借款人在登记时提供的房屋所有权状况
    annualIncome 年收入
    verificationStatus 验证状态
    issueDate 贷款发放的月份
    purpose 借款人在贷款申请时的贷款用途类别
    postCode 借款人在贷款申请中提供的邮政编码的前3位数字
    regionCode 地区编码
    dti 债务收入比
    delinquency_2years 借款人过去2年信用档案中逾期30天以上的违约事件数
    ficoRangeLow 借款人在贷款发放时的fico所属的下限范围
    ficoRangeHigh 借款人在贷款发放时的fico所属的上限范围
    openAcc 借款人信用档案中未结信用额度的数量
    pubRec 贬损公共记录的数量
    pubRecBankruptcies 公开记录清除的数量
    revolBal 信贷周转余额合计
    revolUtil 循环额度利用率,或借款人使用的相对于所有可用循环信贷的信贷金额
    totalAcc 借款人信用档案中当前的信用额度总数
    initialListStatus 贷款的初始列表状态
    applicationType 表明贷款是个人申请还是与两个共同借款人的联合申请
    earliesCreditLine 借款人最早报告的信用额度开立的月份
    title 借款人提供的贷款名称
    policyCode 公开可用的策略_代码=1新产品不公开可用的策略_代码=2
    n系列匿名特征 匿名特征n0-n14,为一些贷款人行为计数特征的处理

1.2.3 预测指标

AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。

金融风控之贷款违约预测相关推荐

  1. 【算法竞赛学习】金融风控之贷款违约预测-模型融合

    Task5 模型融合 Tip:此部分为零基础入门金融风控的 Task5 模型融合部分,欢迎大家后续多多交流. 赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约预测 项目地址:https:// ...

  2. 【算法竞赛学习】金融风控之贷款违约预测-建模与调参

    Task4 建模与调参 此部分为零基础入门金融风控的 Task4 建模调参部分,带你来了解各种模型以及模型的评价和调参策略,欢迎大家后续多多交流. 赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷 ...

  3. 数据竞赛入门-金融风控(贷款违约预测)五、模型融合

    前言 本次活动为datawhale与天池联合举办,为金融风控之贷款违约预测挑战赛(入门) 比赛地址:https://tianchi.aliyun.com/competition/entrance/53 ...

  4. 数据竞赛入门-金融风控(贷款违约预测)四、建模与调参

    前言 本次活动为datawhale与天池联合举办,为金融风控之贷款违约预测挑战赛(入门) 比赛地址:https://tianchi.aliyun.com/competition/entrance/53 ...

  5. 数据竞赛入门-金融风控(贷款违约预测)三、特征工程

    前言 本次活动为datawhale与天池联合举办,为金融风控之贷款违约预测挑战赛(入门) 比赛地址:https://tianchi.aliyun.com/competition/entrance/53 ...

  6. 零基础入门金融风控之贷款违约预测挑战赛-task01

    零基础入门金融风控之贷款违约预测挑战赛-task01 零基础入门金融风控之贷款违约预测挑战赛 1.赛题描述 根据某信贷平台的贷款记录的数据,进行训练测试,预测用户贷款是否违约,得出用户违约的概率. 在 ...

  7. 数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测

    相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...

  8. 入门金融风控【贷款违约预测】

    入门金融风控[贷款违约预测] 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题.通过这道赛题来引导大家了解金融 ...

  9. 【数据分析与挖掘实战】金融风控之贷款违约预测详解2(有代码和数据集)

    本文接着上一篇博客,如果您未阅读上篇博客,请点击[数据分析与挖掘实战]金融风控之贷款违约预测详解1(有代码和数据集) 七.建模和调参 7.1模型相关原理介绍 由于相关算法原理篇幅较长,本文推荐了一些博 ...

  10. 金融风控(贷款违约预测)

    Task1赛题理解 Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 -- 零基础入门金融风控之贷款违约预测挑战赛. 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申 ...

最新文章

  1. 使用Cbrgen和Setdest构造无线仿真环境
  2. c++list支持索引吗_还在为不懂Python切片操作及原理而苦恼吗?漫画帮你立马理解掌握...
  3. linux docker 目录挂载映射
  4. python适合做后端开发吗-用Python做后台开发,看这一篇就够了
  5. GDCM:Torture的测试程序
  6. Python中的If,Elif和Else语句
  7. mount 挂载光盘
  8. 【Linux】设置虚拟内存
  9. Linux学习之七--mysql的安装使用
  10. 分享几个个人经常用到的js方法
  11. 使用python读取kafka实时topic数据demo,包括安装kafka module
  12. 利用kd树实现最近邻搜索
  13. 《数学模型(第五版)》简记
  14. Nanjing GDG Meetup 8月线下活动
  15. [渝粤教育] 徐州工业职业技术学院 药物分离技术 参考 资料
  16. 拆解PowerApps - 请假申请 - 4
  17. C# C++ 互操作:C++向C#输出不定长数组或指针的实现
  18. multiple definition of `_start'
  19. LVS均衡负载(三) LVS后端服务健康状态检查
  20. Python 套件管理程式簡介

热门文章

  1. j1900适合装哪版群晖_NAS 拔草记:群晖 DS220j 使用体验
  2. php file_put_contents 根目录权限,php – Composer:file_put_contents(./ composer.json):无法打开流:权限被拒绝...
  3. 永信至诚成功当选CNCERT网络安全应急服务支撑单位
  4. K8S——存储-Secret
  5. 手机翻译html工具,1分钟教你用手机实时翻译,自带翻译功能就是强大,各牌手机均可...
  6. sap采购申请自动转采购订单_我的SAP运维日常_0021_MM_计划订单转采购申请时绑定凭证类型...
  7. 解决Macbook双系统 找不到麦克风问题
  8. 共识算法POW原理及实现
  9. 20169220 网络攻防实践 第二周学习总结
  10. guitar chord html5,Chord Guitar Full