写在前面:

刚接触数据挖掘,看了几页python就跳进了这个大坑,也不知道该咋写这个博客,先瞎写着吧。介绍下自己参加的这个项目,是Datawhale和天池比赛联合发起的,我们在Datawhale组对学习,然后自愿参加报名天池比赛。Datawhale是一个AI领域的开源学习组织,我个人很敬佩他们的创始者,至少目前让我感觉这是一个很不错的组织;天池是阿里云旗下的一个组织,也是专注于AI领域的,我上去看了下,里面也有很多关于AI的学习视频和比赛。两者结合,我感觉自己一定会有所收获的。下面开始介绍我现在接触的入门项目——零基础入门金融风控之贷款违约预测。

*************************************************我是分界线**************************************************************************************

这个项目分5个任务开展,今天就写一下Task1:赛题理解

任务目标:预测用户贷款是否违约

数据:

数据获取需要注册天池比赛,然后才可在对应的赛事中下载数据。

(天池比赛链接:https://tianchi.aliyun.com/competition/entrance/531830/introduction

总数据量120w,47列变量信息,其中15列为匿名变量;80万条作为训练集,20万条作为测试集A,20万条作为测试集B。

数据字段:是对数据中15列变量的说明。

字段 描述
id 为贷款清单分配的唯一信用证标识
loanAmnt 贷款金额
term 贷款期限(year)
interestRate 贷款利率
installment 分期付款金额
grade 贷款等级
subGrade 贷款等级之子级
employmentTitle 就业职称
employmentLength 就业年限(年)
homeOwnership 借款人在登记时提供的房屋所有权状况
annualIncome 年收入
verificationStatus 验证状态
issueDate 贷款发放的月份
purpose 借款人在贷款申请时的贷款用途类别
postCode 借款人在贷款申请中提供的邮政编码的前3位数字
regionCode 地区编码
dti 债务收入比
delinquency_2years 借款人过去2年信用档案中逾期30天以上的违约事件数
ficoRangeLow 借款人在贷款发放时的fico所属的下限范围
ficoRangeHigh 借款人在贷款发放时的fico所属的上限范围
openAcc 借款人信用档案中未结信用额度的数量
pubRec 贬损公共记录的数量
pubRecBankruptcies 公开记录清除的数量
revolBal 信贷周转余额合计
revolUtil 循环额度利用率,或借款人使用的相对于所有可用循环信贷的信贷金额
totalAcc 借款人信用档案中当前的信用额度总数
initialListStatus 贷款的初始列表状态
applicationType 表明贷款是个人申请还是与两个共同借款人的联合申请
earliesCreditLine 借款人最早报告的信用额度开立的月份
title 借款人提供的贷款名称
policyCode 公开可用的策略_代码=1新产品不公开可用的策略_代码=2
n系列匿名特征 匿名特征n0-n14,为一些贷款人行为计数特征的处理

评价标准:

我们通过一些评价指标来评价我们的预测结果,其实也就是评价这个算法好不好。

这个项目采用的分类算法,评价分类算法常用以下指标:

  • 混淆矩阵(Confuse Matrix)
  • 准确率(Accuracy)
  • 精确率(Precision)
  • 召回率(Recall)
  • F1 Score
  • P-R曲线(Precision-Recall Curve)
  • ROC
  • AUC

此项目采用AUC作为评价指标。这些指标在python中都可以利用内置函数进行计算,不用我们去写算法,直接调用就好了。我们只需要知道AUC这个值越接近1,说明效果越好。

************************************************我是分界线***********************************************************************************

写在后面:

其实看完Task1就是要了解我们要做的项目是什么,以及如何来评价我们的工作成果。写的比较偏通俗理解,因为我感觉技术贴太多了,而且我按照那样去写估计也是复制粘贴。写完这些如果还想具体了解如何导入数据,以及关于评价指标的相关信息可以百度一下,而相关代码的实现可以找找其他人的博客,他们也是这个项目,但估计就很“技术”了。哈哈,就酱!收工!

零基础入门金融风控-贷款违约预测相关推荐

  1. 笔记之零基础入门金融风控-贷款违约预测

    零基础入门金融风控-贷款违约预测 赛题描述 赛题概况 数据概况 合理的创建标题,有助于目录的生成 预测指标 赛题流程 评分卡 笔记记录转载 赛题描述 赛题以金融风控中的个人信贷为背景,要求选手根据贷款 ...

  2. 零基础入门金融风控-贷款违约预测-机器学习-数据分析

    零基础入门金融风控-贷款违约预测 一.赛题数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变 ...

  3. 零基础入门金融风控-贷款违约预测_Task1

    贷款违约预测_Task1 零基础入门金融风控-贷款违约预测_Task1 数据概况 预测指标 零基础入门金融风控-贷款违约预测_Task1 数据概况 数据包含三部分:训练集(train.csv).测试集 ...

  4. 零基础入门金融风控-贷款违约预测-Task05——模型融合

    有幸参加了阿里云举办的零基础入门金融风控-贷款违约预测训练营.收获颇多. 每天记录一些自己之前的知识盲点,需经常温习. 第五次的学习任务,是模型融合. 一.模型融合常用方法 模型融合有常用的如下六种方 ...

  5. 阿里天池零基础入门金融风控-贷款违约预测文本处理

    阿里天池零基础入门金融风控-贷款违约预测文本处理 文本处理 日期处理 等级处理 就业年限处理 删除含有空值的行 数据归一化 踩坑 文本处理 日期处理 earliesCreditLine: 可以看到ea ...

  6. 零基础入门金融风控-贷款违约预测-Task4 建模与调参

    此部分为零基础入门金融风控的 Task4 建模调参部分,带你来了解各种模型以及模型的评价和调参策略,欢迎大家后续多多交流. 项目地址 比赛地址 4.1 学习目标 学习在金融分控领域常用的机器学习模型 ...

  7. 天池新人赛-零基础入门金融风控-贷款违约预测-排名174

    赛题以预测用户贷款是否违约为任务,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量.从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B ...

  8. 基于机器学习与深度学习的金融风控贷款违约预测

    基于机器学习与深度学习的金融风控贷款违约预测 目录 一.赛题分析 1. 任务分析 2. 数据属性 3. 评价指标 4. 问题归类 5. 整体思路 二.数据可视化分析 1. 总体数据分析 2. 数值型数 ...

  9. DataWhale天池-金融风控贷款违约预测-Task01赛题理解

    目录 一.赛题概况 二.数据集介绍 三.预测指标 理解 通过ROC曲线评估分类器 最佳阈值点选择 一.赛题概况 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 -- 零基础入门 ...

最新文章

  1. scanf可不可以输入浮点型_数据的输入和输出
  2. 全球变暖java_全球变暖 蓝桥杯
  3. IO多路复用的三种机制Select,Poll,Epoll
  4. 《Detroit:Become Human》玩家情感故事背后的叙事魔法和体验设计
  5. 利用 WebService实现远程服务器文件的上传和下载
  6. Android中onInterceptTouchEvent、dispatchTouchEvent及onTouchEvent的调用顺序及内部原理
  7. 11个技巧让你编写出更好的Python代码,值得收藏!!
  8. python中pyecharts_小白学Python(8)——pyecharts 入门
  9. [Linux] 如何让linux加载当前目录的动态库
  10. 浅谈java.awt使用过程中遇到的问题
  11. android制作弹出框样式,Android Dialog 弹出框 自定义 样式
  12. TXSQL:云计算时代数据库核弹头——云+未来峰会开发者专场回顾
  13. 存储过程传递参数时出现类型转换错误!如:varchar转换为int时出错
  14. jQuery之事件绑定到触发全过程及知识点补充
  15. 微软宣布以197亿美元现金收购语音识别巨头Nuance
  16. 反爬虫策略的应对方法汇总
  17. 《缠中说禅108课》79:分型的辅助操作与一些问题的再解答
  18. JavaScript与JScript的区别
  19. python菜鸟教程 | print功能
  20. ecshop小京东短信接口插件修改-v41,42,43,50+图片说明

热门文章

  1. NeuroImage:对情绪表现的快速接近—回避反应反映了基于价值的决策:来自脑电图研究的神经证据
  2. 改进埃尔米特(Hermite)分段三次插值——(可在pchip函数中自定义导数值)
  3. 超文本传输协议(HTTP)
  4. css背景渐变(灰色渐变背景)
  5. html页面怎样打印二分之一,打印二分之一a4纸 大小的纸张 Word该如何设置?
  6. excel设置斑马线
  7. 如何更新seaborn库_Python 绘图总结(seaborn库的使用) (上)
  8. Cortex-M MMU内存管理单元和 Linux
  9. 抖音seo源码.源代码开发可二开搭建/抖音seo优化系统代开发
  10. 树莓派2使用360wifi ,小米wifi