拍拍贷魔镜杯风控算法大赛项目
(以后更新)
数据集构成:
三万条已知标签的训练集,二万条不知标签的测试集
训练集和测试集均有三种表:
Master(主要的特征表),Log_Info(用户登陆信息表),Userupdate_Info(客户信息修改更新表)
(1)
Master
每一行代表一个样本(一笔成功成交借款),每个样本包含200多个各类字段。
idx:每一笔贷款的unique key,可以与另外2个文件里的idx相匹配。
UserInfo_*:借款人特征字段
WeblogInfo_*:Info网络行为字段
Education_Info*:学历学籍字段
ThirdParty_Info_PeriodN_*:第三方数据时间段N字段
SocialNetwork_*:社交网络字段
LinstingInfo:借款成交时间
Target:违约标签(1 = 贷款违约,0 = 正常还款)。
测试集里不包含target字段。
(2)
Log_Info
借款人的登陆信息。
ListingInfo:借款成交时间
LogInfo1:操作代码
LogInfo2:操作类别
LogInfo3:登陆时间
idx:每一笔贷款的unique key
(3)
Userupdate_Info
借款人修改信息
ListingInfo1:借款成交时间
UserupdateInfo1:修改内容
UserupdateInfo2:修改时间
idx:每一笔贷款的unique key
本文大体的步骤是:
1)训练数据和测试数据的合并(为了一起对特征进行处理)
2)分类型变量的清洗
3)基于一些分类型变量和其他表数据(登陆信息表、修改信息表)的特征衍生
4)数值型变量均值填充
5)最后对特征工程后的数据集进行特征筛选(lightgbm)
6)筛选完后进行建模预测
7)通过调整lightgbm的参数,来提高模型的精度
8)模型融合(stacking)
参考:
1、Kesci“魔镜杯”风控算法大赛铜奖解决方案
https://blog.csdn.net/Bryan__/article/details/51190452?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158420359819724811847185%2522%252C%2522scm%2522%253A%252220140713.130056874..%2522%257D&request_id=158420359819724811847185&biz_id=0&utm_source=distribute.pc_search_result.none-task
2、第四届拍拍贷魔镜杯冠军方案分享 https://blog.csdn.net/u011599639/article/details/102064579?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
3、拍拍贷金融风控案例(总结) https://blog.csdn.net/taka_is_beauty/article/details/88809679?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
4、拍拍贷魔镜杯风控算法大赛——基于lightgbm https://blog.csdn.net/LuLuYao9494/article/details/91380540?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
拍拍贷魔镜杯风控算法大赛项目相关推荐
- 拍拍贷魔镜杯风控算法大赛——基于lightgbm
本文仿照知乎一位大神的文章,基于理解的基础上,修改了部分代码~感谢前辈的分享~ 参考文献: https://zhuanlan.zhihu.com/p/56864235 原始数据来源: https:// ...
- “魔镜杯”风控算法大赛
比赛概览 拍拍贷"魔镜风控系统"从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测 ...
- Kesci“魔镜杯”风控算法大赛铜奖解决方案
决赛答辩第4,获得铜奖 代码地址:https://github.com/wepe/PPD_RiskControlCompetition
- Kesci“魔镜杯”风控算法大赛复赛解决方案
决赛答辩第4,获得铜奖 代码地址:https://github.com/wepe/PPD_RiskControlCompetition
- 第四届拍拍贷魔镜杯冠军方案分享
浏览更多内容,可访问:http://www.growai.cn 1.介绍 队员:@回头是岸,@林萧, @观想,作者:@一休 2. 赛题背景 资金流动性管理迄今仍是金融领域的经典问题.在互联网金融信 ...
- 风控算法赛lgb实战-拍拍贷魔镜杯
写在开头,关注公众号:Python风控模型与数据分析.回复 风控实战1 ,即可获取本文数据集及完整代码,以及更多理论知识与代码分享 目录 1.导包 2.数据读取 3.统计分析 3.1 样本分布 3.2 ...
- 科赛网 魔镜杯“风控算法比赛”赛后总结
1.问题描述 从平均400个数据维度来评估当前用户的信用状态,给每个借款人打出当前状态的信用分.在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进 ...
- 拍拍贷“魔镜风控系统”数据比赛
一.项目介绍 这是拍拍贷举办的一个风控算法比赛,目标是根据用户历史行为数据来预测用户在未来6个月内是否会逾期还款.评价指标为AUC. 然后给出的数据有贷款记录.借款人登录信息,借款人修改信息,主要进行 ...
- “达观杯”NLP算法大赛再启航,丰厚奖金、直通Offer等你来拿!
来源:达观数据 本文约1258字,建议阅读3分钟. "达观杯"是由达观数据主办的全国前沿人工智能和大数据技术竞赛,此届"达观杯"以文本智能处理为主题. 人工智能 ...
- 标题相似度算法_智能客服问题相似度算法设计——第三届魔镜杯大赛第12名解决方案...
目录: 一.比赛介绍 二.数据介绍 三.解决方案 (一)问题分析 (二)数据探索 (三)模型 (四)调参 (五)特征工程 (六)模型集成 (七)后处理 四.比赛总结 (一)比赛成绩 (二)代码分享 ( ...
最新文章
- AI一分钟 | 阿里NLP技术连破两项世界纪录,玉泉一号AI试验卫星明年发射
- Django博客系统(博客保存)
- pyhton url参数和字典互转
- 自己动手实现操作系统引导程序(OS bootloader)——借助QEMU/GDB/losetup/dd等工具
- php ci cookie使用,CI框架实现cookie登陆的方法详解
- c rsa java私钥_RSA,JAVA私钥加密,C#公钥解密
- 【NLP】让AI读懂法律文书:一种基于多分类的关键句识别方法
- 关于android的外文论文,关于android的外文文献.doc
- ES6 generator
- (C语言)请编写程序,计算1-1/2-1/3-1/4-.....-1/50的和。
- node:爬虫爬取网页图片
- python显示中文文件内容_Python实现的json文件读取及中文乱码显示问题解决方法...
- 晨哥真有料丨明知道没有结果的爱情,还要继续下去吗?
- document.compatMode介绍
- (已解决) centos6.5 yum源 失效 The whole CentOS 6 is dead and shouldn’t be used anywhere at all
- 光流(八)--总结篇
- 路由交换技术vlan、trunk、单臂路由、三层交换、链路聚合、STP
- TI FMCW毫米波雷达基础(2)——测速原理
- 强制开启android webview debug模式使用Chrome inspect
- 请冷静地对待手中的EOS——EOS数据分析