(以后更新)

数据集构成:

三万条已知标签的训练集,二万条不知标签的测试集

训练集和测试集均有三种表:

Master(主要的特征表)Log_Info(用户登陆信息表),Userupdate_Info(客户信息修改更新表)

(1)

Master
每一行代表一个样本(一笔成功成交借款),每个样本包含200多个各类字段。

idx:每一笔贷款的unique key,可以与另外2个文件里的idx相匹配。

UserInfo_*:借款人特征字段

WeblogInfo_*:Info网络行为字段

Education_Info*:学历学籍字段

ThirdParty_Info_PeriodN_*:第三方数据时间段N字段

SocialNetwork_*:社交网络字段

LinstingInfo:借款成交时间

Target:违约标签(1 = 贷款违约,0 = 正常还款)。

测试集里不包含target字段。

(2)

Log_Info
借款人的登陆信息。

ListingInfo:借款成交时间

LogInfo1:操作代码

LogInfo2:操作类别

LogInfo3:登陆时间

idx:每一笔贷款的unique key

(3)

Userupdate_Info
借款人修改信息

ListingInfo1:借款成交时间

UserupdateInfo1:修改内容

UserupdateInfo2:修改时间

idx:每一笔贷款的unique key

本文大体的步骤是:

1)训练数据和测试数据的合并(为了一起对特征进行处理)

2)分类型变量的清洗

3)基于一些分类型变量和其他表数据(登陆信息表、修改信息表)的特征衍生

4)数值型变量均值填充

5)最后对特征工程后的数据集进行特征筛选(lightgbm)

6)筛选完后进行建模预测

7)通过调整lightgbm的参数,来提高模型的精度

8)模型融合(stacking)

参考:

1、Kesci“魔镜杯”风控算法大赛铜奖解决方案

https://blog.csdn.net/Bryan__/article/details/51190452?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158420359819724811847185%2522%252C%2522scm%2522%253A%252220140713.130056874..%2522%257D&request_id=158420359819724811847185&biz_id=0&utm_source=distribute.pc_search_result.none-task

2、第四届拍拍贷魔镜杯冠军方案分享   https://blog.csdn.net/u011599639/article/details/102064579?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task

3、拍拍贷金融风控案例(总结)  https://blog.csdn.net/taka_is_beauty/article/details/88809679?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task

4、拍拍贷魔镜杯风控算法大赛——基于lightgbm   https://blog.csdn.net/LuLuYao9494/article/details/91380540?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task

拍拍贷魔镜杯风控算法大赛项目相关推荐

  1. 拍拍贷魔镜杯风控算法大赛——基于lightgbm

    本文仿照知乎一位大神的文章,基于理解的基础上,修改了部分代码~感谢前辈的分享~ 参考文献: https://zhuanlan.zhihu.com/p/56864235 原始数据来源: https:// ...

  2. “魔镜杯”风控算法大赛

    比赛概览 拍拍贷"魔镜风控系统"从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测 ...

  3. Kesci“魔镜杯”风控算法大赛铜奖解决方案

    决赛答辩第4,获得铜奖 代码地址:https://github.com/wepe/PPD_RiskControlCompetition

  4. Kesci“魔镜杯”风控算法大赛复赛解决方案

    决赛答辩第4,获得铜奖 代码地址:https://github.com/wepe/PPD_RiskControlCompetition

  5. 第四届拍拍贷魔镜杯冠军方案分享

    浏览更多内容,可访问:http://www.growai.cn 1.介绍 ​ 队员:@回头是岸,@林萧, @观想,作者:@一休 2. 赛题背景 资金流动性管理迄今仍是金融领域的经典问题.在互联网金融信 ...

  6. 风控算法赛lgb实战-拍拍贷魔镜杯

    写在开头,关注公众号:Python风控模型与数据分析.回复 风控实战1 ,即可获取本文数据集及完整代码,以及更多理论知识与代码分享 目录 1.导包 2.数据读取 3.统计分析 3.1 样本分布 3.2 ...

  7. 科赛网 魔镜杯“风控算法比赛”赛后总结

    1.问题描述 从平均400个数据维度来评估当前用户的信用状态,给每个借款人打出当前状态的信用分.在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进 ...

  8. 拍拍贷“魔镜风控系统”数据比赛

    一.项目介绍 这是拍拍贷举办的一个风控算法比赛,目标是根据用户历史行为数据来预测用户在未来6个月内是否会逾期还款.评价指标为AUC. 然后给出的数据有贷款记录.借款人登录信息,借款人修改信息,主要进行 ...

  9. “达观杯”NLP算法大赛再启航,丰厚奖金、直通Offer等你来拿!

    来源:达观数据 本文约1258字,建议阅读3分钟. "达观杯"是由达观数据主办的全国前沿人工智能和大数据技术竞赛,此届"达观杯"以文本智能处理为主题. 人工智能 ...

  10. 标题相似度算法_智能客服问题相似度算法设计——第三届魔镜杯大赛第12名解决方案...

    目录: 一.比赛介绍 二.数据介绍 三.解决方案 (一)问题分析 (二)数据探索 (三)模型 (四)调参 (五)特征工程 (六)模型集成 (七)后处理 四.比赛总结 (一)比赛成绩 (二)代码分享 ( ...

最新文章

  1. AI一分钟 | 阿里NLP技术连破两项世界纪录,玉泉一号AI试验卫星明年发射
  2. Django博客系统(博客保存)
  3. pyhton url参数和字典互转
  4. 自己动手实现操作系统引导程序(OS bootloader)——借助QEMU/GDB/losetup/dd等工具
  5. php ci cookie使用,CI框架实现cookie登陆的方法详解
  6. c rsa java私钥_RSA,JAVA私钥加密,C#公钥解密
  7. 【NLP】让AI读懂法律文书:一种基于多分类的关键句识别方法
  8. 关于android的外文论文,关于android的外文文献.doc
  9. ES6 generator
  10. (C语言)请编写程序,计算1-1/2-1/3-1/4-.....-1/50的和。
  11. node:爬虫爬取网页图片
  12. python显示中文文件内容_Python实现的json文件读取及中文乱码显示问题解决方法...
  13. 晨哥真有料丨明知道没有结果的爱情,还要继续下去吗?
  14. document.compatMode介绍
  15. (已解决) centos6.5 yum源 失效 The whole CentOS 6 is dead and shouldn’t be used anywhere at all
  16. 光流(八)--总结篇
  17. 路由交换技术vlan、trunk、单臂路由、三层交换、链路聚合、STP
  18. TI FMCW毫米波雷达基础(2)——测速原理
  19. 强制开启android webview debug模式使用Chrome inspect
  20. 请冷静地对待手中的EOS——EOS数据分析

热门文章

  1. 保密协议中竞业限制未写明补偿金的是否可以生效?
  2. MySQL时间分区案例
  3. 一篇了解TrustZone
  4. 小觅双目相机陀螺仪静态数据输出为0+timeshift ubuntu 系统备份
  5. 关键词作用和选择技巧
  6. 【idea配置】idea右下角不显示版本分支
  7. 计算机sci二区期刊,图像处理的sci二区期刊有哪些
  8. 13个Python必备的知识
  9. 163vip邮箱登陆入口,怎么登录163邮箱?
  10. 组态王中Modbus字节顺序的调整