金融风控数据挖掘-Task6

  • 一、学习知识点概要
  • 二、学习内容
    • 1、部分难题
    • 2、比赛结果
  • 三、学习问题与解答
    • 1、小数点的意义
  • 四、学习思考与总结

一、学习知识点概要

本文为金融风控数据竞赛的最后一part,在不少的努力下提交了最终的结果,虽然排名不尽人意,但总归是努力的结果。

二、学习内容

1、部分难题

印象最深刻的是task3中的调参过程,所使用的调参方式为贝叶斯调参。

可以看到单是调参过程就花了大概80分钟,而后通过调整一个较小的学习率,使用cv函数确定最优的迭代次数。

中间过程前面已经提及,最终lgb的单模型ROC曲线如下。

2、比赛结果

理论上来说可以通过调lgb,xgb,cat的参数,找最优迭代次数等方法求出不同的test值,再用不同的模型融合方法(stacking,blending,甚至加权)对三种树模型进行融合,然后就是刷分的过程了,大概是这样,但此次由于时间问题,只完整做出了lgb以及部分的xgb模型,然后通过简单的加权得到了最终的结果。

三、学习问题与解答

1、小数点的意义

第一次参加这种数据挖掘比赛,赛前其实一直都有一个问题,类似kaggle这种比赛,选手们多半有一个特殊的爱好,那就是刷排名,通过不断提交新结果,在小数点上做文章,不可否认,一个好的排名能从一定意义上体现一个选手的能力,或者说一个团队的能力,但是,如果在赛后对于这个比赛过程没有一个好的总结,可能有点索然无味的感觉。

四、学习思考与总结

赛前就看到了官方对于此次比赛的难度定义为中,整个过程下来也发现其实难度介于低到中之间,当然如果要研究透不同模型,模型融合等难题那就不止这个难度了,此次比赛,lgb的单模型就可以得到一个不错的分数,显然相当照顾新手,这也是为什么说比赛的完成、结果的提交难度介于低到中之间。

金融风控数据挖掘-Task6相关推荐

  1. 【天池】金融风控数据挖掘task1

    天池金融风控数据挖掘task1 1.赛题理解 赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量.为了保 ...

  2. 金融风控数据挖掘 · Task 2 EDA 数据可视化

    金融风控数据挖掘 · Task 2 EDA 数据可视化 一.数据载入.存储及文件格式 1. 文件格式的读写 常用的数据处理用到的库 二.数据总览 一.数据载入.存储及文件格式 1. 文件格式的读写 常 ...

  3. 金融风控数据挖掘-Task1

    本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampdoc ...

  4. 金融风控数据挖掘--Task1

    赛题分析: 通过给定训练集数据训练得模型,利用AUC作为评测指标,预测测试集中数据评判各属性金融风险. 一.学习内容: 金融风控预测类常见的评估指标 1.ROC曲线 在信号检测理论中,接收者操作特征曲 ...

  5. 金融风控数据挖掘 · Task 5 模型融合

    一.模型融合常见方法 模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大 ...

  6. 数据挖掘实践(金融风控)——task1:赛题理解

    文章目录 数据概况 数据读取 评估指标 数据概况 数据量超过120w,包含47列变量信息,其中15列为匿名变量.80万条作为训练集,20万条作为测试集A,20万条作为测试集B,变量含义如下: id 为 ...

  7. 数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测

    相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...

  8. 零基础入门数据挖掘之金融风控-贷款违约预测

    零基础入门数据挖掘之金融风控-贷款违约预测 摘要 1.数据概况 2.数据读取 3.分类指标评价计算 摘要 在实践中学,很高兴有这次机会,与志同道合的小伙伴一起学习,本次主要通过天池实际比赛项目学习数据 ...

  9. 【数据挖掘】金融风控 Task02 数据分析

    [数据挖掘]金融风控 Task02 数据分析 1. 探索性数据分析(EDA)概述 1. 1 探索性数据分析概念 1.2 探索性数据分析目的 1.3 探索性数据分析(EDA)与传统统计分析(Classi ...

最新文章

  1. 花了我一个晚上浓缩了一整套阿里资深技术专家设计教程整理出的java架构设计方法
  2. 配置bind主域名服务器
  3. DKHadoop人力资源大数据解决方案架构
  4. 用户操作-查询所有用户操作
  5. 区块链应用大数据的优势有哪些
  6. 【合肥黑马程序员】SpringBoot应用Docker化
  7. Docker学习: 配置Docker阿里云的镜像加速器(图文)
  8. Xcode5 symbolicatecrash文件路径
  9. 计算方法——C语言实现——LU分解法求解非线性方程
  10. 凯恩帝绝对坐标清零_凯恩帝100T数控车床怎么把加工数量时间清零
  11. latex 箭头上带_latex 上下箭头
  12. matlab一维数组操作,Matlab创建一维数组的具体操作讲解
  13. php7 pecl安装,PHP7安装pecl:memcached扩展
  14. 在C语言中为什么c1出现错误,我在用C语言编程时,编译后总出现Error:spawning C1.exe的错误,看不懂,是什么意思啊??快快快,谢谢!...
  15. 行深智能亮相乌镇互联网大会,荣获直通乌镇全球互联网大赛一等奖
  16. java计算 月数_Java 计算开始年月到结束年月期间的年月数
  17. 微信公众号获取的封面图片显示‘’此图片来自微信公众平台,未经允许不可引用'的解决方案
  18. abp 链接本地mysql_abp vNext 使用Mysql 数据库
  19. 优秀的软件测试工程师都会以下八点!
  20. 跨境电商小白:一件代发是什么?为什么要选择Starday一件代发?

热门文章

  1. 网络协议-dubbo协议
  2. SAN外置存储阵列和NAS外置存储阵列
  3. matlab物理运动,MATLAB软件在中学物理运动学教学中的应用
  4. 实现动态验证element输入框密码框
  5. android toast怎么改变位置,Android 更改 Toast 的默认位置方法
  6. kubesphere集群部署
  7. matlab参数化翼型,轴流风机机翼型叶片参数化建模方法
  8. [leaflet] 1 esri-leaflet
  9. 干货分享:PCB防静电设计的必要性
  10. php excel class