金融风控数据挖掘-Task6
金融风控数据挖掘-Task6
- 一、学习知识点概要
- 二、学习内容
- 1、部分难题
- 2、比赛结果
- 三、学习问题与解答
- 1、小数点的意义
- 四、学习思考与总结
一、学习知识点概要
本文为金融风控数据竞赛的最后一part,在不少的努力下提交了最终的结果,虽然排名不尽人意,但总归是努力的结果。
二、学习内容
1、部分难题
印象最深刻的是task3中的调参过程,所使用的调参方式为贝叶斯调参。
可以看到单是调参过程就花了大概80分钟,而后通过调整一个较小的学习率,使用cv函数确定最优的迭代次数。
中间过程前面已经提及,最终lgb的单模型ROC曲线如下。
2、比赛结果
理论上来说可以通过调lgb,xgb,cat的参数,找最优迭代次数等方法求出不同的test值,再用不同的模型融合方法(stacking,blending,甚至加权)对三种树模型进行融合,然后就是刷分的过程了,大概是这样,但此次由于时间问题,只完整做出了lgb以及部分的xgb模型,然后通过简单的加权得到了最终的结果。
三、学习问题与解答
1、小数点的意义
第一次参加这种数据挖掘比赛,赛前其实一直都有一个问题,类似kaggle这种比赛,选手们多半有一个特殊的爱好,那就是刷排名,通过不断提交新结果,在小数点上做文章,不可否认,一个好的排名能从一定意义上体现一个选手的能力,或者说一个团队的能力,但是,如果在赛后对于这个比赛过程没有一个好的总结,可能有点索然无味的感觉。
四、学习思考与总结
赛前就看到了官方对于此次比赛的难度定义为中,整个过程下来也发现其实难度介于低到中之间,当然如果要研究透不同模型,模型融合等难题那就不止这个难度了,此次比赛,lgb的单模型就可以得到一个不错的分数,显然相当照顾新手,这也是为什么说比赛的完成、结果的提交难度介于低到中之间。
金融风控数据挖掘-Task6相关推荐
- 【天池】金融风控数据挖掘task1
天池金融风控数据挖掘task1 1.赛题理解 赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量.为了保 ...
- 金融风控数据挖掘 · Task 2 EDA 数据可视化
金融风控数据挖掘 · Task 2 EDA 数据可视化 一.数据载入.存储及文件格式 1. 文件格式的读写 常用的数据处理用到的库 二.数据总览 一.数据载入.存储及文件格式 1. 文件格式的读写 常 ...
- 金融风控数据挖掘-Task1
本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampdoc ...
- 金融风控数据挖掘--Task1
赛题分析: 通过给定训练集数据训练得模型,利用AUC作为评测指标,预测测试集中数据评判各属性金融风险. 一.学习内容: 金融风控预测类常见的评估指标 1.ROC曲线 在信号检测理论中,接收者操作特征曲 ...
- 金融风控数据挖掘 · Task 5 模型融合
一.模型融合常见方法 模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大 ...
- 数据挖掘实践(金融风控)——task1:赛题理解
文章目录 数据概况 数据读取 评估指标 数据概况 数据量超过120w,包含47列变量信息,其中15列为匿名变量.80万条作为训练集,20万条作为测试集A,20万条作为测试集B,变量含义如下: id 为 ...
- 数据挖掘机器学习[六]---项目实战金融风控之贷款违约预测
相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...
- 零基础入门数据挖掘之金融风控-贷款违约预测
零基础入门数据挖掘之金融风控-贷款违约预测 摘要 1.数据概况 2.数据读取 3.分类指标评价计算 摘要 在实践中学,很高兴有这次机会,与志同道合的小伙伴一起学习,本次主要通过天池实际比赛项目学习数据 ...
- 【数据挖掘】金融风控 Task02 数据分析
[数据挖掘]金融风控 Task02 数据分析 1. 探索性数据分析(EDA)概述 1. 1 探索性数据分析概念 1.2 探索性数据分析目的 1.3 探索性数据分析(EDA)与传统统计分析(Classi ...
最新文章
- 花了我一个晚上浓缩了一整套阿里资深技术专家设计教程整理出的java架构设计方法
- 配置bind主域名服务器
- DKHadoop人力资源大数据解决方案架构
- 用户操作-查询所有用户操作
- 区块链应用大数据的优势有哪些
- 【合肥黑马程序员】SpringBoot应用Docker化
- Docker学习: 配置Docker阿里云的镜像加速器(图文)
- Xcode5 symbolicatecrash文件路径
- 计算方法——C语言实现——LU分解法求解非线性方程
- 凯恩帝绝对坐标清零_凯恩帝100T数控车床怎么把加工数量时间清零
- latex 箭头上带_latex 上下箭头
- matlab一维数组操作,Matlab创建一维数组的具体操作讲解
- php7 pecl安装,PHP7安装pecl:memcached扩展
- 在C语言中为什么c1出现错误,我在用C语言编程时,编译后总出现Error:spawning C1.exe的错误,看不懂,是什么意思啊??快快快,谢谢!...
- 行深智能亮相乌镇互联网大会,荣获直通乌镇全球互联网大赛一等奖
- java计算 月数_Java 计算开始年月到结束年月期间的年月数
- 微信公众号获取的封面图片显示‘’此图片来自微信公众平台,未经允许不可引用'的解决方案
- abp 链接本地mysql_abp vNext 使用Mysql 数据库
- 优秀的软件测试工程师都会以下八点!
- 跨境电商小白:一件代发是什么?为什么要选择Starday一件代发?