文章目录

  • 前言
  • 思路
  • 特征工程
  • 模型
  • 方案分享
  • 题外话

前言


赛题地址:https://tianchi.aliyun.com/competition/entrance/531858/introduction?spm=5176.12281925.0.0.40727137gkOt3m

在4108支队伍中,本人荣幸得到第22名成绩,感觉实际参赛的人不多 ,因为分数只是超越baseline一点点,而且在复赛中过拟合,但对于想累计经验的我,还是一个不错的成绩。

思路

Github: https://github.com/GioDio1002/tianchi-2nd-hand-car-sales

首先,感谢DataWhale官方的baseline

代码的骨干是基于baseline已经确保线上线下在绝大部分情况下,有一致的变化。之后就是按训练分数增减特征,最后就是调参。诚然,baseline是有极限的,但奈何本人技术不足,不能实现比baseline更好的模板代码,这也是日后自己竞赛需要提升的地方。

特征工程

以下为部分我加入的有效特征工程:

  • KMeans/SVD/PCA的聚类特征
  • 利用Pearson分析中,与Target相关性较高的特征作交叉特征
  • 以类别特征作聚合(Groupby)的情况下,得出与目标值的统计特征
  • 部分类别特征作对数变换

无效特征工程:

  • 归一化
  • 差值统计特征
  • 数据分桶作新维度
  • 重要原始特征交叉熵

模型

只按baseline用了xgboost和lightgbm,因为决定分数的就是特征工程,毕竟是结构化数据,树模型表现已经足够,曾经加入catboost,但提分幅度不大。

方案分享

河北高校邀请赛-二手车交易价格预测-B榜-top13-提交代码01
决赛还在进行中,下次就写个优胜方案复盘吧。

题外话

前一阵子到上海金桥看自由高达像,除了缺少武器和翅膀连着地上,帅就完了。

天池大数据竞赛-河北高校邀请赛——二手车交易价格预测-初赛第22名相关推荐

  1. 王朝阳:河北高校邀请赛 -- 二手车交易价格预测决赛答辩

  2. 黄家懿:河北高校邀请赛 -- 二手车交易价格预测决赛答辩

  3. 【直播】王茂霖:二手车交易价格预测-千变万化特征工程(河北高校数据挖掘邀请赛)

    二手车交易价格预测-千变万化特征工程 目前 河北高校数据挖掘邀请赛 正在如火如荼的进行中.为了大家更好的参赛,王茂霖分享了 从0梳理1场数据挖掘赛事!,完整梳理了从环境准备.数据读取.数据分析.特征工 ...

  4. 【直播】王茂霖:二手车交易价格预测 Baseline 提高(河北高校数据挖掘邀请赛)

    二手车交易价格预测 Baseline 提高 目前 河北高校数据挖掘邀请赛 正在如火如荼的进行中.为了大家更好的参赛,王茂霖分享了 从0梳理1场数据挖掘赛事!,完整梳理了从环境准备.数据读取.数据分析. ...

  5. 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...

    阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!          天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...

  6. 【TIANCHI】天池大数据竞赛(学习赛)--- 淘宝用户购物行为数据可视化分析

    目录 前言 一.数据集的来源和各个字段的意义 二.数据分析 1.引入库 2.读入数据 3.查看数据数量级 4.PV(Page View)/UV访问量 5.漏斗模型 6.用户购买商品的频次分析. 7.A ...

  7. AI比赛-NER:“万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战

    大赛概况 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作.通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础.挑战旨在通过抽 ...

  8. 【算法竞赛学习】二手车交易价格预测-Task1赛题理解

    二手车交易价格预测-Task1 赛题理解 一. 赛题理解 Tip:此部分为零基础入门数据挖掘的 Task1 赛题理解 部分,为大家入门数据挖掘比赛提供一个基本的赛题入门讲解,欢迎后续大家多多交流. 赛 ...

  9. 【算法竞赛学习】二手车交易价格预测-Baseline

    二手车交易价格预测-Baseline Baseline-v1.0 版 Tip:这是一个最初始baseline版本,抛砖引玉,为大家提供一个基本Baseline和一个竞赛流程的基本介绍,欢迎大家多多交流 ...

  10. 【算法竞赛学习】二手车交易价格预测-Task5模型融合

    二手车交易价格预测-Task5 模型融合 五.模型融合 Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多 ...

最新文章

  1. Mysql组复制故障恢复测试
  2. php 框架 laravel 简介
  3. string to byte[]
  4. linux下top命令参数解释
  5. python模块(4)-Collections
  6. 显示墙 显示服务器地址,云墙怎么看服务器地址
  7. Apache+Tomcat实现负载均衡
  8. 如何使用Selenium-Grid
  9. arp映射表查看与管理
  10. c语言汉诺塔课设计报告,汉诺塔游戏的设计
  11. [网络流24题] 06 最长递增子序列(最多不相交路径,最大流)
  12. c语言最近点对问题(4个点)-分治法递归
  13. Linux remote desktop protocol
  14. ERP系统常用SQL集锦(转, 一个网友写的,感觉有点虎头蛇尾,不过还是有价值参考)...
  15. 大数据 SQL Boy 脱坑指南
  16. 黑猫带你学eMMC协议第11篇:eMMC擦除详解(erase/trim/discard/sanitize/secure erase/secure trim...)
  17. 【Zbrush教程】小白也能看懂的ZBrush基础教学,速看
  18. java-php-python-ssm水星家纺网站计算机毕业设计
  19. pwn the box 百度网盘分享链接
  20. 不是我吓唬你,写不出这种代码,那就等着被leader开除吧

热门文章

  1. PowerDesign
  2. C-V2X国内现状分析
  3. hcse5.0全套PPT档
  4. 思科ccnp认证网络工程师关于NAT64协议概述一定要看
  5. Dos系统功能的调用
  6. excle表格导出到本地
  7. 电子系统综合设计作业笔记
  8. 如何用计算机函数计算房租,Excel商铺租金模板,租金每两年递增5%,具备收租期、租赁起止期、单价函数自动计算功能...
  9. 微软消息队列-MicroSoft Message Queue(MSMQ)队列的C#使用
  10. android 天气类应用,一周天气预报!7款另类Android天气应用