Kaggle比赛平台每年都会举办N多有价值的比赛,吸引了全球的用户参与。但作为参赛选手的你,你知道今年Kaggle最热门的比赛吗?今年最常见的比赛库是什么?

90页竞赛年鉴领取方式见文末,Kaggle年鉴内容(2022年度):

  • 比赛类型统计

  • 参赛选手统计

  • 模型&库统计

  • 比赛内容统计

比赛类型统计

2022年度举办57场比赛,共吸引了全球6万人次参加,总共提交方案84万次,总奖金162万美元。

  • Feature:工业赛赛题,难度较大

  • Research:学术赛题,难度较大

  • Playground:练习赛,难度适中

  • Analytics:数据分析赛

  • Getting Started:入门赛,难度较低

  • Kernel赛题:通过Notebook提交的比赛

  • 非Kernel赛题:通过Notebook & 文件提交的比赛

今年Kaggle比赛按照比赛任务可划分有7个方向,其中数据挖掘和计算机视觉占比较多:

  • 大部分数据挖掘赛题来自Playground,没有比赛积分和奖牌

  • 部分视觉比赛是Kernel赛题,而所有文本赛题是Kernel赛题

  • 今年金融量化比赛比往年多,但语音识别比赛比往年少

  • 今年视觉赛题为语义分割赛题居多,纯分类赛题较少

Kaggle年度热门比赛

比赛名称 比赛方向 参赛人数 提交次数
Ubiquant Market Prediction 金融量化 1646 16151
Santa 2022 - The Christmas Card   Conundrum 组合优化 1312 11766
Kore 2022 强化学习 1003 9971
H&M   Personalized Fashion Recommendations 推荐系统 860 7235
UW-Madison   GI Tract Image Segmentation 计算机视觉 1176 8902
Feedback   Prize - English Language Learning 自然语言处理 886 5984
American Express -   Default Prediction 数据挖掘 1278 16346

参赛选手统计

Kaggle平台上男性选手占比为77%,和「Coggle」公众号性别占比相同。大部分的Kaggle用户在40岁,且20 – 30之间年轻人比较多

  • 40%左右的Kaggle用户拥有硕士学历,高学历占比较多

  • Coursera是Kaggle用户最偏爱的在线学习平台

参赛工具统计

Python是第一编程语言,其次是SQL和R。具统计Kaggle上R语言的Notebook在逐渐变少。

  • Jupyter Notebook是最受欢迎的IDE,其次是VSCode

  • Colab和Kaggle是最受欢迎的Notebook平台

  • 机器学习库流行排序:scikit-learn、XGBoost、LightGBM、Catboost、Caret

  • 深度学习库流行排序:TensorFlow、Keras、Pytorch、Jax

  • 可视化库流行排序:Matplotlib、Seaborn、Plotly、ggplot2

比赛内容汇总

更多内容,请查看年鉴PDF。

Kaggle学习路径

【参赛建议】:数据挖掘类型

  • 赛题难度:入门、进阶赛题居多

  • 参赛建议:适合小白入门,对机器配置要求低

  • 常见赛题方向:二分类、多分类、回归、时序预测

  • 必备Python库:Pandas、Sklearn、XGBoost、LightGBM、CatBoost

  • 常见模型:树模型和集成学习居多

【参赛建议】:计算机视觉类型

  • 赛题难度:进阶和较难居多,需要GPU支持

  • 参赛建议:适合学习深度学习入门,建议以分类赛题入门

  • 常见赛题方向:图像多分类、细粒度分类、语义分割

  • 必备Python库:Pytorch、TensorFlow、timm

  • 常见模型:CNN模型、transformer模型

【学习资料】:XGBoost / LightGBM / CatBoost

XGBoost / LightGBM / CatBoost是高阶的树模型,是数据挖掘竞赛必备库。ü XGBoost使用案例,LightGBM使用案例,CatBoost使用案例

  • 学习难度:⭐⭐⭐⭐⭐

  • 【基础】能完成训练和与预测

  • 【进阶】能进行交叉验证进行验证和预测,能使用Early Stop

  • 【进阶】能使用GPU进行训练和预测,并对类别进行编码

  • 【进阶】能对模型进行可视化,计算特征重要性,并进行特征筛选

  • 【深入】理解模型超参数含义,会对模型进行调参

  • 【深入】能自定义损失函数与评价函数

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码

Kaggle 2022 年鉴发布!涵盖竞赛趋势 57场比赛方案汇总!相关推荐

  1. 第十六届智能车竞赛广东省线上比赛成绩汇总

    简 介: 第十六届全国大学生智能车竞赛广东赛区采用 线上竞赛方式 进行.参赛的学校 分成四个高校组合比赛点 进行比赛.经过7月22,23两天的调试比赛,安装 线上比赛赛道 规格进行了一轮的正式比赛.没 ...

  2. Gartner发布《2022年12大技术趋势》:超自动化连续3年入选

    近日,全球著名咨询调查机构Gartner发布了<2022年12大技术趋势>报告. 12大技术分别是数据结构.网络安全网格.隐私增强计算 .云原生平台.可组合应用程序.决策智能.超自动化.人 ...

  3. 《2022大数据产业年度趋势人物》榜重磅发布丨金猿奖

    ‍ 年度金猿榜单/奖项 本届"数据猿年度金猿策划活动--2022大数据产业年度趋势人物榜单/奖项"由金猿&数据猿共同推出. ‍数据智能产业创新服务媒体 --聚焦数智 · 改 ...

  4. 《2022产业互联网安全十大趋势》发布,专家学者透析产业安全新变化

    2月28日,在中国产业互联网发展联盟指导下,人民邮电报.中国信息安全.腾讯安全联合实验室.腾讯研究院联合推出<2022产业互联网安全十大趋势>.该报告由<中国信息安全>杂志出品 ...

  5. 北大占3成、00后超一半,2022阿里全球数学竞赛77位获奖者出炉

    来源:机器之心 2022 阿里巴巴全球数学竞赛于今年 3 月 14 日(国际数学日)正式开赛,竞赛吸引了来自全球 70 余个国家,55028 人注册报名,注册人数创历史新高. 本年度参赛者年龄跨越不同 ...

  6. 【竞赛相关】Kaggle竞赛宝典国内外竞赛方案汇总

    本文汇总了kaggle竞赛宝典将近50个竞赛的Top方案&思路&代码. 2019年度所有国内外竞赛汇总 干货 | 2019 数据竞赛TOP方案合集 数据竞赛2019年度年鉴发布(250 ...

  7. 【数据竞赛】Kaggle竞赛宝典国内外竞赛方案汇总

    本文汇总了kaggle竞赛宝典将近50个竞赛的Top方案&思路&代码.关注"kaggle竞赛宝典"并在后台输入"竞赛宝典",还将获得5个kagg ...

  8. 召唤AI大神与病毒作战!Kaggle发起CORD-19数据集文本挖掘竞赛

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转自新智元.   新智元报道   来源:Kaggle 编辑:王芳,元子 [新智元导读]对抗冠状病毒,岂可少了AI?近日,艾伦AI研究所等顶级研究小组 ...

  9. 【移动开发】InfoQ 2022 年移动和物联网趋势报告

    关键要点 由于 SwiftUI 和 Jetpack Compose 的日益成熟和采用,构建声明式 UI 显然已成为 iOS 和 Android 世界的一种趋势. 移动应用程序的跨平台故事也在缓慢而稳定 ...

最新文章

  1. DBUtils连接池,websocket
  2. [CQOI2012]模拟工厂 题解(搜索+贪心)
  3. Ubuntu瘦身与扩容运动
  4. 大事件后台管理系统开发实战(下)
  5. Win11蓝屏100%不重启解决方法
  6. android中自定义的dialog中的EditText无法弹出输入法解决方案
  7. Winodws10 system进程占用磁盘100%
  8. AutoCAD Civil 3D-横断面-创建横断面、横断面图及采样线的编辑(断面法工程量计算)
  9. T32 dump 连续寄存器
  10. 清华大学计算机系成立量子软件研究中心,应明生受聘为主任
  11. ERP、APS与MES系统是什么?
  12. 编程到底学的是什么,主次又是什么
  13. 总线Bus是什么意思
  14. 【计量经济学】异方差性
  15. 自学编程的妙方法,直接省了几万块钱报班,不收藏就可惜了!
  16. 06_04_任务二:SSM拉勾教育后台管理系统(广告模块与用户模块)
  17. Linux 系统怎么改开机密码
  18. python+milvus实现一个以图搜图系统
  19. python 大智慧股池_跟我从零开始学会大智慧股票池自动交易
  20. 一,survey:person re-identification:past,present and future

热门文章

  1. 2021-04-04
  2. 全排列问题(可重复排列和不可重复排列)
  3. 使用Powerdesigner绘制数据流图
  4. 电脑手写板怎么才能连接电脑使用
  5. 深入浅出内存管理--kmalloc支持的最大内存分配
  6. 标准编解码结构的局限性
  7. weblogic 控制台访问路径
  8. win 8 store app 中国国内航班 隐私声明
  9. OpenERP 千位分隔符(thousand separator)
  10. Python 程序:24点计算器