数据竞赛中baseline是最入门的分享,

它不仅有思路、方法还有内容;

或许你与Top选手的差距就是一个baseline!

01

项目介绍

如果你是数据竞赛的初学者、爱好者,比赛的baseline不仅是比赛思路分享,同时也是一类数据问题的方法总结。我们想做的就是收集并整理并分享各种比赛的baseline方案。

你可能会问为什么是baseline,而不是获胜者的代码分享?相比于获胜者的代码baseline代码都比较简单,容易整理和学习;其次baseline代码更加实用和简洁,适合入门学习。

https://www.kaggle.com/c/nfl-big-data-bowl-2020/

在每个Kaggle比赛中baseline分享一般都是最受大家欢迎的,也是点赞最多的kernel。比赛的baseline不仅能降低参赛的门槛,同时也能极大程度刺激选手的参赛热情。

鉴于国内比赛平台没有类似的分享机制,于是我们(阿水和鱼佬)在Datawhale计划做一个国内的竞赛baseline分享计划,我们目标是做成国内最完整的竞赛baseline和比赛案例分享项目。

我们的baseline开源项目初步构建完成:

https://github.com/datawhalechina/competition-baseline

02

项目内容

我们对国内外常见的数据竞赛平台进行整理:

国外竞赛平台:

  • Kaggle

  • DrivenData

  • Colalab

  • CrowdAI

  • Kelvins

  • Signate

  • analyticsvidhya

国内竞赛平台:

  • 天池

  • 点石

  • JData

  • DataCastle

  • DataFountain

  • Biendata

  • 科赛

  • AI研习社

  • 图灵联邦

  • AI Studio

  • FlyAI

我们还对国内比赛的baseline进行了全面的整理。为了帮助大家更好的学习,我们根据赛题的数据类型分为三类典型比赛:

  • 结构化数据比赛:表格形式的赛题;

  • 计算机视觉(CV)比赛:图像类型的赛题;

  • 自然语言处理(NLP)比赛:文本类型的赛题;


结构化数据比赛:

  • 白葡萄酒品质预测

  • 肌肉活动电信号推测手势

  • 肌肉活动电信号推测手势

  • Retention Rate of Baidu Hao Kan APP Users

  • kaggle-two-sigma-connect-rental-listing-inquiries

  • kaggle-allstate-claims-severity


计算机视觉CV比赛:

  • 胸腔X光肺炎检测

  • CCF2019-视频版权检测算法

  • kaggle-quickdraw-doodle-recognition

  • TinyMind人民币面值&冠字号编码识别挑战赛


自然语言处理NLP比赛:

  • 智源&计算所-互联网虚假新闻检测挑战赛

  • 互联网金融新实体发现

  • 技术需求与技术成果项目之间关联度计算模型

  • 互联网新闻情感分析

  • 第三届阿里云安全算法挑战赛

03

项目协作

一个优秀的开源项目少不了大家的协作,我们也希望大家踊跃参与到项目的分享过程中,让baseline帮助更多的人学习和成长。

为了让大家更加合理有序的贡献,我们初步制定了以下的协作机制:

  1. 代码按照比赛的形式整理,写明比赛网址、数据类型和解题赛题;

  2. 代码注明运行的环境,机器最低配置,如:

  • 操作系统:Linux,内存16G,

  • Python环境:Python2/3

  • Pytorch版本:0.4.0

  • baseline代码只能提供可运行的代码和思路,请不要提供直接可以提交的结果文件;

  • 代码提供者应对代码版权和共享权负责;

  • Datawhale竞赛群已成立

    扫描下方二维码,添加负责人微信,可申请加入竞赛学习交流群,一起组队参赛(一定要备注:入群+学校/公司+方向例如:入群+浙大+机器学习

    ▲长按加群

    项目地址,欢迎STAR

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!...相关推荐

  1. 爱可可推荐!关于竞赛思路,方法和代码实践,数据竞赛Baseline开源分享!

    数据竞赛中baseline是最入门的分享, 它不仅有思路.方法还有内容: 或许你与Top选手的差距就是一个baseline! 01 项目介绍 如果你是数据竞赛的初学者.爱好者,比赛的baseline不 ...

  2. python求解平方根的方法_Python分享解平方根的方法 python代码改错,关于逐次逼近和分享平方根...

    Python如何使用平方根?所谓喜欢,不过是不清醒时的一种错觉.小编喜欢这种错觉.有那么一瞬间,小编想和你在一起,一辈子. 用Python分享一个数的平方根. At each iteration (l ...

  3. 吐血整理!10 个机器学习教程汇总,爱可可推荐!

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 今天给大家推荐 10 个机器学习课程清单,含课程视频.这份教程是由一名来自硅谷的计算机科学家 ...

  4. 重磅 | 深度学习“四大名著”发布!爱可可推荐!

    红色石头的个人网站:redstonewill.com 前几天,红色石头在逛微博的时候,发现有人转发了@爱可可老师的这样一篇微博: 红色石头很有共鸣,这四本书着实很不错!我们都知道现在机器学习.深度学习 ...

  5. 机器学习笔记(十一)实践之数据竞赛的套路

    前面写了很多篇理论,大家愿意一篇一篇坚持看下来其实挺不容易的,虽然理论很重要,但脱离了实践还是空中楼阁啊,算法科学家也不可能不代码啊,所以呀,今天我们就插播一期实践,和大家聊一聊实际过程当中机器学习算 ...

  6. java按顺序售票方法_java_Java代码实践12306售票算法(二),周五闲来无事,基于上一篇关 - phpStudy...

    Java代码实践12306售票算法(二) 周五闲来无事,基于上一篇关于浅析12306售票算法(java版)理论,进行了java编码实践供各位读者参考(以下为相关代码的简单描述) 1.订票工具类 1.1 ...

  7. 【数据竞赛】厦门国际银行 “数创金融杯”数据建模大赛-冠军分享

    写在前面 冠军团队:三位靓仔 成员介绍:团队成员由当下国内赛圈著名选手组成,一月三冠选手宁缺,赛圈网红林有夕,以及最具潜力选手孙中宇组成. 首先还是非常感谢他们提供的冠军方案分享,下面就一起来看看是如 ...

  8. 独家 | 数据分析@爱可可-爱生活是否在用机器学习算法运营微博

    微博账号@爱可可-爱生活是数据科学圈的网红,因每天分享大量精选的数据科学领域的学习资料而出名,深受粉丝关注和喜爱.该账号每天从早晨4-5点开始发微博,日均发布大几十条原创,有人不禁质疑,它的运营者北邮 ...

  9. 独家 | 数据分析@爱可可-爱生活是否利用机器学习算法运营微博

    微博账号@爱可可-爱生活是数据科学圈的网红,因每天分享大量精选的数据科学领域的学习资料而出名,深受粉丝关注和喜爱.该账号每天从早晨4-5点开始发微博,日均发布大几十条原创,有人不禁质疑,它的运营者北邮 ...

最新文章

  1. 大数据调度平台Airflow(三):Airflow单机搭建
  2. IETester-IE兼容性测试工具
  3. [Linux] 进程间通信
  4. sentinel 时间窗口_Sentinel 实战-规则持久化
  5. @Import-给容器中加载bean的第三种方式
  6. log4j:warn找不到_修复log4j WARN找不到记录器的附加程序,请正确初始化log4j系统
  7. 程序员面试金典——番外篇之下一个较大元素I
  8. 微信开发者工具安装教程
  9. 计算机电气工程论文,计算机在电气工程自动化控制的作用
  10. 郁金香商业辅助教程 2016 笔记 1~5
  11. Unity 2D 自定义碰撞系统(一)
  12. jquery fadeOut 异步
  13. win7计算机里不显示摄像头,win7系统不显示摄像头的解决方法
  14. Bluedroid 打开蓝牙流程
  15. matlab mcl,wsn定位蒙特卡洛方法mcl的matlab
  16. 除了照片征集、视频征集,fotoo还可以征集什么?
  17. 台达PLC中的寄存器如何进行高低位调换?
  18. 【DEVOPS】基于禅道 - 重构研发协作流程
  19. 秋招面经第十一弹:沐瞳科技一面-大数据平台开发工程师
  20. 粤嵌开发板之手机WIFI摄像头

热门文章

  1. 使用Script元素发送JSONP请求
  2. 查看Linux系统中某目录的大小
  3. 永久设置SecureCRT的背景色和文字颜色方案
  4. 6-6.用HLSL定义点光源
  5. 【转载】C语言编译全过程
  6. 技术图文:如何利用BigOne的API制作自动化交易系统 -- 订单系统
  7. Matlab与线性代数 -- 矩阵的大小
  8. Analysis and Design Overview
  9. IDEA HDFS客户端准备
  10. 【 HihoCoder】1082 The Marshtomp has seen it all before (暴力 或 脑力)