kaggle中的Two-Stage比赛规则以及metadata数据的使用规定

[1]是Two-Stage比赛的一些说明.

分为两阶段,

merge deadline之前是stage1,

mereg deadline之后是stage2.

[1]中的意思是为了防止参赛者不写代码直接使用别人的成果,

所以在stage1要求参赛者提供代码,并且要求改代码能复现submission.csv中的数据.

如果不提交代码,就取消最终成绩.

---------------------------------------------------提交模型的方法---------------------------------------------------

先选择Team，如下:

然后选择:

模型和python或者.ipynb文件都需要打包在一个压缩包里面，kaggle只保留最新的压缩包．

总结下就是:

Two-Stage比赛的Stage 1需要在kaggle页面的两个不同的地方

分别提交模型文件以及submission.csv

--------------------------------------------------------------------------------------------------------------------------------------------------------

[2]中提到,

如果代码中带有随机部分,导致submission.csv的结果是不可复现的,那么提交的结果可能会被拒绝.

原文如下:

It is possible for you to be rejected from claiming the prize if your code doesn't generate exactly the outcome because of random seed.(但是我觉得这种问题，要死一起死吧，谁不用random seed?)

[3]中提到,除了提交模型生成的代码文件,还要上传权重文件.

[4]中官方人士提到:

stage1结束后不准再修改代码.

stage2用stage1上传的代码来预测新的测试集.

[5]中提到:

metadata can be used for pre-processing of images, but they cannot be features in your model or used to change or label predictions post-modeling.

意思是dicom中的metadata可以用来预处理，但是不能作为模型的特征。

[6]中提到:

stage1结束后，stage1的测试集会公布类别标签，可以根据自己需要重新训练。

个人感觉:

这类比赛其实是因为kaggle感觉自己也无法提供很有力的设备资源而做出的一种折衷．

总结下：

Two-stage比赛需要提交三个东西,

1.模型(必须在stage1和stage2分别至少提交一次)

2.代码

3.submission.csv(必须在stage1和stage2分别至少提交一次)

4.根据[1],似乎是在进行人工检查。

5.根据[7]如果使用预训练模型，那么只需要在readme文件中指出即可

也就是说，two-stage比赛中需要上传模型指的是上传能产生模型的文件以及其他证明资料即可。

Reference:

[1]Two-Stage Frequently Asked Questions

[2]Two stage competition FAQ

[3]Varying .png resolutions

[4]Model submission for stage 1

[5]2 step pipeline: Predict anys then the hemorrhage type

[6]Will stage1 test data's label be released?

[7]summary of Two-stage competitions

kaggle中的Two-Stage比赛规则以及metadata数据的使用规定相关推荐

解压bz2；kaggle（google人机验证）；pycharm加上参数运行；no module named ‘torch_sparse；像这种在kaggle中运行程序报错—— invalid syn
https://jingyan.baidu.com/article/86fae3461437c53c48121a50.html 关于kaggle一些问题解决办法 - Y-flower - 博客园 Go ...
在kaggle中运行YOLO v5需要输入wandb的选项
这是我实际遇到的一个问题,我在Stack Overflow上找到了答案: python - Kaggle notebook running cell requires input - Stack Ov ...
向kaggle中添加包
1,找到tensorflow_privacy包的路径 2,打包压缩成.zip 3,采用kaggle中添加dataset的形式添加该包 4,添加: import os for dirname, _, f ...
ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数
Kaggle比赛之根据城市自行车共享系统数据预测在某个时间段自行车被租出去的个数目录一.FE整体设计思路二.FE分步骤处理相关代码输出结果一.FE整体设计思路二.FE分步骤处理相关代码 ...
c 窗体中添加mysql控件,MYSQL 统计数据-svn服务器启动-WinFrom控件库|.net开源控件库|HZHControls官网...
统计数据的重要性相信了解ORACLE数据库的都非常清楚,他是生成执行计划的唯一标准,所以统计数据是否准确直接影响到执行计划的正确性, 关于MYSQL虽然没有ORACLE那么多维度的统计数据(比如直方图 ...
Kibana：在 Kibana 中使用 Maps 和 Timelion 分析地震数据
在之前的文章 "使用 Kibana Timelion 进行时间序列分析",我已经介绍了 Kibana 中的 Timelion 可视化工具.在今天的文章中,我将使用 Timelion ...
Kaggle宝典｜使用Python进行全面的数据探索
算法工程师的日常工作中基础最多的便是数据,但是大多数的算法工程师在使用数据过程中,最缺少的还是对数据的整体把控和分析,更多靠的是业务经验.但是严谨的算法工程师在建模之前是需要对数据进行探索和分析的,以 ...
如何爬取知乎中问题的回答以及评论的数据？
如何爬取知乎中问题的回答以及评论的数据? 我们以爬取"为什么中医没有得到外界认可?"为例来讨论一下如何爬取知乎中问题的回答以及评论的数据. 爬取网页数据通常情况下会经历以下三个步骤 ...
php中的全局变量$_POST收集表单数据
< !-- php中的$POST被广泛的用于手机表单数据,在HTML中from的标签指定的该属性是method="post" 下面我们将显示一个输入的字段,以及一个提交的按钮 ...

kaggle中的Two-Stage比赛规则以及metadata数据的使用规定

kaggle中的Two-Stage比赛规则以及metadata数据的使用规定相关推荐

最新文章

热门文章