kaggle中的Two-Stage比赛规则以及metadata数据的使用规定
[1]是Two-Stage比赛的一些说明.
分为两阶段,
merge deadline之前是stage1,
mereg deadline之后是stage2.
[1]中的意思是为了防止参赛者不写代码直接使用别人的成果,
所以在stage1要求参赛者提供代码,并且要求改代码能复现submission.csv中的数据.
如果不提交代码,就取消最终成绩.
---------------------------------------------------提交模型的方法---------------------------------------------------
先选择Team,如下:
然后选择:
模型和python或者.ipynb文件都需要打包在一个压缩包里面,kaggle只保留最新的压缩包.
总结下就是:
Two-Stage比赛的Stage 1需要在kaggle页面的两个不同的地方
分别提交模型文件以及submission.csv
--------------------------------------------------------------------------------------------------------------------------------------------------------
[2]中提到,
如果代码中带有随机部分,导致submission.csv的结果是不可复现的,那么提交的结果可能会被拒绝.
原文如下:
It is possible for you to be rejected from claiming the prize if your code doesn't generate exactly the outcome because of random seed.(但是我觉得这种问题,要死一起死吧,谁不用random seed?)
[3]中提到,除了提交模型生成的代码文件,还要上传权重文件.
[4]中官方人士提到:
stage1结束后不准再修改代码.
stage2用stage1上传的代码来预测新的测试集.
[5]中提到:
metadata can be used for pre-processing of images, but they cannot be features in your model or used to change or label predictions post-modeling.
意思是dicom中的metadata可以用来预处理,但是不能作为模型的特征。
[6]中提到:
stage1结束后,stage1的测试集会公布类别标签,可以根据自己需要重新训练。
个人感觉:
这类比赛其实是因为kaggle感觉自己也无法提供很有力的设备资源而做出的一种折衷.
总结下:
Two-stage比赛需要提交三个东西,
1.模型(必须在stage1和stage2分别至少提交一次)
2.代码
3.submission.csv(必须在stage1和stage2分别至少提交一次)
4.根据[1],似乎是在进行人工检查。
5.根据[7]如果使用预训练模型,那么只需要在readme文件中指出即可
也就是说,two-stage比赛中需要上传模型指的是上传能产生模型的文件以及其他证明资料即可。
Reference:
[1]Two-Stage Frequently Asked Questions
[2]Two stage competition FAQ
[3]Varying .png resolutions
[4]Model submission for stage 1
[5]2 step pipeline: Predict anys then the hemorrhage type
[6]Will stage1 test data's label be released?
[7]summary of Two-stage competitions
kaggle中的Two-Stage比赛规则以及metadata数据的使用规定相关推荐
- 解压bz2;kaggle(google人机验证);pycharm加上参数运行;no module named ‘torch_sparse;像这种在kaggle中运行程序报错—— invalid syn
https://jingyan.baidu.com/article/86fae3461437c53c48121a50.html 关于kaggle一些问题解决办法 - Y-flower - 博客园 Go ...
- 在kaggle中运行YOLO v5需要输入wandb的选项
这是我实际遇到的一个问题,我在Stack Overflow上找到了答案: python - Kaggle notebook running cell requires input - Stack Ov ...
- 向kaggle中添加包
1,找到tensorflow_privacy包的路径 2,打包压缩成.zip 3,采用kaggle中添加dataset的形式添加该包 4,添加: import os for dirname, _, f ...
- ML之FE:Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数
Kaggle比赛之根据城市自行车共享系统数据预测在某个时间段自行车被租出去的个数 目录 一.FE整体设计思路 二.FE分步骤处理 相关代码 输出结果 一.FE整体设计思路 二.FE分步骤处理 相关代码 ...
- c 窗体中添加mysql控件,MYSQL 统计数据-svn服务器启动-WinFrom控件库|.net开源控件库|HZHControls官网...
统计数据的重要性相信了解ORACLE数据库的都非常清楚,他是生成执行计划的唯一标准,所以统计数据是否准确直接影响到执行计划的正确性, 关于MYSQL虽然没有ORACLE那么多维度的统计数据(比如直方图 ...
- Kibana:在 Kibana 中使用 Maps 和 Timelion 分析地震数据
在之前的文章 "使用 Kibana Timelion 进行时间序列分析",我已经介绍了 Kibana 中的 Timelion 可视化工具.在今天的文章中,我将使用 Timelion ...
- Kaggle宝典|使用Python进行全面的数据探索
算法工程师的日常工作中基础最多的便是数据,但是大多数的算法工程师在使用数据过程中,最缺少的还是对数据的整体把控和分析,更多靠的是业务经验.但是严谨的算法工程师在建模之前是需要对数据进行探索和分析的,以 ...
- 如何爬取知乎中问题的回答以及评论的数据?
如何爬取知乎中问题的回答以及评论的数据? 我们以爬取"为什么中医没有得到外界认可?"为例来讨论一下如何爬取知乎中问题的回答以及评论的数据. 爬取网页数据通常情况下会经历以下三个步骤 ...
- php中的全局变量$_POST收集表单数据
< !-- php中的$POST被广泛的用于手机表单数据,在HTML中from的标签指定的该属性是method="post" 下面我们将显示一个输入的字段,以及一个提交的按钮 ...
最新文章
- python游戏-零基础python教程-用Python设计你的第一个小游戏
- 测试设备和Android机怎么传递消息,如何检测设备是Android手机还是Android平板电脑?...
- Play框架的用户验证。
- aix系统java堆_浅谈AIX环境下的Java性能调优
- python函数sn_Python plist.SndRcvList方法代码示例
- android 开发 切图,Android开发,切图网站推荐。
- 语音识别技术的研究难点以及未来发展方向
- OC省字典的数组摘要集
- 腾讯社交广告大赛回来的感悟
- 「 C++ 通讯 」“Socket通信原理(TCP/IP)”研究
- 【USACO题库】3.2.4 Feed Ratios饲料调配
- ArcGIS\QGIS无插件加载(无偏移)MapBox高清影像图
- ahri8.php,松鼠症仓库自行更新规则后无法获取正确的title
- 如何识别企业内的“千里马”?
- codevs1373 射命丸文
- 悟空HRM人力资源系统正式开源发布
- router学习(二): 路由导航守卫
- 深入理解编译系统(0.1)
- 数学建模图论算法学习总结
- 基于matlab的数字信号发生器及简易电子琴设计,简易电子琴电路的设计仿真与实现课程设计...
热门文章
- CVE-2015-1635(MS15-034)-HTTP.sys远程代码执行复现
- 安卓java音乐播放器下一曲_Android实现简单音乐播放器(MediaPlayer)
- link 和 @import 的区别
- angularjsl路由_AngularJS实现路由实例
- python基于rsa的数字签名实现_青岛宽客聚会期权定价公式基于python的实现
- python怎么使用int四舍五入_使用Python 3的数字格式可以将数字四舍五入到成百上千个...
- Rolling element bearing diagnostics using the Case Western Reserve University data-学习笔记
- 2021年10月到12月一个月学习总结2
- Matlab/Eigen矩阵填充问题
- 算法设计之—直接 遍历/穷举法、贪心算法、动态规划、回溯法、EM方法