谈下关于kaggle的反作弊规则
看了下知乎,反作弊机制无视账号所在不同的IP
如果两个账号的提交文件一模一样,并且没有线上组队,那么就会取消成绩。多次取消成绩封号处理。kaggle官方不接受申诉。
开小号组队的话,整个队伍同样只有五次/天。
另外可以开小号提交不同的模型的效果。
如果多个账号提交别人公开的kernel上面的结果会不会被查呢?应该是不会的。
删号如果开了新号以后,你新提交的和删号前提交的一致,就会被视为作弊,我在这里找到了一个有意思的截图:
如果A账号和B账号曾经(注意是曾经)提交过相同的结果,最后结果不一致,会不会被查呢?不清楚
删号的还有一个效果如下:
如果作弊了,删除账号有没有用呢?
我之前注册了两个号码,一个账号没包含名字想改,改不了,然后去注册了第二个账号,
然后第二个账号就被封了,发邮件给kaggle要求删除第一个才能恢复第二个。
然后就删除了第一个。
然后第一个过几天就彻底连discussion上面的信息都没了。
今天删了一次主号,然后重新注册,没问题,所以还有一种办法是,你注册一个小号,五次上限达到了以后,你可以删除这个号然后重新建,提交新的结果,那么这样理论上你就可以在一天内提交无数次。
但是删号会同时删除你之前其他比赛的所有成绩
另外,kaggle的GPU只让用30个小时,所以从媷羊毛角度,小号也是必须的。
小号还有一个作用就是别人发布了kernel 但是没有提交成绩,那么你可以用小号测试下对方的kernel的submission.csv
另外,提交次数的话是根据账户所在ip的时区来更新的,国内的话,是第二天八点准时更新。
有个自称京东的哥们儿作弊直接导致成绩被取消:
这个人发的notebook是:
IEEE cbt 9600 LB solution | Kaggle
一个小技巧,如果是用临时邮箱注册的小号,那么看过的帖子有更新,怎么知道哪些更新的评论是自己没看过的呢?
很简单,在之前看的时候,给评论点赞,这样点赞过的都会有标记,过几天再来看这个帖子,没点赞过得就是没看过的.
如下:
另外,反作弊系统大概运行时间为不到一天.在通过作弊系统以后,才会发放奖牌.
补充:
作弊被kaggle发现后,你的submission.csv 全部会消失。
如果是因为没有上传代码文件(Two-stage 比赛)被取消成绩,那么submission记录将会保留,呈现:
上面这个是正常的。
下面的这个是作弊处理结果:
账号正常的话应该是这样:
也就是说,被查到作弊后,你提交的文件被kaggle吞没作为凭据,按钮"My Submissions消失"你再也不能参加这个比赛了。
另外,还有的人通过两个文件各自乘以一个不同系数来防止"被kaggle认为作弊",注意这个系数不能是这种1.000001
因为小数点后面位数太多的话,两个文件就是一样的了,因为kaggle是计算小数点后面的4~5位,所以
如果你的位数太多,两个文件一致,就会被认为是作弊的了。
举个例子:
帐号a:预测文件predict1.csv=原始文件*1.00001
帐号b:预测文件predict2.csv=原始文件*1.00002
两个帐号分别提交上述结果到同一场比赛,
属于结果一致,会在比赛结束后,两个帐号都会被视为作弊,因为反作弊系统只看前面几位小数.
kaggle具体检测前几位小数?每场比赛检测的小数位数长度各不相同。
一定要记住,如果你开了小号,或者小号借给别人用了,任意两个账号之间的某次提交都不能是同一个文件,如果你乘了一个系数1.000001生成一个文件,kaggle会认为生成后的文件与生成前的一致,视为作弊,两个账号都会有作弊记录,作弊的效果上面的截图中有.被视为作弊后,kaggle禁止申诉,一定要小心,最好是每次提交的时候,都做个记录,严格检查与上次提交的结果不一致。个人比较推荐的习惯就是,每个csv文件只要你修改过,就重命名,并且每次提交文件到kaggle之前,都确定自己提交的是个新名字的文件。
同一个IP登陆多个不同的kaggle账号会不会被判定为作弊呢?
理论上来讲,不会。
①因为一个IP,室内可以团队的各个成员独立参加,他们在百度上的IP都是路由器IP
②IP是动态的,DHCP决定的,也就是每次你启动电脑、打开百度的IP都可以与上一次不一样。所以换位思考,kaggle官方不可能通过绑定"IP和账号"的方式,来判定同一个IP登陆的都是作弊成员。
同一台电脑多个账号提交不同的csv会不会被判定为作弊呢?
理论上来讲,不会。
因为Kaggle没有PC客户端软件,都是网页登陆,理论上来讲,浏览器不会提供你网卡的物理地址给kaggle。不像QQ这种客户端把个人电脑信息扫描个遍。
为什么两个文件里面的数值很接近不会被判定为作弊呢?
因为kaggle的排行榜基本都是在拼小数点后面几位,前几百名成绩都差不多,所以kaggle没法监测这种情况,如果kaggle想要监测,那么kaggle就必须冤枉和错杀排行榜前面做的特别好的一些参赛选手。
注意Two-Stage比赛会同时查stage1和stage2的作弊情况。
谈下关于kaggle的反作弊规则相关推荐
- 算法系列 - 广告反作弊概述
以下所有内容均整理于各种博客 文章目录 一.广告名词解释 二.广告作弊手段 三.广告反作弊规则方案 3.1 用户标识 3.2 用户行为 3.3 广告来源 四.广告反作弊机器学习方案 五.参考文档 一. ...
- 爱奇艺流量反作弊的“术”与“道”
爱奇艺流量反作弊的"术"与"道" 本文根据爱奇艺张晓明老师在DataFun Talk大数据风控系列活动中分享的<爱奇艺流量反作弊的"术" ...
- 回顾·爱奇艺流量反作弊的“术”与“道”
作者:张晓明 整理:DataFun社区 社区公众号ID:datafuntalk 今天主要从以下几个方面介绍,首先介绍下流量反作弊相关的介绍,然后是爱奇艺流量反作弊的"道",爱奇艺流 ...
- 淘宝反作弊系统的个人理解
#作弊规则 ##一丶 反作弊部门情况 天猫品控部门:只查天猫,不查淘宝.监察范围:质检.抽检.品牌控.店铺异常情况(刷单.所有违规),全部都管,可以店铺关店,店铺扣分,单品删除,单品降权. 反作弊部门 ...
- 图算法在斗鱼反作弊中的实践
导读:斗鱼作为个人直播平台,长期以来除了普遍存在的灰黑产,虚假流量也是流量风控的重灾区.本文将介绍图算法在斗鱼反作弊中的业务实践,主要内容包括: 斗鱼流量风控业务场景 斗鱼图算法体系 图算法风控建模 ...
- O2O防刷单并没那么难,看完这个你也会反作弊了
前几日传出滴滴快的联合京沪警方打击刷单,什么情况?刷单都到了需要动用警力的地步了?有实力补贴没能力防刷? 今天就要八一八刷单那些事儿,看清楚这里不是传授刷单秘籍,也不是xx天xxx万的运营干货,从产品 ...
- 阿里妈妈流量反作弊算法实践
阿里妈妈是阿里巴巴集团旗下商业数字营销平台.依托阿里巴巴集团核心的商业数据和超级媒体矩阵,为数百万的广告主每年提供上千亿金额的广告服务. 2020年中国互联网广告市场规模达5292亿元,根据秒针< ...
- 【实践】阿里妈妈流量反作弊算法实践
阿里妈妈是阿里巴巴集团旗下商业数字营销平台.依托阿里巴巴集团核心的商业数据和超级媒体矩阵,为数百万的广告主每年提供上千亿金额的广告服务. 2020年中国互联网广告市场规模达5292亿元,根据秒针< ...
- 从0到1搭建电商营销数据分析平台(六)——聊聊反作弊
欢迎关注公众号--<数据三分钟> 一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人.还有面试指导和内推机会. 任何一个平台,无论设计得 ...
最新文章
- 分布式存储(ceph)技能图谱(持续更新)
- Python轻松爬取Rosimm写真网站全部图片
- 面向对象C语言编程--抽象数据类型-AbstractDataTypes
- VError - Found 0 matching services的根源分析
- 数字图像处理之Canny编程实现
- mysql版本不支持 loop,loopback4, node mysql connector支持 utf8mb4字符集
- python模块time_Python模块:time模块详解(转)
- cuda nvcc版本不一致_windows 验证CUDA和CUDNN是否安装成功
- 11-Mybatis 延迟加载策略
- hung task日志linux,Linux Kernel Crash--hung_task_timeout_secs
- 电子书格式,ePub将是趋势
- eclipse如何导入一个项目_如何建立一个完美的 Python 项目
- golang 读取Excel 或者map字符型返回结构体数组
- 早该知道的7个JavaScript技巧
- 高端存储下一个爆款凭什么是它?
- 前端开发人员的精彩文字
- Win 10 无法锁屏,快捷键win+L失效
- 全网最全编程学习网站汇总来了,还不赶快收藏
- 如何写出一篇好的技术方案?
- 批量将多个文件夹整理合并到一个文件夹中
热门文章
- 武汉游记,三件新鲜奇葩事
- lumia920 和htc 8x的对比评测
- [转]百万数据查询优化技巧三四则
- html 简单 在线编辑器 ie ff,一款垃圾中的极品HTML编辑器(兼容IE OR FF)
- linux 命令博客,Linux命令(一)
- unity调整旋转需要传什么参数?参数在数学上叫做什么?_人脸识别背后,卷积神经网络的数学原理原来是这样的...
- 炫界 (667) -(回应骑两小)_为什么那么多人喜欢骑地平线
- 关于生活与工作的一些反思
- 设置输入框placeholder文字颜色
- leaflet加载离线地图教程以及下载离线地图瓦片工具