看了下知乎,反作弊机制无视账号所在不同的IP

如果两个账号的提交文件一模一样,并且没有线上组队,那么就会取消成绩。多次取消成绩封号处理。kaggle官方不接受申诉。

开小号组队的话,整个队伍同样只有五次/天。

另外可以开小号提交不同的模型的效果。

如果多个账号提交别人公开的kernel上面的结果会不会被查呢?应该是不会的。

删号如果开了新号以后,你新提交的和删号前提交的一致,就会被视为作弊,我在这里找到了一个有意思的截图:

如果A账号和B账号曾经(注意是曾经)提交过相同的结果,最后结果不一致,会不会被查呢?不清楚

删号的还有一个效果如下:

如果作弊了,删除账号有没有用呢?

我之前注册了两个号码,一个账号没包含名字想改,改不了,然后去注册了第二个账号,

然后第二个账号就被封了,发邮件给kaggle要求删除第一个才能恢复第二个。

然后就删除了第一个。

然后第一个过几天就彻底连discussion上面的信息都没了。

今天删了一次主号,然后重新注册,没问题,所以还有一种办法是,你注册一个小号,五次上限达到了以后,你可以删除这个号然后重新建,提交新的结果,那么这样理论上你就可以在一天内提交无数次。

但是删号会同时删除你之前其他比赛的所有成绩

另外,kaggle的GPU只让用30个小时,所以从媷羊毛角度,小号也是必须的。

小号还有一个作用就是别人发布了kernel 但是没有提交成绩,那么你可以用小号测试下对方的kernel的submission.csv

另外,提交次数的话是根据账户所在ip的时区来更新的,国内的话,是第二天八点准时更新。

有个自称京东的哥们儿作弊直接导致成绩被取消:

这个人发的notebook是:

IEEE cbt 9600 LB solution | Kaggle

一个小技巧,如果是用临时邮箱注册的小号,那么看过的帖子有更新,怎么知道哪些更新的评论是自己没看过的呢?

很简单,在之前看的时候,给评论点赞,这样点赞过的都会有标记,过几天再来看这个帖子,没点赞过得就是没看过的.

如下:

另外,反作弊系统大概运行时间为不到一天.在通过作弊系统以后,才会发放奖牌.

补充:

作弊被kaggle发现后,你的submission.csv 全部会消失。

如果是因为没有上传代码文件(Two-stage 比赛)被取消成绩,那么submission记录将会保留,呈现:

上面这个是正常的。

下面的这个是作弊处理结果

账号正常的话应该是这样:

也就是说,被查到作弊后,你提交的文件被kaggle吞没作为凭据,按钮"My Submissions消失"你再也不能参加这个比赛了。

另外,还有的人通过两个文件各自乘以一个不同系数来防止"被kaggle认为作弊",注意这个系数不能是这种1.000001

因为小数点后面位数太多的话,两个文件就是一样的了,因为kaggle是计算小数点后面的4~5位,所以

如果你的位数太多,两个文件一致,就会被认为是作弊的了。

举个例子:

帐号a:预测文件predict1.csv=原始文件*1.00001

帐号b:预测文件predict2.csv=原始文件*1.00002

两个帐号分别提交上述结果到同一场比赛,

属于结果一致,会在比赛结束后,两个帐号都会被视为作弊,因为反作弊系统只看前面几位小数.

kaggle具体检测前几位小数?每场比赛检测的小数位数长度各不相同。

一定要记住,如果你开了小号,或者小号借给别人用了,任意两个账号之间的某次提交都不能是同一个文件,如果你乘了一个系数1.000001生成一个文件,kaggle会认为生成后的文件与生成前的一致,视为作弊,两个账号都会有作弊记录,作弊的效果上面的截图中有.被视为作弊后,kaggle禁止申诉,一定要小心,最好是每次提交的时候,都做个记录,严格检查与上次提交的结果不一致。个人比较推荐的习惯就是,每个csv文件只要你修改过,就重命名,并且每次提交文件到kaggle之前,都确定自己提交的是个新名字的文件。

同一个IP登陆多个不同的kaggle账号会不会被判定为作弊呢?

理论上来讲,不会。

①因为一个IP,室内可以团队的各个成员独立参加,他们在百度上的IP都是路由器IP

②IP是动态的,DHCP决定的,也就是每次你启动电脑、打开百度的IP都可以与上一次不一样。所以换位思考,kaggle官方不可能通过绑定"IP和账号"的方式,来判定同一个IP登陆的都是作弊成员。

同一台电脑多个账号提交不同的csv会不会被判定为作弊呢?

理论上来讲,不会。

因为Kaggle没有PC客户端软件,都是网页登陆,理论上来讲,浏览器不会提供你网卡的物理地址给kaggle。不像QQ这种客户端把个人电脑信息扫描个遍。

为什么两个文件里面的数值很接近不会被判定为作弊呢?

因为kaggle的排行榜基本都是在拼小数点后面几位,前几百名成绩都差不多,所以kaggle没法监测这种情况,如果kaggle想要监测,那么kaggle就必须冤枉和错杀排行榜前面做的特别好的一些参赛选手。

注意Two-Stage比赛会同时查stage1和stage2的作弊情况

谈下关于kaggle的反作弊规则相关推荐

  1. 算法系列 - 广告反作弊概述

    以下所有内容均整理于各种博客 文章目录 一.广告名词解释 二.广告作弊手段 三.广告反作弊规则方案 3.1 用户标识 3.2 用户行为 3.3 广告来源 四.广告反作弊机器学习方案 五.参考文档 一. ...

  2. 爱奇艺流量反作弊的“术”与“道”

    爱奇艺流量反作弊的"术"与"道" 本文根据爱奇艺张晓明老师在DataFun Talk大数据风控系列活动中分享的<爱奇艺流量反作弊的"术" ...

  3. 回顾·爱奇艺流量反作弊的“术”与“道”

    作者:张晓明 整理:DataFun社区 社区公众号ID:datafuntalk 今天主要从以下几个方面介绍,首先介绍下流量反作弊相关的介绍,然后是爱奇艺流量反作弊的"道",爱奇艺流 ...

  4. 淘宝反作弊系统的个人理解

    #作弊规则 ##一丶 反作弊部门情况 天猫品控部门:只查天猫,不查淘宝.监察范围:质检.抽检.品牌控.店铺异常情况(刷单.所有违规),全部都管,可以店铺关店,店铺扣分,单品删除,单品降权. 反作弊部门 ...

  5. 图算法在斗鱼反作弊中的实践

    导读:斗鱼作为个人直播平台,长期以来除了普遍存在的灰黑产,虚假流量也是流量风控的重灾区.本文将介绍图算法在斗鱼反作弊中的业务实践,主要内容包括: 斗鱼流量风控业务场景 斗鱼图算法体系 图算法风控建模 ...

  6. O2O防刷单并没那么难,看完这个你也会反作弊了

    前几日传出滴滴快的联合京沪警方打击刷单,什么情况?刷单都到了需要动用警力的地步了?有实力补贴没能力防刷? 今天就要八一八刷单那些事儿,看清楚这里不是传授刷单秘籍,也不是xx天xxx万的运营干货,从产品 ...

  7. 阿里妈妈流量反作弊算法实践

    阿里妈妈是阿里巴巴集团旗下商业数字营销平台.依托阿里巴巴集团核心的商业数据和超级媒体矩阵,为数百万的广告主每年提供上千亿金额的广告服务. 2020年中国互联网广告市场规模达5292亿元,根据秒针< ...

  8. 【实践】阿里妈妈流量反作弊算法实践

    阿里妈妈是阿里巴巴集团旗下商业数字营销平台.依托阿里巴巴集团核心的商业数据和超级媒体矩阵,为数百万的广告主每年提供上千亿金额的广告服务. 2020年中国互联网广告市场规模达5292亿元,根据秒针< ...

  9. 从0到1搭建电商营销数据分析平台(六)——聊聊反作弊

    欢迎关注公众号--<数据三分钟> 一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人.还有面试指导和内推机会. ​       任何一个平台,无论设计得 ...

最新文章

  1. 分布式存储(ceph)技能图谱(持续更新)
  2. Python轻松爬取Rosimm写真网站全部图片
  3. 面向对象C语言编程--抽象数据类型-AbstractDataTypes
  4. VError - Found 0 matching services的根源分析
  5. 数字图像处理之Canny编程实现
  6. mysql版本不支持 loop,loopback4, node mysql connector支持 utf8mb4字符集
  7. python模块time_Python模块:time模块详解(转)
  8. cuda nvcc版本不一致_windows 验证CUDA和CUDNN是否安装成功
  9. 11-Mybatis 延迟加载策略
  10. hung task日志linux,Linux Kernel Crash--hung_task_timeout_secs
  11. 电子书格式,ePub将是趋势
  12. eclipse如何导入一个项目_如何建立一个完美的 Python 项目
  13. golang 读取Excel 或者map字符型返回结构体数组
  14. 早该知道的7个JavaScript技巧
  15. 高端存储下一个爆款凭什么是它?
  16. 前端开发人员的精彩文字
  17. Win 10 无法锁屏,快捷键win+L失效
  18. 全网最全编程学习网站汇总来了,还不赶快收藏
  19. 如何写出一篇好的技术方案?
  20. 批量将多个文件夹整理合并到一个文件夹中

热门文章

  1. 武汉游记,三件新鲜奇葩事
  2. lumia920 和htc 8x的对比评测
  3. [转]百万数据查询优化技巧三四则
  4. html 简单 在线编辑器 ie ff,一款垃圾中的极品HTML编辑器(兼容IE OR FF)
  5. linux 命令博客,Linux命令(一)
  6. unity调整旋转需要传什么参数?参数在数学上叫做什么?_人脸识别背后,卷积神经网络的数学原理原来是这样的...
  7. 炫界 (667) -(回应骑两小)_为什么那么多人喜欢骑地平线
  8. 关于生活与工作的一些反思
  9. 设置输入框placeholder文字颜色
  10. leaflet加载离线地图教程以及下载离线地图瓦片工具