点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

成功复现一篇论文到底有多难?

大概就像这样吧:

可太TM难了——相信这是大多数机器学习研究者都吐槽过的心声。

正义也许会迟到,但绝不会缺席。

这不,就在昨日,PapersWithCode官宣其上线了新功能,在单篇论文的详情页面展示“公开处刑判决书”——论文复现报告。

他们在推特上表示:“这项功能是显示论文成果可复现性的新信号。”并在下方展示了一个案例。

在此案例中,进行复现的研究员如此说道:我们复现的模型准确率与原论文相差不到0.5%,这证明了它在分类任务中的表现是很不错的。当我们将模型应用到语义分割中时,发现结果非常平庸。可以得出结论,与其他贝叶斯方法一样,很难在更复杂的任务上训练该模型。

这篇论文近期已经发表在ReScience C上,ReScience C 是开放获取同行评审期刊,鼓励明确复现已发表的研究。

ReScience C与其他传统科学期刊截然不同。ReScience C 可以说是一个 GitHub 项目,上面提供了关于计算研究的每个新实现以及评审、解释和测试。

对每个提交,他们都会采用公开审查和测试的问题形式,以保证任何研究人员都可以重复使用它。

而这篇论文最初的起源,来自PapersWithCode组织的一个挑战赛——RC 2020。

地址:https://paperswithcode.com/rc2020

近几年,PapersWithCode都在组织顶会论文复现挑战赛,近期他们已经将复现范围扩展到了NeurIPS、ICML、ICLR、ACL、EMNLP、CVPR 和 ECCV等知名AI会议。

所有参赛者提交的复现报告都将经过同行评审,并显示在 PapersWithCode的原始论文旁边。报告会通过 OpenReview 进行同行评审。在每年的挑战赛中,都会有一批优秀的报告发表在 ReScience C上。

在Open Review上,根据这篇论文的评审结果,作者是将模型应用到了分类以外的任务,即语义分割(而这是原始论文中没有做的研究),从而表明该模型不适用于更加复杂的任务。

优秀的复现论文当然不止这篇,Open Review上也列出了所有在RC 2020中被ReScience C接收的论文列表。

地址:https://openreview.net/group?id=ML_Reproducibility_Challenge/2020

你也可以在PapersWithCode上查看RC 2020相关论文。

地址:https://paperswithcode.com/conference/rc-2020

PapersWithCode这家网站在鼓励论文可复现性上一直不遗余力,除了常年组织复现挑战赛,近期他们也和arXiv合作上线了在arXiv页面上传代码链接的功能。

为了不让复现者怀疑人生,他们可真是拼尽了全力。

并非首例

其实在此之前也有研究者自建了一个名为 Papers Without Code 的网站,来张贴复现不了的论文。

起因是这位同时作为Reddit 网友的研究者,在机器学习社区不断地吐槽:“我耗费了一个星期的时间来尝试复现一篇论文,结果每次都是失败。上网搜了一下才发现,原来不止我一个,也有别人无法复现这篇论文。”

他之后又了解到一个粗略的数据:所有论文中可能有 50%-75%是不可复现的。

于是这位网友盛怒之下创建了一个名为「Papers Without Code」的网站,专门方便大家挂出无法复现的机器学习论文研究。这样可以节省研究人员的时间和精力,以免花费不必要的成本去复现一篇根本无法复现的论文结果。

如果某篇论文「光荣上榜」,论文作者会第一时间收到邮件通知,并有机会针对无法复现的问题作出回应,因为这可能是因为在论文中没有交代足够的细节或一些tricks。

网站的建立者希望通过这样来促进机器学习社区之间的有效交流,并培养健康的研究生态。

网站地址:https://www.paperswithoutcode.com/

打开该网站后可以发现目前已经有19篇论文被挂了出来,从左到右的四列分别显示的论文标题、是否被解决、论文链接、提交该论文的原因。

如上图所示,值得注意的是在这19篇论文当中,有8篇论文显示已被解决。

仔细观察后发现原来在作者答复当中,大部分作者更新或上传的代码之后,无法复现的论文就大多得到了解决。

也有作者亲自做出来很详细了回复,感谢大家提出该问题,并详细列出了解决方案以表达歉意。

最后,需要说明的是,硬币总是两面的,论文无法复现不一定都是作者的原因,如果只是一两个人无法复现,而别人却都能复现,这个时候先别着急忙慌地把锅甩到作者身上,造成错怪,年轻人要先从自己身上找找原因,是不是码力不够深厚呢?

另外在某些情况下,即使作者将源代码和数据都公布,其他研究者依然也很难复现出结果。

这可能有很多原因,比如cherry picking:作者从多个实验中挑选出最好的结果,以强行达到 SOTA 水平;或者使用一些tricks,针对数据集来魔法调配模型的参数,以提升实验结果。

除此之外,即使论文结果最终可复现,但因为机器学习模型会针对特定环境和条件过拟合,所以在新的数据集上效果不好也是可以理解的。

最最后,也要防止只会敲一行 import tensorflow as pytorch 的伸手党打着无法复现论文的名义来威胁作者白嫖代码。

“我,白嫖怪,无法(不会、不想、懒得)复现,快交出你的代码!”

参考链接:

https://twitter.com/paperswithcode/status/1400428318898495494

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

公开处刑:PapersWithCode上线“论文复现报告”,遏制耍流氓行为!相关推荐

  1. 论文无法复现「真公开处刑」,PapersWithCode上线「论文复现报告」

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨机器之心 编辑丨极市平台 导读 近日,机器学习资源网站 Pap ...

  2. 公开处刑:研究者自建Papers Without Code网站,张贴复现不了的论文

    来源丨机器之心 编辑丨极市平台 导读 在 Papers 「Without」 Code 网站上,复现不了的论文可是要被公开处刑的,作者也可能面临「社会性死亡」. 「无法复现的论文都是耍流氓.」 二十几天 ...

  3. 公开处刑:复现不了就撤稿!

    最近Reddit 用户「ContributionSecure14」在机器学习社区疯狂吐槽:「我花了一个星期尝试复现一篇论文,结果失败了.上网搜了一下才发现,也有其他人说这篇论文的结果无法复现.」 另一 ...

  4. 宅在家限制智力输出?这场论文复现赛让思维发光

    农历庚子鼠年,我们经历了一个不一样的春节. 大朋友和小朋友宅在家中,囤了口罩,肥了蛮腰,同时还收获了大把的时间来感受宅的无聊.但宅真的一无是处吗?显然并非如此. 当前,宅不仅是一种有效的为国做贡献的举 ...

  5. 这场论文复现的华山论剑,谁能拔得头筹

    问世间,AI技术谁家最高? 每人都有不同的看法.而在各个市场调研机构的眼中,评价一家企业AI技术实力最直观的数据,就是其AI专利和相关论文的产出量. 而评价一个员工在AI方面能力的高低就要复杂一些.因 ...

  6. 经典论文复现 | 基于深度卷积网络的图像超分辨率算法

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

  7. 经典论文复现 | 基于标注策略的实体和关系联合抽取

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

  8. 经典论文复现 | ICML 2017大热论文:Wasserstein GAN

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

  9. 经典论文复现 | InfoGAN:一种无监督生成方法

    过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含"伪代码".这是今年 AAAI ...

最新文章

  1. 抽成 30% 的苹果税是良心价?谷歌也学“坏”了
  2. MyEclipse10中配置开发Python所需要的PyDev 绝对靠谱 不忽悠!
  3. 在java中使用redis
  4. [ffmpeg]安装
  5. 分段路由:一个新的SDN内部技术—Vecloud
  6. Linux/Android Kconfig Makefile defconfig 和 .config关系
  7. 为什么浮点型运算结果会有误差?
  8. 程序员,如何摆脱平庸?
  9. char、varchar、binary和varbinary的区别与联系
  10. 新一代蓝牙对工业物联网(IIOT)的应用
  11. 线性代数矩阵思维导图_斌叔2021考研数学公式:几种特殊形式的矩阵
  12. UIScrollView 遇到的小坑
  13. 动手DIY一个智能镜子
  14. 小程序图片上传,存储,获取,显示
  15. 理想窄高斯脉冲matlab,关于实际采样与理想采样的问题
  16. wps excel查找不定位_Excel查找、替换和定位
  17. 华为云教程(虚拟私有云VPC)
  18. 微信内部浏览器打开网页时提示外部浏览器打开 升级版
  19. 抖音商家找达人带货怎么给链接?抖音带货操作方法分享
  20. List------数据结构

热门文章

  1. 夏天来了,你的数据中心应该跟着热起来
  2. 从CES Asia 2017看智能家居的发展趋势
  3. php5.6.11编译安装报错configure: error: Don't know how to define struct flock on this system
  4. ng-repeat根据多个字段排序
  5. scala 日期格式转换
  6. Scrum指南2020中文版发布/scrum中文网
  7. 假如我是超级卷王。。。
  8. 到底是先更新数据库还是先更新缓存?
  9. NIO中那些奇怪的Buffer
  10. Redis做消息队列,香吗?