晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI论文,到底该不该强制开源代码?

NeurIPS 2020官方近日发布了一份开源指南。从2019开始,NeurIPS就“强烈建议”提交论文代码,不过仍非强制。

但无论如何,官方传达出了一种信号:AI学术顶会开源代码已是行业趋势。

NeurIPS此举也引发了一场“年经”式的讨论:如果将来学术会议要求必须开源,投稿人应该拒绝吗?

而让人始料未及的是,不少网友认为:不开源,我有理。

反对一:代码并没有那么重要

首先,开源代码的目的是什么?是为了让其他研究者可以复现结果。

如果一篇论文包含足够多的细节,那么别人就可以根据其中的公式自己写出代码,对于这类论文,可以不公开代码。不过前提必须是提供足够多的细节。

比如谷歌的AlphaGo就没有开源代码,但是没有人怀疑它的正确性,事实上也有很多人根据谷歌论文复现了AlphaGo。

而且作者本人的代码可能会出现错误,不开源的一个好处就是让其他研究者独立复现。

万一作者在代码里挖了个不明显的“坑”,其他人也可以规避,防止被带到沟里。

另外,也不要高估代码的价值,经典论文可以几十年长盛不衰,但是代码很可能十年后就难以运行了。

当然,还有一种观点就是,对于AI来说,数据集更重要。没有数据的代码是没有价值的,而很多数据集没法开放,这意味着你即使拿到代码,也无法复现SOTA结果。

反对二:要为作者考虑

不开源同时也是为了照顾作者的种种特殊情况。

比如一些研究者是从事纯理论的研究。有一个网友就说,他甚至都不知道怎么构建Docker容器,虽然发表了多篇论文都在GitHub上开源了代码,但它从来不维护。

所以,论文是否开源应该根据代码对于文章的重要性而定,不该一刀切。

还有一些商业公司的研究者,他们在写论文的时候用到了公司内部专有软件库,如果强制开源,他们必须从头再写一遍代码,费时费力,对这些人也是不公平的。

还有一些作者,本身并不是不想开源,而是希望能够将成果保护一段时间,在论文发布几个月后再开源代码,这对于从事医疗、法律领域的学者很重要。

综上所述,反方网友认为,强制开源过于极端,应该对论文开源持鼓励态度,而不是强制。

支持开源:不开源怎能让人信服

首先是一名从事石油行业的网友说,他们行业的数据都是商业机密,所以不会发布任何数据和代码,甚至会在文章中丢掉一些公式来隐藏成果,还声称98%的正确率。结果怎能让人信服。

他认为不公开数据和代码,就像把一篇论文中所有的关键要素都删了,这样的研究即使发表出来也毫无价值。

还有一些人认为,强制开源会改变其他行业对机器学习的偏见。

很多其他学科的人都把机器学习看成伪科学,这是为什么?因为AI领域的论文发布过程非常不成熟。

科学方法的关键是一致性和可重复性。追逐单一的指标,每个人都对SOTA着迷,这是一个巨大的问题。

而开源是解决此问题的一种方法。

去年,AI知名女学者Anima Anandkumar曾在个人博客里公开喊话,强烈反对发论文却不给代码的行为,呼吁学术会议强制要求投稿同时必须公开代码。

她认为不开源代码不利于评审论文,不利于对论文造假的追责,更不利于行业开放竞争。

你觉得公开的学术论文也应该公开代码么?

参考链接:

https://www.reddit.com/r/MachineLearning/comments/fzss9t/d_if_a_paper_or_project_doesnt_publicly_release/

https://www.reddit.com/r/MachineLearning/comments/fzp8bu/d_official_neurips_2020_guidelines_for_making/

作者系网易新闻·网易号“各有态度”签约作者

END

在看,让更多人看到  

AI论文代码强制开源?“我反对!”相关推荐

  1. 论文代码不开源,应该被直接拒稿?

    公众号关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 转自机器之心 前不久,图灵奖得主 Yann LeCun 公开质疑谷歌大脑的论 ...

  2. 估值一亿的AI核心代码现已开源

    package ai.core;import java.util.Scanner;/*** @description: AI核心代码*/ public class AiMain {public sta ...

  3. 民间估值1个亿的AI核心代码终于开源了...

    今天,朋友圈被一则AI届的重要事件刷屏! 今天,是一个里程碑式的开始! 从今日起 每一个AI人 都可以昂头挺胸的说 我们不光只有PPT!!! 我们还有估值1个亿的开源代码!!! 周五快乐喽 本图来源网 ...

  4. 约束多目标优化 约束多目标进化/演化算法入门论文文献推荐 大部分论文代码已开源

      在实际生活中常常会碰到需要同时优化多个目标的应用问题,这些问题又往往包含许多个约束条件,这样的问题通常被称为约束多目标优化问题,它的数学表达式为: minimizeF(x)=(f1(x),f2(x ...

  5. 价值一个亿的 AI 核心代码!开源了~

    点击上方"Java基基",选择"设为星标" 做积极的人,而不是积极废人! 源码精品专栏 原创 | Java 2020 超神之路,很肝~ 中文详细注释的开源项目 ...

  6. “我为什么反对AI论文强制开源代码”

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI论文,到底该不该强制开源代码? NeurIPS 2020官方近日发布了一份开源指南.从2019开始,NeurIPS就"强烈建 ...

  7. VLM:Meta AI CMU提出任务无关视频语言模型视频理解预训练VLM,代码已开源!(ACL 2021)...

    关注公众号,发现CV技术之美 本文分享 ACL 2021 论文『VLM: Task-agnostic Video-Language Model Pre-training for Video Under ...

  8. 本周AI热点回顾:30行代码,让27吨发电机原地爆炸;Photoshop把AI论文demo打包实现了;2块钱就能买上千张人脸照片

    点击左上方蓝字关注我们 01 Photoshop把AI论文demo打包实现了:照片上色.改年龄.换表情只需要点点鼠标 这两年,我们从很多论文中看到过一些令人惊艳的 demo,比如老照片自动上色.低画质 ...

  9. 完整复现何恺明ICCV获奖论文结果并开源 !(附论文开源代码)

    ICCV 作为计算机视觉的顶级会议,2017年共收到2143篇论文投稿,比上一届ICCV2015的1698篇增加了26.2%.共621篇被选为大会论文,录用比例28.9%:poster.spotlig ...

最新文章

  1. KV数据存储:持久化
  2. 新浪博客服务器维护,服务器安全维护
  3. WPF指南之一(WPF的结构)
  4. JFinal之学习资源
  5. js屏蔽浏览器(IE和FireFox)的刷新和右键等功能
  6. 【Python】判断字符串中是否含有某个子串
  7. ASP.NET Core快速入门(第1章:介绍与引入)--学习笔记
  8. 子类既要实现接口又要继承抽象类的一个demo
  9. mysql怎么获得权限_mysql怎么给用户加权限
  10. 用了这些浏览器插件,让你的科研效率飞起
  11. 计算机英语辅助翻译软件,计算机辅助翻译(CAT)软件 计算机辅助翻译(CAT)软件 v6.3.0.616...
  12. Linux自动启动ssh方法
  13. mysql 有没有minus_MySQL实现差集(Minus)和交集(Intersect)
  14. APP中方法超过64K的解决办法
  15. ADB修改mumu模拟器分辨率
  16. 小程序改变swiper样式(带缩略图)
  17. wh6服务器怎么修改,文华财经怎样设置云服务器
  18. php微信公众号支付vue,vue项目使用微信公众号支付总结及遇到的坑
  19. 离线识别率最高的Python人脸识别系统
  20. unity 利用NavMeshAgent2D实现怪物追人

热门文章

  1. LeetCode实战:有效的括号
  2. 反转!BAT编程吸金榜来了,AI程序员刷爆了......
  3. 乘风破浪的PTM:两年来预训练模型的技术进展
  4. 针对《评人工智能如何走向新阶段》一文,继续发布国内外的跟贴留言477-486条如下:
  5. 吴恩达的Landing.ai又迎来一位AI大牛
  6. 如何用Python做三阶拼图?
  7. Reddit欲融资3亿美元,由腾讯领投
  8. 12岁AI开发者现身DuerOS发布会:得开发者得天下
  9. Microsoft HoloLens 入华一周年,都有哪些进展?
  10. 40 个 Spring Boot 常用注解