文 | Sheryc_王苏

从5月初开始,CV圈似乎开始了一阵MLP“文艺复兴”的热潮:在短短4天时间里,来自谷歌、清华、牛津、Facebook四个顶级研究机构的研究者分别独立发布了4篇关于MLP结构在图像任务上取得不错效果的论文。虽然研究本身令人兴奋,但发表的过程却让人一言难尽:来自牛津的小哥Luke就在reddit上抱怨到他正在进行的实验被谷歌的MLP-Mixer抢先发表(scoop)了,所以他正在撰写的实验总结也只能以实验报告的方式尽快挂在arXiv上。

做研究的过程中,同样的想法被其他研究者抢先发表是家常便饭。或许我们已经对此习以为常,但这真的没有办法解决吗?在NAACL 2021上,就有研究者从心理学、药学等其他学科研究中被普遍使用的“预注册”机制(Pre-registration)出发,为NLP领域量身定做了一套预注册机制,希望能用一套新的研究和投稿流程让作者不再担心被抢先发表不再担心好的研究因为没有SOTA被拒不再担心慢研究赶不上快节奏…根据作者在文中绘制的蓝图,这种机制虽然简单却好处多多,它究竟能够为未来的NLP研究带来什么样的改变呢?

论文题目
Preregistering NLP Research

论文链接
https://arxiv.org/abs/2103.06944

Arxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0525】 下载论文PDF~

什么是预注册?

预注册

所谓预注册,指的是在进行一项研究之前,将自己的详细研究计划在预注册网站[1]上进行注册。预注册的内容反映了在研究开始之前需要考虑的所有事项,例如自己的研究假设、模型设计和实验方案。

在内容上,预注册很像是在申请项目资金时撰写的申请材料,或是研究开始前导师要求撰写的研究计划,不过虽然内容类似,预注册的不同之处在于“注册”二字:这些内容会被提交至网站上,并打上提交之时的时间戳,证明作者在某个时刻已经完成了实验设计。在网站上预注册的内容可以作为实验的初始设计记录、作为实验取得进展或发生变化后记录进度的仓库,甚至可以直接作为“注册报告”(Registered reports)向期刊或会议直接投稿。这种机制早在2018年就已在Science上发文[2]进行过相关讨论,但目前在AI领域还并不常见。

注册报告投稿制度

上文中提到的“注册报告投稿制度正是线上预注册制度的主要副产物。在这种审稿制度下,同行评议过程被分为两个阶段

  1. 研究开始前,作者给审稿人提交一份预注册的研究计划。随后,审稿人根据研究计划进行评审,经过多轮修改,决定是否接收该研究计划

  2. 研究计划被接受后,开始根据已提交的研究计划进行相关实验,撰写论文,随后向审稿人进行第二轮提交。随后,审稿人根据论文进行评审,经过多轮修改,决定是否接收该论文

对于注册报告投稿制度,一般在第一阶段的研究计划被接受后,作者便得到了来自主办方的保证,即只要按照研究计划完成的论文即可被接收,无论实验效果好坏。因此,如果实验计划被认为有意义,即使最终被证明方法无效也可以被接收。

在进行实验时,作者可以随时对研究计划进行修改,但对研究计划的任何修改都需要在最终报告中体现。目前,注册报告投稿制度已经被包括Nature子刊在内的数百种期刊采用。

预注册有哪些好处?

看起来,预注册似乎只是将自己的详细研究方案在开始着手试验之前挂在网站上。但是,这样简单的操作却能带来新的研究范式,改变现有研究中的诸多问题:

  1. 让自己提前完整设计研究方案。在进行研究之前,通过预注册网站上提供的一系列问题列表让自己在动手之前就可以从多个维度仔细思考研究的细节和意义,避免进行无意义的探索。同时,正如NLP大牛Jason Eisner所建议的[3],预注册过程中撰写的报告或许可以作为最终论文的一部分,让自己在开始研究之前就着手撰写论文。

  2. 区分探索性分析(Exploratory)和验证性分析(Confirmatory)。所谓探索性分析指通过实验结果产生新的假设,而验证性分析指通过更多实验和分析验证先前已提出的假设。在一些实际研究中,研究者往往将探索性分析伪装成验证性分析,即首先通过实验得出结果,再通过结果反推出一个假设,说明自己的实验验证了反推出的假设,这种行为被简称为HARKing(Hypothesizing after results are known),会导致产生不严谨的假设。如果是根据注册报告进行评价,则在得到实验结果前就需要对探索性分析和验证性分析进行区分,避免错误假设的出现。

  3. 避免发表偏见[4]。所谓发表偏见,指的是会议或期刊偏好于发表现象显著、结果好的研究,而不偏好现象不明显、结果较差的研究。实际上,有些研究即使结果不好也有其发表价值,但是为了能够让论文发表,研究者倾向于压缩负面的发现,着重强调好的结果。这也难怪为何近年来NeurIPS上还会有“I Can't Believe It's Not Better! Workshop”[5]这样专发没效果的模型的workshop了。但如果根据注册报告投稿制度,根据论文本身的设计来确定接受与否,就可以让研究者在看到哪条路可行的同时,更多的接触到那些前人试过但不可行的方案了。

  4. 避免被他人抢先发表。注册报告制度使得先提出实验方案的人拥有优先权。即使不实行注册报告制度,预注册报告上的时间戳也可以证明提出类似想法的时间先后。预注册报告可以随时选择是否公开,让他人难以直接通过预注册报告剽窃方案。

  5. 鼓励慢科学[6]。当注册报告被同意接受之后,作者不需要担心被提前发表,因此可以不用在尽可能短的时间赶完文章,而是可以选择用更长时间仔细打磨自己的想法,让论文更具深度。

NLP的预注册有什么特点?

不同领域有着不同的研究特点,甚至同一领域内的不同种类论文也有不同的研究方法。这篇论文的最大贡献就在于其对NLP领域内的各类论文分别提出了一个初版的预注册表格,作者在预注册时需要回答表格内的若干问题。

对于NLP领域,作者根据COLING 2018的论文分类将研究分为了3种:计算辅助的语言学分析(Computationally-aided linguistic analysis),NLP工程实验(NLP engineering experiment paper),以及复现/资源/立场/综述(Reproduction/Resource/Position/Survey paper)。其中,作者对于除Position Paper以外的各类研究都给出了推荐的预注册表格。

下面以最为常见的NLP工程实验论文为例,在预注册过程中需要回答以下问题:

  1. 你的研究目的是什么?

  2. 你的研究假设是什么?

  3. 独立变量有哪些(例如:模型结构)?非独立变量有哪些(例如:模型输出好坏)?

  4. 以上变量将被如何衡量

  5. 实验包含几种语料或任务

  6. 你将使用哪些软件库

  7. 你将使用何种硬件

  8. 你将使用何种参数设置

  9. 你将使用什么样的数据

  10. 如果实验数据不存在,请回答关于资源类论文(Resource paper)关于收集数据的预注册问题(原文附录A.6)。如果实验数据存在,你对实验数据的熟悉程度是?你的实验假设在多大程度上与该数据相关?这在多大程度上影响了你方法在其他数据上的泛化性能?你是否准备收集更多数据来验证自己的方法?

  11. 为何选择该数据?这些数据有哪些关键性质

  12. 这些数据是如何被划分为训练集/验证集/测试集的?

  13. 你将如何分析结果并测试自己的假设?如果是自动评测,你将使用什么样的指标和实现?它们被如何设置?如果是人工评测,请回答关于人工评测设置的预注册问题(原文附录A.8.1)

  14. 你是否会进行错误分析?如果是,请回答关于错误分析设置的预注册问题(原文附录A.8.2)

  15. 你是否有其他需要进行预注册的信息?

其他种类论文的预注册表格可以在论文的附录中找到。

可以看到,预注册的问题着重瞄准自己的方法如何能论证/反驳自己的假设,而非如何在数据集上取得更好结果。虽然需要回答的问题很多,但这些问题基本涵盖了NLP实验论文的全部设计细节,在着手试验之前想清楚以上所有问题对于实验的整体把握会有相当大的帮助。

总结

预注册和注册报告制度虽然已经被心理学等学科的顶刊作为标准流程,它的可行性和影响依然在探索之中。不过,对于我们一直以来所诟病的“刷SOTA”、抢创意、堆算力的行为,使用注册报告制度或许能够带来缓解;同时,预注册制度也能让研究者从在单一数据集上追求模型性能的过程中提前跳出来,从更高的角度和更多元的视角上探索自己的方法对整个领域的推动作用。即使预注册不是标准流程,在研究开始前仔细思考和记录预注册问题的结果也能提前避免一些弯路,让后续的实验更有效率。在AI领域日益火爆的当下,对于研究和投稿流程的改进同样是一项重要课题,几年后NLP的研究范式会变成什么样,着实让人期待呢(=•ω•=)

萌屋作者:Sheryc_王苏

北航高等理工学院CS专业的市优秀毕业生,蒙特利尔大学/MILA博士生,资深ACG宅,目前作为实习生在腾讯天衍实验室进行NLP研究。虽主攻NLP,却对一切向更完善的智能迈进的系统和方向充满好奇。如果有一天N宝能真正理解我的文字,这个世界应该会被卖萌占领吧。(还没发过东西的)知乎ID:Sheryc

作品推荐:

  1. NLP未来,路在何方?12位巨佬联名指路!

  2. 这几个模型不讲“模德”,我劝它们耗子尾汁

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1].常用的预注册网站,不妨去看看:Open Science Framework: https://osf.io/prereg/ AsPredicted: https://aspredicted.org/

[2].Science对于预注册的讨论:More and more scientists are preregistering their studies. Should you?. Science. https://www.sciencemag.org/news/2018/09/more-and-more-scientists-are-preregistering-their-studies-should-you

[3].研究之前先开始写:Write the Paper First by Jason Eisner. https://www.cs.jhu.edu/~jason/advice/write-the-paper-first.html

[4].发表偏见:Publication Bias - Wikipedia. https://en.wikipedia.org/wiki/Publication_bias

[5].慢科学与快科学:Research Fast and Slow by Min-Yen Kan. http://bit.ly/kan-coling18

[6].有关预注册机制的更多细节:https://www.cos.io/initiatives/prereg?_ga=2.218660505.1451147193.1621172626-420219689.1621172626

论文投稿新规则,不用跑出SOTA,还能“内定”发论文?!相关推荐

  1. NeurIPS 2019最佳论文出炉,今年增设“新方向奖”,微软华人学者获经典论文奖...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 第32届神经信息处理系统大会(NeurIPS 2019)今天在加拿大温哥华正式召开. 据大会官方介绍,今年的参会人数达到了空前的1.3万人 ...

  2. 武汉大学计算机学院 论文,武大计算机学院教授分享:学术论文投稿与Rebuttal经验...

    原标题:武大计算机学院教授分享:学术论文投稿与Rebuttal经验 新智元推荐 来源:知乎 作者:叶茫 [新智元导读]本文 以笔者近期的几篇论文投稿为例,分享一篇实用的论文学术论文投稿与返修(Rebu ...

  3. NeurIPS 2019 获奖论文出炉,微软华人学者Lin Xiao 获经典论文奖

    导语:历史之最,参会1.3万人~ 作为最久负盛名的机器学习顶会之一,今年 NeurIPS 2019 在召开之前就消息不断:在今年论文审稿期间,NeurIPS 2019 程序委员会主席专门发布声明称,1 ...

  4. 【论文投稿指南】SCI论文投稿后,还需要做啥?

    论文投稿后最开心的时刻莫过于收到论文被期刊接收的录用发表通知啦!但论文被接收还不是这一流程的最终点,接下来还有版权与版面费处理.清样校对.发表与检索.宣传分享与追踪引用等一系列重要工作要进行,可千万不 ...

  5. (新)IEEE Access论文投稿步骤

    1. 进入IEEE Access投稿网站 新的投稿网站: https://ieee.atyponrex.com/journal/ieee-access 需要梯子打开登录页面 旧的投稿网站不能提交了: ...

  6. 还在为论文发愁?ACL组委会手把手教你论文投稿小技巧 | ACL 2017

    虽然ACL大会投稿时间已经结束,但是还有其他各种会议的deadline在等着呀.在投稿的截止日期之前写出一篇完美的论文是众多研究者的心愿,Deadline之前的一个礼拜时间虽短,但是仍能够将一篇文章从 ...

  7. NeurIPS 2019公布获奖论文!新增杰出新方向奖项,微软华裔研究员斩获经典论文...

    来源:大数据文摘 备受瞩目的NeurlPS 2019周日一早在温哥华拉开序幕,今天,组委会通过一篇博客公布了包括杰出论文奖.杰出新方向论文奖等五大类奖项. NeurIPS,全称神经信息处理系统大会(C ...

  8. 下行文格式图片_帮你填平论文投稿格式修改这个大坑,一文了解三大出版社投稿要求...

    点击上方↑ "新能源前线" ↑关注我 [引语] 科研方法:本专栏旨在为大家整理一些研究方法策略,供大家选择参考. 材料人现在已经推出了很多优质的专栏文章,所涉及领域也正在慢慢完善. ...

  9. 【SCI】英文论文投稿经验分享

    发表SCI或EI类英文文章的一些投稿经验[转载] 英文投稿的一点经验[转载] 1. 首先一定要注意杂志的发表范围, 超出范围的千万别投,要不就是浪费时间;另外,每个杂志都有他们的具体格式要求,一定要按 ...

最新文章

  1. 谢文睿:西瓜书 + 南瓜书 吃瓜系列 2. 多元线性回归
  2. php开发以太坊无法连接到远程Geth,connect: permission denied.
  3. ​实时音视频服务的“既要、又要、还要”
  4. 由浅到深理解ROS(8)-线程管理
  5. html代码在线分析,网站html代码解析
  6. 复练-软考网规-两地三中心
  7. 关于类成员函数中访问同类对象的私有成员
  8. MapReduce编程(四) 求均值
  9. [AHOI2006]Editor文本编辑器Splay Pascal
  10. cmd 根据计算机名查ip地址_如何查找和更改Mac上的IP地址
  11. 随机森林评估特征重要性
  12. font-family:中文字体的英文名称 (宋体 微软雅黑)
  13. 两个路由器的有线桥接与无线桥接
  14. 自监督学习(四)Joint Unsupervised Learning of Deep Representations and Image Clusters
  15. response.text 与 response.content
  16. 如何用MathType编辑出积分符号
  17. controller 之@...
  18. MySql报错:unblock with mysqladmin flush-hosts
  19. vscode 无法跳转到定义引用
  20. 计算机视觉(CV)领域的公司

热门文章

  1. hibernate持久化对象
  2. 【JavaScript代码实现四】获取和设置 cookie
  3. PyCharm 5 破解注册方法
  4. vs2010 rdlc 报表及报表控件
  5. strcpy()函数一个简单那程序来了解一下它。。
  6. (转)初次体验.net Ajax无刷新技术
  7. std::string中的find_first_of()和find_last_of()函数
  8. 不知道的,还以为是555牌香烟
  9. Linux kernel 同步机制(下篇)
  10. python os renames_Python3 os.renames() 方法