中国投稿第一!ACL2021开幕,历届最大审稿团,预训练刷屏
原定于泰国曼谷举行的 ACL-IJCNLP 2021 于 8月2日在线正式开幕。本届会议由中科院自动化所研究员宗成庆担任ACL2021 大会主席,程序主席为来自罗马大学的Roberto Navigli、华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授。
整理:李梦佳,戴一鸣
01
ACL盘点
本次 ACL 大会共提交了 3350篇文章,相较于去年的 3429 篇投稿似乎有所回落。这某种程度上也显示了 AI 的热潮正在回归理性。
在3000+的投稿论文中,有 710 篇普通论文被录用(其中 571篇长文本,139篇短文本)。除此之外,另有 493 篇论文被录用为 Findings paper。
根据程序主席Roberto Nabigli的介绍,今年主会论文的接收率为21.2%,并额外接收了14.7%的论文到Findings子刊。
整体来看,ACL录用率保持在20%~25%之间,没有太大变化;其中长文章录用率基本维持在25%左右,短文章录用率则逐年下降。这表明,ACL大会似乎越来越不喜欢「尚未完成但是已经有了一点成果的工作,或者是得到负面结果的工作」。
Roberto讲到,Findings机制指的是有些论文虽然没有被主会所接收,但工作依然很扎实,有一定的质量和创新性,因而被接收为Findings论文。其中共邀请了493篇论文为Findings论文,有457篇论文作者接受了邀请。
在领域方面,有领域主题的名称有所调整,一些领域进行了融合,如「Semantics: Sentence Level」和「Semantics: Textual Inference and Other Areas of Semantics」整合到了一起。
增加了「NLP for Social Good」这个子主题,该子主题下共有36篇投稿。
所有收录论文所属的领域,前五名的主题和2020年相同,分别为机器学习、机器翻译和多语言、信息抽取、对话系统、NLP应用和句法分析。
在投稿国家方面,本届大会上共有57个国家投稿,其中投稿数前二国家是中国(37.6%)和美国(25.1%),其中中国投稿量是美国的1.5倍之多。
从投稿关注的领域上,今年和2018年有很大区别。3年前,CNN等是研究者关注的重点,但本届大会上最受关注的研究是预训练语言模型,包括BERT、RoBERTa、BART、GPT-2等。
大会还推出了一个用于搜索论文、作者、研究方向等的工具,名为semantic path工具。工具地址:acl.semanticpaths.org。
大会还公布了其他一些数据,例如,在ACL会员方面,ACL已成为人工智能领域最重要的会议之一。从会员数量来看,2020年ACL会员数量超过6000。
以下是本届大会的最佳论文,最佳论文的发布环节在8月4日。
一共会有三场主旨演讲,值得期待。
02
规模最大审稿团队
本届会议组委会堪称历届会议中规模最大的团队,共设置了19个子委员会,共68个共同主席。
夏飞教授则介绍了审稿的具体流程。ACL今年推出了新机制——ACL Rolling Review,适用于所有 ACL 系列会议和 Workshop 的投稿与审稿流程,在EMNLP得到应用。
审稿方面,本次大会的组委会是历届ACL大会中规模最庞大的一次。大会设立了3个程序主席,负责大会的人员招募、流程制定、议程设置等工作,并决定最终接收的论文。
此外,大会招募了60名高级领域主席(SAC),负责招募领域主席、选择审稿人、提名最佳论文和杰出论文等工作。
在领域主席之下是323名领域主席,负责招募审稿人、提名最佳论文和接触论文,撰写评审结果,最初初步提名的工作。大会同时招募了3600多名初级审稿人和260多名高级审稿人,每人负责审阅1-6篇投稿。
值得注意的是,本届大会专门设置了伦理顾问委员会(EAC),其中包括3位主席和56名审稿人。伦理顾问委员会的主要职责是审查论文的社会和伦理问题。在EAC的审核中,247篇论文可能存在问题,其中28篇经过修改后有条件接收。
最佳论文的评审中,候选论文由领域主席和高级主席提名,并由程序委员们提出最终的提名名单。本届大会上,入围提名的有25篇长论文和3篇短论文。最终,最佳论文评选委员会从提名论文中选出了1篇最佳论文和6篇杰出论文。
此外,每个主题赛道(Theme Track)都会选出最佳主题论文,由高级领域主席选出。
03
关注社会 伦理 教育
本届大会上,密歇根大学的Rada Mihalcea教授介绍了ACL组委会近来在推动组织发展方面的工作,以及当前NLP领域的研究趋势和热点问题。
在社会责任方面,ACL已设立了ACL 平等主管一职。主要负责推动多样性、包容性等方面的工作,如推动更为安全和包容的环境等。
在伦理方面,ACL 伦理委员会将会提供一个持续的平台,解决ACL活动和社区提出的伦理问题,并为伦理研究提供指导和解决方案,支撑AI伦理方面的研究。ACL伦理委员会由3名共同主席担任,任期五年,委员会同时将会有6名成员,任期3年。伦理委员会将会确保AACL(亚洲计算语言协会)、EACL(欧洲计算语言协会)和NAACL(北美计算语言协会)都会得到同样的指导。
ACL同时也在加强和高校学生的互动工作,本届大会上,ACL提出了Year-Round Mentorship机制,通过一年的虚拟指导,为学生入门AI领域提供支持。导师来自学术界或在计算语言学领域有关键影响的工业界专家。
学生在研究过程可以获得研究方面的指导,如开题、写论文、是否读博等。目前注册通道已开放。
04
研究热点及趋势
Mihalcea也介绍了ACL近年来NLP领域的研究热点和趋势,并进行了分析。
研究趋势方面,本届ACL的研究可以看到对人工智能在应用和社会发展中的关注,当前这一领域的热门研究内容包括:对话、语言和视觉、计算社会科学、常识、NLP中的伦理问题(隐私安全)等。
从近几年的研究来看,采用词云统计,有关word embeddings的论文数量快速上升。
在研究关注的领域方面,虽然以往的研究者主要关注的是模型的accuracy,但现在研究人员已经开始转向整个AI系统的表现,关注系统准确性。
对此,Mihalcea呼吁,研究者不要仅关注SOTA结果,盲目追求系统准确性。她列举了很多研究者需要关注的问题,如可解释性、泛化性等。
可解释性方面,人们需要更透明,更容易用的系统来解决可解释性的问题。研究者需要解答的问题是,「我们到底从这些神经网络当中能够学到什么?」一个可以参考的链接是 http://blackboxnlp.github.io/
除了准确性之外,研究者还要关注算法的泛化性问题,在一个域中训练的网络往往无法迁移到其他域中,或者说很难通过少量的数据就完成迁移。此外,所谓的领域内(in-domain)到底是指什么意思(同一个主题/同一风格/同一级别的形式)?
她举了语种作为例子,英语语言模型的能力很难迁移到世界上更广泛的语言中。解决这个问题可以参考的文章题为NLP beyond English( http://ruder.io/nlp-beyond-english/)
研究者也需要关注AI伦理问题。这就是为什么ACL采纳了美国计算机协会的伦理准则,成立了ACL伦理委员会。
NLP的社会影响方面,Mihalcea认为有很多AI研究具有社会影响,应当予以关注。根据ACL的一项调查,47.5%的人认为,从长期来讲,NLP对于解决某些社会问题是有益处的。30.5%的人认为,NLP在长期来讲在解决大量社会问题方面可以起到关键性作用。
Mihalcea认为,这项调查说明,能够带来潜在社会影响的NLP任务包括,低资源情况下的机器翻译;机器辅助技术;信息的收集和处理(比如自然语言理解、总结、信息检索、问答);心理健康,发现仇恨言论;扼制错误信息的传播。
演讲最后,Mihalcea提到了AI对环境的影响,以及可能带来的垄断问题。她认为,随着超大规模预训练模型成为NLP领域的研究热点,研究人员需要关注训练模型带来的环境影响,减少碳排放等负面效应。
同时,训练大模型的成本非常高昂,研究者需要警惕AI垄断(AI Monoploy)的问题。因为只有大企业、大机构才有能力去研发和训练大模型。
欢迎加入「自然语言处理」交流群!
(与内行人交流日常)
中国投稿第一!ACL2021开幕,历届最大审稿团,预训练刷屏相关推荐
- 如何投稿iMeta期刊?ScholarOne投审稿系统作者使用教程
如何投稿iMeta期刊?ScholarOne投审稿系统作者使用教程 投稿系统ScholarOne Manuscripts(S1M) 主页:https://mc.manuscriptcentral.co ...
- 中国谋略第一书:《素书》全文解析
中国谋略第一书:<素书>全文解析 <素书>以道家思想为宗旨,集儒.法.兵的思想发挥道的作用及功能,同时以道.德.仁.义.礼为立身治国的根本.揆度宇宙万物自然运化的理数,以此认识 ...
- 【历史上的今天】8 月 1 日:中国的第一台计算机成功运行;Microsoft Office 首次推出;今日头条上线
整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 8 月 1 日,在 126 年前的今天,中国第一次放映电影.1895 年 12 月 28 日,电影在 ...
- 【历史上的今天】9 月 17 日:世界上的第一张火车票;GamerDNA 创始人出生;中国开设第一个网上多媒体讲座
整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 9 月 17 日,在 28 年前的今天,美国科学家宣告了"生物圈2号"的失败:& ...
- (转)完美解决中国工商银行第一代网银U盾(NETPASS)在WIN7 x64下的使用问题
http://bbs.pcbeta.com/viewthread.php?tid=591837 http://bbs.pcbeta.com/archiver/tid-591837.html 远景论坛 ...
- 中国医学计算机成级别像杂志,中国医学计算机成像杂志怎么样,审稿时间
医务工作者想要获得晋升的必经之路就是有见刊的论文,晋升不同的职位对期刊的级别要求也是不一样的,不同级别的期刊审稿时间也是不同的,今天小编给大家介绍一下<中国医学计算机成像杂志>的审稿时间. ...
- “中国版权第一案”思路网总裁拒不认罪遭重判
"中国版权第一案"思路网总裁拒不认罪遭重判 对于高清视频发烧友来说,思路网可谓鼎鼎大名,它曾是中国最大的高清门户视频网站,也是国内最大最著名的高清盗版影音网站.46岁的思路网总裁周 ...
- 中国的第一封电子邮件
Across the Great Wall we can reach every corner in the world 或许你已经忘记,那就让我们一同来记起. 中国的第一封电子邮件标志着我国进入了互 ...
- 「中国加班第一楼」深圳科兴万人大撤离!拖主机带屏幕,程序员公交上写代码!...
[导读]2022年2月25日下午,被称「中国第一加班楼」的深圳南山科兴科学园据传有人新冠初筛阳性,万名打工人因此撤离.当晚官方发布消息,称封锁楼宇中的筛查结果是阴性,除密接以外解除管控. 被网友称作是 ...
最新文章
- 基于希克斯需求价格弹性计算_Serverless弹性伸缩的现状调研(超详细)
- html弹窗赋值给查询框,bootstrap模态框动态赋值, ajax异步请求数据后给id为queryInfo的模态框赋值并弹出模态框(JS)...
- 使用jvisualvm的jstatd方式远程监控Java程序
- css 样式使用方法的累积
- 使用tensorflow预测函数的参数值(a simple task)
- threadgroup_Java ThreadGroup toString()方法与示例
- C++从0到1的入门级教学(十一)——友元
- 上海电力学院计算机技术,上海电力学院计算机与信息工程学院介绍
- Redhat linux 5.3 基于bond的heartbeat
- c语言文件读写_学生信息管理系统(C语言\单向链表\文件读写)
- 怎样成为一个好的技术领导者
- Oreo易支付程序开源源码分享发行版V1.3
- 1.使用Dotnet core命令建立并且运行项目。
- 人工智能学c语言还是python-python深入学习好还是直接学人工智能好?
- canvas对象arcTo函数的使用-遁地龙卷风
- Tomcat的下载与安装
- 验证性因子分析中有哪些指标?
- 锁存器芯片74HC573芯片的用法,及其在实际电路中的应用
- Java相关证书,你考过哪个?
- 25G/100G-PON演进与趋势分析
热门文章
- 南京工业大学python考试题库_程序设计语言(Python程序设计)答案
- oracle向达梦迁移工作量,从Oracle安全移植到国产达梦数据库的DBA实践
- 学猫叫用计算机歌词,我们一起学猫叫什么歌歌词是什么意思
- Mysql当前的根密码核查_在MySQL数据库中复位根用户的密码的方法
- win7如何启动计算机,win7开机启动项怎么设置 电脑开机启动项在哪里设置
- 64位微型计算机系统是指内存,重庆2012年计算机非等级考试一级笔试试题
- php多进程共享数据库,PHP多进程环境下通过共享内存与信号量实现资源共享
- linux下的SIGINT的作用,signal(SIGINT,stop)的问题,大家进来看下!!!
- php报500怎么抛出来,PHP将日期爆炸为值并使用if语句抛出500个错误
- 为自己搭建一个鹊桥 -- Native Page与Web View之间的JSBridge实现方式