原定于泰国曼谷举行的 ACL-IJCNLP 2021 于 8月2日在线正式开幕。本届会议由中科院自动化所研究员宗成庆担任ACL2021 大会主席,程序主席为来自罗马大学的Roberto Navigli、华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授。

整理:李梦佳,戴一鸣

01

ACL盘点

本次 ACL 大会共提交了 3350篇文章,相较于去年的 3429 篇投稿似乎有所回落。这某种程度上也显示了 AI 的热潮正在回归理性。

在3000+的投稿论文中,有 710 篇普通论文被录用(其中 571篇长文本,139篇短文本)。除此之外,另有 493 篇论文被录用为 Findings paper。

根据程序主席Roberto Nabigli的介绍,今年主会论文的接收率为21.2%,并额外接收了14.7%的论文到Findings子刊。

整体来看,ACL录用率保持在20%~25%之间,没有太大变化;其中长文章录用率基本维持在25%左右,短文章录用率则逐年下降。这表明,ACL大会似乎越来越不喜欢「尚未完成但是已经有了一点成果的工作,或者是得到负面结果的工作」。

Roberto讲到,Findings机制指的是有些论文虽然没有被主会所接收,但工作依然很扎实,有一定的质量和创新性,因而被接收为Findings论文。其中共邀请了493篇论文为Findings论文,有457篇论文作者接受了邀请。

在领域方面,有领域主题的名称有所调整,一些领域进行了融合,如「Semantics: Sentence Level」和「Semantics: Textual Inference and Other Areas of Semantics」整合到了一起。

增加了「NLP for Social Good」这个子主题,该子主题下共有36篇投稿。

所有收录论文所属的领域,前五名的主题和2020年相同,分别为机器学习、机器翻译和多语言、信息抽取、对话系统、NLP应用和句法分析。

在投稿国家方面,本届大会上共有57个国家投稿,其中投稿数前二国家是中国(37.6%)和美国(25.1%),其中中国投稿量是美国的1.5倍之多。

从投稿关注的领域上,今年和2018年有很大区别。3年前,CNN等是研究者关注的重点,但本届大会上最受关注的研究是预训练语言模型,包括BERT、RoBERTa、BART、GPT-2等。

大会还推出了一个用于搜索论文、作者、研究方向等的工具,名为semantic path工具。工具地址:acl.semanticpaths.org。

大会还公布了其他一些数据,例如,在ACL会员方面,ACL已成为人工智能领域最重要的会议之一。从会员数量来看,2020年ACL会员数量超过6000。

以下是本届大会的最佳论文,最佳论文的发布环节在8月4日。

一共会有三场主旨演讲,值得期待。

02

规模最大审稿团队

本届会议组委会堪称历届会议中规模最大的团队,共设置了19个子委员会,共68个共同主席。

夏飞教授则介绍了审稿的具体流程。ACL今年推出了新机制——ACL Rolling Review,适用于所有 ACL 系列会议和 Workshop 的投稿与审稿流程,在EMNLP得到应用。

审稿方面,本次大会的组委会是历届ACL大会中规模最庞大的一次。大会设立了3个程序主席,负责大会的人员招募、流程制定、议程设置等工作,并决定最终接收的论文。

此外,大会招募了60名高级领域主席(SAC),负责招募领域主席、选择审稿人、提名最佳论文和杰出论文等工作。

在领域主席之下是323名领域主席,负责招募审稿人、提名最佳论文和接触论文,撰写评审结果,最初初步提名的工作。大会同时招募了3600多名初级审稿人和260多名高级审稿人,每人负责审阅1-6篇投稿。

值得注意的是,本届大会专门设置了伦理顾问委员会(EAC),其中包括3位主席和56名审稿人。伦理顾问委员会的主要职责是审查论文的社会和伦理问题。在EAC的审核中,247篇论文可能存在问题,其中28篇经过修改后有条件接收。

最佳论文的评审中,候选论文由领域主席和高级主席提名,并由程序委员们提出最终的提名名单。本届大会上,入围提名的有25篇长论文和3篇短论文。最终,最佳论文评选委员会从提名论文中选出了1篇最佳论文和6篇杰出论文。

此外,每个主题赛道(Theme Track)都会选出最佳主题论文,由高级领域主席选出。

03

关注社会 伦理 教育

本届大会上,密歇根大学的Rada Mihalcea教授介绍了ACL组委会近来在推动组织发展方面的工作,以及当前NLP领域的研究趋势和热点问题。

在社会责任方面,ACL已设立了ACL 平等主管一职。主要负责推动多样性、包容性等方面的工作,如推动更为安全和包容的环境等。

在伦理方面,ACL 伦理委员会将会提供一个持续的平台,解决ACL活动和社区提出的伦理问题,并为伦理研究提供指导和解决方案,支撑AI伦理方面的研究。ACL伦理委员会由3名共同主席担任,任期五年,委员会同时将会有6名成员,任期3年。伦理委员会将会确保AACL(亚洲计算语言协会)、EACL(欧洲计算语言协会)和NAACL(北美计算语言协会)都会得到同样的指导。

ACL同时也在加强和高校学生的互动工作,本届大会上,ACL提出了Year-Round Mentorship机制,通过一年的虚拟指导,为学生入门AI领域提供支持。导师来自学术界或在计算语言学领域有关键影响的工业界专家。

学生在研究过程可以获得研究方面的指导,如开题、写论文、是否读博等。目前注册通道已开放。

04

研究热点及趋势

Mihalcea也介绍了ACL近年来NLP领域的研究热点和趋势,并进行了分析。

研究趋势方面,本届ACL的研究可以看到对人工智能在应用和社会发展中的关注,当前这一领域的热门研究内容包括:对话、语言和视觉、计算社会科学、常识、NLP中的伦理问题(隐私安全)等。

从近几年的研究来看,采用词云统计,有关word embeddings的论文数量快速上升。

在研究关注的领域方面,虽然以往的研究者主要关注的是模型的accuracy,但现在研究人员已经开始转向整个AI系统的表现,关注系统准确性

对此,Mihalcea呼吁,研究者不要仅关注SOTA结果,盲目追求系统准确性。她列举了很多研究者需要关注的问题,如可解释性、泛化性等。

可解释性方面,人们需要更透明,更容易用的系统来解决可解释性的问题。研究者需要解答的问题是,「我们到底从这些神经网络当中能够学到什么?」一个可以参考的链接是 http://blackboxnlp.github.io/

除了准确性之外,研究者还要关注算法的泛化性问题,在一个域中训练的网络往往无法迁移到其他域中,或者说很难通过少量的数据就完成迁移。此外,所谓的领域内(in-domain)到底是指什么意思(同一个主题/同一风格/同一级别的形式)?

她举了语种作为例子,英语语言模型的能力很难迁移到世界上更广泛的语言中。解决这个问题可以参考的文章题为NLP beyond English( http://ruder.io/nlp-beyond-english/)

研究者也需要关注AI伦理问题。这就是为什么ACL采纳了美国计算机协会的伦理准则,成立了ACL伦理委员会。

NLP的社会影响方面,Mihalcea认为有很多AI研究具有社会影响,应当予以关注。根据ACL的一项调查,47.5%的人认为,从长期来讲,NLP对于解决某些社会问题是有益处的。30.5%的人认为,NLP在长期来讲在解决大量社会问题方面可以起到关键性作用。

Mihalcea认为,这项调查说明,能够带来潜在社会影响的NLP任务包括,低资源情况下的机器翻译;机器辅助技术;信息的收集和处理(比如自然语言理解、总结、信息检索、问答);心理健康,发现仇恨言论;扼制错误信息的传播。

演讲最后,Mihalcea提到了AI对环境的影响,以及可能带来的垄断问题。她认为,随着超大规模预训练模型成为NLP领域的研究热点,研究人员需要关注训练模型带来的环境影响,减少碳排放等负面效应。

同时,训练大模型的成本非常高昂,研究者需要警惕AI垄断(AI Monoploy)的问题。因为只有大企业、大机构才有能力去研发和训练大模型。


欢迎加入「自然语言处理」交流群!

(与内行人交流日常)


中国投稿第一!ACL2021开幕,历届最大审稿团,预训练刷屏相关推荐

  1. 如何投稿iMeta期刊?ScholarOne投审稿系统作者使用教程

    如何投稿iMeta期刊?ScholarOne投审稿系统作者使用教程 投稿系统ScholarOne Manuscripts(S1M) 主页:https://mc.manuscriptcentral.co ...

  2. 中国谋略第一书:《素书》全文解析

    中国谋略第一书:<素书>全文解析 <素书>以道家思想为宗旨,集儒.法.兵的思想发挥道的作用及功能,同时以道.德.仁.义.礼为立身治国的根本.揆度宇宙万物自然运化的理数,以此认识 ...

  3. 【历史上的今天】8 月 1 日:中国的第一台计算机成功运行;Microsoft Office 首次推出;今日头条上线

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 8 月 1 日,在 126 年前的今天,中国第一次放映电影.1895 年 12 月 28 日,电影在 ...

  4. 【历史上的今天】9 月 17 日:世界上的第一张火车票;GamerDNA 创始人出生;中国开设第一个网上多媒体讲座

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 9 月 17 日,在 28 年前的今天,美国科学家宣告了"生物圈2号"的失败:& ...

  5. (转)完美解决中国工商银行第一代网银U盾(NETPASS)在WIN7 x64下的使用问题

    http://bbs.pcbeta.com/viewthread.php?tid=591837 http://bbs.pcbeta.com/archiver/tid-591837.html 远景论坛  ...

  6. 中国医学计算机成级别像杂志,中国医学计算机成像杂志怎么样,审稿时间

    医务工作者想要获得晋升的必经之路就是有见刊的论文,晋升不同的职位对期刊的级别要求也是不一样的,不同级别的期刊审稿时间也是不同的,今天小编给大家介绍一下<中国医学计算机成像杂志>的审稿时间. ...

  7. “中国版权第一案”思路网总裁拒不认罪遭重判

    "中国版权第一案"思路网总裁拒不认罪遭重判 对于高清视频发烧友来说,思路网可谓鼎鼎大名,它曾是中国最大的高清门户视频网站,也是国内最大最著名的高清盗版影音网站.46岁的思路网总裁周 ...

  8. 中国的第一封电子邮件

    Across the Great Wall we can reach every corner in the world 或许你已经忘记,那就让我们一同来记起. 中国的第一封电子邮件标志着我国进入了互 ...

  9. 「中国加班第一楼」深圳科兴万人大撤离!拖主机带屏幕,程序员公交上写代码!...

    [导读]2022年2月25日下午,被称「中国第一加班楼」的深圳南山科兴科学园据传有人新冠初筛阳性,万名打工人因此撤离.当晚官方发布消息,称封锁楼宇中的筛查结果是阴性,除密接以外解除管控. 被网友称作是 ...

最新文章

  1. 基于希克斯需求价格弹性计算_Serverless弹性伸缩的现状调研(超详细)
  2. html弹窗赋值给查询框,bootstrap模态框动态赋值, ajax异步请求数据后给id为queryInfo的模态框赋值并弹出模态框(JS)...
  3. 使用jvisualvm的jstatd方式远程监控Java程序
  4. css 样式使用方法的累积
  5. 使用tensorflow预测函数的参数值(a simple task)
  6. threadgroup_Java ThreadGroup toString()方法与示例
  7. C++从0到1的入门级教学(十一)——友元
  8. 上海电力学院计算机技术,上海电力学院计算机与信息工程学院介绍
  9. Redhat linux 5.3 基于bond的heartbeat
  10. c语言文件读写_学生信息管理系统(C语言\单向链表\文件读写)
  11. 怎样成为一个好的技术领导者
  12. Oreo易支付程序开源源码分享发行版V1.3
  13. 1.使用Dotnet core命令建立并且运行项目。
  14. 人工智能学c语言还是python-python深入学习好还是直接学人工智能好?
  15. canvas对象arcTo函数的使用-遁地龙卷风
  16. Tomcat的下载与安装
  17. 验证性因子分析中有哪些指标?
  18. 锁存器芯片74HC573芯片的用法,及其在实际电路中的应用
  19. Java相关证书,你考过哪个?
  20. 25G/100G-PON演进与趋势分析

热门文章

  1. 南京工业大学python考试题库_程序设计语言(Python程序设计)答案
  2. oracle向达梦迁移工作量,从Oracle安全移植到国产达梦数据库的DBA实践
  3. 学猫叫用计算机歌词,我们一起学猫叫什么歌歌词是什么意思
  4. Mysql当前的根密码核查_在MySQL数据库中复位根用户的密码的方法
  5. win7如何启动计算机,win7开机启动项怎么设置 电脑开机启动项在哪里设置
  6. 64位微型计算机系统是指内存,重庆2012年计算机非等级考试一级笔试试题
  7. php多进程共享数据库,PHP多进程环境下通过共享内存与信号量实现资源共享
  8. linux下的SIGINT的作用,signal(SIGINT,stop)的问题,大家进来看下!!!
  9. php报500怎么抛出来,PHP将日期爆炸为值并使用if语句抛出500个错误
  10. 为自己搭建一个鹊桥 -- Native Page与Web View之间的JSBridge实现方式