2018自然语言处理与机器学习论文发表统计
来源:http://www.marekrei.com/blog/ml-and-nlp-publications-in-2018/
翻译:哈工大SCIR 尹庆宇
自然语言处理领域在2018年有着突飞猛进的进步,在论文发表和投递数量都屡创新高,打破历史记录。NeurIPS会议的门票甚至在11分38秒内就售罄。本文对2018年相关会议和期刊的论文发表做出统计,按照作者和机构介绍论文发表情况。
今年的统计包括了如下会议和期刊:ACL, EMNLP, NAACL, EACL, COLING, TACL, CL, CoNLL, NeurIPS(原NIPS), ICML, ICLR, AAAI。这些基本涵盖了目前世界上主流的自然语言处理和机器学习相关会议和期刊。与往年相比,我们去掉了SemEval,因为这个会议更多关注的是评测论文,而在其他会议中也去掉了这类论文。另外,在几年我们也增加了AAAI的统计。本统计用脚本从论文列表中自动统计信息,用多种手段将作者和机构对齐,尽量避免错误。
尽管本统计显示了在过去一年内发表论文数目最多的作者和机构,但是我们觉得论文的质量是我们领域最应该被重视和追求的。下边的图表显示,本领域发展的越来越快,并变得越来越流行。发表一篇高质量,能够被人记住的论文往往比发表10篇很快被遗忘的论文重要。本文只是从高层视角统计了作者在会议中发表论文的情况,可能给新的研究者在论文新想法上些许启发。
会议规模统计
首先,我们对每个会议发表的论文数做出统计(2012-2018)。大多数会议发表的论文数目都有大幅提高,尤其是AAAI和NeurIPS发表的论文数目比上一年多了1000篇以上,EMNLP和NAACL都大幅超越自己的论文发表记录,而ACL和Coling则与历史数目相似。TACL和CL每年的论文发表数目基本不变。
作者统计
接下来,我们按照作者统计了2018年发表论文数目。3个学者在2018年分别贡献了22篇论文,他们是:Ming Zhou(MSRA),Graham Neubig(CMU)和Sergey Levine(UCB)。后续排名的学者分别是Tong Zhang(Tencent AI),Maosong Sun(清华)和Iryna Gurevych(TU Darmstadt)。值得一提的是,哈工大社会计算与信息检索研究中心主任刘挺教授(Ting Liu)共发表论文17篇,排名第10名(华人学者中排名第4)。
我们还统计了从2012年到2018年作者发表的论文总数。来自DeepMind的Chris Dyer排名第一,接下来分别是Ming Zhou(MSRA), Yoshua Bengio(Montreal),Yue Zhang(西湖大学)和Noah A.Smith(Washington)。哈工大社会计算与信息检索研究中心主任刘挺(Ting Liu)教授排名第6(华人学者中排名第3)。
接下来做了各作者不同年份发表的论文数目变化统计。从统计中可以看到,Chris Dyer在两年内论文数目的差距是最大的,Yue Zhang和Ming Zhou也有类似的情况。
第一作者统计
我们还对发表论文的第一作者做出了统计。统计表明,来自南洋理工大学的Yi Tay(博士三年级)共发表10篇论文,大幅领先第二名,排名榜首。
对于2012-2018时间段,Jiwei Li以22篇第一作者论文遥遥领先。
机构统计
在2018年年发表的论文中,按照机构统计的结果如下图所示。与2017年相比,CMU还是占据了榜首的位置。在工业界,Google和Microsoft排名靠前。国内的学校中,清华大学、北京大学、上海交通大学等都榜上有名。
在2012-2018年的全时段排名中,CMU依旧排名榜首。Google和Microsoft排名第二和第三。Princeton, INRIA 和Duke看起来只发表机器学习相关的论文,并不涉及自然语言处理领域。Peking, CAS和Edinburgh在语言处理应用相关论文(NeurIPS/ICML)有着很强的影响力。值得注意的是,哈尔滨工业大学作为国内的四所大学之一上榜。
主题聚类
我们利用主题聚类的方式对作者和机构进行聚类。聚类是通过将所有相关论文放入LDA实现的。聚类的图体现了不同作者或机构发表论文内容的相似程度。
最后,希望大家在2019年有更大收获。
本期责任编辑:张伟男
本期编辑:孙卓
往期推荐:
一大批历史精彩文章啦
谈谈我在自然语言处理进阶上的一些个人拙见
有偿征稿!
概率论从入门到放弃?布朗学霸火到宕机的毕业作品,让统计“看得见”
如何到top5%?NLP文本分类和情感分析竞赛总结
2018自然语言处理与机器学习论文发表统计相关推荐
- MLNLP顶会论文发表总榜:谷歌最狂,清北入前十,周明、张岳、刘挺华人前三...
中美差距何止一丁点! 作者 | 丛末.蒋宝尚 编辑 | 贾伟 伦敦帝国理工学院机器学习和自然语言处理著名学者Marek Rei 教授从2016年起,每年都会对ML&NLP相关的会议论文进行统计 ...
- MLNLP顶会论文发表总榜:谷歌最狂,清北入前十,周明、张岳、刘挺华人前三
2020-02-08 16:38 导语:中美差距何止一丁点! 中美差距何止一丁点! 伦敦帝国理工学院机器学习和自然语言处理著名学者Marek Rei 教授从2016年起,每年都会对ML&NLP ...
- cscd期刊是c刊吗_武工商C刊和北大核心期刊论文发表数量位列全省同类高校前三甲...
近日,知名学术公众号"学术志"发布了2018全国高校C刊论文发表数量排行榜和2018全国高校北大核心期刊论文发表数量排行榜.榜单显示,武汉工商学院2018年共发表C刊论文9篇,位列 ...
- 首发:徐亦达教授团队最新发表的两篇机器学习论文
徐亦达团队在 Asian Conference on Machine Learning 的发表了两篇机器学习论文,本人得到徐老师授权在本站发布论文. 论文 1:Realistic Image Gene ...
- ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)
整理 | Jane 出品| AI科技大本营 [导读]9 月 8 日-14 日,每两年举办一次的 2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,本次会议总共收到了 2439 篇有效 ...
- 年度必读:2018最具突破性人工智能论文Top 10
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | topbots.com.Reddit 转自 | 新智元 本文总结了2018年以来最重要的10 ...
- 必读!2018最具突破性计算机视觉论文Top 10
转载自新智元(AI_era) [导读]本文总结了2018年以来最重要的10篇计算机视觉/图像生成相关的研究,包括许多新颖的架构设计,图像生成方面的突破等. 自从卷积神经网络在特定的图像识别任务上开始超 ...
- 重磅!上海交通大学取消博士论文发表要求!
刚刚不久!上海交通大学研究生院网站公布2021年版<关于申请授予博士学位的规定>,新规正式取消博士研究生毕业需发表2篇论文的强制性要求. 2017年修订版则显示,"就读博士期间, ...
- 【竞赛算法学习】学术前沿趋势分析-论文数据统计
任务1:论文数据统计 1.1 任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量: 任务内容:赛题的理解.使用 Pandas 读取数据并进行统计: 任务成果:学习 Panda ...
- (转)会议期刊论文发表介绍(计算机科学领域)
转自:http://blog.csdn.net/babyfacer/archive/2009/07/25/4377552.aspx 一.计算机科学期刊介绍 计算机科学的publication最大特点在 ...
最新文章
- C++中STL中的大、小、相等概念
- 系列有什么区别_哈弗的F系列和H系列,有什么区别?
- Money Pro for Mac如何导入账单?
- Hdu2558(欧拉函数)
- java爬虫 教程_Java爬虫其实也很简单,教你实用的入门级爬虫
- Checker框架学习笔记
- 内网即时通讯软件优点大全分享
- 【halcon】菜鸡入门,白纸黑点
- LA 5713 Qin Shi Huang's National Road System 最小生成树
- 【爬虫】如何通过爬虫,爬取百度图片?新手小白一看便会,内附超详细代码讲解
- 电驱系列:直流无刷马达(不用芯片,独立元器件搭建)
- python中interval函数_python强大的区间处理库interval用法介绍
- php全角符号转半角,php如何实现全角符号转半角
- 进入BeOS的花花世界 系列六
- Java基础 课后作业错题集
- 三、elasticsearch 实际应用(碎片篇)
- css flex布局超长自动换行
- 树莓派(十三)——使用flask创建视频流媒体服务器
- U盘装系统(Linux)
- 进程调度算法相关习题