昨天实验室一位刚进组的同学发邮件来问我如何查找学术论文,这让我想起自己刚读研究生时茫然四顾的情形:看着学长们高谈阔论领域动态,却不知如何入门。经过研究生几年的耳濡目染,现在终于能自信地知道去哪儿了解最新科研动态了。我想这可能是初学者们共通的困惑,与其只告诉一个人知道,不如将这些Folk Knowledge写下来,来减少更多人的麻烦吧。当然,这个总结不过是一家之谈,只盼有人能从中获得一点点益处,受个人认知所限,难免挂一漏万,还望大家海涵指正。

  1. 国际学术组织、学术会议与学术论文
    

自然语言处理(natural language processing,NLP)在很大程度上与计算语言学(computational linguistics,CL)重合。与其他计算机学科类似,NLP/CL有一个属于自己的最权威的国际专业学会,叫做The Association for ComputationalLinguistics(ACL,URL:http://aclweb.org/),这个协会主办了NLP/CL领域最权威的国际会议,即ACL年会,ACL学会还会在北美和欧洲召开分年会,分别称为NAACL和EACL。除此之外,ACL学会下设多个特殊兴趣小组(special interest groups,SIGs),聚集了NLP/CL不同子领域的学者,性质类似一个大学校园的兴趣社团。其中比较有名的诸如SIGDAT(Linguistic data and corpus-based approaches toNLP)、SIGNLL(Natural Language Learning)等。这些SIGs也会召开一些国际学术会议,其中比较有名的就是SIGDAT组织的EMNLP(Conference on Empirical Methods on NaturalLanguage Processing)和SIGNLL组织的CoNLL(Conference on Natural LanguageLearning)。此外还有一个International Committee on ComputationalLinguistics的老牌NLP/CL学术组织,它每两年组织一个称为International Conference on ComputationalLinguistics (COLING)的国际会议,也是NLP/CL的重要学术会议。NLP/CL的主要学术论文就分布在这些会议上。

作为NLP/CL领域的学者最大的幸福在于,ACL学会网站建立了称作ACL Anthology的页面(URL:http://aclweb.org/anthology-new/),支持该领域绝大部分国际学术会议论文的免费下载,甚至包含了其他组织主办的学术会议,例如COLING、IJCNLP等,并支持基于Google的全文检索功能,可谓一站在手,NLP论文我有。由于这个论文集合非常庞大,并且可以开放获取,很多学者也基于它开展研究,提供了更丰富的检索支持,具体入口可以参考ACL Anthology页面上方搜索框右侧的不同检索按钮。

与大部分计算机学科类似,由于技术发展迅速,NLP/CL领域更重视发表学术会议论文,原因是发表周期短,并可以通过会议进行交流。当然NLP/CL也有自己的旗舰学术期刊,发表过很多经典学术论文,那就是Computational Linguistics(URL:http://www.mitpressjournals.org/loi/coli)。该期刊每期只有几篇文章,平均质量高于会议论文,时间允许的话值得及时追踪。此外,ACL学会为了提高学术影响力,也刚刚创办了Transactions of ACL(TACL,URL:http://www.transacl.org/),值得关注。值得一提的是这两份期刊也都是开放获取的。此外也有一些与NLP/CL有关的期刊,如ACM Transactions on Speech and LanguageProcessing,ACM Transactions on Asian Language InformationProcessing,Journal of QuantitativeLinguistics等等。

根据Google Scholar Metrics 2013年对NLP/CL学术期刊和会议的评价,ACL、EMNLP、NAACL、COLING、LREC、Computational Linguistics位于前5位,基本反映了本领域学者的关注程度。

NLP/CL作为交叉学科,其相关领域也值得关注。主要包括以下几个方面:(1)信息检索和数据挖掘领域。相关学术会议主要由美国计算机学会(ACM)主办,包括SIGIR、WWW、WSDM等;(2)人工智能领域。相关学术会议主要包括AAAI和IJCAI等,相关学术期刊主要包括Artificial Intelligence和Journal of AI Research;(3)机器学习领域,相关学术会议主要包括ICML,NIPS,AISTATS,UAI等,相关学术期刊主要包括Journal of Machine LearningResearch(JMLR)和Machine Learning(ML)等。例如最近兴起的knowledge graph研究论文,就有相当一部分发表在人工智能和信息检索领域的会议和期刊上。实际上国内计算机学会(CCF)制定了“中国计算机学会推荐国际学术会议和期刊目录”(http://www.ccf.org.cn/sites/ccf/aboutpm.jsp?contentId=2567814757463),通过这个列表,可以迅速了解每个领域的主要期刊与学术会议。

最后,值得一提的是,美国Hal Daumé III维护了一个natural language processing的博客(http://nlpers.blogspot.com/),经常评论最新学术动态,值得关注。我经常看他关于ACL、NAACL等学术会议的参会感想和对论文的点评,很有启发。另外,ACL学会维护了一个Wiki页面(http://aclweb.org/aclwiki/),包含了大量NLP/CL的相关信息,如著名研究机构、历届会议录用率,等等,都是居家必备之良品,值得深挖。

  1. 国内学术组织、学术会议与学术论文
    

与国际上相似,国内也有一个与NLP/CL相关的学会,叫做中国中文信息学会(URL:http://www.cipsc.org.cn/)。通过学会的理事名单(http://www.cipsc.org.cn/lingdao.php)基本可以了解国内从事NLP/CL的主要单位和学者。学会每年组织很多学术会议,例如全国计算语言学学术会议(CCL)、全国青年计算语言学研讨会(YCCL)、全国信息检索学术会议(CCIR)、全国机器翻译研讨会(CWMT),等等,是国内NLP/CL学者进行学术交流的重要平台。尤其值得一提的是,全国青年计算语言学研讨会是专门面向国内NLP/CL研究生的学术会议,从组织到审稿都由该领域研究生担任,非常有特色,也是NLP/CL同学们学术交流、快速成长的好去处。值得一提的是,2010年在北京召开的COLING以及2015年即将在北京召开的ACL,学会都是主要承办者,这也一定程度上反映了学会在国内NLP/CL领域的重要地位。此外,计算机学会中文信息技术专委会组织的自然语言处理与中文计算会议(NLP&CC)也是最近崛起的重要学术会议。中文信息学会主编了一份历史悠久的《中文信息学报》,是国内该领域的重要学术期刊,发表过很多篇重量级论文。此外,国内著名的《计算机学报》、《软件学报》等期刊上也经常有NLP/CL论文发表,值得关注。

过去几年,在水木社区BBS上开设的AI、NLP版面曾经是国内NLP/CL领域在线交流讨论的重要平台。这几年随着社会媒体的发展,越来越多学者转战新浪微博,有浓厚的交流氛围。如何找到这些学者呢,一个简单的方法就是在新浪微博搜索的“找人”功能中检索“自然语言处理”、“计算语言学”、“信息检索”、“机器学习”等字样,马上就能跟过去只在论文中看到名字的老师同学们近距离交流了。还有一种办法,清华大学梁斌开发的“微博寻人”系统(http://xunren.thuir.org/)可以检索每个领域的有影响力人士,因此也可以用来寻找NLP/CL领域的重要学者。值得一提的是,很多在国外任教的老师和求学的同学也活跃在新浪微博上,例如王威廉(http://weibo.com/u/1657470871)、李沐(http://weibo.com/mli65)等,经常爆料业内新闻,值得关注。还有,国内NLP/CL的著名博客是52nlp(http://www.52nlp.cn/),影响力比较大。总之,学术研究既需要苦练内功,也需要与人交流。所谓言者无意、听者有心,也许其他人的一句话就能点醒你苦思良久的问题。无疑,博客微博等提供了很好的交流平台,当然也注意不要沉迷哦。

  1. 如何快速了解某个领域研究进展
    

最后简单说一下快速了解某领域研究进展的经验。你会发现,搜索引擎是查阅文献的重要工具,尤其是谷歌提供的Google Scholar,由于其庞大的索引量,将是我们披荆斩棘的利器。

当需要了解某个领域,如果能找到一篇该领域的最新研究综述,就省劲多了。最方便的方法还是在Google Scholar中搜索“领域名称+ survey / review / tutorial/ 综述”来查找。也有一些出版社专门出版各领域的综述文章,例如NOW Publisher出版的Foundations and Trends系列,Morgan & ClaypoolPublisher出版的Synthesis Lectures on Human LanguageTechnologies系列等。它们发表了很多热门方向的综述,如文档摘要、情感分析和意见挖掘、学习排序、语言模型等。

如果方向太新还没有相关综述,一般还可以查找该方向发表的最新论文,阅读它们的“相关工作”章节,顺着列出的参考文献,就基本能够了解相关研究脉络了。当然,还有很多其他办法,例如去videolectures.net上看著名学者在各大学术会议或暑期学校上做的tutorial报告,去直接咨询这个领域的研究者,等等。

初学者如何查阅学术资料—以自然语言处理为例,分析cv领域

(1) 视觉领域会议: cvpr,iccv,eccv,icml,iclr,等

(2) 毋庸置疑arXiv已经成为深度学习最新进展的重要发布渠道,Yoshua Bengio等著名学者及其团队的最新研究成果,往往先发布在arXiv上,然后再发表在相关顶级会议上

(3) 当需要了解某个领域,如果能找到一篇该领域的最新研究综述,就省劲多了。最方便的方法还是在Google Scholar中搜索“领域名称 + survey / review / tutorial / 综述”来查找。

如果方向太新还没有相关综述,一般还可以查找该方向发表的最新论文,阅读它们的“相关工作”章节,顺着列出的参考文献,就基本能够了解相关研究脉络了。

下面文章转载于

文章转载于 http://mp.weixin.qq.com/s?__biz=MzIxNzE2MTM4OA==&mid=413008841&idx=1&sn=c8062acc2ec8f804990e22d5ed22ae29&scene=0#wechat_redirect

自然语言处理和人工智能是一个快速发展的领域,我们往往需要阅读最新的论文来了解相关方向的最新进展。实验室曾经有位刚进组的同学发邮件来问我如何查找学术论文,这让我想起自己刚读研究生时茫然四顾的情形:看着学长们高谈阔论领域动态,却不知如何入门。经过研究生几年的耳濡目染,现在终于能自信地知道去哪儿了解最新科研动态了。我想这可能是初学者们共通的困惑,与其只告诉一个人知道,不如将这些小知识写下来,让后来人少走些弯路。当然,这个总结只是一家之谈,只盼有人能从中获得一点点益处,受个人认知所限,难免挂一漏万,还望大家海涵指正。

国际学术组织、学术会议与学术论文

在计算机领域,国际上有众多专业学术组织,通过定期组织学术年会,报告学术论文,让学者们能够更方便地交流最新成果。这里以自然语言处理领域为例,介绍国际学术组织和学术会议的组织形式,以及国际学术论文的查找方式。

自然语言处理(NLP)在很大程度上与计算语言学(computational linguistics,CL)重叠。与其他计算机学科类似,NLP/CL有一个属于自己的最权威的国际专业学会,叫The Association for Computational Linguistics(ACL,URL:http://aclweb.org/ ),ACL学会主办了NLP/CL领域最权威的国际会议,即ACL年会,ACL学会还会在北美和欧洲召开分年会,分别称为NAACL和EACL。除此之外,ACL学会下设多个特殊兴趣小组(special interest groups,SIGs),聚集了NLP/CL不同子领域的学者,性质类似一个大学校园的兴趣社团。其中比较有名的诸如SIGDAT(Linguistic data and corpus-based approaches to NLP)、SIGNLL(Natural Language Learning)等。这些SIGs也会召开一些国际学术会议,其中比较有名的就是SIGDAT组织的EMNLP(Conference on Empirical Methods on Natural Language Processing)和SIGNLL组织的CoNLL(Conference on Natural Language Learning)。此外还有一个International Committee on Computational Linguistics的老牌NLP/CL学术组织,它每两年组织一个称为International Conference on Computational Linguistics(COLING)的国际会议,也是NLP/CL的重要学术会议。NLP/CL的高水平学术论文主要分布在ACL、NAACL、EMNLP和COLING等几个学术会议上。

作为NLP/CL领域的学者最大的幸福在于,ACL学会网站建立了称作ACL Anthology的页面(URL:http://aclweb.org/anthology-new/ ),支持该领域绝大部分国际学术会议论文的免费下载,甚至包含了其他组织主办的学术会议,例如COLING、IJCNLP等,并支持基于Google的全文检索功能,可谓一站在手,NLP论文我有。由于这个论文集合非常庞大,并且可以开放获取,很多学者也基于它开展研究,提供了更丰富的检索支持,具体入口可以参考ACL Anthology页面上方搜索框右侧的不同检索按钮。

与大部分计算机学科类似,由于技术发展迅速,NLP/CL领域更重视发表学术会议论文,原因是发表周期短,并可以通过会议进行交流。当然NLP/CL也有自己的旗舰学术期刊,发表过很多经典学术论文,那就是Computational Linguistics(URL:http://www.mitpressjournals.org/loi/coli)。该期刊每期只有几篇文章,平均质量高于会议论文,时间允许的话值得及时追踪。此外,ACL学会为了提高学术影响力,也刚刚创办了Transactions of ACL(TACL,URL:http://www.transacl.org/ ),值得关注。值得一提的是这两份期刊也都是开放获取的。此外也有一些与NLP/CL有关的期刊,如ACM Transactions on Speech and Language Processing,ACM Transactions on Asian Language Information Processing,Journal of Quantitative Linguistics等等。

根据Google Scholar Metrics 2015年对NLP/CL学术期刊和会议的评价,ACL、EMNLP、NAACL、COLING、LREC、Computational Linguistics位于前5位,基本反映了本领域学者的关注程度。

值得一提的是,美国Hal Daumé III维护了一个natural language processing的博客(http://nlpers.blogspot.com/ ),经常评论最新学术动态,值得关注。我经常看他关于ACL、NAACL等学术会议的参会感想和对论文的点评,很有启发。另外,ACL学会维护了一个Wiki页面(http://aclweb.org/aclwiki/ ),包含了大量NLP/CL的相关信息,如著名研究机构、历届会议录用率,等等,都是居家必备之良品,值得深挖。

NLP/CL是文本大数据智能的主要研究领域。作为交叉学科,大数据智能也与以下几个方面密切相关:(1)信息检索和数据挖掘领域。相关学术会议主要由美国计算机学会(ACM)主办,包括SIGIR、WWW、WSDM、KDD等。相关期刊包括ACM TOIS、ACM TKDD、IEEE TKDE等。(2)人工智能领域。相关学术会议主要包括IJCAI和AAAI等,相关学术期刊主要包括Artificial Intelligence和Journal of AI Research。(3)机器学习领域,相关学术会议主要包括ICML,NIPS,AISTATS,UAI等,相关学术期刊主要包括Journal of Machine Learning Research(JMLR)和Machine Learning(ML)等。

中国计算机学会(CCF)制定了“中国计算机学会推荐国际学术会议和期刊目录”(http://www.ccf.org.cn/sites/ccf/paiming.jsp),基本公允地列出了每个领域的高水平期刊与会议,已经成为国内很多计算机系的重要评估指标。在2015年底推出的最新版目录中,ACL和NIPS等著名会议升为A类,实属实至名归。大家可以通过这个列表,迅速了解每个领域的主要期刊与学术会议。

值得注意的是,虽然计算机领域学术会议论文的发表周期已经非常短,仍然不能满足最近深度学习等方向的迅猛发展。因此,越来越多学者选择绕过学术会议或期刊的审稿流程,直接通过arXiv(http://arxiv.org/)等预印本平台在线发布论文。由于省去了同行评议的流程,这些最新学术成果得以更快地发布。但也由于缺少同行评议的意见和过滤,导致预印本平台上发布的论文质量良莠不齐,需要有较强的鉴别力,才能找到其中真正有价值的工作。现在,虽然自然语言处理等方向的学者对通过arXiv率先发布成果看法不一,众说纷纭,但毋庸置疑arXiv已经成为深度学习最新进展的重要发布渠道,Yoshua Bengio等著名学者及其团队的最新研究成果,往往先发布在arXiv上,然后再发表在相关顶级会议上。因此,arXiv是了解大数据智能最新进展的重要信息渠道。

国内学术组织、学术会议与学术论文

与国际上相似,国内也有一家与NLP/CL相关的学术组织,中国中文信息学会(URL:http://www.cipsc.org.cn/ )。通过学会的理事名单(http://www.cipsc.org.cn/lingdao.php )基本可以了解国内从事NLP/CL的主要单位和学者。中文信息学会每年组织很多学术会议,例如全国计算语言学学术会议(CCL)、中国自然语言处理青年学者研讨会(YSSNLP)、全国信息检索学术会议(CCIR)、全国机器翻译研讨会(CWMT)等,是国内NLP/CL学者进行学术交流的重要平台。尤其值得一提的是,中国自然语言处理青年学者研讨会是专门面向国内NLP/CL青年学者的研讨交流会,采用邀请制参加,大家自愿报名在研讨会上报告前沿学术前沿动态,是国内NLP/CL青年学者进行学术交流、建立学术合作的绝佳平台。

2010年的COLING和2015年的ACL在北京召开,均由中文信息学会负责组织工作,这一定程度上反映了学会在国内NLP/CL领域的重要地位。此外,计算机学会中文信息技术专委会组织的自然语言处理与中文计算会议(NLP&CC)是最近崛起的国内重要NLP/CL学术会议。中文信息学会主编了一份历史悠久的《中文信息学报》,是国内该领域的重要学术期刊,发表过很多篇重量级论文。此外,国内著名的《计算机学报》、《软件学报》等期刊上也经常有NLP/CL论文发表,值得关注。

过去几年,在水木社区BBS上开设的AI、NLP版面曾经是国内NLP/CL领域在线交流讨论的重要平台。这几年随着社会媒体的发展,越来越多学者转战新浪微博,有浓厚的交流氛围。如何找到这些学者呢?一个简单的方法就是在新浪微博搜索的“找人”功能中检索“自然语言处理”、 “计算语言学”、“信息检索”、“机器学习”等字样,马上就能跟过去只在论文中看到名字的老师同学们近距离交流了。还有一种办法,清华大学梁斌开发的“微博寻人”系统(http://xunren.thuir.org/ )可以检索每个领域的有影响力人士,因此也可以用来寻找NLP/CL领域的重要学者。

值得一提的是,很多在国外任教的老师和求学的同学也活跃在新浪微博上,例如王威廉(http://weibo.com/u/1657470871 )、李沐(http://weibo.com/mli65 )等,经常发布重要的业内新闻,值得关注。微博上还有一些专门整理和推送人工智能相关信息的账号,如好东西传送门(http://memect.com/ ),每天都会整理发布的每日领域动态。学术研究既需要苦练内功,也需要与人交流。所谓言者无意、听者有心,也许其他人的一句话就能点醒你苦思良久的问题。毫无疑问,微博等社交媒体提供了很好的交流平台,但也要注意不宜沉迷。

如何快速了解某个领域研究进展

最后简单说一下快速了解某领域研究进展的经验。你会发现,搜索引擎是查阅文献的重要工具,尤其是谷歌提供的Google Scholar,由于其庞大的索引量,将是我们披荆斩棘的利器。

当需要了解某个领域,如果能找到一篇该领域的最新研究综述,就省劲多了。最方便的方法还是在Google Scholar中搜索“领域名称 + survey / review / tutorial / 综述”来查找。也有一些出版社专门出版各领域的综述文章,例如NOW Publisher出版的Foundations and Trends系列,Morgan & Claypool Publisher出版的Synthesis Lectures on Human Language Technologies系列等。它们发表了很多热门方向的综述,如文档摘要、情感分析和意见挖掘、学习排序、语言模型等。

如果方向太新还没有相关综述,一般还可以查找该方向发表的最新论文,阅读它们的“相关工作”章节,顺着列出的参考文献,就基本能够了解相关研究脉络了。当然,还有很多其他办法,例如去videolectures.net上看著名学者在各大学术会议或暑期学校上做的tutorial报告,去直接咨询这个领域的研究者,等等。

如何查阅NLP资料 转自https://blog.csdn.net/qq_27009517/article/details/80841146相关推荐

  1. https://blog.csdn.net/wutianxu123/article/details/82597337

    web安全/渗透测试--1--web安全原则 版权声明:本文为博主原创文章,转载本站文章请注明作者和出处,请勿用于任何商业用途. https://blog.csdn.net/wutianxu123/a ...

  2. https://blog.csdn.net/blmoistawinde/article/details/84329103

    背景     很多场景需要考虑数据分布的相似度/距离:比如确定一个正态分布是否能够很好的描述一个群体的身高(正态分布生成的样本分布应当与实际的抽样分布接近),或者一个分类算法是否能够很好地区分样本的特 ...

  3. 数据采集之解析Mysql的binlog日志发送至Kafka实时消费(转:https://blog.csdn.net/liguohuabigdata/article/details/79472777)

    本文采用Maxwell来实现实时解析mysql的binlog日志发送至kafka 1.开启mysql binlog 环境中mysql是docker容器,所以需要进入容器修改mysql配置.docker ...

  4. https://blog.csdn.net/nameofcsdn/article/details/53164652

    https://blog.csdn.net/nameofcsdn/article/details/53164652 转载于:https://www.cnblogs.com/Yinku/p/106872 ...

  5. https://blog.csdn.net/cscscscsc/article/details/50

    https://blog.csdn.net/cscscscsc/article/details/50899522 转载于:https://blog.51cto.com/7237876/2129682

  6. GitHu的诞生记 转 https://blog.csdn.net/fanpeihua123/article/details/58151161

    前言:这篇文章应读者要求所写,主要聊聊版本管理系统(Version Control System,简称 VCS), 这篇文章不能让你学会一门技术, 但是希望能帮你理解版本管理的原理. "人肉 ...

  7. 自动车牌识别(ALPR)---https://blog.csdn.net/ELEVEN_ZOU/article/details/80893579

    1.基本功能:从一张或者一系列的图片中提取车牌信息,比如车牌号码.车牌颜色等信息. 2.功能扩展:车型.车品牌.车牌类型等. 3.应用方向:电子交易系统(停车自动收费.收费站自动支付等).交通执法.交 ...

  8. https://blog.csdn.net/watermelon_learn/article/details/88902117

    这里写自定义目录标题 第一次转载大神的文章,也是第一次发表csdn,有错大家请原谅. 华为2019年3月27日实习生笔试题及解答 第一次转载大神的文章,也是第一次发表csdn,有错大家请原谅. 我们对 ...

  9. https://blog.csdn.net/codezjx/article/details/8872090

    FBI Warning:欢迎转载,但请标明出处:http://blog.csdn.net/codezjx/article/details/8872090,未经本人同意请勿用于商业用途,感谢支持! 前言 ...

最新文章

  1. android单线字体,Android自定义字体
  2. java编程石头剪刀布图片_石头、剪刀、布!10分钟带你打开深度学习大门,代码已开源...
  3. android启动第三方应用
  4. tomcat 深度优化
  5. js中内置对象Math()常用方法笔记
  6. linux轻量级进程LWP
  7. step1 . day10 C语言基础练习之指针和函数
  8. ds1302典型应用原理图_不同类型的光纤激光器,在工业中有哪些典型应用
  9. Debian的软件包管理工具命令不完全列表
  10. 继续推荐几款VisualStudio的插件
  11. python爬虫模拟点击下拉菜单和_python+selenium爬虫过程中的模拟点击问题
  12. Struts 常用标签的使用
  13. HttpClient配置
  14. 前阿里GOC负责人葛梅:运维转型运营,IT服务管理体系搭建实践
  15. item_search_pro - 高级关键字搜索淘宝商品 API
  16. 计算机桌面图片打不开显示内存不足,电脑上的windows图片查看器提示内存不足如何解决...
  17. 互联网金融风控模型大全
  18. 曲苑杂坛--查看CPU配置
  19. 论如何冲破小游戏流量变现的瓶颈?
  20. code==200是什么意思

热门文章

  1. https安全传输揭秘 1
  2. PHP生成PDF库(TCPDF)参数说明
  3. 绘制半长轴和半短轴分别为a,b的椭圆
  4. 周纪五 赧王下四十三年(己丑、前272)——摘要
  5. python join函数报错_python中join()函数的使用方法
  6. c语言 结构体 选择题,c语言结构体共用体选择题新
  7. 【BZOJ4416】阶乘字符串(SHOI2013)-状压DP
  8. SQL insert into 插入的单行,多行的情况
  9. Windows 和Linux利用tftp协议传送文件
  10. 第一次接触APK【破解纪实】