如何学习自然语言处理(转)

2012年6月30日

21:25

转载的文章,自己标注出了学习重点。

转自:http://www.52nlp.cn/getting-started-in-natural-language-processing

nlpers上有几篇“Getting Started in X”,其中X分别是nlp(自然语言处理),summarization及sequence labeling,觉得写得不错,尤其是对初学者有一定借鉴意义,计划在这里分别结合自己的理解来介绍这几篇文章。本期介绍的是“如何学习自然语言处理(Getting Started in NLP)”,nlpers

当一个读者开始接触自然语言处理这个领域时(事实上对于任何一个领域同样如此),最直接的学习途径是:

读书,但是要读哪些书(which ones?);

阅读文献,但是在×××并且通过何人指导(from where and by whom?);

去参加附近的学术会议,但是哪一些会议值得参加(which ones?)以及

做实验,但是要做什么样的实验(on what?)。

最后,作者还建议大家多在nlpers上阅读和写作;这里,我也建议大家常来看看“我爱自然语言处理”,有空的话,也可以在52nlp上发表一下自然语言处理方面的心得体会,非常欢迎!

在读书方面,nlpers给出了四本自然语言处理领域的标准书籍(standard books),分别是

《统计自然语言处理基础》(Statistical NLP, Manning + Schutze),

《自然语言处理综论》(Speech and Language Processing, Jurafsky + Martin),

Statistical Language Learning (Charniak)

以及《自然语言理解》(Natural Language Understanding,Allen),

这四本书的详细介绍大家可以参考《自然语言处理与计算语言学书籍汇总之一:国外书籍》。

对于这四本书,nlpers也给出了自己的比较,后两本比较老,虽然有一些人喜欢Charniak to Manning + Schutze,但是如果仅仅买一本的话,作者会挑选Manning + Schutze(统计自然语言处理基础,注意这里使用的是书籍作者的名字)。

对于《统计自然语言处理基础》这本书,略读第1、4、6及13章会给读者一个合理(但不是所有)的背景知识介绍。但不幸的是,这本书也少了许多领域的介绍,譬如信息抽取,问答系统等。

这里我再做一点补充:《统计自然语言处理》就不必说了,我也很喜欢这本书;虽然《自然语言处理综论》涉及的范围很广,但经典依然是经典,尤其是08年新出的第二版,有了很大的改进,虽然对于入门读者有一定的门槛,但可以常备案头查阅;

另外对于刚开始接触自然语言处理的读者,推荐与nltk工具包相关的今年刚出的《Natural Language Processing with Python》,应该翻译为《用Python进行自然语言处理》吧,虽然中文版还没有出,但是英文电子版已经可以下载了,8月份的时候热心读者brishen曾经给我提供过这个版本的电子版下载渠道:http://code.google.com/p/brishen/downloads/list,并且希望有读者可以一起利用52nlp这个平台来学习这本书和研究nltk,目前我也在学习中,后期会和brishen推出这个系列,欢迎有兴趣的读者加入,同时需要说明的是,这本书很适合入门学习,并且可以一并学习一下python,对于与自然语言处理密切相关的脚本语言来说,选择python也是一个不错的选择。

阅读文献方面,对于初学者来说,寻找好的经典的文献还比较困难。如果没有人指导,可以在ACL,NAACL,HLT或者COLING等会议论文集上略读一些文章的题目和摘要,从而发现一些感兴趣的论文和领域。

ACL anthology是一个非常不错的寻找自然语言处理方面已公开发表的论文的好地方。同时nlpers的作者计划在之后的博客中列出一些领域的“必读(must reads")文献,这的确是一个不错的对于初学读者有帮助的方法,不过nlpers的这个系列没能写出很多领域。如果读者找到了一些感兴趣的论文,可以访问相应作者的个人主页,看是否有其他相关的工作,更进一步,可以访问这个作者的导师的主页,通常导师们会有更多的学生做着相似的课题,同时,导师们会有一些课程资料,这些通常都是一些自然语言处理领域的介绍级别的入门好资料。

关于参加会议,nlpers建议如果以上任何一个自然语言处理领域的高级别会议在你身边举行,一定要亲自去参加和感受,这比阅读论文有趣很多。而对于我们来说,明年的COLING2010会议绝对是一个难得的机会,对自然语言处理感兴趣读者在北京的话千万不要错过了。

转载自:“我爱自然语言处理”:www.52nlp.cn

本文链接地址:http://www.52nlp.cn/getting-started-in-natural-language-processing

相关文章:

1. “知行合一”与自然语言处理

2. 自然语言处理与计算语言学书籍汇总之一:国外书籍

3. 斯坦福大学“自然语言处理”授课视频

4. 提供几本自然语言处理书

5. Coling 2010 文章已可下载

6. 几本自然语言处理入门书

7. HMM在自然语言处理中的应用一:词性标注1

8. COLING 2010前瞻——规则与统计共舞,语言随计算齐飞

9. 统计机器翻译文献阅读指南

10. ACL 2010文章已可下载

By Elvis_Zhou

标注完成时间:2012年6月30日

发表于2012年7月17日

转载于:https://blog.51cto.com/elvisz/932905

如何学习自然语言处理(转)相关推荐

  1. 【NAACL2021】Graph4NLP:图深度学习自然语言处理(附ppt)

    来源:专知本文约1500字,建议阅读5分钟 最新图深度学习在自然语言处理应用的概述报告,不可错过! 深度学习已经成为自然语言处理(NLP)研究的主导方法,特别是在大规模语料库中.在自然语言处理任务中, ...

  2. 十分钟学习自然语言处理概述

    十分钟学习自然语言处理概述 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛.笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文章全部看了一遍做个整理,也可以称之为概述.关于这些问 ...

  3. 【直播回放】新手如何入门并学习自然语言处理

    大家好,欢迎来到我们的付费视频直播回放栏目,在这个专栏中我们会每一次针对某一个主题,做1-2个小时左右的直播,包含PPT的讲解与微信群的答疑交流. 作者&编辑 | 言有三 本文主题与资源 主讲 ...

  4. 推荐:学习自然语言处理(NLP)的学习方法和资料合集

    本文作者:乐雨泉,优秀的nlp学习者,在各类技术论坛和网站署名yuquanle,这篇文章是他作为一名自然语言初学者,在nlp里摸爬滚打了许久的一些心得. 学习nlp方法大致可以分为二种. 第一种,在实 ...

  5. [深度学习] 自然语言处理---Transformer原理(一)

    <Attention Is All You Need>是Google在2017年提出的一篇将Attention思想发挥到极致的论文.该论文提出的Transformer模型,基于encode ...

  6. [深度学习] 自然语言处理 --- Bert开发实战 (Transformers)

    本文主要介绍如果使用huggingface的transformers 2.0 进行NLP的模型训练 除了transformers,其它兼容tf2.0的bert项目还有: 我的博客里有介绍使用方法  [ ...

  7. [深度学习] 自然语言处理 --- Self-Attention(一) 基本介绍

    [深度学习] 自然语言处理 --- Self-Attention(一) 基本介绍_小墨鱼的专栏-CSDN博客https://zengwenqi.blog.csdn.net/article/detail ...

  8. 如何学习自然语言处理:一本书和一门课

    关于"如何学习自然语言处理",有很多同学通过不同的途径留过言,这方面虽然很早之前写过几篇小文章:<如何学习自然语言处理>和<几本自然语言处理入门书>,但是更 ...

  9. 机器学习/深度学习/自然语言处理学习路线

    原文地址:http://www.cnblogs.com/cyruszhu/p/5496913.html 未经允许,请勿用于商业用途!相关请求,请联系作者:yunruizhu@126.com转载请附上原 ...

  10. 深入学习自然语言:NLP、NLG不可分开战斗!

    有人说来自语言的数据是"非结构化数据",事实证明这是一个错误的说法.如果没有特定的语言结构,人们可能无法用语音或者书面语言进行正确交流.语法是语言的结构,它有助于定义语言的含义.大 ...

最新文章

  1. 行列式介绍及Eigen/OpenCV/C++的三种实现
  2. Java jdt 编辑_JDT入门
  3. Windows 7 X64平台编译LLVM+clang
  4. python安装email模块_Python使用SMTP模块、email模块发送邮件
  5. QT学习:多线程运用
  6. leetcode 155. 最小栈(常数时间获取最小值,需要维护两个栈)
  7. 基于javaEE技术的课程设计管理系统设计与实现
  8. java 七巧板油漆问题_七巧板颜色填充的问题?
  9. 判断一个数能否同时被3和5整除(信息学奥赛一本通-T1046)
  10. 全文搜索引擎 Elasticsearch 安装
  11. hash算法总结收集
  12. 将Ubuntu从Win7的魔爪中拯救出来
  13. 海康威视NVR萤石云配置及不在线故障排除
  14. 语音识别技术:2018年主要参与者的完整指南
  15. moto+早期android手机,七款摩托罗拉早期经典机型回顾
  16. 以实例说明,网吧组网方案详解!(转)
  17. 吊打何同学?猛肝24小时,用6000元成本打造 AirDesk!
  18. 华硕重装后进入bios_华硕笔记本重装系统后直接进入bios,怎么处理
  19. Win10 Synaptics触摸板无法实现双指单击模拟鼠标右键点击的解决办法
  20. Python爬虫入门(一)(适合初学者)

热门文章

  1. Synchronous Bidirectional Inference for Neural Sequence Generation
  2. 机器学习之特征选择(feature_selection)
  3. Dart基础第13篇: 泛型、泛型方法 、泛型类、泛型接口
  4. 服务站: WCF 消息传递基础 -- MSDN Magazine, April 2007
  5. python的shelve库
  6. JPEG库在Linux系统下的编译和移植【转】
  7. 搭建和测试 Redis 主备和集群
  8. 下载完apk安装包后实现自动安装;
  9. 图片旋转,拖拽,缩放,删除一体
  10. Swift之 ? 和 !