特别推荐系列:
1、HMM学习最佳范例全文文档,百度网盘链接: http://pan.baidu.com/s/1pJoMA2B 密码: f7az

2、无约束最优化全文文档 -by @朱鉴 ,百度网盘链接:链接: http://pan.baidu.com/s/1hqEJtT6 密码: qng0

3、PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版,陈涛sean 无偿翻译。链接: http://pan.baidu.com/s/1i3DvwFV 密码: oxne
4、正态分布的前世今生(pdf 版) - by @rickjin
5、LDA-math-汇总 LDA数学八卦 - by @rickjin
6、如何计算两个文档的相似度全文文档
7、中文分词入门之字标注法全文文档

一、书籍:
1、《自然语言处理综论》英文版第二版
2、《统计自然语言处理基础》英文版
3、《用Python进行自然语言处理》,NLTK配套书
4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦
5、《自然语言处理中的模式识别》
6、《EM算法及其扩展》
7、《统计学习基础》
8、《自然语言理解》英文版(似乎只有前9章)
9、《Fundamentals of Speech Recognition》,质量不太好,不过第6章关于HMM的部分比较详细,作者之一便是Lawrence Rabiner;
10、概率统计经典入门书:《概率论及其应用》(英文版,威廉*费勒著)
第一卷  第二卷  DjVuLibre阅读器(阅读前两卷书需要)
11、一本利用Perl和Prolog进行自然语言处理的介绍书籍:《An Introduction to Language Processing with Perl and Prolog》
12、国外机器学习书籍之:
1) "Programming Collective Intelligence",中文译名《集体智慧编程》,机器学习&数据挖掘领域"近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的"
2) "Machine Learning",机器学习领域无可争议的经典书籍,下载完毕将后缀改为pdf即可。豆瓣评论 by 王宁):老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能"新"到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。
3) “Introduction to Machine Learning”
13、国外数据挖掘书籍之:
1) "Data.Mining.Concepts.and.Techniques.2nd",数据挖掘经典书籍 作者 : Jiawei Han/Micheline Kamber 出版社 : Morgan Kaufmann 评语 : 华裔科学家写的书,相当深入浅出。
2) Data Mining:Practical Machine Learning Tools and Techniques
3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher)
14、国外模式识别书籍之:
1)“Pattern Recognition”
2)“Pattern Recongnition Technologies and Applications”
3)“An Introduction to Pattern Recognition”
4)“Introduction to Statistical Pattern Recognition”
5)“Statistical Pattern Recognition 2nd Edition”
6)“Supervised and Unsupervised Pattern Recognition”
7)“Support Vector Machines for Pattern Classification”
15、国外人工智能书籍之:
1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智能领域无争议的经典。
2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP”
16、其他相关书籍:
1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor
2)Learning.Python第四版,英文

二、课件:
1、哈工大刘挺老师的“统计自然语言处理”课件;
2、哈工大刘秉权老师的“自然语言处理”课件;
3、中科院计算所刘群老师的“计算语言学讲义"课件;
4、中科院自动化所宗成庆老师的“自然语言理解”课件;
5、北大常宝宝老师的“计算语言学”课件;
6、北大詹卫东老师的“中文信息处理基础”的课件及相关代码;
7、MIT Regina Barzilay教授的“自然语言处理”课件,52nlp上翻译了前5章;
8、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然语言处理的机器学习方法)”课件;
9、Michael Collins的“Machine Learning (机器学习)”课件;
10、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高级自然语言处理)”课件;
11、Philipp Koehn “Empirical Methods in Natural Language Processing”课件;
12、Philipp Koehn“Machine Translation(机器翻译)”课件;

三、语言资源和开源工具:
1、Brown语料库:
a) XML格式的brown语料库,带词性标注;
b) 普通文本格式的brown语料库,带词性标注;
c) 合并并去除空行、行首空格,用于词性标注训练:browntest.zip
2、NLTK官方提供的语料库资源列表
3、OpenNLP上的开源自然语言处理工具列表
4、斯坦福大学自然语言处理组维护的“统计自然语言处理及基于语料库的计算语言学资源列表”
5、LDC上免费的中文信息处理资源
6、中文分词相关工具:
1)Java版本的MMSEG:mmseg-v0.3.zip,作者为solol,详情可参见:《中文分词入门之篇外》
2)张华平老师的ICTCLAS2010,该版本非商用免费一年,下载地址:
http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/.Public/ICTCLAS2010-packet-release.rar
7、热心读者“finallyliuyu”提供的一批新闻语料库,包括腾讯,新浪,网易,凤凰等,目前放在CSDN上:http://finallyliuyu.download.csdn.net/
另外finalllyliuyu在2010年9月又提供了一批文本文类语料,详情见:献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二

四、文献:
1、ACL-IJCNLP 2009论文全集:
a) 大会论文Full Paper第一卷
b) 大会论文Full Paper第二卷
c) 大会论文Short Paper合集
d) ACL09之EMNLP-2009合集
e) ACL09 所有workshop论文合集

《自然语言处理》的相关资源相关推荐

  1. 医学自然语言处理相关资源整理

    github链接,持续更新 Chinese_medical_NLP 医疗NLP领域(主要关注中文) 评测数据集 与 论文等相关资源. 中文评测数据集 中文医学知识图谱 英文数据集 相关论文 中文医疗领 ...

  2. 一文尽览!文本对抗攻击基础、前沿及相关资源

    // 导读 深度学习的安全性问题已经逐渐被学术界.工业界所认识到并且重视,就文本领域而言,垃圾邮件检测.有害文本检测.恶意软件查杀等实用系统已经大规模部署了深度学习模型,安全性对于这些系统尤为重要. ...

  3. 李航老师《统计学习方法》的代码实现、课件、作业等相关资源的最全汇总

    编辑 | Will 出品 | 字节AI 李航:毕业于日本京都大学电气电子工程系,日本东京大学获得计算机科学博士学位.1990年至2001年就职于日本NEC 公司中央研究所,任研究员,2001年至201 ...

  4. Github项目推荐-图神经网络(GNN)相关资源大列表

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 转自 | AI研习社 作者|Zonghan Wu 这是一个与图神经网络相关的资源集合.相关资源浏览下方 ...

  5. NLP自然语言常见问题及相关模型训练数据格式示例

    NLP自然语言常见问题及相关模型训练数据格式示例 目录 NLP自然语言常见问题及相关模型训练数据格式示例 NLP任务集 <

  6. 在线CSS工具及相关资源收集

    在线CSS工具: W3C CSS 校验服务 :提供万维网协会(W3C)样式表(CSS)校验服务. CSS 在线编辑器:OnLine CSS Designer - CSS Style Editor. C ...

  7. MBG 相关资源链接

    MyBatis Generator(MBG)相关资源链接 http://mbg.cndocs.tk/quickstart.html http://www.mybatis.tk/ http://git. ...

  8. KaliLinuxNetHunter教程下载相关资源

    KaliLinuxNetHunter教程下载相关资源 当用户将刷机工具准备完后,则需要下载ROM包.ROM是ROM image(只读内存镜像)的简称,常用于手机定制系统.一般手机刷机的过程,就是将只读 ...

  9. Osmocom-BB 相关资源、知识分享

    Osmocom-BB 相关资源.知识分享 1.在layer1层添加了解析sniffer的代码 参考http://git.osmocom.org/osmocom-bb/log/?h=luca/gsmma ...

  10. 【FluidSynth】FluidSynth 简介 ( 相关资源链接 | 简介 | 特征 )

    文章目录 一.相关资源链接 二.FluidSynth 简介 三.FluidSynth 特征 一.相关资源链接 相关资源链接 : fluidsynth.org 官方网站 FluidSynth 支持的 M ...

最新文章

  1. Tokyo Cabinet 安装
  2. Ubuntu中Atom安装与使用
  3. Kubernetes日志分析利器:Elassandra部署使用指南
  4. 北京加强数据中心节能审查,2030年100%利用可再生能源
  5. Ubuntu/linux 系统彻底杀死一个进程的方法
  6. LiveVideoStackCon讲师热身分享 ( 十二 ) —— 微博短视频高并发架构
  7. 漫谈Servlet(一)
  8. 计算机图形学E11——B样条曲线
  9. wdatepicker不展示秒_华为电源键只能开关机?其实还隐藏了这5个作用,一般人不知道...
  10. 转 java synchronized详解
  11. Python 语言程序设计(4-3) Random 随机库
  12. gsonformat安装
  13. 广义加性模型(GAM)
  14. 横向合计代码 锐浪报表_锐浪报表使用技巧
  15. 基于哈里斯鹰算法优化概率神经网络PNN的分类预测-附代码
  16. 对抗攻击常见方法汇总
  17. WordPress缩略图美化插件ThnBoV1.3.1ThnBo
  18. CentOS7.2(单网卡iptables)做DNAT访问弹性IP地址端口转发到后端无公网IP的服务器不同端口
  19. 【Vue】解决 Vue 视图不刷新和组件循环引用不加载问题
  20. 强势来袭!国内首本大型分布式架构笔记浴火新生

热门文章

  1. Effective C++ 条款02:尽量使用const,enum,inline替换#define
  2. 2021年昆明师专附中高考成绩查询,云南省昆明市云南师范大学附属中学2020-2021学年高三高考适应性月考卷(一)语文试题...
  3. 我们都在成全别人眼中的自己
  4. 基于3dmax及Unity的虚拟博物展览馆
  5. 编写shell脚本,输入一个数字n并计算1~n的和。要求:输入的数字不能小于1和空。
  6. 色散介质中的脉冲展宽
  7. Python3的fo if while 循环
  8. 佘其炯:关于97工程的思考
  9. 火车站信息服务系统之LED大屏显示
  10. SparkSQL内置函数