资源

这里提供一些52nlp博客的一些系列文章以及收集的自然语言处理相关书籍及其他资源的下载,陆续整理中!如有不妥,我会做删除处理!

特别推荐系列:
1、HMM学习最佳范例全文文档
2、无约束最优化全文文档 -by @jianzhu
3、PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版,陈涛sean 无偿翻译。
4、正态分布的前世今生(pdf 版) – by @rickjin
5、LDA-math-汇总 LDA数学八卦 – by @rickjin
6、如何计算两个文档的相似度全文文档
7、中文分词入门之字标注法全文文档

一、书籍:
1、《自然语言处理综论》英文版第二版
2、《统计自然语言处理基础》英文版
3、《用Python进行自然语言处理》,NLTK配套书
4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦
5、《自然语言处理中的模式识别》
6、《EM算法及其扩展》
7、《统计学习基础》
8、《自然语言理解》英文版(似乎只有前9章)
9、《Fundamentals of Speech Recognition》,质量不太好,不过第6章关于HMM的部分比较详细,作者之一便是Lawrence Rabiner;
10、概率统计经典入门书:《概率论及其应用》(英文版,威廉*费勒著)
第一卷  第二卷  DjVuLibre阅读器(阅读前两卷书需要)
11、一本利用Perl和Prolog进行自然语言处理的介绍书籍:《An Introduction to Language Processing with Perl and Prolog》
12、国外机器学习书籍之:
1) “Programming Collective Intelligence“,中文译名《集体智慧编程》,机器学习&数据挖掘领域”近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的”
2) “Machine Learning“,机器学习领域无可争议的经典书籍,下载完毕将后缀改为pdf即可。豆瓣评论 by 王宁):老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能”新”到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。
3) “Introduction to Machine Learning”
13、国外数据挖掘书籍之:
1) “Data.Mining.Concepts.and.Techniques.2nd“,数据挖掘经典书籍 作者 : Jiawei Han/Micheline Kamber 出版社 : Morgan Kaufmann 评语 : 华裔科学家写的书,相当深入浅出。
2) Data Mining:Practical Machine Learning Tools and Techniques
3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher)
14、国外模式识别书籍之:
1)“Pattern Recognition”
2)“Pattern Recongnition Technologies and Applications”
3)“An Introduction to Pattern Recognition”
4)“Introduction to Statistical Pattern Recognition”
5)“Statistical Pattern Recognition 2nd Edition”
6)“Supervised and Unsupervised Pattern Recognition”
7)“Support Vector Machines for Pattern Classification”
15、国外人工智能书籍之:
1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智能领域无争议的经典。
2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP”
16、其他相关书籍:
1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor
2)Learning.Python第四版,英文

二、课件:
1、哈工大刘挺老师的“统计自然语言处理”课件;
2、哈工大刘秉权老师的“自然语言处理”课件;
3、中科院计算所刘群老师的“计算语言学讲义“课件;
4、中科院自动化所宗成庆老师的“自然语言理解”课件;
5、北大常宝宝老师的“计算语言学”课件;
6、北大詹卫东老师的“中文信息处理基础”的课件及相关代码;
7、MIT Regina Barzilay教授的“自然语言处理”课件,52nlp上翻译了前5章;
8、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然语言处理的机器学习方法)”课件;
9、Michael Collins的“Machine Learning (机器学习)”课件;
10、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高级自然语言处理)”课件;
11、Philipp Koehn “Empirical Methods in Natural Language Processing”课件;
12、Philipp Koehn“Machine Translation(机器翻译)”课件;

三、语言资源和开源工具:
1、Brown语料库:
a) XML格式的brown语料库,带词性标注;
b) 普通文本格式的brown语料库,带词性标注;
c) 合并并去除空行、行首空格,用于词性标注训练:browntest.zip
2、NLTK官方提供的语料库资源列表
3、OpenNLP上的开源自然语言处理工具列表
4、斯坦福大学自然语言处理组维护的“统计自然语言处理及基于语料库的计算语言学资源列表”
5、LDC上免费的中文信息处理资源
6、中文分词相关工具:
1)Java版本的MMSEG:mmseg-v0.3.zip,作者为solol,详情可参见:《中文分词入门之篇外》
2)张华平老师的ICTCLAS2010,该版本非商用免费一年,下载地址:
http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/.Public/ICTCLAS2010-packet-release.rar
7、热心读者“finallyliuyu”提供的一批新闻语料库,包括腾讯,新浪,网易,凤凰等,目前放在CSDN上:http://finallyliuyu.download.csdn.net/
另外finalllyliuyu在2010年9月又提供了一批文本文类语料,详情见:献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二

四、文献:
1、ACL-IJCNLP 2009论文全集:
a) 大会论文Full Paper第一卷
b) 大会论文Full Paper第二卷
c) 大会论文Short Paper合集
d) ACL09之EMNLP-2009合集
e) ACL09 所有workshop论文合集

【转载】52nlp博客上的资源相关推荐

  1. 新东方尹圆圆老师的博客上找来的

    这些网站是从新东方尹圆圆老师的博客上找来的,希望大家好好利用: 1. http://www.texun.cn/addrso/index.htm 特训网:English Learning Website ...

  2. 【e周美文】优秀博客上榜推荐

    声明:eoe文章著作权属于作者,受法律保护,转载时请务必以超链接形式附带如下信息 原文作者: 活动管理员 原文地址: http://my.eoe.cn/huodong/archive/5430.htm ...

  3. 把一些11年老博客上的文章转移过来了

    VPS过期后博客也荒废了很久,饭硬盘的时候发现了一些11年老博客上的内容,转过来吧,当时纪念也好..时间过得是真快. 转载于:https://blog.51cto.com/halforg/136579 ...

  4. 最近在我的python博客上花时间!

    最近在我的python博客上花时间! python很强大,值得学习!呵呵. 学习中得到很多乐趣,发现其思想 还是和别的语言有点不同,但现在 可能说不出个所以然来! 常常思索,咱们国人也该写一个 这么优 ...

  5. 最近准备把安卓和java的知识再回顾一遍,顺便会写博客上!千变万化还都是源于基础,打扎实基础...

    最近准备把安卓和java的知识再回顾一遍,顺便会写博客上!千变万化还都是源于基础,打扎实基础,加油吧 距离去北京还有23天 转载于:https://www.cnblogs.com/AceIsSunsh ...

  6. Html方式转载CSDN博客 CSDN博客转换成Markdown文件

    文章目录 内容简介 Html方式转载CSDN博客 保存CSDN博客的Markdown文件 内容简介 主要分为两个部分 第一部分:将CSDN博客的html源码进行复制并转发到自己的blog上(大家记得发 ...

  7. 进程、线程、协程 关于进程、线程、协程,有非常详细和丰富的博客或者学习资源,我不在此做赘述,我大致在此介绍一下这几个东西。 进程拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程由操作系统调度。

    进程.线程.协程 关于进程.线程.协程,有非常详细和丰富的博客或者学习资源,我不在此做赘述,我大致在此介绍一下这几个东西. 进程拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程由操作系统调度. 线程 ...

  8. 如何转载-CSDN博客

    1.在要转载的博客页面,右键-[检查] 2.选中 "#article_content",可以看到,源码中 被选中,网页中的博客内容被选中. 在该 div 右键-[copy] -[c ...

  9. SQL基础用法总结(以前复习的时候放在自己的新浪博客上)

    工作后主要做移动端和前端这一块,后端的知识都是靠自己学习积累的,下面的链接是以前重温的时候整理的SQL基础最核心部分的知识点和代码示例放在自己的新浪博客上,如果以后有需要,直接从这里进入,可以快速复习 ...

  10. Java基础部分快速复习(以前复习的时候放在自己的新浪博客上)

    工作后Java基本没有用到,有时候自己也会把基础过一遍,下面的链接是以前重温的时候整理的Java基础最核心部分的知识点和代码示例放在自己的新浪博客上,如果以后有需要,直接从这里进入,可以快速复习,节省 ...

最新文章

  1. adb 操作安卓模拟器--备忘
  2. rsynv+inotify触发试实时同步
  3. Reactive Extensions简介一
  4. python如何开启多进程_python如何写多进程
  5. QQ 互联审核不通过问题的解决方法
  6. 水题总结NYOJ74,1094,60,975,111,833
  7. 【华为云技术分享】9 个Java 异常处理的规则!
  8. stm32f4有重映射么_STM32管教复用与重映射关系
  9. build openposewith opencv-2.4.13,cuda9(9.0 - 9.2)
  10. linux上tomcat安装
  11. php获取手机目录,PHP通过API获取手机号码归属地
  12. linux sound usb声卡,openwrt上用usb声卡听音乐
  13. java实现web ssh客户端
  14. 南开100题C语言(001-010)
  15. openstack搭建(私有云、公有云)云计算遇到的相关问题汇总整理
  16. android耗电怎么解决方法,Android手机媒体进程耗电严重怎么办
  17. 臭打游戏的看过来!Windows 11 22H2 这波加强直接起飞
  18. 使用阿里云/腾讯云的云服务器搭建邮箱服务器,避开25端口限制
  19. ubuntu(Linux) 挂接小鹤音形 (基于IBus框架)
  20. 数据库导出excel文件过大时无法下载

热门文章

  1. 经典算法-BF算法(字符串匹配)
  2. 【uniappAPP实现支付宝授权登录】
  3. 安装移动视频监控 即时监控地铁车厢
  4. 公司内部分享【富有成效的每日站会】总结
  5. 跳舞毯 [HDU2154]
  6. NameNode作用
  7. Linux扩展ip上限,Linux之iptables添加扩展模块实现封P2P、封国家IP
  8. linux安装阵列卡驱动程序,Linux系统下如何安装阵列卡驱动?
  9. 什么是 Transactions Paper ?
  10. 200 OK(from memory cache)和 200 OK(from disk cache)