内容简介

自然语言处理(natural language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。

《python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。本书基于python编程语言以及一个名为nltk的自然语言工具包的开源库;但并不要求读者有python编程的经验。全书共11章,按照难易程度顺序编排。第1章到3章介绍了语言处理的基础,讲述如何使用小的python程序分析感兴趣的文本信息。第4章讨论结构化程序设计,以巩固前面几章中介绍的编程要点。第5章到第7章介绍语言处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句子解析、句法结构识别和句意表达方法。第11章介绍了如何有效管理语言数据。后记部分简要讨论了nlp领域的过去和未来。

《python自然语言处理》的实践性很强,包括上百个实际可用的例子和分级练习。本书可供读者用于自学,也可以作为自然语言处理或计算语言学课程的教科书,或是人工智能、文本挖掘、语料库语言学等课程的补充读物。

作者简介

Steven Bird是墨尔本大学计算机科学和软件工程系副教授,宾夕法尼亚大学语言学数据联盟高级研究助理。

Ewan Klein是爱丁堡大学信息学院语言技术教授。

Edward Loper是毕业于宾夕法尼亚大学专注于机器学习的自然语言处理方向的博士,现在在波士顿的BBN Technologies担任研究员。

目录

《python自然语言处理》

第1章 语言处理与python 1

1.1 语言计算:文本和词汇 1

1.2 近观python:将文本当做词链表 10

1.3 计算语言:简单的统计 17

1.4 回到python:决策与控制 24

1.5 自动理解自然语言 29

1.6 小结 35

1.7 深入阅读 36

1.8 练习 37

第2章 获得文本语料和词汇资源 41

2.1 获取文本语料库 41

2.2 条件频率分布 55

2.3 更多关于python:代码重用 60

2.4 词典资源 63

2.5 wordnet 72

2.6 小结 78

2.7 深入阅读 79

2.8 练习 80

第3章 处理原始文本 84

3.1 从网络和硬盘访问文本 84

3.2 字符串:最底层的文本处理 93

3.3 使用unicode进行文字处理 100

3.4 使用正则表达式检测词组搭配 105

3.5 正则表达式的有益应用 109

3.6 规范化文本 115

3.7 用正则表达式为文本分词 118

3.8 分割 121

3.9 格式化:从链表到字符串 126

3.10 小结 132

3.11 深入阅读 133

3.12 练习 134

第4章 编写结构化程序 142

4.1 回到基础 142

4.2 序列 147

4.3 风格的问题 152

4.4 函数:结构化编程的基础 156

4.5 更多关于函数 164

4.6 程序开发 169

4.7 算法设计 175

4.8 python库的样例 183

4.9 小结 188

4.10 深入阅读 189

4.11 练习 189

第5章 分类和标注词汇 195

5.1 使用词性标注器 195

5.2 标注语料库 197

5.3 使用python字典映射词及其属性 206

5.4 自动标注 216

5.5 n-gram标注 221

5.6 基于转换的标注 228

5.7 如何确定一个词的分类 230

5.8 小结 233

5.9 深入阅读 234

5.10 练习 235

第6章 学习分类文本 241

6.1 监督式分类 241

6.2 监督式分类的举例 254

6.3 评估 258

6.4 决策树 263

6.5 朴素贝叶斯分类器 266

6.6 最大熵分类器 271

6.7 为语言模式建模 275

6.8 小结 276

6.9 深入阅读 277

6.10 练习 278

第7章 从文本提取信息 281

7.1 信息提取 281

7.2 分块 284

7.3 开发和评估分块器 291

7.4 语言结构中的递归 299

7.5 命名实体识别 302

7.6 关系抽取 306

7.7 小结 307

7.8 深入阅读 308

7.9 练习 308

第8章 分析句子结构 312

8.1 一些语法困境 312

8.2 文法的用途 316

8.3 上下文无关文法 319

8.4 上下文无关文法分析 323

8.5 依存关系和依存文法 332

8.6 文法开发 336

8.7 小结 343

8.8 深入阅读 344

8.9 练习 344

第9章 建立基于特征的文法 349

9.1 文法特征 349

9.2 处理特征结构 359

9.3 扩展基于特征的文法 367

9.4 小结 379

9.5 深入阅读 380

9.6 练习 381

第10章 分析语句的含义 384

10.1 自然语言理解 384

10.2 命题逻辑 391

10.3 一阶逻辑 395

10.4 英语语句的语义 409

10.5 段落语义层 422

10.6 小结 428

10.7 深入阅读 429

10.8 练习 430

第11章 语言数据管理 434

11.1 语料库结构:案例研究 434

11.2 语料库生命周期 439

11.3 数据采集 443

11.4 使用xml 452

11.5 使用toolbox数据 459

11.6 使用olac元数据描述语言资源 463

11.7 小结 466

11.8 深入阅读 466

11.9 练习 467

后记 470

参考文献 476

python中文版免费下载-PYTHON自然语言处理(中文最新完整版)pdf下载相关推荐

  1. python编程快速上手自动化_《Python编程快速上手 让繁琐工作自动化》完整版PDF...

    image.png <Python编程快速上手 让繁琐工作自动化>完整版PDF 提取码:7qm4 3.jpg 有关本书 累计销售超过10万册 零基础编程者的不二之选 基于Python3编写 ...

  2. 阿里研究院:数据治理解决方案,附7篇数据治理完整版PDF下载

    企业离不开数据治理,帆软君为大家整理了7篇有关数据治理的资料供大家学习 本文涉及的完整资料PDF已帮你备好,可移步文末获取 1.数据大治理.PDF下载 作者:毕马威中国.阿里研究院 企业端数据治理整体 ...

  3. 网页设计创意书(第2卷) 彩页 完整版PDF下载

    <网页设计创意书(卷2)>先讲解了如何从他人的优秀设计中寻找灵感,接着阐述了重点.对比.平衡.对齐等网站设计的基本原则,然后将网站按类型.设计元素.风格和主题.结构样式和结构元素分类,并分 ...

  4. java 今日头条面试_【面试分享】今日头条Java面试题,复习资料完整版PDF下载

    2021年,字节的技术岗依旧是最香的,而且随着字节的规模不断扩大,机会也越来越多.马上迎来金三银四,很多小伙伴都在撸题备战中. 2021年,字节的技术岗依旧是最香的,而且随着字节的规模不断扩大,机会也 ...

  5. 孙鑫《VC++深入详解》完整版PDF 下载

    非常不错的书,结合孙鑫视频看,效果很好. 下载地址: http://pan.baidu.com/s/1sjBT1hV (链接更新时间:2015-08-28 00:59:03  一两年内应该有效) 此书 ...

  6. 免费的Lucene 原理与代码分析完整版下载

    Lucene是一个基于Java的高效的全文检索库. 那么什么是全文检索,为什么需要全文检索? 目前人们生活中出现的数据总的来说分为两类:结构化数据和非结构化数据.很容易理解,结构化数据是有固定格式和结 ...

  7. php ci框架开发手册下载,php敏捷开发codeigniter框架-CodeIgniter教程(中文手册)pdf格式免费完整版-东坡下载...

    这既是一份CodeIgniter教程,也是一份不可多得的CodeIgniter中文手册,更具体一点来说,它其实是<php敏捷开发codeigniter框架>,如果你需要一份这样的codei ...

  8. FL Studio 20.99中文高级完整版,2023年可免费升级适用于Win/Mac版下载

    FL Studio 20.99中文高级完整版免费下载适用于Mac 和 Windows 32 位和 64 位操作系统.在这里兔八哥提供了最新版本的 Fruity Loops Studio 20.9.2 ...

  9. python影视数据爬虫sqlite源码+论文(完整版和简洁版)

    python影视数据爬虫sqlite源码+论文(完整版和简洁版)-99源码网,程序代做,代写程序代码,代写编程,代写Java编程,代写php编程,计算机专业代做,计算机毕业设计,网站建设,网站开发,程 ...

最新文章

  1. 我亲手调教的AI,竟然开始歧视我了!
  2. 最大概率法分词及性能测试
  3. c语言中很多中括号由外向里,浅谈C语言中的类型声明
  4. winserver2008 Oracle 11g 安装
  5. 程序员绩效总结_阿里五年晋升三次,这个程序员要聊聊他的选择
  6. MVC中使用 事物
  7. Spring容器与上下文理解
  8. 【C】KoobooJson在asp.net core中的使用
  9. Android 之PackageManager框架
  10. 2017年终奖发放,程序员人均11776元排名第一!
  11. python提高——进程、线程、协程对比及代码实现
  12. Android实训案例(四)——关于Game,2048方块的设计,逻辑,实现,编写,加上色彩,分数等深度剖析开发过程!...
  13. 【原创】搭建spark环境二
  14. 设计模式-第二篇之简单工厂模式
  15. DirectX11 SDK 例程报错解决方法
  16. 尽量干净地卸载360
  17. [Go]基于Go语言的Web路由转发,多个网站共享一个端口(新版本,支持WebSocket)
  18. 【大数据安全分析】图计算在安全方面的应用思考
  19. 禁止MAC Chrome更新
  20. Web Scraper爬虫

热门文章

  1. python3使用print打印带颜色的字符串
  2. Tosca 注意事项(持续更新)
  3. python 小兵(2)
  4. The requested URL /xxxx.html was not found on this server
  5. LeetCode Rearrange String k Distance Apart
  6. 抽奖随机算法的技术探讨与C#实现
  7. jquery.form.js ajax提交上传文件
  8. 会员注册审核状态更新计算
  9. 福建省队集训被虐记——DAY3
  10. [文摘20071008]全国软考相关-计算机技术与软件专业资格(水平)考试