自然语言处理(NLP)是有关计算语言学与人工智能的研究领域之一。NLP主要关注人机交互,它提供了计算机和人类之间的无缝交互,使得计算机在机器学习的帮助下理解人类语言。

本书详细介绍如何使用Python执行各种自然语言处理(NLP)任务,并帮助读者掌握利用Python设计和构建基于NLP的应用的实践。本书引导读者应用机器学习工具来开发各种各样的模型。对于训练数据的创建和主要NLP应用的实现,例如命名实体识别、问答系统、语篇分析、词义消歧、信息检索、情感分析、文本摘要以及指代消解等,本书都进行了清晰的介绍。本书有助于读者使用NLTK创建NLP项目并成为相关领域的专家。

通过阅读本书,你将能够:

● 实现字符串匹配算法以及标准化技术;

● 实现统计语言建模技术;

● 深刻理解词干提取器、词形还原器、形态分析器以及形态生成器的开发;

● 开发搜索引擎并实现词性标注和统计建模(包含n-gram方法)等相关概念;

● 熟悉诸如树型库建设、CFG建设、CYK以及Earley线图解析算法等相关概念;

● 开发基于NER的系统并理解和应用情感分析的相关概念;

● 理解并实现信息检索和文本摘要等相关概念;

● 开发语篇分析系统以及基于指代消解的系统。

精通Python自然语言处理 内容简介

自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。

本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。

本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。

精通Python自然语言处理 目录

前言

第1章 字符串操作

1.1 切分

1.2 标准化

1.3 替换和校正标识符

1.4 在文本上应用Zipf定律

1.5 相似性度量

1.6 小结

第2章 统计语言建模

2.1 理解单词频率

2.2 在MLE模型上应用平滑

2.3 为MLE开发一个回退机制

2.4 应用数据的插值以便获取混合搭配

2.5 通过复杂度来评估语言模型

2.6 在语言建模中应用Metropolis-Hastings算法

2.7 在语言处理中应用Gibbs采样法

2.8 小结

第3章 形态学:在实践中学习

3.1 形态学简介

3.2 理解词干提取器

3.3 理解词形还原

3.4 为非英文语言开发词干提取器

3.5 形态分析器

3.6 形态生成器

3.7 搜索引擎

3.8 小结

第4章 词性标注:单词识别

4.1 词性标注简介

4.2 创建词性标注语料库

4.3 选择一种机器学习算法

4.4 涉及n-gram的统计建模

4.5 使用词性标注语料库开发分块器

4.6 小结

第5章 语法解析:分析训练资料

5.1 语法解析简介

5.2 Treebank建设

5.3 从Treebank提取上下文无关文法规则

5.4 从CFG创建概率上下文无关文法

5.5 CYK线图解析算法

5.6 Earley线图解析算法

5.7 小结

第6章 语义分析:意义很重要

6.1 语义分析简介

6.2 使用Wordnet生成同义词集id

6.3 使用Wordnet进行词义消歧

6.4 小结

第7章 情感分析:我很快乐

7.1 情感分析简介

7.2 小结

第8章 信息检索:访问信息

8.1 信息检索简介

8.2 向量空间评分及查询操作符关联

8.3 使用隐性语义索引开发IR系统

8.4 文本摘要

8.5 问答系统

8.6 小结

第9章 语篇分析:理解才是可信的

9.1 语篇分析简介

9.2 小结

第10章 NLP系统评估:性能分析

10.1 NLP系统评估要点

10.2 IR系统的评估

10.3 错误识别指标

10.4 基于词汇搭配的指标

10.5 基于句法匹配的指标

10.6 使用浅层语义匹配的指标

10.7 小结

精通Python自然语言处理 精彩文摘

自然语言处理(Natural Language Processing,NLP)关注的是自然语言与计算机之间的交互。它是人工智能(Artificial Intelligence,AI)和计算语言学的主要分支之一。它提供了计算机和人类之间的无缝交互并使得计算机能够在机器学习的帮助下理解人类语言。在编程语言(例如C、C++、Java、Python等)里用于表示一个文件或文档内容的基础数据类型被称为字符串。在本章中,我们将探索各种可以在字符串上执行的操作,这些操作将有助于完成各种NLP任务。

本章将包含以下主题:

·文本切分。

·文本标准化。

·替换和校正标识符。

·在文本上应用Zipf定律。

·使用编辑距离算法执行相似性度量。

·使用Jaccard系数执行相似性度量。

·使用Smith Waterman算法执行相似性度量。

切分可以认为是将文本分割成更小的并被称作标识符的模块的过程,它被认为是NLP的一个重要步骤。

当安装好NLTK包并且Python的交互式开发环境(IDLE)也运行起来时,我们就可以将文本或者段落切分成独立的语句。为了实现切分,我们可以导入语句切分函数,该函数的参数即为需要被切分的文本。

sent_tokenize函数使用了NLTK包的一个叫作PunktSentenceTokenizer类的实例。基于那些可以标记句子开始和结束的字母和标点符号,NLTK中的这个实例已经被训练用于对不同的欧洲语言执行切分。

python自然语言处理书籍_精通Python自然语言处理pdf相关推荐

  1. python 标准库 书籍_《Python标准库》Python语言的权威之作

    <Python标准库>由资深python专家亲自执笔,python语言的核心开发人员作序推荐,是Python的权威之作,书中对一百多个模块进行了生动的讲解.<Python标准库> ...

  2. 关于python的经典书籍_关于Python的经典入门书籍有哪些?

    适合完全没有编程基础的新手使用. 回复内容: 适合完全没有编程基础的新手使用? Learn Python The Hard Way是你唯一的.最终的.史诗级的选择.它也许不能和 _why 的 why' ...

  3. python框架django书籍_有Python基础,刚接触web框架的Django初学者。

    本文面向:有Python基础,刚接触web框架的Django初学者. 环境:windows7 python3.5.1 pycharm Django 1.10版 pip3 一.Django简介 百度百科 ...

  4. python画交互式地图_使用Python构建交互式地图-入门指南

    python画交互式地图 Welcome to The Beginner's Guide to Building Interactive Maps in Python 欢迎使用Python构建交互式地 ...

  5. python自然语言处理书籍_自然语言处理有哪些可以推荐的书?

    研究人类语言的过程称为NLP.深入研究语言的人称为语言学家,而"计算语言学家"这个专有名词适用于应用计算研究语言处理的人.从本质上讲,计算语言学家是深入了解语言的计算机科学家,计算 ...

  6. python 数据科学书籍_您必须在2020年阅读的数据科学书籍

    python 数据科学书籍 "We're entering a new world in which data may be more important than software.&qu ...

  7. python数据分析师书籍_如何自学成为数据分析师

    展开全部 第1本<谁说菜2113鸟不会数据5261分析入门篇> 很有趣的数据分析书!基本看过就能明白4102,以小说的1653形式讲解,很有代入感.包含了数据分析的结构化思维.数据处理技巧 ...

  8. 自学python书籍_自学python看什么书

    俗话说:工欲善其事,必先利其器!对于零基础入门的人来说,对于Python的学习还是有点懵懵懂懂的,如果有一些书籍先看看来引导,学起来难度也会减低很多,同时会提高学习者的自信心!今天向推荐这些零基础入门 ...

  9. 学习python最好的书籍_最好的Python书籍

    学习python最好的书籍 Python is an amazing programming language. It can be applied to almost any programming ...

最新文章

  1. WSL系列操作:安装,卸载
  2. 联通电子渠道的差异化思维
  3. java win8 mac地址_Windows8系统下MAC地址修改方法图文教程
  4. 大话数据结构(十)java程序——队列
  5. python批量下载网页文件-python使用selenium实现批量文件下载
  6. Oracle DML
  7. postgreSQL源码分析——索引的建立与使用——GIST索引(2)
  8. Storyboard全解析-第二部分
  9. 移动APP之专项测试
  10. html三级链表,二叉链表怎么画
  11. JS 页面跳转,参数的传递
  12. 常用的台式计算机,台式电脑常见简单故障排除
  13. 【Linux】Linux的字符终端
  14. FDM3D打印技术原理简析
  15. 网易互娱游戏研发工程师笔试
  16. 实践▍用大数据扒一扒蔡徐坤的真假流量粉 | Alfred数据室
  17. 很久以前某位大仙对petri网的总结
  18. JSON转String
  19. Bone-Age-Detection-From-X-Ray
  20. c++rpg黑框游戏_RPG游戏 C++源码 文字RPG游戏

热门文章

  1. cesium 经纬度绘制点_炫酷大屏地图自定义绘制(一)
  2. composer升级_Composer 使用姿势与 Lumen 升级指南
  3. 如何实现软件的远程更新_手机免root终于也能实现远程控制了 这款国产软件真是越来越好用...
  4. 计算机入门 姚班,清华“姚班”:学霸中的尖子生,大佬毕业后都去哪了?
  5. springboot starter工作原理_98,谈谈SpringBoot的工作原理
  6. 山海伏妖录java_山海伏妖录攻略大全 剧情结局加点妖兽大全
  7. DataParallel 和 DistributedDataParallel 的区别和使用方法
  8. 大虾对51单片机入门的经验总结
  9. sass使用相关报错
  10. 在HubSpot是如何应对Fat JAR困境的