python 文本分析

This is a book review of Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data by Dipanjan Sarkar

这是有关使用Python进行文本分析的书评: Dipanjan Sarkar提出的一种从数据中获取可行见解的实用现实方法

One of my go-to books for natural language processing with Python has been Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit by Steven Bird, Ewan Klein, and Edward Loper.  This has been the book for me and was one of my dissertation references.  I used this book so much, that I I had to buy a second copy of this book because I wore the first one out.  I’ve read many other NLP books but haven’t found any that could match this book – till now.

我使用Python进行自然语言处理的热门书籍之一是《使用Python进行自然语言处理:使用自然语言工具包分析文本》,作者是 Steven Bird,Ewan Klein和Edward Loper。 这是给我的书,也是我的论文参考之一。 我用了这么多书,以至于我不得不买第二本书,因为我把第一本书都穿了。 我读过许多其他NLP书籍,但直到现在都找不到与这本书匹配的书籍。

Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data by Dipanjan Sarkar is a fantastic book and has now taken a permanent place on my bookshelf.

使用Python进行文本分析:一种实用的现实世界方法,可从您的数据中获取可行的见解 Dipanjan Sarkar是一本很棒的书,现在已经在我的书架上占据了永久位置。

Unlike many books that I run across, this book spends plenty of time talking about the theory behind things rather than just doing some hand-waving and then showing some code. In fact, there isn’t any code (that I saw) until page 41. That’s impressive these days.   Here’s a quick overview of the book’s layout:

与我读过的许多书不同,这本书花了大量时间谈论事物背后的理论,而不仅仅是挥舞双手然后展示一些代码。 实际上,直到第41页都没有任何代码(我看到的)。这些天令人印象深刻。 这是本书布局的快速概述:

  • Chapter 1 provides the baseline for Natural Language. This is a very good overview for anyone that’s never worked much with NLP.
  • Chapter 2 is a python ‘refresher’. If you don’t know python at all but know some other language, this should get you started enough to use the rest of the book.
  • Chapter’s 3 – 7 is there the real fun begins. These chapters cover Text Classification, Summarization Similarity / Clustering and Semantic / Sentiment Analysis.
  • 第1章提供了自然语言的基础。 对于从未使用过NLP的人来说,这是一个很好的概述。
  • 第2章是python“刷新器”。 如果您根本不了解python,但了解其他语言,则应该可以使您开始使用本书的其余部分。
  • 第三章至第七章是真正的乐趣开始的地方。 这些章节涵盖了文本分类,摘要相似度/聚类和语义/情感分析。

If you have some familiarity with python and NLP, you can jump to Chapter 3 and dive into the details.

如果您对python和NLP有所了解,则可以跳至第3章,并深入研究细节。

What I really like about this book is that it places theory first.  I’m a big fan of ‘learning by doing’ but I think before you can ‘do’ you need to know ‘why’ you are doing what you are doing.  The code in the book is really well done as well and uses the NLTK,  Sklearn and gensim libraries for most of the work. Additionally, there are multiple ‘build your own’ sections where the author provides a very good overview (and walk-through) of what it takes to build your own functionality for your own NLP work.

我真正喜欢这本书的地方在于它将理论放在第一位。 我是“边做边学”的忠实拥护者,但我认为在“可以做”之前,您需要知道“为什么”在做自己在做的事情。 本书中的代码确实做得很好,并且使用NLTK,Sklearn和gensim库完成了大部分工作。 此外,还有多个“构建自己的”部分,作者在其中提供了很好的概述(和演练)以介绍如何为自己的NLP工作构建自己的功能。

This book is highly recommended.

强烈推荐这本书。



Links in this post:

这篇文章中的链接:

Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit by Steven Bird, Ewan Klein, and Edward Loper.

使用Python进行自然语言处理:使用 Steven 语言 ,Ewan Klein和Edward Loper 的自然语言工具包分析文本 。

Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data by Dipanjan Sarkar

使用Python进行文本分析:一种实用的现实世界方法,可从您的数据中获取可行的见解 Dipanjan Sarkar

Eric Brown埃里克·布朗
Eric D. Brown , D.Sc. has a doctorate in Information Systems with a specialization in Data Sciences, Decision Support and Knowledge Management. He writes about utilizing python for data analytics at pythondata.com and the crossroads of technology and strategy at ericbrown.com
埃里克·布朗(Eric D.Brown) 拥有信息系统博士学位,专门研究数据科学,决策支持和知识管理。 他写了关于利用数据分析Python在pythondata.com技术和战略的十字路口在ericbrown.com

http://pythondata.wpengine.com/http://pythondata.wpengine.com/

翻译自: https://www.pybloggers.com/2017/09/text-analytics-with-python-a-book-review/

python 文本分析

python 文本分析_使用Python进行文本分析–书评相关推荐

  1. python 时间序列预测_使用Python进行动手时间序列预测

    python 时间序列预测 Time series analysis is the endeavor of extracting meaningful summary and statistical ...

  2. python 概率分布模型_使用python的概率模型进行公司估值

    python 概率分布模型 Note from Towards Data Science's editors: While we allow independent authors to publis ...

  3. 分布分析和分组分析_如何通过群组分析对用户进行分组并获得可行的见解

    分布分析和分组分析 数据分析 (DATA ANALYSIS) Being a regular at a restaurant is great. 乙 eing定期在餐厅是伟大的. When I sta ...

  4. python char 相等_用 Python 实现 Excel文本函数

    用 Python 实现 Excel文本函数 Excel 是非常强大的电子表格软件,大家日常经常用 Excel 处理成绩.师生名单.分析数据等,对 Excel 的函数比较了解,通过用 Python 实现 ...

  5. python查询和替换一个文本字符串_【Python】python面试题

    一些Python面试题 1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只 ...

  6. python行业中性_用python进行金融市场文本数据的情感计算

    之前我依据一篇论文中的中文金融情感词典CFSD(chinese financial sentiment dictionary),中文金融领域情感词典构建, 整理成csv文件的情感词典.现在我们找点财经 ...

  7. python中二进制和文本不同_关于Python字符编码与二进制不得不说的一些事

    二进制 核心思想: 冯诺依曼 + 图灵机 电如何表示状态,才能稳定? 计算机开始设计的时候并不是考虑简单,而是考虑能自动完成任务与结果的可靠性, 简单始终是建立再稳定.可靠基础上 经过尝试10进制,但 ...

  8. python图片显示文本框_用PYTHON以“形式”同时显示图像和文本框

    我是PYTHON新手.我试图用PYTHON以"表单"同时显示图像和文本框.在 我的问题是:图像在屏幕上不可见.如何解决这个问题?在 谢谢 我的代码:import tkinter a ...

  9. python链表划分_《Python自然语言处理》——1.2 近观Python:将文本当做词链表-阿里云开发者社区...

    本节书摘来自异步社区<Python自然语言处理>一书中的第1章,第1.2节,作者[美]Steven Bird,Ewan Klein,Edward Loper, 陈涛,张旭,崔杨,刘海平 译 ...

最新文章

  1. 【入门级】自学Python第一步,记住这7大编码规范
  2. Struts1和Struts2对照
  3. 代理加盟哪家小程序开发公司好
  4. import导入工程时出现error:Description Resource Path Location Type Target runtime com.genuitec.runtime.gener
  5. 云炬VB开发笔记 4选择结构
  6. BugkuCTF-MISC题又一张图片,还单纯吗
  7. Matlab无法打开,卡logo
  8. Xilinx FPGA资源解析与使用系列——Transceiver(十)PRBS、RX Equalizer、CDR
  9. python0基础 第三节
  10. 国内哪一家银行的账户最适合用来接收来自国外机构的美元汇款?
  11. wps中有半根横线无法选中无法删除
  12. 灵活高效PDF转Word工具
  13. 迎接2012新赛季——HDOJ系列热身赛(4)部分结题报告
  14. 幸福和不幸福是对比出来的
  15. ubuntu安装teamviewer后无法打开,提示权限不够
  16. C# PictureBox 图片自适应
  17. java的io和nio例子
  18. Win下制作U盘安装盘二
  19. 【胖虎的逆向之路】02——Android整体加壳原理详解实现
  20. mysql表结构设计工具_工具 EZDML表结构设计器

热门文章

  1. 【OpenCV】Mac OS M1上安装OpenCV
  2. Atom 1.37.0 beta 1 发布,跨平台文本编辑器
  3. linux下aria2的安装与配置
  4. Media Foundation——媒体类型(1)
  5. 第51章 设置FLASH的读写保护及解除—零死角玩转STM32-F429系列
  6. 《人月神话》纪念典藏版撤下了以前的宣传语
  7. Oracle知识点(一)--创建表
  8. laravel多库操作
  9. vue3项目实战---知乎日报----登录页
  10. html表格展开格式,4款简单常见的纯CSS表格(table)样式