《自然语言处理入门》是图灵 2019 年 10 月出版的一本 NLP 领域的入门图书,作者是何晗(网名 hankcs,HanLP 作者、「码农场」博客博主)。图书上架之后得到了广大的读者的喜爱,在短短半年内,已经印刷了 6 次,总印数为 14 000。与此同时,这本书目前已经被三十多所学校的教师或者研究团队作为参考教材,或者大公司的 NLP 团队作为交流参考资料。不夸张地说,这本书在某种程度上满足了一大批读者的诉求,而此前图书市场上并没有图书做到这一点。

我们收到过很多朋友的致谢,非常荣幸这本书对这部分读者帮助如此之大。我们也收到过一些朋友三三两两的意见,反馈这本书在某些方面并没有达到他们的期望,非常感谢这些反馈和建议。大家的需求如此多样,而我们的书只能定位解决其中的一两个问题,更多问题,只能寄希望于出版更多图书。

但是,还有一小撮读者对这本书有一定的误解,甚至有读者买来图书都没有好好阅读就跑去豆瓣评了一星(这本书目前在豆瓣的评分是 8.8 分),大家知道,对于辛苦写作的作者和认真出版的出版方来说,这样的评论很扎心,也很无奈,因为你没办法跟做出这种行为的读者讲理——你想通过大家的意见认真提升图书品质,而他只不过是靠肤浅的认知随意过把嘴瘾。我能这么提这个问题是因为我试着按图索骥找到过其中两位读者咨询他们的意见,结果,你可能猜到了,他们甚至没有认真读过书,对于自己的“恶毒”评论也没说出个所以然来。

我也想借此提醒诸君,在豆瓣或者大众点评等网站上,尽量客观表达你的使用体验,如果能够做到有理有据那就更好了,这是为数不多能体现我们普通人影响力的地方。

书无完书,也不可能满足所有读者的阅读需求,只希望真正需要这这本书人都能找到这本书。

好了,说这么多,其实这篇文章的核心是为部分对《自然语言处理入门》有些许误解或者过度期待的读者简单解释一下,我原文转载了作者何晗的说明,请见如下。

各位读者大家好:

在大家的支持下,拙作《自然语言处理入门》 取得了些许成绩,包括印数、繁体中文版企划等,谢谢你们。

在读者群壮大的同时,我也收到了许多反馈。勘误类的反馈我在 《自然语言处理入门》勘误表 中一一答复并致谢。但一些两极化的评论也引发了我的一些担忧,在此我做一个统一的澄清。取决于读者自身的基础,产生了如下几种观点,我认为是不妥当的。

搞NLP只需看《自然语言处理入门》 就够了,比某某教材好

只看一本书肯定是不够的,拿《自然语言处理入门》 跟经典教材比也是不恰当的,拙作无意也无法取代经典教材。拙作定位是面向零基础读者的入门读物,相当于科普而非专著。专著中的定义、理论、推导证明等对零基础读者而言太难了。就入门而言,最重要的是兴趣而不是难度,所以读者看到的是一个通俗易懂的定位。同时,对有难度的部分,书里也有对专著的引用,请有志于深造的读者递归学习。

《自然语言处理入门》 不够深入,理论性不强

这一点还是取决于读者自身的基础。事实上,关于拙作究竟是太难了还是太简单了这一点,我听到了许多截然相反的评价。有ML或数理基础的读者倾向于认为拙作太简单,而部分一点数学都接受不了的读者则认为拙作太难。我诚恳地建议,NLP是ML的应用层,既不要过高地期待NLP入门书会深入ML理论的核心,也不要连ML的皮毛都畏难抗拒。正如介绍语所言,拙作仅允许必需的公式出现。拙作既没有写成ML和NLP的并集,也没有写成NLP与ML的差集,个人认为是符合入门的定位的。

《自然语言处理入门》 没怎么讲深度学习

惭愧,第十三章一定没有满足这部分读者。然而,深度学习是无论如何都不可能通过一章就讲清楚。数一数的话,线性代数基础需要一章、优化理论需要一章、词的分布表示需要一章、CNN/RNN/Transformer各需要一章、《自然语言处理入门》 1中涉及到的各种NLP任务各需要一章。基本上,CS224n有多少节课相应就需要多少章,这些章节加起来又是一本书了。另一方面,将这些内容加入到入门书里并不恰当。正如我在第一章所说,深度学习不是所有场景都适用,也不是所有企业都用得起深度学习,掌握传统机器学习有助于理解深度学习。深度学习有泡沫成分,本身也是一个理论不完备的领域,初学者不必急于求成。

《自然语言处理入门》 讲了很多HanLP的内容

这在部分读者看来是好事,在另一部分读者看来是缺点。理论是通用的,实现只选取一种。作为入门书,我觉得有责任提供正确实现还能用到生产项目里的代码。我在前言和试读中都有提到,自己写的代码自己讲得清楚,所以书里讲到HanLP的设计和实现是理所当然的事情。

总之,读者自我定位和本书的定位是否匹配非常重要,不必跟风购买。千言万语,总结为一句话,定位就是入门,不要抱有过度的期待。有任何批评和建议,尽管留言或私信。同时,方便的话,欢迎读者朋友去豆瓣留下公正的书评。

如果你正在入门自然语言处理,或者对 NLP 很感兴趣,不如先来了解下~

Java 与 Python 双实现

助你零起点上手自然语言处理

《自然语言处理入门》

何晗 著

本书作者是自然语言处理类库 HanLP 作者何晗。截至 2019 年 10 月初,该项目在 GitHub 上 Star 数已达 15 K,超过了宾夕法尼亚大学的 NLTK、斯坦福大学的 CoreNLP、哈尔滨工业大学的 LTP。作者汇集多年经验,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。

☟ 一键试读

《自然语言处理入门》不是 NLP 学习路上的万能药相关推荐

  1. 视频教程-自然语言处理实战——情感分析-NLP

    自然语言处理实战--情感分析 从事软件开发行业二十余年,创业公司做过,上市公司也干过,历任程序员.项目经理.产品经理.QA经理.技术总监等职位. AI浪潮来临,发现AI编程与传统编程差异明显,深感淘汰 ...

  2. NLP自然语言处理入门学习笔记(一)

    文章目录 一.NLP简介 1.1.什么是自然语言处理 1.2.NLP发展简史 1.3.NLP应用场景 二.文本预处理 2.1.认识文本预处理 2.2.文本处理的基本方法 2.2.1.分词简介 2.2. ...

  3. 小白自然语言处理入门学习笔记(2020年)

    提示:点赞在看~养成好习惯 这是2020年在疫情期间,研一自学的笔记,整理一下就相当于自己的笔记整理.也是刚入门机器学习,代码写的不好麻烦见谅 觉得可以的话 Star一下呗 谢谢啦. 仓库的内容主要为 ...

  4. 利用计算机技术实现对文本篇章,自然语言处理NLP学习笔记一:概念与模型初探...

    前言 先来看一些demo,来一些直观的了解. 自然语言处理: 可以做中文分词,词性分析,文本摘要等,为后面的知识图谱做准备. 知识图谱: 还有2个实际应用的例子,加深对NLP的理解 九歌机器人: 微软 ...

  5. NLP汉语自然语言处理入门基础知识介绍

    NLP汉语自然语言处理入门基础知识介绍 自然语言处理定义: 自然语言处理是一门计算机科学.人工智能以及语言学的交叉学科.虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部 ...

  6. 自然语言处理入门实战2:基于深度学习的文本分类

    自然语言处理入门实战2:基于深度学习的文本分类 数据集 数据预处理 模型 模型训练 模型测试 参考 本文参考复旦大学自然语言处理入门练习,主要是实现基于深度学习的文本分类. 环境:python3.7 ...

  7. 【实战教程】NLP-Beginner:自然语言处理入门练习

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 今天给大家分享一门很好的NLP入门学习实战仓库,话不多说,学它!!! 此项目完成了 ...

  8. 一份从入门到精通NLP的完整指南 | NLPer

    该小博主介绍 本人:笔名zenRRan,方向自然语言处理,方法主要是深度学习. 未来的目标:人工智能之自然语言处理博士. 写公众号目的:将知识变成开源,让每个渴求知识而难以入门人工智能的小白以及想进阶 ...

  9. 终于有人把自然语言处理、机器学习、深度学习和AI讲明白了

    导读:本文将带你了解自然语言处理的概念.应用,以及与机器学习.深度学习和人工智能之间的关系. 作者:卡蒂克·雷迪·博卡(Karthiek Reddy Bokka).舒班吉·霍拉(Shubhangi H ...

最新文章

  1. ubuntu安装OpenCV详细教程(建议收藏)
  2. 首届中文NL2SQL挑战赛:千支队伍参赛,国防科大夺冠
  3. [Lua]50行代码的解释器,用来演示lambda calculus
  4. 设计模式 学习笔记(1)简单工厂模式、策略模式
  5. html 元素怎么分类的,前端之Html元素的分类
  6. 6 Git 分支 - 变基
  7. c++ 特定容器算法(sort,merge,reverse,remove,unique)
  8. P5170 【模板】类欧几里得算法(类欧)
  9. java学习(110):日期date类
  10. Outlook最小到系统托盘
  11. php取数组里面数组的值,PHP获取数组的键与值方法小结
  12. 2018年,加油!!!
  13. android使用greedao踩坑日记
  14. Python 学习笔记——笨方法学python3——习题41
  15. 解决chrome添加扩展时的报错:“此项内容已下载并添加到Chrome中”
  16. php 百望电子发票,百望云电子发票服务平台开票工具
  17. 申请苹果公司版开发者账号实录【99美元,非299美元企业版账号】
  18. windows10突发explorer.exe“没有注册类”错误的解决方式
  19. Linux-脚本安装、快照、重置虚拟机
  20. 2021年全球及中国天然橡胶产量、消费量及价格走势分析:中国市场需求量急速增涨[图]

热门文章

  1. 兴趣点推荐代码_推荐系统模型阿里用户兴趣模型(附完整代码)
  2. treeview控件怎么使用修改发育树_树形控件在生产力工具中的设计
  3. iphone屏蔽系统更新_一招屏蔽系统更新!再见 iOS 13...
  4. 电脑ip地址设置_关于电脑的远程开机(唤醒)
  5. mysql解析运行时间_分析 MySQL 语句运行时间
  6. word邮件合并一页8个_利用word邮件合并批量制作准考证
  7. 求13-23+33……-1003(3.6)(Java)
  8. java内省操作类的属性
  9. Windows系统一键安装zabbix agent
  10. PHP判断ajax请求:HTTP_X_REQUESTED_WITH