nltk是NLP领域中一个比较通用的国际分词工具,但是使用时往往依赖语料库数据包,需要安装到本地,以下介绍在线安装和离线安装两种方式:

(ps:对NLP感兴趣的朋友可以相互学习,我的微信号:Joney-Joney,请备注:NLP博客)

1.在线安装punkt等数据包:

1.1 在线安装时往往会报SSL等安全连接验证错误,可通过python的ssl模块中启用无验证的网络连接方式,代码如下:

import nltk
import ssl
try:_create_unverified_https_context = ssl._create_unverified_context
except AttributeError:pass
else:ssl._create_default_https_context = _create_unverified_https_context
nltk.download()

1.2 运行后就会弹出python解释器后自动打开nltk下载器的界面如下,按图示操作即可:

1.3 单个包都比较小,下载完后打开上图中自行指定的nltk_data目录可看到punkt目录结构如下:

1.4 恭喜您,现在可以正确运行你的代码啦(报错日志中依赖什么包就安装对应的包)

2 离线安装方式:

2.1 先到官网NLTK Corpora(如下图)下载zip包:

2.2 新建一个nltk_data文件夹(仅第一次安装时)放到任意路径下(如:我放在Python.framework/Versions/3.7/share/中);

2.3 把下载好的语料包punkt.zip解压到nltk_data/tokenizers/中(因为punkt属于tokenizers所以需要新建tokenizers文件夹);

2.4 最后把nltk_data目录以代码的形式添加到nltk的数据文件路径中(只需要在第一次安装时添加,添加的代码如下)。

import nltk
nltk.data.path.append('xxxx/nltk_data')  # 参数为你放置的nltk_data文件夹的绝对路径

3.安装nltk其它的语料库同理,个人推荐在线安装的方式,比较方便~~

nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法相关推荐

  1. 解决git clone时报SSL错误

    目录 背景 解决问题 背景 之前项目是使用SSH方式Clone下来的的,但是最近在执行git pull等操作时,在输入密码时,直接报连接不上远程服务器的错误. 分析下来,决定换成HTTPS的方式clo ...

  2. “IIS配置401错误”完美解决方案

    "IIS配置401错误"完美解决方案   1.错误号401.1 症状:HTTP 错误 401.1 - 未经授权:访问由于凭据无效被拒绝. 分析: 由于用户匿名访问使用的账号(默认是 ...

  3. RX580显卡安装驱动时报184错误的解决方案

    最近在朋友的安利之下,想玩玩新出的<小缇娜的奇幻之地>.于是唤醒了我尘封已久的台式机,一顿操作猛如虎的安装了EPIC,然后下载了小缇娜.就当我准备进入游戏大杀四方的时候,游戏刚进入加载界面 ...

  4. 64位Win7系统中安装vc++2008运行时报Error1935错误的解决方法

    问题说明   最新单位来了一批新的计算机(64位Win7系统),其中很多计算机在安装应用系统过程中报错.通过对比正常使用的计算机,发现是没有安装vc++2008运行时,于是在网上下载了运行时并在有问题 ...

  5. 安装npm时报-4048错误的解决方案

    使用npm install express -g报如下错误几位解决方案 解决方案: 1.修改安装路径下的文件夹权限,我这里是安装在D:\NodeJs下,所以修改NodeJs的文件夹权限即可. 2.删除 ...

  6. Ubuntu/Deepin下Python3.8出现SSL错误的解决方案

    在使用pip3的时候,错误信息如下: WARNING: pip is configured with locations that require TLS/SSL, however the ssl m ...

  7. mysql免安装版,遇到msvcr120dll文件丢失错误的解决方案

    无法启动此程序,因为计算机中丢失MSVCR120.dll.这个怎么解决 楼主你好,你可以重新下载一个msvcr120.dll文件,然后按如下步骤操作: 一.解压后直接拷贝该文件到系统目录里: 1.Wi ...

  8. linux 安装微信ca证书,微信SSL证书更换的检查与安装方法

    微信SSL证书更换的检查与安装方法 Ubuntu, Debian 查看根证书 确认操作系统上,是否存在以下文件: /etc/ssl/certs/DigiCert_Global_Root_CA.pem ...

  9. Ubuntu 16.04安装Wine版的迅雷+QQ(完美方案,终极解决方法)

    安装前先备份好系统! 继上一篇安装QQ的方法http://www.cnblogs.com/EasonJim/p/7425978.html,这一篇的QQ采用的是Wine模式安装.完美解决消息记录中文乱码 ...

最新文章

  1. Oracle计算两个整数的和与这两个整数的差与商
  2. 鸿蒙osppt,Mate40 Pro鸿蒙OS快速上手体验+一点个人看法
  3. 学习MongoDB 十一: MongoDB聚合(Aggregation Pipeline基础篇上)(三)
  4. js中的scroll和offset 的使用比较
  5. TCL座机日期时间调整
  6. jQuery -- 光阴似箭(三):jQuery 操作 HTML 元素和属性
  7. 你抢购盐干什么?要抢购也是先选大米啊
  8. python深度学习之TensorFlow
  9. NODDI在临床研究中的应用
  10. 硬盘的老化测试软件,扩容卡检测、扩容U盘检测工具(MyDiskTest)
  11. 微师电脑客户端 附使用教程
  12. vscode运行命令是报错:标记“”不是此版本中的有效语句分隔符。
  13. “Ubuntu 18.04.2 LTS _Bionic Beaver_ - Release amd64 (20190210)” 的盘片插入驱动器“/cdrom/”再按「回车」键
  14. Android从一个应用程序启动第三方应用app
  15. 新款车型防盗器的安装方法
  16. 太经典了!NBA球员超逗的豪言壮语
  17. 数据分析报告——经典统计量的描述性分析:平均数方差、偏度峰度
  18. Moodle二次开发(1)-- 微创新
  19. SAP、Oracle和微软:ERP该选哪一家?
  20. xtu oj 1376 回文数

热门文章

  1. python语言format用法_详解Python中的format格式化函数的使用方法
  2. 题目:16版.雇员的工作职责(一)
  3. pythonvim编辑教程_Pycharm学习教程(6) Pycharm作为Vim编辑器使用
  4. python代码画小狗_程序员教你用代码手绘一只可爱的小狗,正好拿去送给女朋友给她个惊喜...
  5. Platform Builder实践之配置文件
  6. mybatis的mysql参数传递参数_mybatis 传递参数的方法总结
  7. 是网关吗_智能家居网关功能这么多,你都知道吗?
  8. bert pytorch 序列标注_序列标注:Bi-LSTM + CRF
  9. python中的类怎样理解_理解Python数据类:Dataclass fields 的概述(下)
  10. inputstream java_Java实现inputstream流的复制