众所周知,nltk需要download一些文件才能用,但由于网络不通畅,经常下载不下来。官方链接在这里:点击官方链接

我已经帮大家下载好了必备的几个文件,资源在这里,不必担心网络问题,仅需0积分,可以直接下载:
https://download.csdn.net/download/weixin_43997331/87148814

获取nltk允许的数据路径

import nltk
print(nltk.data.path)

然后选择一个路径,作为之后文件存放的位置。

punkt

创建tokenizers文件夹,把下载好的punkt文件夹放进去。

averaged_perceptron_tagger

创建taggers文件夹,把averaged_perceptron_tagger文件夹放进去。

words

创建corpora文件夹,把words文件夹放进去。

maxent_ne_chunker

创建chunkers文件夹,把maxent_ne_chunker文件夹放进去。

测试

全部放好之后就开始测试吧

import nltk
s = 'i have five apples and apple 5th'
s_token = nltk.word_tokenize(s)
s_tagged = nltk.pos_tag(s_token)
s_ner = nltk.chunk.ne_chunk(s_tagged)
print(s_ner)

结果为

(S i/NNS have/VBP five/CD apples/NNS and/CC apple/NN 5th/CD)

nltk download所需包相关推荐

  1. anaconda安装手写字符识别所需包

    前言   成功安装好anaconda后,想要运行手写字符识别的程序,需要一些安装包,现将命令记录如下: 正文 1.配置TensorFlow环境   首先需要进入anaconda自带的命令行窗口中,在窗 ...

  2. Resource punkt not found.nltk.download()下载失败

    Resource punkt not found.&&nltk.download()下载失败 LookupError: ******************************** ...

  3. nltk download失败

    之前在台式机win10的系统,python 2.7,用的pycharm执行nltk download(),很顺利.然而到了我的笔记本只是换个一个win8的系统,Python的配置都是一样的,但是这时候 ...

  4. nltk.download(“stopwords“)

    Resource 'corpora/stopwords' not found.  Please use the NLTK Downloader to obtain the resource: > ...

  5. NLTK语料库nltk.download()安装失败及下载很慢的解决方法

    使用NLTK.download()时出现的问题 nltk_data数据下载链接:https://gitee.com/qwererer2/nltk_data/tree/gh-pages/

  6. 安装GitHub代码所需包

    安装GitHub代码所需包 pip install -r requirements.txt -i https://pypi.douban.com/simple

  7. 已解决nltk.download(‘punkt’) [nltk_data] Error loading punkt: [WinError 10060] [nltk_data]

    已解决(nltk下载词库报错)nltk.download('punkt') [nltk_data] Error loading punkt: [WinError 10060] [nltk_data] ...

  8. nltk离线数据:解决nltk.download()下载错误

    无网络环境解决nltk.download()报错 下载nltk_data,打开nltk_data下载packages文件夹. 使用 nltk.data.find(".") 这个命令 ...

  9. nltk.download(‘punkt‘)报错

    问题描述 在跑代码时,用到nltk库,但是出现如下问题: import nltk nltk.download('punkt') For more information see: https://ww ...

最新文章

  1. C++/C++11中std::set用法汇总
  2. c++把数组所有元素剔除_C语言基础之数组,第一节,C语言必学知识点剖析
  3. vscode 调试python 无法连接远程服务器_vscode 远程调试python的方法
  4. IplImage, CvMat, Mat 的关系和相互转换 再次理解 /(ㄒoㄒ)/~~
  5. 再会迪杰斯特拉(Dijkstra)
  6. CCNA考试试验总结
  7. 【codevs1116】四色问题,深搜入门题目
  8. #define _INTSIZEOF(n) ((sizeof(n)+sizeof(int)-1)~(sizeof(int) - 1) )
  9. 兄弟打印机内存已满清零方法_兄弟打印机清零方法大全
  10. java 罗马数字_罗马数字 | 学步园
  11. 【转】CT (电子计算机断层扫描)
  12. openffice安装(windows和linux)
  13. 开路电压法与电流积分法
  14. 西瓜书习题 - 8.集成学习
  15. K8s介绍及离线安装(四)
  16. Hyperledger Fabric2中文文档-修改通道配置
  17. python医药数据分析_Python数据分析案例-药品数据分析案例
  18. R语言之主成分回归与偏最小二乘xt8.3xt8.4
  19. win10 中使用bat脚本关机,重启 代码
  20. Git remote: error: this exceeds file size limit of 100.0 MB

热门文章

  1. 计算机组成与结构——概述
  2. 知了 | 基于NLP的智能问答推荐系统
  3. 碧水风荷录-第一章(未完,正在整理中……)
  4. 【CCF CSP】【Python】【201903-1】小中大
  5. 1,0在js中有可能会等于true和false来去判断的
  6. 关于Keystone 服务运维学习
  7. PCB如何更合理的拼版
  8. openCV简易人脸考勤
  9. CICD之 gitlab和gtilab runner
  10. java不足位数补0