nltk download所需包
众所周知,nltk需要download一些文件才能用,但由于网络不通畅,经常下载不下来。官方链接在这里:点击官方链接
我已经帮大家下载好了必备的几个文件,资源在这里,不必担心网络问题,仅需0积分,可以直接下载:
https://download.csdn.net/download/weixin_43997331/87148814
获取nltk允许的数据路径
import nltk
print(nltk.data.path)
然后选择一个路径,作为之后文件存放的位置。
punkt
创建tokenizers文件夹,把下载好的punkt文件夹放进去。
averaged_perceptron_tagger
创建taggers文件夹,把averaged_perceptron_tagger文件夹放进去。
words
创建corpora文件夹,把words文件夹放进去。
maxent_ne_chunker
创建chunkers文件夹,把maxent_ne_chunker文件夹放进去。
测试
全部放好之后就开始测试吧
import nltk
s = 'i have five apples and apple 5th'
s_token = nltk.word_tokenize(s)
s_tagged = nltk.pos_tag(s_token)
s_ner = nltk.chunk.ne_chunk(s_tagged)
print(s_ner)
结果为
(S i/NNS have/VBP five/CD apples/NNS and/CC apple/NN 5th/CD)
nltk download所需包相关推荐
- anaconda安装手写字符识别所需包
前言 成功安装好anaconda后,想要运行手写字符识别的程序,需要一些安装包,现将命令记录如下: 正文 1.配置TensorFlow环境 首先需要进入anaconda自带的命令行窗口中,在窗 ...
- Resource punkt not found.nltk.download()下载失败
Resource punkt not found.&&nltk.download()下载失败 LookupError: ******************************** ...
- nltk download失败
之前在台式机win10的系统,python 2.7,用的pycharm执行nltk download(),很顺利.然而到了我的笔记本只是换个一个win8的系统,Python的配置都是一样的,但是这时候 ...
- nltk.download(“stopwords“)
Resource 'corpora/stopwords' not found. Please use the NLTK Downloader to obtain the resource: > ...
- NLTK语料库nltk.download()安装失败及下载很慢的解决方法
使用NLTK.download()时出现的问题 nltk_data数据下载链接:https://gitee.com/qwererer2/nltk_data/tree/gh-pages/
- 安装GitHub代码所需包
安装GitHub代码所需包 pip install -r requirements.txt -i https://pypi.douban.com/simple
- 已解决nltk.download(‘punkt’) [nltk_data] Error loading punkt: [WinError 10060] [nltk_data]
已解决(nltk下载词库报错)nltk.download('punkt') [nltk_data] Error loading punkt: [WinError 10060] [nltk_data] ...
- nltk离线数据:解决nltk.download()下载错误
无网络环境解决nltk.download()报错 下载nltk_data,打开nltk_data下载packages文件夹. 使用 nltk.data.find(".") 这个命令 ...
- nltk.download(‘punkt‘)报错
问题描述 在跑代码时,用到nltk库,但是出现如下问题: import nltk nltk.download('punkt') For more information see: https://ww ...
最新文章
- C++/C++11中std::set用法汇总
- c++把数组所有元素剔除_C语言基础之数组,第一节,C语言必学知识点剖析
- vscode 调试python 无法连接远程服务器_vscode 远程调试python的方法
- IplImage, CvMat, Mat 的关系和相互转换 再次理解 /(ㄒoㄒ)/~~
- 再会迪杰斯特拉(Dijkstra)
- CCNA考试试验总结
- 【codevs1116】四色问题,深搜入门题目
- #define _INTSIZEOF(n) ((sizeof(n)+sizeof(int)-1)~(sizeof(int) - 1) )
- 兄弟打印机内存已满清零方法_兄弟打印机清零方法大全
- java 罗马数字_罗马数字 | 学步园
- 【转】CT (电子计算机断层扫描)
- openffice安装(windows和linux)
- 开路电压法与电流积分法
- 西瓜书习题 - 8.集成学习
- K8s介绍及离线安装(四)
- Hyperledger Fabric2中文文档-修改通道配置
- python医药数据分析_Python数据分析案例-药品数据分析案例
- R语言之主成分回归与偏最小二乘xt8.3xt8.4
- win10 中使用bat脚本关机,重启 代码
- Git remote: error: this exceeds file size limit of 100.0 MB