《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置
安装Anaconda
安装NLTK
安装Anaconda
下载Anaconda 中 支持python 3.5(WIN 7)版本(本人桌面系统环境)
地址 : https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D
地址:https://repo.continuum.io/archive/
文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe
修改Anaconda中的Jupyter Notebook默认工作路径
打开Windows的cmd,在cmd中输入jupyter notebook --generate-config
可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件
打开此文件找到
#c.NotebookApp.notebook_dir = ‘’
将其改为
c.NotebookApp.notebook_dir = ‘C:/Users/Administrator/workspace/Jupyter’
其中C:/Users/Administrator/workspace/Jupyter为我的工作空间,你可以改成你自己的,
注意:
1.#c.NotebookApp.notebook_dir = ''中的#必须删除,且前面不能留空格。
2.Jupyter文件夹必须提前新建,如果没有新建,Jupyter Notebook会找不到这个文件,会产生闪退现象。
3.但是当我们通过快捷方式再次打开后,发现还是没有变化,因为还需要在快捷方式的目录里面的
%USERPROFILE%
删除
安装ANLTK
打开Anaconda Prompt,输入conda install nltk 安装ANLTK
输入python启动python-shell环境
import nltk
nltk.download()
选择需要下载的内容,修改数据存储路径(c:\nltk_data)
建议:
官网的镜像在境外,所以直接update可能会比较慢或者不能访问。
用中科大的镜像
conda config –add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes
加个小tip:要删除 .condarc文件 。
.condarc以点开头,一般表示 conda 应用程序的配置文件,在用户的根目录
(windows:C:\users\username\,linux:/home/username/)。但对于.condarc配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的。
当用户第一次运行 conda config命令时,将会在用户的家目录创建该文件。
让python pip使用国内镜像
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
note:新版ubuntu要求使用https源,要注意。
临时使用:
可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。
永久修改,一劳永逸:
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)
内容如下:
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:\Users\WQP\pip\pip.ini)内容同上。
也就是说,今天开始必须恢复官方源了
使用以下语句可以恢复到默认源。
conda config --remove-key channels
如果还是嫌慢,那么命令行科学上网方式可以使你加快速度。
使用conda 创建虚拟环境报错,
conda config --add channels http://mirrors.aliyun.com/pypi/simple/
conda config --set show_channel_urls yes
删除了 defaul
问题解决
conda update --all
conda install tensorflow-gpu
conda install keras-gpu
恢复清华源
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
show_channel_urls: true
ssl_verify: true
致谢
《Python自然语言处理》1 2 3,作者:【印】雅兰·萨纳卡(Jalaj Thanaki),是实践性很强的一部新作。为进一步深入理解书中内容,对部分内容进行了延伸学习、练习,在此分享,期待对大家有所帮助,欢迎加我微信(验证:NLP),一起学习讨论,不足之处,欢迎指正。
参考文献
https://github.com/jalajthanaki ↩︎
《Python自然语言处理》,(印)雅兰·萨纳卡(Jalaj Thanaki) 著 张金超 、 刘舒曼 等 译 ,机械工业出版社,2018 ↩︎
Jalaj Thanaki ,Python Natural Language Processing ,2017 ↩︎
《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置相关推荐
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:08 自然语言处理中的机器学习方法
08 自然语言处理中的机器学习方法 8.1 机器学习的基本概念 8.1.1 ML类型 8.1.2 ML 监督学习 8.1.3 无监督学习 8.1.4 强化学习 8.2 自然语言处理应用的开发步骤 8. ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:07 规则式自然语言处理系统
07 规则式自然语言处理系统 7.1 规则式系统 7.2 规则式系统的目的 7.2.1 为何需要规则式系统 7.2.2 使用规则式系统的应用 7.2.3 练习 7.2.4 开发规则式系统需要的资源 7 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:05 特征工程和NLP算法
05 特征工程和NLP算法 5.1 理解特征工程 5.1.1 特征工程的定义 5.1.2 特征工程的目的 5.1.3 一些挑战 5.2 NLP中的基础特征 5.2.1 句法解析和句法解析器 5.2.2 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:06 高级特征工程和NLP算法
06 高级特征工程和NLP算法 6.1 词嵌入 6.2 word2vec基础 6.2.1 分布语义 6.2.2 定义word2vec 6.2.3 无监督分布语义模型中的必需品 6.3 word2vec ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:11 如何提高你的NLP技能
11 如何提高你的NLP技能 11.1 开始新的NLP职业生涯 11.2 备忘列表 11.3 确定你的领域 11.4 通过敏捷的工作来实现成功 11.5 NLP和数据科学方面一些有用的博客 11.6 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:04 预处理
03 预处理 4.1 处理原始语料库文本 4.1.1 获取原始文本 4.1.2 小写化转换 4.1.3 分句 4.1.4 原始文本词干提取 4.1.5 原始文本词形还原 4.1.6 停用词去除 4.2 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:10 高级工具
10 高级工具 10.1 使用Apache Hadoop作为存储框架 10.2 使用Apache Spark作为数据处理框架 10.3 使用Apache Flink作为数据实时处理框架 10.4 Py ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:12 安装指导
12 安装指导 12.1 安装Python.pip和NLTK 12.2 安装PyCharm开发环境 12.3 安装依赖库 12.4 框架安装指导 12.5 解决你的疑问 12.6 总结 本附录为您提供 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:03 理解句子的结构
03 理解句子的结构 3.1 理解NLP的组成 3.1.1 自然语言理解 3.1.2 自然语言生成 3.1.3 NLU和NLG的区别 3.1.4 NLP的分支 3.2 上下文无关文法 3.3 形态分析 ...
- 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集
什么是语料库? 为什么我们需要语料库? 理解语料库分析? 数据属性的类型 语料库的不同文件格式 免费语料库的资源 为NLP应用准备数据集 网页爬取 什么是语料库? 在语料库中,大数据集合可以采用以下格 ...
最新文章
- Windows系统下安装Thrift的方法
- Neighbor-Vote:使用邻近距离投票优化单目3D目标检测(ACM MM2021)
- RGBD相机参数输出定义
- Hibernate Shards 数据的水平、垂直切割(二)- Hibernate Shards基本演示
- offsetTop,offsetHeight,scrollHeight,scrollTop的区别
- SAP BOPF和ESF2这两个框架有什么区别
- arduino步进电机程序库_Arduino基础入门篇27—步进电机驱动库的使用
- 阿里巴巴前架构师 360 度无死角剖析微服务
- python处理文件效率对比awk
- labview 判断整数_labview教程——如何判断字符串包含的是数字
- 远程计算机超出最大连接数,远程桌面超出了最大连接数怎么办呢?
- 基于HuTool工具实现Excel复杂表头生成、单元格合并绘制对角线(计算N叉树的最大深度和最大宽度)
- 【Power BI】插入文本框且值为度量值替代方案:创建度量值时自定义文本
- aes key iv从mysql_OpenSSL AES 算法中 Key 和 IV 是如何生成的?
- 正则表达式:提取数字和小数点
- 【VBA研究】调用API实现汉字简繁互换
- python 实现接口上传图片
- linux网站杀毒软件,linux下的杀毒软件----ClamAV
- JAVA生成高强度密码(包含随机数字+随机英文大小写)
- UniswapV2Library.sol
热门文章
- 驱动编程,点亮LED小灯
- 计算机实战项目、毕业设计、课程设计之 [含论文+辩论PPT+源码等]微信小程序家庭理财系统+后台管理|前后分离VUE[包运行成功
- 种子填充算法----计算机图形学
- 东北石油大学计算机科学与技术排名,东北石油大学的王牌专业怎么样?实力一流...
- Linux教程——常见Linux发行版本有哪些?
- 键盘监听器————在飞机大战中的利用(移动,加速,发射子弹,一应俱全)
- 白领是如何恢复硬盘数据的呢
- 计算机房怎么读英语单词,教学机房,teaching computer lab,音标,读音,翻译,英文例句,英语词典...
- python文字游戏循环3次_如何停止迭代for循环以便玩家可以在Python迷宫游戏中移动?...
- 手机服务器共享信息,手机云共享服务器设置