安装Anaconda
安装NLTK

安装Anaconda

下载Anaconda 中 支持python 3.5(WIN 7)版本(本人桌面系统环境)

  • 地址 : https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D

  • 地址:https://repo.continuum.io/archive/

  • 文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe

修改Anaconda中的Jupyter Notebook默认工作路径

打开Windows的cmd,在cmd中输入jupyter notebook --generate-config
可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件
打开此文件找到
#c.NotebookApp.notebook_dir = ‘’
将其改为
c.NotebookApp.notebook_dir = ‘C:/Users/Administrator/workspace/Jupyter’
其中C:/Users/Administrator/workspace/Jupyter为我的工作空间,你可以改成你自己的,
注意:
1.#c.NotebookApp.notebook_dir = ''中的#必须删除,且前面不能留空格。
2.Jupyter文件夹必须提前新建,如果没有新建,Jupyter Notebook会找不到这个文件,会产生闪退现象。
3.但是当我们通过快捷方式再次打开后,发现还是没有变化,因为还需要在快捷方式的目录里面的
%USERPROFILE%删除

安装ANLTK

打开Anaconda Prompt,输入conda install nltk 安装ANLTK

输入python启动python-shell环境

import nltk
nltk.download()


选择需要下载的内容,修改数据存储路径(c:\nltk_data)

建议:

官网的镜像在境外,所以直接update可能会比较慢或者不能访问。
用中科大的镜像
conda config –add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes

加个小tip:要删除 .condarc文件 。
.condarc以点开头,一般表示 conda 应用程序的配置文件,在用户的根目录
(windows:C:\users\username\,linux:/home/username/)。但对于.condarc配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的。
当用户第一次运行 conda config命令时,将会在用户的家目录创建该文件。

让python pip使用国内镜像
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

note:新版ubuntu要求使用https源,要注意。

临时使用:
可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。

永久修改,一劳永逸:
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)

内容如下:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:\Users\WQP\pip\pip.ini)内容同上。

也就是说,今天开始必须恢复官方源了

使用以下语句可以恢复到默认源。

conda config --remove-key channels
如果还是嫌慢,那么命令行科学上网方式可以使你加快速度。

使用conda 创建虚拟环境报错,

conda config --add channels http://mirrors.aliyun.com/pypi/simple/
conda config --set show_channel_urls yes

删除了 defaul
问题解决

conda update --all

conda install tensorflow-gpu
conda install keras-gpu

恢复清华源
channels:

  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    show_channel_urls: true
    ssl_verify: true

致谢
《Python自然语言处理》1 2 3,作者:【印】雅兰·萨纳卡(Jalaj Thanaki),是实践性很强的一部新作。为进一步深入理解书中内容,对部分内容进行了延伸学习、练习,在此分享,期待对大家有所帮助,欢迎加我微信(验证:NLP),一起学习讨论,不足之处,欢迎指正。

参考文献


  1. https://github.com/jalajthanaki ↩︎

  2. 《Python自然语言处理》,(印)雅兰·萨纳卡(Jalaj Thanaki) 著 张金超 、 刘舒曼 等 译 ,机械工业出版社,2018 ↩︎

  3. Jalaj Thanaki ,Python Natural Language Processing ,2017 ↩︎

《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置相关推荐

  1. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:08 自然语言处理中的机器学习方法

    08 自然语言处理中的机器学习方法 8.1 机器学习的基本概念 8.1.1 ML类型 8.1.2 ML 监督学习 8.1.3 无监督学习 8.1.4 强化学习 8.2 自然语言处理应用的开发步骤 8. ...

  2. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:07 规则式自然语言处理系统

    07 规则式自然语言处理系统 7.1 规则式系统 7.2 规则式系统的目的 7.2.1 为何需要规则式系统 7.2.2 使用规则式系统的应用 7.2.3 练习 7.2.4 开发规则式系统需要的资源 7 ...

  3. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:05 特征工程和NLP算法

    05 特征工程和NLP算法 5.1 理解特征工程 5.1.1 特征工程的定义 5.1.2 特征工程的目的 5.1.3 一些挑战 5.2 NLP中的基础特征 5.2.1 句法解析和句法解析器 5.2.2 ...

  4. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:06 高级特征工程和NLP算法

    06 高级特征工程和NLP算法 6.1 词嵌入 6.2 word2vec基础 6.2.1 分布语义 6.2.2 定义word2vec 6.2.3 无监督分布语义模型中的必需品 6.3 word2vec ...

  5. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:11 如何提高你的NLP技能

    11 如何提高你的NLP技能 11.1 开始新的NLP职业生涯 11.2 备忘列表 11.3 确定你的领域 11.4 通过敏捷的工作来实现成功 11.5 NLP和数据科学方面一些有用的博客 11.6 ...

  6. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:04 预处理

    03 预处理 4.1 处理原始语料库文本 4.1.1 获取原始文本 4.1.2 小写化转换 4.1.3 分句 4.1.4 原始文本词干提取 4.1.5 原始文本词形还原 4.1.6 停用词去除 4.2 ...

  7. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:10 高级工具

    10 高级工具 10.1 使用Apache Hadoop作为存储框架 10.2 使用Apache Spark作为数据处理框架 10.3 使用Apache Flink作为数据实时处理框架 10.4 Py ...

  8. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:12 安装指导

    12 安装指导 12.1 安装Python.pip和NLTK 12.2 安装PyCharm开发环境 12.3 安装依赖库 12.4 框架安装指导 12.5 解决你的疑问 12.6 总结 本附录为您提供 ...

  9. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:03 理解句子的结构

    03 理解句子的结构 3.1 理解NLP的组成 3.1.1 自然语言理解 3.1.2 自然语言生成 3.1.3 NLU和NLG的区别 3.1.4 NLP的分支 3.2 上下文无关文法 3.3 形态分析 ...

  10. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集

    什么是语料库? 为什么我们需要语料库? 理解语料库分析? 数据属性的类型 语料库的不同文件格式 免费语料库的资源 为NLP应用准备数据集 网页爬取 什么是语料库? 在语料库中,大数据集合可以采用以下格 ...

最新文章

  1. Windows系统下安装Thrift的方法
  2. Neighbor-Vote:使用邻近距离投票优化单目3D目标检测(ACM MM2021)
  3. RGBD相机参数输出定义
  4. Hibernate Shards 数据的水平、垂直切割(二)- Hibernate Shards基本演示
  5. offsetTop,offsetHeight,scrollHeight,scrollTop的区别
  6. SAP BOPF和ESF2这两个框架有什么区别
  7. arduino步进电机程序库_Arduino基础入门篇27—步进电机驱动库的使用
  8. 阿里巴巴前架构师 360 度无死角剖析微服务
  9. python处理文件效率对比awk
  10. labview 判断整数_labview教程——如何判断字符串包含的是数字
  11. 远程计算机超出最大连接数,远程桌面超出了最大连接数怎么办呢?
  12. 基于HuTool工具实现Excel复杂表头生成、单元格合并绘制对角线(计算N叉树的最大深度和最大宽度)
  13. 【Power BI】插入文本框且值为度量值替代方案:创建度量值时自定义文本
  14. aes key iv从mysql_OpenSSL AES 算法中 Key 和 IV 是如何生成的?
  15. 正则表达式:提取数字和小数点
  16. 【VBA研究】调用API实现汉字简繁互换
  17. python 实现接口上传图片
  18. linux网站杀毒软件,linux下的杀毒软件----ClamAV
  19. JAVA生成高强度密码(包含随机数字+随机英文大小写)
  20. UniswapV2Library.sol

热门文章

  1. 驱动编程,点亮LED小灯
  2. 计算机实战项目、毕业设计、课程设计之 [含论文+辩论PPT+源码等]微信小程序家庭理财系统+后台管理|前后分离VUE[包运行成功
  3. 种子填充算法----计算机图形学
  4. 东北石油大学计算机科学与技术排名,东北石油大学的王牌专业怎么样?实力一流...
  5. Linux教程——常见Linux发行版本有哪些?
  6. 键盘监听器————在飞机大战中的利用(移动,加速,发射子弹,一应俱全)
  7. 白领是如何恢复硬盘数据的呢
  8. 计算机房怎么读英语单词,教学机房,teaching computer lab,音标,读音,翻译,英文例句,英语词典...
  9. python文字游戏循环3次_如何停止迭代for循环以便玩家可以在Python迷宫游戏中移动?...
  10. 手机服务器共享信息,手机云共享服务器设置