步骤一:卸载已经安装的python

步骤二:安装python科学计算工具,里面自动安装了很多库,像numpy,matplotlib,nltk等等,并且会自动安装python,安装完成后,不需要配置环境。下载地址https://www.continuum.io/downloads

我安装的版本是https://repo.continuum.io/archive/Anaconda2-4.2.0-Windows-x86.exe

步骤三:安装pymysql,因为这个工具不包含连接mysql的库。http://www.cnblogs.com/lovely7/p/5828419.html 见之前写的安装。

数据库使用示范:

importpymysqlconn=pymysql.connect(

host='localhost',

port= 3306,

user='root',

passwd='',

db='ad',

)#conn = MySQLdb.connect(user='root', password='', use_unicode=True)

cursor =conn.cursor()

sql= "SELECT title,abstract,pmb_id,time,url FROM `article`"a=cursor.execute(sql)printa

b= cursor.fetchmany(a) #b has 7887 abstract list

titleandabstractList=[]

pmbIDdict={}

yearlist=[]

url_dict={}for j inrange(a):

titleandabstractList.append(b[j][0]+b[j][1])

pmbIDdict[j]= b[j][2]

yearlist.append(b[j][3].year)

url_dict[j]= b[j][4]

分词使用示范:使用MWETokenizer可以对词组做分词处理。

from nltk.tokenize importMWETokenizer

tokenizer= MWETokenizer([('a', 'little'), ('a', 'little', 'bit'), ('a', 'lot')])

tokenizer.add_mwe(('in', 'spite', 'of'))

print tokenizer.tokenize('a little Testing testing a lot one two in spite of'.split())

未成功的方法

Install Python: http://www.python.org/download/releases/2.7.3/

安装Numpy (optional): http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

安装Setuptools: http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe

安装 Pip: Start>Run... c:\Python27\Scripts\easy_install pip

安装PyYAML and NLTK: Start>Run... c:\Python27\Scripts\pip install pyyaml nltk

我的电脑之前装过numpy,setuptools,和pip,只需要在python2.7的scripts目录下运行

pip install pyyaml nltk即可。

http://blog.sina.com.cn/s/blog_8af1069601019xmo.html

http://blog.csdn.net/joey_su/article/details/17287559

http://blog.csdn.net/alihonglong/article/details/52668801

http://www.ibm.com/developerworks/cn/opensource/os-pythonnltk/index.html

一 :以上都是理论可行的方法,但是最近实验室网不行,下载总是timeout。最后使用手机4g连接https://pypi.python.org/simple/nltk/

下载了nltk-3.0.5.win32.exe 终于成功下载安装。

import nltk没有问题

二:https://pypi.python.org/simple/pyyaml/下载安装了 PyYAML-3.10.win32-py2.7.exe

三:下载nltk数据源 。nltk_data是必要的nltk数据包,实现分词,词性标注,命名实体识别等功能都要用到这个数据包

import nltk

nltk.download()

出现

但是下载速度会比较慢

或者到http://www.nltk.org/nltk_data/ 手动下载

但是实验室的网速下了一夜也没下载成功,参考

http://blog.csdn.net/cxq2046/article/details/50972715

下载会很慢或干脆卡住。此时需要手动下载nltk_data包。

下载方法:到https://github.com/nltk/nltk_data下载gh-pages分支,里面的Packages就是我们要的资源里面有部分是压缩包,需要解压

将Packages文件夹改名为nltk_data,放在以下任一路径:

分词 http://wenku.baidu.com/link?url=xJtphneI5792wB7hsIRjB6L8TTT-bCjCEjCzs8Jm_NfzsHRPImge68J3SaiBzrYT5BvFFLn_Vd8J9Z0j5EQyhVgOAKqUazdZE-uSfzhhZL3

python自然语言处理工具nltk安装_安装自然语言处理工具Nltk以及初次使用相关推荐

  1. python安装环境安装_安装Python运行环境

    可以直接在python的官网下载相应操作系统平台的python安装包:https://www.python.org/downloads 点击下载后出现的安装界面,建议选中界面下方的Add Python ...

  2. python程序下载及安装_安装下载python的安装和配置

    查了好多资料,发现还是不全,干脆自己整理吧,至少保证在我的做法正确的,以免误导读者,也是给自己做个记录吧! 1.安装python pythson2.4下载址地:http://www.python.or ...

  3. python第三方包是什么意思_安装Python和第三方包的方法

    应女朋友的邀请,写一篇关于Python和第三方包的安装方法. 一.Python安装 上官网Welcome to Python.org​www.python.org 下载保存 二.Pycharm安装 上 ...

  4. python wand安装_安装PythonMagick和pythonmagickwand 步骤

    在centos6.0上测试安装,安装前准备工作: ########################################################################### ...

  5. pip 离线安装_安装不上python的模块怎么办?别怕,我这有妙招!

    之前我们介绍过如何在Python中安装第三方的包: Python以第三方包丰富而著称,你想要的功能几乎都可以通过pip命令安装,避免什么都要自己重新造轮子尬尴. 但是pip安装有两个常见问题,第一是下 ...

  6. java fx eclice安装_安装e(fx)clipse到Eclipse (JavaFX工具)

    本篇文章帮大家学习安装e(fx)clipse到Eclipse (javaFX工具),包含了安装e(fx)clipse到Eclipse (JavaFX工具)使用方法.操作技巧.实例演示和注意事项,有一定 ...

  7. pip 安装_安装 pip 轻松管理 PyPI 软件包 | Linux 中国

    在 Linux.Mac 或 Windows 上为旧版 Python 安装 pip.-- Vijay Singh Khatri Python 是一种功能强大.流行广泛的编程语言,在常规编程.数据科学等很 ...

  8. scrapy 安装_安装scrapy时出错

    Python3环境下安装scrapy 环境:win7,win10 Python 3.5.2 1.首先打开Anaconda Prompt 执行命令: pip install scrapy 若未出错,表示 ...

  9. cmd测试cuda安装_安装:anaconda+cuda+pytorch+pycharm

    每次安装都要在网上各种搜索,为了下次安装的时候简单一点,把对我安装帮助较大的链接整理了一下,整个过程仅供参考: 除了pycharm,其他位置均不建议更改默认位置,建议全程可开着cmd 1.anacon ...

最新文章

  1. ZeroC ICE java异步实现方式(ami/amd)
  2. java web 性能分析_web系统性能分析JavaMelody
  3. “男儿有泪不轻弹”和“活着”
  4. [YTU]_2384( 矩形类中运算符重载【C++】)
  5. verilog一些小知识点注意事项集合
  6. 在Global Object Services (GOS) 中加入自定义项目
  7. boost::container_hash模块实现哈希信息
  8. nginx alias
  9. 还在犹豫吗?现在参与 OCM 社区正是时候
  10. BTrace使用小结
  11. 2019-03-14-算法-进化(两个数组的交集 II)
  12. 【大牛系列教学】靠着这份面试题跟答案
  13. python接口自动化(七)--状态码详解对照表(详解)
  14. cant connect local mysql to_连接Mysql提示Can't connect to local MySQL server through socket的解决方法...
  15. “scikit-learn(sklearn) 官方文档中文版”
  16. linux下opendir的使用
  17. 网上找的视频素材有水印怎么办?教你一键打码
  18. 用matlab绘制挠度图,如何绘制载荷挠度曲线图
  19. attempted an unsupported operation 、an unsupported operation was attempted [尝试不支持的操作]错误的三种解决方案
  20. 谷歌浏览器如何重置?谷歌浏览器恢复默认设置?

热门文章

  1. 三相桥式可控整流器分析与研究
  2. 朱广权和李佳琦直播间为国货代言;博实乐收购翰林学院51%股权 | 美通企业日报...
  3. [转载]程序员的电脑文件管理技巧
  4. 智慧工厂工业4.0解决方案
  5. 未来计算机的发展趋势趋向于,计算机科学与技术的发展趋势
  6. 视频带宽计算公式(码流_分辨率_帧率)
  7. aviator表达式教程
  8. 腾讯微博java版下载_腾讯微博——你的心声,世界的回声
  9. gdb调试分析多线程死锁
  10. 【八大排序(一)】排序还只会用冒泡?进来给我学!