分词的第三方模块

介绍用过的 Python 两种分词的模块 jieba 和 snownlp,直接上实例:

1、实例 jieba

from jieba import posseg as pseg# 采用结巴分词进行分词,返回分词和词性
cur_tuple_words = pseg.lcut(words)
for word, flag in cur_tuple_words:print(word)print(flag)

2、实例 snownlp

from snownlp import SnowNLPs = SnowNLP(text)
fenciList = s.tags
for word, flag in fenciList:print(word)print(flag)

在使用过程中,发现两者存在一个很明显的区别——结巴在导入时花费时间比较长,snownlp明显短。用代码来说明,请看下面:

  • import snownlp 大概三四秒
import time
start_time = time.time()
from snownlp import SnowNLP
end_time = time.time()
print(end_time - start_time)

输出 3.98864293098

  • import jieba 在 10秒左右
import time
start_time = time.time()
from jieba import posseg as pseg
end_time = time.time()
print(end_time - start_time)

输出 10.1280369759


业务需求用到,没深究,若有错误欢迎请指出。

友情链接:jieba(结巴)分词种词性简介

Python 分词 第三方模块相关推荐

  1. Python 安装第三方模块

    目录 1. 包管理器 2. 安装第三方模块 3. 常用第三方模块 (1)requests (2)chardet (3)psutil Python 拥有大量的易用的第三方模块,这些模块的调用节省了大量重 ...

  2. python常用第三方模块多少万_python 常用第三方模块

    除了内建的模块外,Python还有大量的第三方模块. 基本上,所有的第三方模块都会在https://pypi.python.org/pypi上注册,只要找到对应的模块名字,即可用pip安装. 本章介绍 ...

  3. python中第三方模块_如何在python脚本中包含第三方模块?

    我已经开始使用Python来自动化我工作中的重复任务,并且经常需要将对第三方模块的引用集成到我的脚本中.如何将这些文件直接包含在脚本中?我知道有一些方法可以在python安装文件夹(C:\Python ...

  4. Python入门--第三方模块的安装与使用,pip,import

    #第三方模块的安装 #第一种方法 #pip install 模块名(win+R,输入cmd,在弹出的黑窗口中输入pip install 模块名) #此时需将pycharm解释器选择自己安装的pytho ...

  5. 为Python安装第三方模块

    转载请注明出处:http://mageedu.blog.51cto.com,谢谢! 一.基本安装 Python Distribution Utilities(Distutils)在Python 2.0 ...

  6. Python 基础 - 第三方模块PyYAML

    目录 1. yaml基本示例 2. yaml组织结构 3. pyyaml的安装 4. 读取 / 写入单个yaml文件 5. 读取 / 写入多yaml文件 yaml官方文档:YAML Ain't Mar ...

  7. python安装第三方模块

    一:通过pip安装第三方模块 运行→cmd→然后输入:pip install 你要安装的第三模块的名字(可指定版本号,否则会默认安装最新版本)→Enter(回车) [注意]是直接在cmd黑屏终端这里输 ...

  8. Python中第三方模块requests解析

    一.简述 Requests HTTP Library 二.模块框架 '''__version___internal_utilsadaptersapiauthcertscompatcookiesexce ...

  9. 递归、os.walk、内置函数、lambda、hashlib模块、md5加密、python安装第三方模块、操作mysql数据库...

    #递归就是函数自己调自己,一般递归都会有在什么情况下结束递归,一业可以有结束条件#递归最多死循环999次,递归不能设定次数# count=0# def abc():# global count# co ...

  10. Python安装第三方模块总结 转载的

    转自 https://www.jellythink.com/archives/541

最新文章

  1. php v9 ajax 翻页,phpcms v9建站 ajax列表分页加载更多word文档教程
  2. stdarg.h(c标准库)
  3. 23种设计模式简介_设计模式简介
  4. linux-文件管理-不完整版
  5. 照片快照清除 android,如何在Android中删除和恢复照片
  6. MySQL为啥不用平衡二叉树_MySQL的索引,为什么是B+而不是平衡二叉树
  7. SpringBoot私人学习笔记
  8. js常用方法之Array对象方法扩展
  9. cartographer环境配置及运行
  10. 东财在线计算机应用基础作业,《计算机应用基础》东财在线20秋第一套作业答案...
  11. 【正点原子FPGA连载】第一章FPGA简介 -摘自【正点原子】新起点之FPGA开发指南_V2.1
  12. 桌面无计算机 win10,win10雨木林风系统桌面无计算机图片的处理办法
  13. 数据特征分析 正态性检验
  14. Failed to fetch URl https://dl-ssl.google.com/android/repository/addo Android SDK更新以及ADT更新出现问题的解决办法
  15. Linux CPU使用率超过100%的原因
  16. SQLite这么娇小可爱,不多了解点都不行啊
  17. MT【305】丹德林双球
  18. JavaScript 保留两位小数的三种实现方法
  19. android广播教程,Android学习笔记(广播机制)
  20. 基于Python实现英文单词学习系统

热门文章

  1. 中国省市县地区代码数据库文件
  2. 车牌识别存储云服务器,云端(服务器)车牌识别技术
  3. Qunee学习开发体会
  4. WINDOWS CMAKE与NMAKE
  5. SVN 创建分支,分支与主干的合并
  6. WPF中使用Aforge控件
  7. Quartus II文件编译下载和USB-Blaster驱动安装
  8. ROS与PCL:在setconditionfunciton时,无法使用std::bind
  9. 计算机缺少GD132.dll,Ubuntu12.04宝塔面板安装nginx报错,缺少GD library环境依赖包
  10. 怎么让composer加速