Python 分词 第三方模块
分词的第三方模块
介绍用过的 Python 两种分词的模块 jieba 和 snownlp,直接上实例:
1、实例 jieba
from jieba import posseg as pseg# 采用结巴分词进行分词,返回分词和词性
cur_tuple_words = pseg.lcut(words)
for word, flag in cur_tuple_words:print(word)print(flag)
2、实例 snownlp
from snownlp import SnowNLPs = SnowNLP(text)
fenciList = s.tags
for word, flag in fenciList:print(word)print(flag)
在使用过程中,发现两者存在一个很明显的区别——结巴在导入时花费时间比较长,snownlp明显短。用代码来说明,请看下面:
- import snownlp 大概三四秒
import time
start_time = time.time()
from snownlp import SnowNLP
end_time = time.time()
print(end_time - start_time)
输出 3.98864293098
- import jieba 在 10秒左右
import time
start_time = time.time()
from jieba import posseg as pseg
end_time = time.time()
print(end_time - start_time)
输出 10.1280369759
业务需求用到,没深究,若有错误欢迎请指出。
友情链接:jieba(结巴)分词种词性简介
Python 分词 第三方模块相关推荐
- Python 安装第三方模块
目录 1. 包管理器 2. 安装第三方模块 3. 常用第三方模块 (1)requests (2)chardet (3)psutil Python 拥有大量的易用的第三方模块,这些模块的调用节省了大量重 ...
- python常用第三方模块多少万_python 常用第三方模块
除了内建的模块外,Python还有大量的第三方模块. 基本上,所有的第三方模块都会在https://pypi.python.org/pypi上注册,只要找到对应的模块名字,即可用pip安装. 本章介绍 ...
- python中第三方模块_如何在python脚本中包含第三方模块?
我已经开始使用Python来自动化我工作中的重复任务,并且经常需要将对第三方模块的引用集成到我的脚本中.如何将这些文件直接包含在脚本中?我知道有一些方法可以在python安装文件夹(C:\Python ...
- Python入门--第三方模块的安装与使用,pip,import
#第三方模块的安装 #第一种方法 #pip install 模块名(win+R,输入cmd,在弹出的黑窗口中输入pip install 模块名) #此时需将pycharm解释器选择自己安装的pytho ...
- 为Python安装第三方模块
转载请注明出处:http://mageedu.blog.51cto.com,谢谢! 一.基本安装 Python Distribution Utilities(Distutils)在Python 2.0 ...
- Python 基础 - 第三方模块PyYAML
目录 1. yaml基本示例 2. yaml组织结构 3. pyyaml的安装 4. 读取 / 写入单个yaml文件 5. 读取 / 写入多yaml文件 yaml官方文档:YAML Ain't Mar ...
- python安装第三方模块
一:通过pip安装第三方模块 运行→cmd→然后输入:pip install 你要安装的第三模块的名字(可指定版本号,否则会默认安装最新版本)→Enter(回车) [注意]是直接在cmd黑屏终端这里输 ...
- Python中第三方模块requests解析
一.简述 Requests HTTP Library 二.模块框架 '''__version___internal_utilsadaptersapiauthcertscompatcookiesexce ...
- 递归、os.walk、内置函数、lambda、hashlib模块、md5加密、python安装第三方模块、操作mysql数据库...
#递归就是函数自己调自己,一般递归都会有在什么情况下结束递归,一业可以有结束条件#递归最多死循环999次,递归不能设定次数# count=0# def abc():# global count# co ...
- Python安装第三方模块总结 转载的
转自 https://www.jellythink.com/archives/541
最新文章
- php v9 ajax 翻页,phpcms v9建站 ajax列表分页加载更多word文档教程
- stdarg.h(c标准库)
- 23种设计模式简介_设计模式简介
- linux-文件管理-不完整版
- 照片快照清除 android,如何在Android中删除和恢复照片
- MySQL为啥不用平衡二叉树_MySQL的索引,为什么是B+而不是平衡二叉树
- SpringBoot私人学习笔记
- js常用方法之Array对象方法扩展
- cartographer环境配置及运行
- 东财在线计算机应用基础作业,《计算机应用基础》东财在线20秋第一套作业答案...
- 【正点原子FPGA连载】第一章FPGA简介 -摘自【正点原子】新起点之FPGA开发指南_V2.1
- 桌面无计算机 win10,win10雨木林风系统桌面无计算机图片的处理办法
- 数据特征分析 正态性检验
- Failed to fetch URl https://dl-ssl.google.com/android/repository/addo Android SDK更新以及ADT更新出现问题的解决办法
- Linux CPU使用率超过100%的原因
- SQLite这么娇小可爱,不多了解点都不行啊
- MT【305】丹德林双球
- JavaScript 保留两位小数的三种实现方法
- android广播教程,Android学习笔记(广播机制)
- 基于Python实现英文单词学习系统