今天继续给大家介绍Python相关知识,本文主要内容是Python jieba库简介和使用。

一、jieba库概述

jieba库是Python的一个第三方库,该库常用于中文分词。所谓分词,就是给定一段中文文本,然后将这一段中文文本分成单个的词语。jieba库使用简单,分词效率和准确性较好。jieba基于中文词库进行分词,也可以使用HMM(隐马尔可夫模型)对新词进行处理。

二、jieba库安装

由于jieba是Python的第三方库,因此我们需要额外安装jieba库后才可以使用,执行命令:

pip isntall jieba

即可完成jieba库的安装。

三、jieba库分词的三种模式

jieba库的分词支持三种模式,即精确模式全模式以及搜索引擎模式。这三种模式功能和效果如下所示:
1、精确模式
精确模式可以把文本精确的且分开,并且不存在冗余单词。
2、全模式
全模式可以返回文本中所有可能的词语,但是会存在冗余单词。
3、搜索引擎模式
搜索引擎模式可以在精确模式的基础上,对长单词继续进行切分。

四、jieba库常用函数和示例

jieba库的三种匹配模式函数如下表所示:

jieba库函数 函数作用
jieba.lcut(str) 该函数表示对中文字符串str进行精确模式分词
jieba.lcut(str,cut_all=True) 该函数表示对中文字符串str进行全模式分词
jieba.lcut_for_search(str) 该函数表示对中文字符串str进行搜索引擎模式分词

上述jieba库三种函数和匹配示例如下所示:

原创不易,转载请说明出处:https://blog.csdn.net/weixin_40228200

Python jieba库简介和使用相关推荐

  1. Python jieba库的介绍与使用

    Python jieba库的介绍与使用 一. jieba库简介与安装 简介:jieba库是一个进行中文分词的第三方库.可用来进行关键字搜索. 安装:在python3环境下输入:pip install ...

  2. Python初学13——jieba库简介与使用

    目录 一.jieba库基本介绍 二.jieba库的使用说明(三种模式.lcut().lcut_for_search().add_word() ) 三."文本词频统计"实例 一.ji ...

  3. python jieba库下载_Python中jieba库安装步骤及失败原因解析

    Python 中 jieba 库安装步骤及失败原因解析 作为计算机小白, Python 的流行也让我蠢蠢欲动, 在请教计算机 专业同学后,开始上网课自学 Python 基础知识.今天老师简单的一 句话 ...

  4. python jieba库分词_Python基于jieba库进行简单分词及词云功能实现方法

    本文实例讲述了Python基于jieba库进行简单分词及词云功能实现方法.分享给大家供大家参考,具体如下: 目标: 1.导入一个文本文件 2.使用jieba对文本进行分词 3.使用wordcloud包 ...

  5. Python标准库简介

    很系统的简介了Python标准库的使用方向,对形成知识框架很有帮助. 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python ...

  6. python 常用库简介

    1 Scipy Scipy 是一个用于数学.科学.工程领域的常用软件包,可以处理插值.积分.优化.图像处理.常微分方程数值解的求解.信号处理等问题.它用于有效计算 Numpy 矩阵,使 Numpy 和 ...

  7. python jieba库_python中jieba库的介绍和应用

    jieba库作为python中的第三方库,在平时是非常实用的,例如一些网站就是利用jieba库的中文分词搜索关键词进行工作. 一.安装环境 window + python 二.安装方式 在电脑命令符( ...

  8. python jieba库不存在_Python入门:jieba库的使用

    jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式.全模式和搜索引擎模式,下面是三种模式的特点. 精确模式:试图将语句最精确的切分,不存在冗余数据,适合做 ...

  9. PYTHON常用库简介

    Python科学计算基础库:Numpy,Pandas,Scipy,Matplotlib 1.NumPy 支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,线性代数,傅里叶变换和随机 ...

最新文章

  1. 实战并发编程 - 01多线程读写同一共享变量的线程安全问题深入剖析
  2. 【学术相关】U.S.News正式发布最新的2022最佳全球院校排名
  3. 龙芯团队完成CoreCLR MIPS64移植,在github开源
  4. emoji表情引发的JNI崩溃
  5. Datawhale-零基础入门NLP-新闻文本分类Task02
  6. Scrapy-redis 源码分析 及 框架使用
  7. html button跳转页面_HTML跳转到页面指定位置的几种方法
  8. AI 时代,中国技术创新如何弯道超车?
  9. OpenGL基础35:帧缓冲(下)之简单图像处理
  10. centos7安装redis并设置开机启动
  11. 网络基础笔记(三)二层交换机工作原理、单点故障与链路聚合、DHCP
  12. python面向对象OOP编程(三)-- 同类 不同实例 之间的关联关系
  13. Vmware15 + Ubuntu18.0.4 安装教程(史上最详细记录)【多图预警】
  14. URL 重写模块导致 IIS7 应用程序池自动关闭
  15. HTML界面多语言切换
  16. centos7几种版本x86_64、aarch64、armhfp、i386、power9、ppc64、ppc64el简单说明
  17. LinkCloud谈云主机与主机托管主机租用的区别
  18. C 语言之二维数组(详细版)
  19. linux系统如何安装到u盘,linux系统安装图解教程及卸载修复
  20. 直播预告|生成对抗网络专题复现课今晚开课!

热门文章

  1. AltiumDesigner如何绘制PCB封装
  2. android 酷炫启动页,RxJava实践之打造酷炫启动页
  3. matlab设置线条颜色宽度线型
  4. 洛谷——P1238 走迷宫
  5. Python编程基础之Python语言的基础知识(上)
  6. Java爬虫获取豆瓣的短评数据
  7. 计算机毕业设计Java教育培训机构信息管理系统(源码+系统+mysql数据库+lW文档)
  8. easyRtc设置视频清晰度的方法
  9. Qiime2最全安装教程--包教包会,可私信远程免费帮装
  10. C++常见的三种中文内码转换代码