jieba库

  • jieba库的安装
  • jieba库的基本介绍
  • jieba库的使用

jieba库的安装

(cmd命令行)

pip install jieba

也可以安装国内镜像:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

jieba库的基本介绍

(1)jieba库概述

jieba库是优秀的中文分词第三方库。

中文文本需要通过分词获得单个的词语;
jieba是优秀的中文分词第三方库,需要额外安装;
jieba库提供三种分词模式,最简单只需掌握一个函数;

(2)jieba库分词原理

Jieba分词依靠中文词库

利用一个中文词库,确定汉字之间的关联概率
汉字间概率大的组成词组,形成分词结果
除了分词,用户还可以添加自定义的词组

jieba库的使用

jieba分词的三种模式
  精确模式:把文本精确的切分开,不存在冗余单词
  全模式:把文本中所有可能的词语都扫描出来,有冗余
  搜索引擎模式:在精确模式基础上,对长词再次切分

jieba库函数的使用

函数 描述
jieba.lcut(s) 精确模式,返回一个列表类型的分词结果
>>>jieba.lcut(“中国是一个伟大的国家”)
[‘中国’,‘是’,‘一个’,’伟大‘,’的‘,’国家‘]
jieba.lcut(s,cut_all=True) 全模式,返回一个列表类型的分词结果,存在冗余。
>>>jieba.lcut(“中国是一个伟大的国家”)
[‘中国’,‘国是’,‘一个’,’伟大‘,’的‘,’国家‘]
jieba.lcut_for_search(s) 搜索引擎模式,返回一个列表类型的分词结果,存在冗余。
>>>jieba.lcut_for_search(“中华人民共和国是伟大的”)
[‘中华’,‘华人’,’人民‘,’共和‘,’共和国‘,’中华人民共和国‘,’是‘,’伟大‘,’的‘]
jieba.add_word(w) 向分词词典增加新词w
>>>jieba.add_word(“蟒蛇语言”)

jieba库的安装与使用相关推荐

  1. Python中jieba库的安装方法

    方法一:使用pycharm里的检索项(此方法适用于需要使用pycharm的小伙伴) 1.打开pycharm,在File下打开Settings. 2.在Project Interpret菜单栏下,点击& ...

  2. jieba库的安装与使用方法

    文章目录 jieba库概述 jieba库的安装 jieba分词的原理 jieba分词的三种形式 jieba库常用函数 实例1:Hamlet词频统计 code 实例2:<三国演义>人物出场统 ...

  3. jieba库的安装和应用

    目录         一.jieba库         二. jieba库的安装          三.jieba三种模式的使用         四.jieba 分词简单应用         五.扩展 ...

  4. python中jieba库的安装

    jieba库的作用主要用于中文分词,是一种不错的中文分词组件. python中的库可以理解为有三种:python自带的,自己定义的,第三方库(别人写好的,如jieba库,要从网上下载,进行安装) 常用 ...

  5. python3.8如何安装jieba库_安装jieba、wordcloud等第三方库

    任务:安装第三方库 C:\Users\l>pip install wheel Collecting wheel Downloading https://files.pythonhosted.or ...

  6. Python jieba库的安装

    1.自动安装(速度较慢容易报错,不推荐) 在CMD控制面板中使用pip语言进行安装 pip install jieba 2.半自动安装 2.1.在官网下载压缩包 https://pypi.org/pr ...

  7. python jieba库下载_Python中jieba库安装步骤及失败原因解析

    Python 中 jieba 库安装步骤及失败原因解析 作为计算机小白, Python 的流行也让我蠢蠢欲动, 在请教计算机 专业同学后,开始上网课自学 Python 基础知识.今天老师简单的一 句话 ...

  8. python怎么安装jieba库这个模块 No module named ‘jieba‘ python3.7

    报错提示:No module named 'jieba' 首先点击桌面左下角的开始图标,然后选择运行--cmd(也可以win+R唤出运行菜单) 1. anaconda安装库 可以使用conda ins ...

  9. python文件读写用到的库_python 读写txt文件并用jieba库进行中文分词

    python用来批量处理一些数据的第一步吧. 对于我这样的的萌新.这是第一步. #encoding=utf-8 file='test.txt'fn=open(file,"r")pr ...

最新文章

  1. 因子和,因子数,1到n的因子和,1到n的因子数(积性函数)
  2. 弗林的计算机体系结构分类
  3. [Leedcode][JAVA][第820题][字典树][Set]
  4. [转载]聊一聊人员培养
  5. linux下./xx做了什么?
  6. rsync+inotify实现实时同步案例详解
  7. 华为支持nfc功能的手机有哪些_四款带NFC功能的千元机,三星华为低至1399元!...
  8. Flash知识点总结
  9. 盈建科中地震波_[GMS][地震波][选波]YJK地震波反应谱分析与地震波选取
  10. 盛世zeepower远程距离隔空无线充投放商用 低频磁共振无线充电技术——充电有效距离 20-45mm
  11. 14款免费的GIF制作软件(转载)
  12. 计算机无法识别苹果6手机,电脑无法识别iphone6怎么处理
  13. Spring Boot之Spring-Data-JPA
  14. Java - JavaFx之fxml文件的编写及基本使用方式
  15. python对PDF分割、合并、裁剪等
  16. java怎么计算相隔多少天_java计算两个日期之间相差天数和相隔天数详解
  17. js 关键字搜索功能
  18. 【使用VS2022写c语言】第一次使用VS2022写c语言代码可能会遇到的问题及解决方法。
  19. NR LDPC 04 -definition, Tanner and Protograph Constructions
  20. Few-Shot 学习

热门文章

  1. 时序数据库基本概念学习
  2. Access数据库的加密与解密
  3. 导出开发板根文件系统rootfs
  4. 手机设备端口9006刷回9008救砖步骤
  5. 迁移mysql数据库报错_数据库迁移失败报错
  6. jQuery-入口函数
  7. 如何在Python中安装NumPy
  8. 啊哈添柴挑战Java1581. 填数游戏(入门版)
  9. pythonista_Pythonista的假期愿望清单
  10. Oracle索引和创建函数