jieba库的安装与使用
jieba库
- jieba库的安装
- jieba库的基本介绍
- jieba库的使用
jieba库的安装
(cmd命令行)
pip install jieba
也可以安装国内镜像:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba
jieba库的基本介绍
(1)jieba库概述
jieba库是优秀的中文分词第三方库。
中文文本需要通过分词获得单个的词语;
jieba是优秀的中文分词第三方库,需要额外安装;
jieba库提供三种分词模式,最简单只需掌握一个函数;
(2)jieba库分词原理
Jieba分词依靠中文词库
利用一个中文词库,确定汉字之间的关联概率
汉字间概率大的组成词组,形成分词结果
除了分词,用户还可以添加自定义的词组
jieba库的使用
jieba分词的三种模式
精确模式:把文本精确的切分开,不存在冗余单词
全模式:把文本中所有可能的词语都扫描出来,有冗余
搜索引擎模式:在精确模式基础上,对长词再次切分
jieba库函数的使用
函数 | 描述 |
---|---|
jieba.lcut(s) |
精确模式,返回一个列表类型的分词结果 >>>jieba.lcut(“中国是一个伟大的国家”) [‘中国’,‘是’,‘一个’,’伟大‘,’的‘,’国家‘] |
jieba.lcut(s,cut_all=True) |
全模式,返回一个列表类型的分词结果,存在冗余。 >>>jieba.lcut(“中国是一个伟大的国家”) [‘中国’,‘国是’,‘一个’,’伟大‘,’的‘,’国家‘] |
jieba.lcut_for_search(s) |
搜索引擎模式,返回一个列表类型的分词结果,存在冗余。 >>>jieba.lcut_for_search(“中华人民共和国是伟大的”) [‘中华’,‘华人’,’人民‘,’共和‘,’共和国‘,’中华人民共和国‘,’是‘,’伟大‘,’的‘] |
jieba.add_word(w) |
向分词词典增加新词w >>>jieba.add_word(“蟒蛇语言”) |
jieba库的安装与使用相关推荐
- Python中jieba库的安装方法
方法一:使用pycharm里的检索项(此方法适用于需要使用pycharm的小伙伴) 1.打开pycharm,在File下打开Settings. 2.在Project Interpret菜单栏下,点击& ...
- jieba库的安装与使用方法
文章目录 jieba库概述 jieba库的安装 jieba分词的原理 jieba分词的三种形式 jieba库常用函数 实例1:Hamlet词频统计 code 实例2:<三国演义>人物出场统 ...
- jieba库的安装和应用
目录 一.jieba库 二. jieba库的安装 三.jieba三种模式的使用 四.jieba 分词简单应用 五.扩展 ...
- python中jieba库的安装
jieba库的作用主要用于中文分词,是一种不错的中文分词组件. python中的库可以理解为有三种:python自带的,自己定义的,第三方库(别人写好的,如jieba库,要从网上下载,进行安装) 常用 ...
- python3.8如何安装jieba库_安装jieba、wordcloud等第三方库
任务:安装第三方库 C:\Users\l>pip install wheel Collecting wheel Downloading https://files.pythonhosted.or ...
- Python jieba库的安装
1.自动安装(速度较慢容易报错,不推荐) 在CMD控制面板中使用pip语言进行安装 pip install jieba 2.半自动安装 2.1.在官网下载压缩包 https://pypi.org/pr ...
- python jieba库下载_Python中jieba库安装步骤及失败原因解析
Python 中 jieba 库安装步骤及失败原因解析 作为计算机小白, Python 的流行也让我蠢蠢欲动, 在请教计算机 专业同学后,开始上网课自学 Python 基础知识.今天老师简单的一 句话 ...
- python怎么安装jieba库这个模块 No module named ‘jieba‘ python3.7
报错提示:No module named 'jieba' 首先点击桌面左下角的开始图标,然后选择运行--cmd(也可以win+R唤出运行菜单) 1. anaconda安装库 可以使用conda ins ...
- python文件读写用到的库_python 读写txt文件并用jieba库进行中文分词
python用来批量处理一些数据的第一步吧. 对于我这样的的萌新.这是第一步. #encoding=utf-8 file='test.txt'fn=open(file,"r")pr ...
最新文章
- 因子和,因子数,1到n的因子和,1到n的因子数(积性函数)
- 弗林的计算机体系结构分类
- [Leedcode][JAVA][第820题][字典树][Set]
- [转载]聊一聊人员培养
- linux下./xx做了什么?
- rsync+inotify实现实时同步案例详解
- 华为支持nfc功能的手机有哪些_四款带NFC功能的千元机,三星华为低至1399元!...
- Flash知识点总结
- 盈建科中地震波_[GMS][地震波][选波]YJK地震波反应谱分析与地震波选取
- 盛世zeepower远程距离隔空无线充投放商用 低频磁共振无线充电技术——充电有效距离 20-45mm
- 14款免费的GIF制作软件(转载)
- 计算机无法识别苹果6手机,电脑无法识别iphone6怎么处理
- Spring Boot之Spring-Data-JPA
- Java - JavaFx之fxml文件的编写及基本使用方式
- python对PDF分割、合并、裁剪等
- java怎么计算相隔多少天_java计算两个日期之间相差天数和相隔天数详解
- js 关键字搜索功能
- 【使用VS2022写c语言】第一次使用VS2022写c语言代码可能会遇到的问题及解决方法。
- NR LDPC 04 -definition, Tanner and Protograph Constructions
- Few-Shot 学习