jieba库的安装与使用方法
文章目录
- jieba库概述
- jieba库的安装
- jieba分词的原理
- jieba分词的三种形式
- jieba库常用函数
- 实例1:Hamlet词频统计
- code
- 实例2:《三国演义》人物出场统计
- code
jieba库概述
jieba库的安装
如果无法安装,请看Pyinstaller库的安装与使用方法里面有详细的安装教程
jieba分词的原理
jieba分词的三种形式
jieba库常用函数
实例1:Hamlet词频统计
code
def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ") # 将文本中特殊字符替换为空格return txthamletTxt = getText()
words = hamletTxt.split()
counts = {}
for word in words:counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(10):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))
实例2:《三国演义》人物出场统计
code
import jiebaexcludes = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此"}
txt = open("threekingdoms.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word == "诸葛亮" or word == "孔明曰":rword = "孔明"elif word == "关公" or word == "云长":rword = "关羽"elif word == "玄德" or word == "玄德曰":rword = "刘备"elif word == "孟德" or word == "丞相":rword = "曹操"else:rword = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(10):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))
jieba库的安装与使用方法相关推荐
- Python中jieba库的安装方法
方法一:使用pycharm里的检索项(此方法适用于需要使用pycharm的小伙伴) 1.打开pycharm,在File下打开Settings. 2.在Project Interpret菜单栏下,点击& ...
- jieba库的安装与使用
jieba库 jieba库的安装 jieba库的基本介绍 jieba库的使用 jieba库的安装 (cmd命令行) pip install jieba 也可以安装国内镜像: pip install - ...
- jieba库的安装和应用
目录 一.jieba库 二. jieba库的安装 三.jieba三种模式的使用 四.jieba 分词简单应用 五.扩展 ...
- Python视频编辑神器:全面分析ffmpeg-python库的安装与使用方法
Python视频编辑神器:全面分析ffmpeg-python库的安装与使用方法 在Python中进行视频编辑是一件令人兴奋的事情,它能够让你深入了解和控制你想要的任何一帧视频.而在Python视频编辑 ...
- python中jieba库的安装
jieba库的作用主要用于中文分词,是一种不错的中文分词组件. python中的库可以理解为有三种:python自带的,自己定义的,第三方库(别人写好的,如jieba库,要从网上下载,进行安装) 常用 ...
- python3.8如何安装jieba库_安装jieba、wordcloud等第三方库
任务:安装第三方库 C:\Users\l>pip install wheel Collecting wheel Downloading https://files.pythonhosted.or ...
- Jupyter Notebook 主题库 jupyterthemes 安装和使用方法
原生的Jupyter Notebook界面主题如下: 原生主题简洁大方那个,经典易用,但总是有人热衷于纯黑色的开发界面的.下面就带大家开始体验jupyterthemes 的各种个性主题. 第一步:安装 ...
- Python jieba库的安装
1.自动安装(速度较慢容易报错,不推荐) 在CMD控制面板中使用pip语言进行安装 pip install jieba 2.半自动安装 2.1.在官网下载压缩包 https://pypi.org/pr ...
- 【问题解决】M5神库M5Stack-SD-Updater安装及使用方法
微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 今天终于将M5Stack-SD-Updater编译通过了,说来惭愧,这个问题讲道理应该 ...
最新文章
- 在ubuntu16.04中安装apache2+modsecurity以及自定义WAF规则详解
- ORA-12638: 身份证明检索失败 的解决办法
- 汇编语言--adc指令
- json的格式和简单例子
- 肝了这套Python数据分析教程,进字节稳了!
- C语言 ungetc将变量存放的字符返回给stdin输入流
- oracle sql中打印,在Oracle SQL Developer SQL工作表窗口中打印文本
- access用扫描枪输入_工业级高精度扫描枪适用在哪些环境
- 图像匹配之序贯相似性检测法匹配
- eclipse中文版eclipse汉化教程
- JSON在线对比差异工具
- Soul App 高管被捕,恶意举报导致竞品被下架
- Flutter开发之——Future<dynamic> is not a subtype of type () void
- anconda各个版本下载
- 【Java】Exception in thread main java.lang.UnsupportedClassVersionError
- 短视频动态贴纸的实现思路
- 美国专线是什么,美国专线有哪些物流方式?
- Synergy v1.10版本跨平台鼠键共享资源
- 实例讨论数据可视化的配色思路
- microsoft edge 打开垃圾网页
热门文章
- 高通平台开发系列讲解(外设篇)QCA6696启动过程
- GlusterFs安装部署文档
- 如何高效管理电脑里的文件
- xeon e5-2400 系列处理器能做四路服务器吗?,英特尔Xeon E5系列双路处理器大阅兵
- IDEA 快捷键及修改
- 【优化求解】基于蝗虫算法求解单目标问题附matlab代码
- smss.exe是什么进程?详解Windows会话管理器中的smss.exe
- latex 学习使用记录(插图片,插表格,插公式,插参考文献)
- javascript将table的td变为可编辑的input,实现表格动态编辑(带示例版)
- sip协议呼叫流程详解