文章目录

  • jieba库概述
  • jieba库的安装
  • jieba分词的原理
  • jieba分词的三种形式
  • jieba库常用函数
  • 实例1:Hamlet词频统计
    • code
  • 实例2:《三国演义》人物出场统计
    • code

jieba库概述

jieba库的安装

如果无法安装,请看Pyinstaller库的安装与使用方法里面有详细的安装教程

jieba分词的原理

jieba分词的三种形式

jieba库常用函数


实例1:Hamlet词频统计

code

def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ")  # 将文本中特殊字符替换为空格return txthamletTxt = getText()
words = hamletTxt.split()
counts = {}
for word in words:counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(10):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))

实例2:《三国演义》人物出场统计

code

import jiebaexcludes = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此"}
txt = open("threekingdoms.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word == "诸葛亮" or word == "孔明曰":rword = "孔明"elif word == "关公" or word == "云长":rword = "关羽"elif word == "玄德" or word == "玄德曰":rword = "刘备"elif word == "孟德" or word == "丞相":rword = "曹操"else:rword = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(10):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))

jieba库的安装与使用方法相关推荐

  1. Python中jieba库的安装方法

    方法一:使用pycharm里的检索项(此方法适用于需要使用pycharm的小伙伴) 1.打开pycharm,在File下打开Settings. 2.在Project Interpret菜单栏下,点击& ...

  2. jieba库的安装与使用

    jieba库 jieba库的安装 jieba库的基本介绍 jieba库的使用 jieba库的安装 (cmd命令行) pip install jieba 也可以安装国内镜像: pip install - ...

  3. jieba库的安装和应用

    目录         一.jieba库         二. jieba库的安装          三.jieba三种模式的使用         四.jieba 分词简单应用         五.扩展 ...

  4. Python视频编辑神器:全面分析ffmpeg-python库的安装与使用方法

    Python视频编辑神器:全面分析ffmpeg-python库的安装与使用方法 在Python中进行视频编辑是一件令人兴奋的事情,它能够让你深入了解和控制你想要的任何一帧视频.而在Python视频编辑 ...

  5. python中jieba库的安装

    jieba库的作用主要用于中文分词,是一种不错的中文分词组件. python中的库可以理解为有三种:python自带的,自己定义的,第三方库(别人写好的,如jieba库,要从网上下载,进行安装) 常用 ...

  6. python3.8如何安装jieba库_安装jieba、wordcloud等第三方库

    任务:安装第三方库 C:\Users\l>pip install wheel Collecting wheel Downloading https://files.pythonhosted.or ...

  7. Jupyter Notebook 主题库 jupyterthemes 安装和使用方法

    原生的Jupyter Notebook界面主题如下: 原生主题简洁大方那个,经典易用,但总是有人热衷于纯黑色的开发界面的.下面就带大家开始体验jupyterthemes 的各种个性主题. 第一步:安装 ...

  8. Python jieba库的安装

    1.自动安装(速度较慢容易报错,不推荐) 在CMD控制面板中使用pip语言进行安装 pip install jieba 2.半自动安装 2.1.在官网下载压缩包 https://pypi.org/pr ...

  9. 【问题解决】M5神库M5Stack-SD-Updater安装及使用方法

    微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 今天终于将M5Stack-SD-Updater编译通过了,说来惭愧,这个问题讲道理应该 ...

最新文章

  1. 在ubuntu16.04中安装apache2+modsecurity以及自定义WAF规则详解
  2. ORA-12638: 身份证明检索失败 的解决办法
  3. 汇编语言--adc指令
  4. json的格式和简单例子
  5. 肝了这套Python数据分析教程,进字节稳了!
  6. C语言 ungetc将变量存放的字符返回给stdin输入流
  7. oracle sql中打印,在Oracle SQL Developer SQL工作表窗口中打印文本
  8. access用扫描枪输入_工业级高精度扫描枪适用在哪些环境
  9. 图像匹配之序贯相似性检测法匹配
  10. eclipse中文版eclipse汉化教程
  11. JSON在线对比差异工具
  12. Soul App 高管被捕,恶意举报导致竞品被下架
  13. Flutter开发之——Future<dynamic> is not a subtype of type () void
  14. anconda各个版本下载
  15. 【Java】Exception in thread main java.lang.UnsupportedClassVersionError
  16. 短视频动态贴纸的实现思路
  17. 美国专线是什么,美国专线有哪些物流方式?
  18. Synergy v1.10版本跨平台鼠键共享资源
  19. 实例讨论数据可视化的配色思路
  20. microsoft edge 打开垃圾网页

热门文章

  1. 高通平台开发系列讲解(外设篇)QCA6696启动过程
  2. GlusterFs安装部署文档
  3. 如何高效管理电脑里的文件
  4. xeon e5-2400 系列处理器能做四路服务器吗?,英特尔Xeon E5系列双路处理器大阅兵
  5. IDEA 快捷键及修改
  6. 【优化求解】基于蝗虫算法求解单目标问题附matlab代码
  7. smss.exe是什么进程?详解Windows会话管理器中的smss.exe
  8. latex 学习使用记录(插图片,插表格,插公式,插参考文献)
  9. javascript将table的td变为可编辑的input,实现表格动态编辑(带示例版)
  10. sip协议呼叫流程详解