import jieba

txt = open("西游记.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt) # 使用精确模式对文本进行分词

counts = {} # 通过键值对的形式存储词语及其出现的次数

for word in words:

if len(word) == 1:

continue

elif word == "大圣" or word=="老孙" or word=="行者" or word=="孙大圣" or word=="孙行者" or word=="猴王" or word=="悟空" or word=="齐天大圣" or word=="猴子":

rword = "孙悟空"

elif word == "师父" or word == "三藏" or word=="圣僧":

rword = "唐僧"

elif word == "呆子" or word=="八戒" or word=="老猪":

rword = "猪八戒"

elif word=="沙和尚":

rword="沙僧"

elif word == "妖精" or word=="妖魔" or word=="妖道":

rword = "妖怪"

elif word=="佛祖":

rword="如来"

elif word=="三太子":

rword="白马"

else:

rword = word

counts[rword] = counts.get(rword,0) + 1

items = list(counts.items())#将键值对转换成列表

items.sort(key=lambda x: x[1], reverse=True) # 根据词语出现的次数进行从大到小排序

for i in range(20):

word, count = items[i]

print("{0:<10}{1:>5}".format(word, count))

python的jieba统计西游记_python运用jieba库统计《西游记》中相关分词出现次数最高的20个...相关推荐

  1. Python绘图之matplotlib基础教程:matplotlib库图表绘制中常规设置大全(交互模式、清除原有图像、设置横坐标显示文字/旋转角度、添加图例、绘图布局自动调整、图像显示、图像暂停)

    Python绘图之matplotlib基础教程:matplotlib库图表绘制中常规设置大全(交互模式.清除原有图像.设置横坐标显示文字/旋转角度.添加图例.绘图布局自动调整.图像显示.图像暂停) 目 ...

  2. python时间函数详解_Python:Numpy库基础分析——详解datetime类型的处理

    原标题:Python:Numpy库基础分析--详解datetime类型的处理 Python:Numpy库基础分析--详解datetime类型的处理 关于时间的处理,Python中自带的处理时间的模块就 ...

  3. python turtle画滑稽表情_python使用turtle库绘制奥运五环

    python使用turtle库绘制奥运五环 Turtle库是Python语言中一个很流行的绘制图像的函数库,想象一个小乌龟,在一个横轴为x.纵轴为y的坐标系原点,(0,0)位置开始,它根据一组函数指令 ...

  4. python基础和第三方库 笔记(python基础完结包括高级用法,第三方库持续更新中...)

    python基础 注:本笔记面向有一定基础的人 本笔记是本人快速复习python过程中记录的,不适合零基础的人学习python的主工具,可以作为辅工具,本笔记记录了入门阶段常用操作,如有错误的地方,希 ...

  5. python爬网页统计数据_Python爬取阿拉丁统计信息过程图解

    背景 目前项目在移动端上,首推使用微信小程序.各项目的小程序访问数据有必要进行采集入库,方便后续做统计分析.虽然阿拉丁后台也提供了趋势分析等功能,但一个个的获取数据做数据分析是很痛苦的事情.通过将数据 ...

  6. python文本统计单词_Python实现文本单词统计

    在以前的文章中,我提到过Python标准库中的collections模块中的Counter类.它的作用非常大,这里我们要用利它来实现单词统计.对于任意一篇全英文的文本文件,我们要列出其中每一个单词各自 ...

  7. python资本市场财务数据分析统计服_python股票财务数据分析统计服|蓝田制作项目并购估值...

    高质量增长取得多方认可.高盛研报称,认可碧桂园1直以来的执行力以及说到做到,置信 公司会持续 维持将来 几年的疾速 开展 .项目融资 课件,北京项目融资模式 守护绿色家园 保住生态根基PPP项目融资项 ...

  8. python分割语音端点检测_python的webrtc库如何实现语音端点检测 科大讯飞输入法PC体验版下载:语音+手写+...

    python的webrtc库如何实现语音端点检测 科大讯飞输入法PC体验版下载:语音+手写+ 2018-03-05 出处:网络 整理:zhishizhan.net 延伸:科大讯飞输入法PC体验版下载: ...

  9. python在统计专业的应用_Python在计量经济与统计学中的应用

    Python for Econometrics and Statistics (Python在计量经济与统计学中的应用) [点击链接进入主页].这套笔记将重点介绍Python在计量经济学与统计分析中的 ...

最新文章

  1. 【Interfacenavigation】XML中的字体(27)
  2. Predicate 在根据多个条件过滤数据的例子
  3. 正则表达式。部分实例及说明(摘)
  4. 如何成功搞垮一个团队?
  5. iOS判断为空或者只为空格
  6. linux java socket编程_深入学习socket网络编程,以java语言为例
  7. 数据归一化处理方法_科研常用的实验数据分析与处理方法
  8. 解决error: Microsoft Visual C++ 14.0 is required 问题
  9. 按条件分类_史上最全物流仓储分类方式
  10. opencv python 读取图像/显示图像/保存图像
  11. 反向传播算法(backpropagation)
  12. PPT双屏抽奖,大气,能Hold住全场!与其它PPT内容可融为一体,实现无缝切换!
  13. 如何进行大数据分析及处理(总结)
  14. 实现一个串口调试工具
  15. 永磁同步电机矢量控制(六)——MTPA最大转矩电流比控制
  16. 模块化的机器学习系统就够了吗?Bengio师生告诉你答案
  17. 超级无敌diao炸天的手写堆
  18. Gmail对比Outlook哪个更好
  19. 老九学堂C++实现小游戏之小公主养成记
  20. 什么是开发平台? 几句话就让你明白!

热门文章

  1. 开关电源用什么开关管_电源开关中的安全点击技巧
  2. 超越Scrum:给游戏开发者的精益和看板
  3. 信号归一化功率_如何在频谱分析仪或矢量信号分析仪上测量功率谱密度?
  4. 软文创意18招之二:讲故事
  5. kaggle黑色星期五_黑色星期五:网站开发和设计中的最佳库可享受50%的折扣!
  6. Gartner 2021年云安全技术成熟度曲线中的四项必备技术
  7. (2022,latent spcae)GAN逆映射:综述
  8. 关于qt上实现基于百度的语音识别
  9. Java 中用到的线程调度算法是什么?
  10. python画椭圆形函数算法_python数字图像处理(12):基本图形的绘制