python的jieba统计西游记_python运用jieba库统计《西游记》中相关分词出现次数最高的20个...
import jieba
txt = open("西游记.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt) # 使用精确模式对文本进行分词
counts = {} # 通过键值对的形式存储词语及其出现的次数
for word in words:
if len(word) == 1:
continue
elif word == "大圣" or word=="老孙" or word=="行者" or word=="孙大圣" or word=="孙行者" or word=="猴王" or word=="悟空" or word=="齐天大圣" or word=="猴子":
rword = "孙悟空"
elif word == "师父" or word == "三藏" or word=="圣僧":
rword = "唐僧"
elif word == "呆子" or word=="八戒" or word=="老猪":
rword = "猪八戒"
elif word=="沙和尚":
rword="沙僧"
elif word == "妖精" or word=="妖魔" or word=="妖道":
rword = "妖怪"
elif word=="佛祖":
rword="如来"
elif word=="三太子":
rword="白马"
else:
rword = word
counts[rword] = counts.get(rword,0) + 1
items = list(counts.items())#将键值对转换成列表
items.sort(key=lambda x: x[1], reverse=True) # 根据词语出现的次数进行从大到小排序
for i in range(20):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count))
python的jieba统计西游记_python运用jieba库统计《西游记》中相关分词出现次数最高的20个...相关推荐
- Python绘图之matplotlib基础教程:matplotlib库图表绘制中常规设置大全(交互模式、清除原有图像、设置横坐标显示文字/旋转角度、添加图例、绘图布局自动调整、图像显示、图像暂停)
Python绘图之matplotlib基础教程:matplotlib库图表绘制中常规设置大全(交互模式.清除原有图像.设置横坐标显示文字/旋转角度.添加图例.绘图布局自动调整.图像显示.图像暂停) 目 ...
- python时间函数详解_Python:Numpy库基础分析——详解datetime类型的处理
原标题:Python:Numpy库基础分析--详解datetime类型的处理 Python:Numpy库基础分析--详解datetime类型的处理 关于时间的处理,Python中自带的处理时间的模块就 ...
- python turtle画滑稽表情_python使用turtle库绘制奥运五环
python使用turtle库绘制奥运五环 Turtle库是Python语言中一个很流行的绘制图像的函数库,想象一个小乌龟,在一个横轴为x.纵轴为y的坐标系原点,(0,0)位置开始,它根据一组函数指令 ...
- python基础和第三方库 笔记(python基础完结包括高级用法,第三方库持续更新中...)
python基础 注:本笔记面向有一定基础的人 本笔记是本人快速复习python过程中记录的,不适合零基础的人学习python的主工具,可以作为辅工具,本笔记记录了入门阶段常用操作,如有错误的地方,希 ...
- python爬网页统计数据_Python爬取阿拉丁统计信息过程图解
背景 目前项目在移动端上,首推使用微信小程序.各项目的小程序访问数据有必要进行采集入库,方便后续做统计分析.虽然阿拉丁后台也提供了趋势分析等功能,但一个个的获取数据做数据分析是很痛苦的事情.通过将数据 ...
- python文本统计单词_Python实现文本单词统计
在以前的文章中,我提到过Python标准库中的collections模块中的Counter类.它的作用非常大,这里我们要用利它来实现单词统计.对于任意一篇全英文的文本文件,我们要列出其中每一个单词各自 ...
- python资本市场财务数据分析统计服_python股票财务数据分析统计服|蓝田制作项目并购估值...
高质量增长取得多方认可.高盛研报称,认可碧桂园1直以来的执行力以及说到做到,置信 公司会持续 维持将来 几年的疾速 开展 .项目融资 课件,北京项目融资模式 守护绿色家园 保住生态根基PPP项目融资项 ...
- python分割语音端点检测_python的webrtc库如何实现语音端点检测 科大讯飞输入法PC体验版下载:语音+手写+...
python的webrtc库如何实现语音端点检测 科大讯飞输入法PC体验版下载:语音+手写+ 2018-03-05 出处:网络 整理:zhishizhan.net 延伸:科大讯飞输入法PC体验版下载: ...
- python在统计专业的应用_Python在计量经济与统计学中的应用
Python for Econometrics and Statistics (Python在计量经济与统计学中的应用) [点击链接进入主页].这套笔记将重点介绍Python在计量经济学与统计分析中的 ...
最新文章
- 【Interfacenavigation】XML中的字体(27)
- Predicate 在根据多个条件过滤数据的例子
- 正则表达式。部分实例及说明(摘)
- 如何成功搞垮一个团队?
- iOS判断为空或者只为空格
- linux java socket编程_深入学习socket网络编程,以java语言为例
- 数据归一化处理方法_科研常用的实验数据分析与处理方法
- 解决error: Microsoft Visual C++ 14.0 is required 问题
- 按条件分类_史上最全物流仓储分类方式
- opencv python 读取图像/显示图像/保存图像
- 反向传播算法(backpropagation)
- PPT双屏抽奖,大气,能Hold住全场!与其它PPT内容可融为一体,实现无缝切换!
- 如何进行大数据分析及处理(总结)
- 实现一个串口调试工具
- 永磁同步电机矢量控制(六)——MTPA最大转矩电流比控制
- 模块化的机器学习系统就够了吗?Bengio师生告诉你答案
- 超级无敌diao炸天的手写堆
- Gmail对比Outlook哪个更好
- 老九学堂C++实现小游戏之小公主养成记
- 什么是开发平台? 几句话就让你明白!
热门文章
- 开关电源用什么开关管_电源开关中的安全点击技巧
- 超越Scrum:给游戏开发者的精益和看板
- 信号归一化功率_如何在频谱分析仪或矢量信号分析仪上测量功率谱密度?
- 软文创意18招之二:讲故事
- kaggle黑色星期五_黑色星期五:网站开发和设计中的最佳库可享受50%的折扣!
- Gartner 2021年云安全技术成熟度曲线中的四项必备技术
- (2022,latent spcae)GAN逆映射:综述
- 关于qt上实现基于百度的语音识别
- Java 中用到的线程调度算法是什么?
- python画椭圆形函数算法_python数字图像处理(12):基本图形的绘制