python三国演义人物出现次数_Python分析《三国演义》人物出场次数,孔明第二,赵云第五...
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
importjieba
excludes= {"将军","却说","荆州","二人","不可","不能","如此","商议","如何","主公","军士","左右","军马"}
txt= open("三国演义.txt","r",encoding='utf-8').read()
words=jieba.lcut(txt)
counts={}for word inwords:if len(word)==1:continue
elif word=="诸葛亮"or word =="孔明曰":
rword= "孔明"
elif word == "关公" or word == "云长曰":
rword= "关羽"
elif word == "玄德" or word == "玄德曰":
rword= "刘备"
elif word == "孟德" or word == "丞相":
rword= "曹操"
else:
rword=word
counts[rword]=counts.get(rword,0)+1
for word inexcludes:del(counts[word])
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)for i in range(5):
word,count=items[i]print("{0:<10}{1:>5}".format(word,count))
运行结果:
知识扩展:
1.Jieba库是什么
Jieba库是优秀的中文分词第三方库,中文文本需要通过分词获得单个的词语。
Jieba库的分词原理:利用一个中文词库,确定汉字之间的关联概率,汉字间概率大的组成词组,形成分词结果。除了分词,用户还可以添加自定义的词组。
2.Jieba库的使用
Jieba库分词有3种模式
1)精确模式:就是把一段文本精确地切分成若干个中文单词,若干个中文单词之间经过组合,就精确地还原为之前的文本。其中不存在冗余单词。
2)全模式:将一段文本中所有可能的词语都扫描出来,可能有一段文本它可以切分成不同的模式,或者有不同的角度来切分变成不同的词语,在全模式下,Jieba库会将各种不同的组合都挖掘出来。分词后的信息再组合起来会有冗余,不再是原来的文本。
3)搜索引擎模式:在精确模式基础上,对发现的那些长的词语,我们会对它再次切分,进而适合搜索引擎对短词语的索引和搜索。也有冗余。
以下文章来源于Python小例子,作者 无尘
转载地址
https://blog.csdn.net/fei347795790?t=1
python三国演义人物出现次数_Python分析《三国演义》人物出场次数,孔明第二,赵云第五...相关推荐
- python实现对小说的文本分析(人物关系图,人物词云等)
文本分析 0.效果图 这里有些"二人"."不会"等词语没用筛选掉,手动筛选即可. 1.整体思路: 调用的库:jieba,matplotlib,networkx, ...
- python统计文件中每个单词出现的次数_Python统计单词出现的次数
题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...
- python中文词组统计次数_python统计中文词组出现次数
2018年9月7日在百度google没有找到python统计中文词组的,查出来的都是统计英文单词,词组的,所以我想来实现python中文词组统计分享. 首先我是用textrank4zh库将句子转化成词 ...
- python统计字符在文件中出现的次数_python字符串中字符出现次数(python获取字符串个数)...
今天要说的是Python的字符串函数还是很方便的,只需要调用 count() 方法即可. 最近,我在一个网站上看到了一个自然语言处理课程.我详细解释了一些方法的使用,用例很容易理解,所以我想通过我的博 ...
- python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...
问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...
- python有什么用途视频_Python分析6625条视频,告诉你“打工人”凭什么能刷爆全网...
原标题:Python分析6625条视频,告诉你"打工人"凭什么能刷爆全网 CDA数据分析师 出品 作者:Mika 数据:真达 后期:Mika [导读] 今天教大家用Python分析 ...
- python中什么是算法_python自动开发之(算法)第二十七天
1.什么是算法? 算法(Algorithm):一个计算过程,解决问题的方法 2.复习:递归 递归的两个特点:(1) 调用自身 (2)结束条件 deffunc1(x):print(x) func1(x- ...
- python三国演义人物 统计分析_python统计三国演义人物出场次数
[Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...
- 【Python】 -- 使用jieba库实现对《三国演义》人物出场次数统计
需要借助一个中文词频分析工具--jieba库. 什么是jieba库 jieba是Python中一个重要的第三方中文分词函数库 通过指令pip install jieba 安装 使用: >> ...
- python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
最新文章
- mysql创建只读权限用户_新品速递 | Harbor 修复权限提升漏洞,MySQL Plus 支持密码强度校验以及审计功能...
- 轻松取得建表和索引的DDL语句
- [javaEE] JDBC快速入门
- 这部日本「神作」彻底拉低了我入门AI的门槛
- 天池csv转成grt代码里的luna的csv,pandas库来操作csv文件(pd.DataFrame,pd.concat,pd.Series,to_csv等)实现
- 项目学习 - 收藏集 - 掘金
- 翻译: 3.线性神经网络 概览 深入神经网络 pytorch
- Axure 9.0 使用教程2-函数分类
- 什么是PERT网络分析?
- PS教程:利用灰度蒙版实现无级调节
- 自从自己搭建了这套精选壁纸聊天背景的微信小程序,我的手机背景图再都没重复过
- php汉字转为拼音方法一
- 固定资产条码管理系统软件如何来管控制造家具行业资产?
- ToDoList 案例完整 尚硅谷
- 构造方法:构造方法的格式和执行时机;构造方法的作用;构造方法的注意事项;
- 教你一招如何快速生成微信小程序
- 管理学定律五:二八定律与木桶理论
- Luogu 3642 [APIO 2016] 烟火表演
- 【目标跟踪】|综述 Deep Learning for Visual Tracking: A Comprehensive Survey
- win10怎么安装kali双系统 Windows下安装kali双系统安装教程 全网最详细最有效 win10安装kali linux