本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

importjieba

excludes= {"将军","却说","荆州","二人","不可","不能","如此","商议","如何","主公","军士","左右","军马"}

txt= open("三国演义.txt","r",encoding='utf-8').read()

words=jieba.lcut(txt)

counts={}for word inwords:if len(word)==1:continue

elif word=="诸葛亮"or word =="孔明曰":

rword= "孔明"

elif word == "关公" or word == "云长曰":

rword= "关羽"

elif word == "玄德" or word == "玄德曰":

rword= "刘备"

elif word == "孟德" or word == "丞相":

rword= "曹操"

else:

rword=word

counts[rword]=counts.get(rword,0)+1

for word inexcludes:del(counts[word])

items=list(counts.items())

items.sort(key=lambda x:x[1],reverse=True)for i in range(5):

word,count=items[i]print("{0:<10}{1:>5}".format(word,count))

运行结果:

知识扩展:

1.Jieba库是什么

Jieba库是优秀的中文分词第三方库,中文文本需要通过分词获得单个的词语。

Jieba库的分词原理:利用一个中文词库,确定汉字之间的关联概率,汉字间概率大的组成词组,形成分词结果。除了分词,用户还可以添加自定义的词组。

2.Jieba库的使用

Jieba库分词有3种模式

1)精确模式:就是把一段文本精确地切分成若干个中文单词,若干个中文单词之间经过组合,就精确地还原为之前的文本。其中不存在冗余单词。

2)全模式:将一段文本中所有可能的词语都扫描出来,可能有一段文本它可以切分成不同的模式,或者有不同的角度来切分变成不同的词语,在全模式下,Jieba库会将各种不同的组合都挖掘出来。分词后的信息再组合起来会有冗余,不再是原来的文本。

3)搜索引擎模式:在精确模式基础上,对发现的那些长的词语,我们会对它再次切分,进而适合搜索引擎对短词语的索引和搜索。也有冗余。

以下文章来源于Python小例子,作者 无尘

转载地址

https://blog.csdn.net/fei347795790?t=1

python三国演义人物出现次数_Python分析《三国演义》人物出场次数,孔明第二,赵云第五...相关推荐

  1. python实现对小说的文本分析(人物关系图,人物词云等)

    文本分析 0.效果图 这里有些"二人"."不会"等词语没用筛选掉,手动筛选即可. 1.整体思路: 调用的库:jieba,matplotlib,networkx, ...

  2. python统计文件中每个单词出现的次数_Python统计单词出现的次数

    题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...

  3. python中文词组统计次数_python统计中文词组出现次数

    2018年9月7日在百度google没有找到python统计中文词组的,查出来的都是统计英文单词,词组的,所以我想来实现python中文词组统计分享. 首先我是用textrank4zh库将句子转化成词 ...

  4. python统计字符在文件中出现的次数_python字符串中字符出现次数(python获取字符串个数)...

    今天要说的是Python的字符串函数还是很方便的,只需要调用 count() 方法即可. 最近,我在一个网站上看到了一个自然语言处理课程.我详细解释了一些方法的使用,用例很容易理解,所以我想通过我的博 ...

  5. python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...

    问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...

  6. python有什么用途视频_Python分析6625条视频,告诉你“打工人”凭什么能刷爆全网...

    原标题:Python分析6625条视频,告诉你"打工人"凭什么能刷爆全网 CDA数据分析师 出品 作者:Mika 数据:真达 后期:Mika [导读] 今天教大家用Python分析 ...

  7. python中什么是算法_python自动开发之(算法)第二十七天

    1.什么是算法? 算法(Algorithm):一个计算过程,解决问题的方法 2.复习:递归 递归的两个特点:(1) 调用自身 (2)结束条件 deffunc1(x):print(x) func1(x- ...

  8. python三国演义人物 统计分析_python统计三国演义人物出场次数

    [Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...

  9. 【Python】 -- 使用jieba库实现对《三国演义》人物出场次数统计

    需要借助一个中文词频分析工具--jieba库. 什么是jieba库 jieba是Python中一个重要的第三方中文分词函数库 通过指令pip install jieba 安装 使用: >> ...

  10. python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

最新文章

  1. mysql创建只读权限用户_新品速递 | Harbor 修复权限提升漏洞,MySQL Plus 支持密码强度校验以及审计功能...
  2. 轻松取得建表和索引的DDL语句
  3. [javaEE] JDBC快速入门
  4. 这部日本「神作」彻底拉低了我入门AI的门槛
  5. 天池csv转成grt代码里的luna的csv,pandas库来操作csv文件(pd.DataFrame,pd.concat,pd.Series,to_csv等)实现
  6. 项目学习 - 收藏集 - 掘金
  7. 翻译: 3.线性神经网络 概览 深入神经网络 pytorch
  8. Axure 9.0 使用教程2-函数分类
  9. 什么是PERT网络分析?
  10. PS教程:利用灰度蒙版实现无级调节
  11. 自从自己搭建了这套精选壁纸聊天背景的微信小程序,我的手机背景图再都没重复过
  12. php汉字转为拼音方法一
  13. 固定资产条码管理系统软件如何来管控制造家具行业资产?
  14. ToDoList 案例完整 尚硅谷
  15. 构造方法:构造方法的格式和执行时机;构造方法的作用;构造方法的注意事项;
  16. 教你一招如何快速生成微信小程序
  17. 管理学定律五:二八定律与木桶理论
  18. Luogu 3642 [APIO 2016] 烟火表演
  19. 【目标跟踪】|综述 Deep Learning for Visual Tracking: A Comprehensive Survey
  20. win10怎么安装kali双系统 Windows下安装kali双系统安装教程 全网最详细最有效 win10安装kali linux

热门文章

  1. 英语词典软件测试大乐,软件测试和评估(百词斩和扇贝单词)
  2. java小型计费系统设计_JAVA课程设计模拟电信计费系统
  3. 手把手教你搭建小程序
  4. Win快捷键大全史上最全~ win打开资源管理器快捷键(查看内存的占用)
  5. 用python实现自动化翻译
  6. JAVA语言基础知识总结
  7. 百度网盘分享旁边的个人说明如何修改
  8. ChatGPT 会开源吗?
  9. WebSocket 和 AJAX 比较
  10. 完美卸载mac电脑里的软件及残留清理教程