from jieba import lcut
file=open('three kindom.txt','rt',encoding='utf-8').read()
wordlist=lcut(file)
excludes={'将军','却说','荆州','二人','不可','不能','如此','商议','如何','军士','左右','军马','引兵','次日','大喜','天下','东吴','于是','今日','不敢','魏兵','一人','只见','不知','人马','汉中','众将','后主','蜀兵','上马','大叫','太守','此人'}
count={}
for word in wordlist:if word=='孔明曰' or word=='诸葛亮':rword='孔明'elif word=='关公' or word=='云长':rword='关羽'elif word=='玄德'or word=='玄德曰' or word=='主公':rword='刘备'elif word=='孟德' or word=='丞相' or word=='陛下':rword='曹操'elif word=='都督':rword='周瑜'else:rword=wordif len(rword)<=1 or len(rword)>3:continueelse:count[rword]=count.get(rword,0)+1
rank=sorted(count.items(),key=lambda x:x[1],reverse=True)
for i in range(15+len(excludes)):if rank[i][0] not in excludes:print('{:<5s}  {:>4d}'.format(rank[i][0],rank[i][1]),end='\n')

经过几次优化,前15名结果如下:

曹操     1674
刘备     1583
孔明     1383
关羽      784
周瑜      438
张飞      358
吕布      300
赵云      278
孙权      264
司马懿     221
袁绍      191
马超      185
魏延      180
夫人      173
先主      173

python 三国演义人物出场词频统计相关推荐

  1. python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  2. python三国演义人物出场统计_python爬取三国演义文本

    1.目标 python爬取三国演义,生成词云.图表 2.码前须知 项目目标:三国人物名称及出现次数-----数据统计分析 提出问题:哪个人物在三国演义中出现的次数最多?,我们希望通过数据分析来获得答案 ...

  3. python三国演义人物出场统计ppt_Python统计三国演义主要人物出场次数

    import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...

  4. python三国演义人物 统计分析_python统计三国演义人物出场次数

    [Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...

  5. python三国演义人物 统计分析_Python统计三国演义主要人物出场次数

    import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...

  6. python三国演义人物出场统计_Python分析《三国演义》人物出场次数,孔明第二,赵云第五...

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. import jieba excludes = {"将军", ...

  7. 三国演义人物出场顺序统计(文本词频统计)

    1.使用jieba库 对中文文本进行分词 2.使用字典表达词频 (与hamlet案例相似) import jieba txt = open("threekingdoms.txt", ...

  8. Python词频统计——《红楼梦》人物出场次数统计

    代码实现 import jieba as j names = ['贾母', '贾珍', '贾蓉', '贾赦', '贾政', '袭人', '王熙凤', '紫鹃', '翠缕', '香菱','豆官', '薛 ...

  9. 莽荒纪人物出场数据统计

    今天继续给大家介绍Python相关知识,本文主要内容莽荒纪人物出场数据统计. 一.中文文本词频统计思路 在上文Python英文词频统计(哈姆雷特)程序示例中,我们进行了英文单词的统计.今天,我们进行中 ...

  10. Python中文分词及词频统计

    Python中文分词及词频统计 中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组.英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是 ...

最新文章

  1. 技术详解 | 如何用GAN实现阴影检测和阴影去除?
  2. wxWidgets:wxMultiChoiceDialog类用法
  3. 秒杀多线程第十二篇 多线程同步内功心法——PV操作上
  4. 【设计模式】各个击破单例模式的8种写法
  5. android 插入gif,android – Gboard:在EditText上启用GIF插入
  6. 经典视觉SLAM框架
  7. (中医) 我的中医实践之路-开篇
  8. java B2B2C 多租户电子商城系统-SpringCloud动态刷新配置信息
  9. [转]Flex是什么?flex和flash是什么关系 ?
  10. 使用Intellij Idea生成可执行文件jar,转为exe文件步骤
  11. 2019最新QQ音乐Api
  12. Halcon学习(7):颜色识别
  13. 根据Landset 8计算植被覆盖度
  14. 世界各国发展指标(1960-2019)
  15. CAD工程图纸转jpg格式教程
  16. 2015人生感悟哲理
  17. 《相关性准则——大数据时代的高效能之道》一一1.6 相关性准则
  18. 前端开发学习(七七)
  19. BIOS知识枝桠—— Protocol
  20. cygwin linux 教程,Cygwin工具使用入门教程

热门文章

  1. 使用Hutool发送工作日报
  2. 白杨SEO:百度首页和百度SERP的新闻是怎么做上去的?
  3. 小米手机系统服务组件是干什么的_2799 元!小米 1 亿像素拍照手机来了,还有 MIUI 系统的小米手表...
  4. 淘宝测试开发实习总结
  5. too few variables specified 怎么解决
  6. 麻雀虽小,五脏俱全!RT-Thread BK7252 麻雀一号开发板上手体验
  7. 高质量外链的十大特性
  8. javascript之原型,原型链
  9. OA实施分析:OA系统选型警惕哪些陷阱
  10. 使用键盘操作将桌面计算机图标隐藏,如何创建键盘快捷方式来显示或隐藏桌面图标 | MOS86...