三国演义人物出场次数,出场顺序就不统计了,需要排除的集合太长,丞相这个词语有点问题,代码如下

import jieba
txt = open(r'c:\Users\今天还下雨\desktop\threekingdoms.txt','r',encoding='utf-8').read()
excludes = {'将军','却说','荆州','二人','不可','不能','如此','商议','如何','主公','左右','军士',\'军马','引兵','次日','大喜','天下','东吴','于是','今日','不敢','魏兵','陛下','不知','一人','不敢',\'不知','人马','都督','汉中','只见','蜀兵'}
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word =='诸葛孔明' or word == '孔明曰' or word == '诸葛亮':rword = '孔明'elif word =='关公' or word == '云长':rword = '关羽'elif word =='玄德' or word == '玄德曰':rword = '刘备'elif word =='孟德' or word == '丞相':#丞相也可能是说诸葛亮rword = '曹操'else:rword  = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(30):word,count = items[i]print('{0:<10}{1:>5}'.format(word,count))

三国演义人物出场次数相关推荐

  1. python三国演义人物 统计分析_python统计三国演义人物出场次数

    [Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...

  2. python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  3. Python 三国演义文本可视化(词云,人物关系图,主要人物出场次数,章回字数)

    文章目录 效果展示 介绍 软件架构 使用说明 导入需要的库 执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png 效果展示 介绍 Python读取小说文本,绘制词云图 ...

  4. 【用matplotlib,wordcloud和pyecharts分析三国的分词,词频,词性,小说人物出场次数排序小说人物关系】

    前言 为了顺利完成作业,经过几天的网上查阅完成了[根据第1部分自然语言处理教学内容,请选择一本你喜欢的小说,利用上课讲的但不限于授课内容,对该小说进行分析.比如分析该小说的分词,词频,词性,小说人物出 ...

  5. Python学习之四大名著人物出场次数Python代码

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  6. python诞生的时间地点人物事件_Python学习之四大名著人物出场次数Python代码

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  7. 利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系

    1.需要准备的文件 bird.png:云底图片 sgyy.txt:三国演义原文 tingyong.txt:停用词文件 2.源代码 1.统计词频词性并写入文件中 # 贾高亮 # 时间:2023/3/21 ...

  8. python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  9. 红楼梦人物出场次数统计

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  10. Python中文分析:《射雕英雄传》统计人物出场次数、生成词云图片文件、根据人物关系做社交关系网络和其他文本分析

    前言 python中文分析作业,将对<射雕英雄传>进行中文分析,统计人物出场次数.生成词云图片文件.根据人物关系做社交关系网络和其他文本分析等. 对应内容 1.中文分词,统计人物出场次数, ...

最新文章

  1. linux sed给空文件首行插入_Linux系统中sed命令在文件某行前后添加内容的用法
  2. apache和tomcat区别
  3. java设计模式---适配器模式
  4. 19-spring学习-springMVC环境配置
  5. 打造增长核武器:承载与创造科技公司70%价值的「网络效应」
  6. java对xml文件的读写_java 自己做的对XML文件的读写操作
  7. SkGradientShader::CreateLinear 的参数。
  8. css盒模型中子元素垂直方向上总高度与父元素height的关系
  9. CBA Opportunity creation的性能跟踪
  10. SegmentFault Hackathon 文艺复兴
  11. 实时屏幕监控 linux面板,分享|LXDE、Xfce 及 MATE 桌面环境下的又一系统监视器应用:Multiload-ng...
  12. iOS code collection
  13. mysqlinnodb数据库损坏,全网最新
  14. MES的关键数据模型S95标准介绍
  15. 开关电源环路补偿设计及调节笔记
  16. 敏捷团队的规范与准则
  17. 让我们跳过中年危机,直接聊聊如何善终
  18. 网络协议--SSL/TLS
  19. 百度地图H5/app 导航
  20. 转【孙悟空的火眼金睛】

热门文章

  1. 把时间当作朋友 读书笔记
  2. conda install报错 ValueError: check_hostname requires server_hostname
  3. C#习题之标准体重测试
  4. Java核心技术大会|Java应用开发专场
  5. 只需用Shift键就能提升Mac开机速度的三个方法
  6. 计算机xp的解释,xp蓝屏代码解释以及解决办法
  7. U8glib如何显示中文
  8. Mysql 如何批量复制一个表数据进行增加条数
  9. 小马激活手动分配磁盘_不要成为“单把小马”手动测试仪
  10. c 实现服务器性能监控,Prometheus——进行服务器性能监控的一件法宝