三国演义人物出场次数
三国演义人物出场次数,出场顺序就不统计了,需要排除的集合太长,丞相这个词语有点问题,代码如下
import jieba
txt = open(r'c:\Users\今天还下雨\desktop\threekingdoms.txt','r',encoding='utf-8').read()
excludes = {'将军','却说','荆州','二人','不可','不能','如此','商议','如何','主公','左右','军士',\'军马','引兵','次日','大喜','天下','东吴','于是','今日','不敢','魏兵','陛下','不知','一人','不敢',\'不知','人马','都督','汉中','只见','蜀兵'}
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word =='诸葛孔明' or word == '孔明曰' or word == '诸葛亮':rword = '孔明'elif word =='关公' or word == '云长':rword = '关羽'elif word =='玄德' or word == '玄德曰':rword = '刘备'elif word =='孟德' or word == '丞相':#丞相也可能是说诸葛亮rword = '曹操'else:rword = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(30):word,count = items[i]print('{0:<10}{1:>5}'.format(word,count))
三国演义人物出场次数相关推荐
- python三国演义人物 统计分析_python统计三国演义人物出场次数
[Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...
- python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- Python 三国演义文本可视化(词云,人物关系图,主要人物出场次数,章回字数)
文章目录 效果展示 介绍 软件架构 使用说明 导入需要的库 执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png 效果展示 介绍 Python读取小说文本,绘制词云图 ...
- 【用matplotlib,wordcloud和pyecharts分析三国的分词,词频,词性,小说人物出场次数排序小说人物关系】
前言 为了顺利完成作业,经过几天的网上查阅完成了[根据第1部分自然语言处理教学内容,请选择一本你喜欢的小说,利用上课讲的但不限于授课内容,对该小说进行分析.比如分析该小说的分词,词频,词性,小说人物出 ...
- Python学习之四大名著人物出场次数Python代码
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- python诞生的时间地点人物事件_Python学习之四大名著人物出场次数Python代码
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- 利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系
1.需要准备的文件 bird.png:云底图片 sgyy.txt:三国演义原文 tingyong.txt:停用词文件 2.源代码 1.统计词频词性并写入文件中 # 贾高亮 # 时间:2023/3/21 ...
- python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数
这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...
- 红楼梦人物出场次数统计
这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...
- Python中文分析:《射雕英雄传》统计人物出场次数、生成词云图片文件、根据人物关系做社交关系网络和其他文本分析
前言 python中文分析作业,将对<射雕英雄传>进行中文分析,统计人物出场次数.生成词云图片文件.根据人物关系做社交关系网络和其他文本分析等. 对应内容 1.中文分词,统计人物出场次数, ...
最新文章
- linux sed给空文件首行插入_Linux系统中sed命令在文件某行前后添加内容的用法
- apache和tomcat区别
- java设计模式---适配器模式
- 19-spring学习-springMVC环境配置
- 打造增长核武器:承载与创造科技公司70%价值的「网络效应」
- java对xml文件的读写_java 自己做的对XML文件的读写操作
- SkGradientShader::CreateLinear 的参数。
- css盒模型中子元素垂直方向上总高度与父元素height的关系
- CBA Opportunity creation的性能跟踪
- SegmentFault Hackathon 文艺复兴
- 实时屏幕监控 linux面板,分享|LXDE、Xfce 及 MATE 桌面环境下的又一系统监视器应用:Multiload-ng...
- iOS code collection
- mysqlinnodb数据库损坏,全网最新
- MES的关键数据模型S95标准介绍
- 开关电源环路补偿设计及调节笔记
- 敏捷团队的规范与准则
- 让我们跳过中年危机,直接聊聊如何善终
- 网络协议--SSL/TLS
- 百度地图H5/app 导航
- 转【孙悟空的火眼金睛】
热门文章
- 把时间当作朋友 读书笔记
- conda install报错 ValueError: check_hostname requires server_hostname
- C#习题之标准体重测试
- Java核心技术大会|Java应用开发专场
- 只需用Shift键就能提升Mac开机速度的三个方法
- 计算机xp的解释,xp蓝屏代码解释以及解决办法
- U8glib如何显示中文
- Mysql 如何批量复制一个表数据进行增加条数
- 小马激活手动分配磁盘_不要成为“单把小马”手动测试仪
- c 实现服务器性能监控,Prometheus——进行服务器性能监控的一件法宝