python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...
《三国演义》,《水浒传》,《西游记》的人物出场次数Python代码:
经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱;水浒作者对宋江和武松比较喜爱;西游作者对齐天大圣孙悟空比较喜爱
通过这类代码,我们可以看出一篇文章中作者想表达的主要的的一些东西#三国演义
print("三国演义人物出场次数:")
import jieba #jieba库的应用
import time #引入time库,计算下程序运行的时间
start=time.perf_counter()
txt=open("三国演义.txt","r",encoding="utf-8").read()
excludes={"将军","却说","二人","后主","上马","不知","天子","大叫","众将","不可",
"主公","蜀兵","只见","如何","商议","都督","一人","汉中","不敢","人马",
"陛下","魏兵","天下","今日","左右","东吴","于是","荆州","不能","如此",
"大喜","引兵","次日","军士","军马"} #这些文字是多次程序运行所得
words=jieba.lcut(txt)
counts={}
for word in words:
if len(word)==1:
continue
elif word=="诸葛亮" or word=="孔明曰":
rword="孔明"
elif word=="关公" or word=="云长":
rword="关羽"
elif word=="玄德" or word=="玄德曰":
rword="刘备"
elif word=="孟德" or word=="丞相":
rword="曹操" #把意思相同的归为一个人
else:
rword=word
counts[rword]=counts.get(rword,0)+1
for word in excludes:
del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
word,count=items[i]
print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))
print("-----------------------------------")
#水浒传
print("水浒传人物出场次数:")
import jieba
import time
start=time.perf_counter()
txt=open("水浒传.txt","r",encoding="utf-8").read()
excludes={"二人","一个","来到","人马","你们","我们","好汉",
"知府","什么","他们","银子","梁山","两个"}
words=jieba.lcut(txt)
counts={}
for word in words:
if len(word)==1:
continue
elif word=="哥哥":
rword="宋江"
elif word=="头领":
rword="林冲"
else:
rword=word
counts[word]=counts.get(word,0)+1
for word in excludes:
del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
word,count=items[i]
print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))
print("-----------------------------")
#西游记
print("西游记人物出场次数:")
import jieba
import time
start=time.perf_counter()
txt=open("西游记.TXT","r",encoding="utf-8").read()
excludes={"一个","那里","怎么","我们","不知","两个","甚么","只见","不是",
"原来","不敢","闻言","如何"}
words=jieba.lcut(txt)
counts={}
for word in words:
if len(word)==1:
continue
elif word=="行者" or word=="大圣" or word=="老孙":
rword="悟空"
elif word=="师父" or word=="三藏" or word=="长老":
rword="唐僧"
elif word=="和尚" or word=="呆子":
rword="沙僧"
else:
rword=word
counts[rword]=counts.get(rword,0)+1
for word in excludes:
del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(9):
word,count=items[i]
print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))
python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...相关推荐
- python编程小案例_用Python3编程写第一个小案例!-Go语言中文社区
用Python3编程第一步! 今天博主跟大家聊一聊如何使用Python3编程第一步!!不喜勿喷,如有建议欢迎补充.讨论! Come on! 在前面的几篇文章中我们已经学习了一些Python3 的基本语 ...
- go语言爬虫解析html,Python爬虫【如何爬取内容(html)和解析内容】-Go语言中文社区...
1 基础 HTML解析:定位基础是xpath,了解下面的链接的基本知识. 在python中使用HTML解析等操作时,需要安装lxml包,在pycharm的terminal下:pip install l ...
- android 开发tv盒子,一步一步学习Android TV/盒子开发(二)-Go语言中文社区
TV.机顶盒开发调试不能像手机一样通过USB线连接调试,可通过ADB连接调试 连接电视 adb connect 10.74.84.199 连接后就可以开始开发调试了! 断开连接 // 断开某个设备 a ...
- python情人节之玫瑰花与表白方式_python情人节之玫瑰花与表白方式-Go语言中文社区...
import turtle def initialization(): ''' 初始化画布和画笔 ''' turtle.setup(width=0.9, height=0.9) turtle.spee ...
- python要背的单词_学Python必须背的42个常见单词,看看你都会吗?-Go语言中文社区...
adult [ˈædʌlt] 成年人 authentication [ɔːˌθentɪˈkeɪʃn] 身份验证.认证.鉴定 bit [bɪt] 稍微.小量.小块.一点 byte [baɪt] 字节.位 ...
- Python学习之四大名著人物出场次数Python代码
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- python诞生的时间地点人物事件_Python学习之四大名著人物出场次数Python代码
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- 红楼梦人物出场统计python_红楼梦有多少人物统计(一)
原本打算写点有关在红楼梦中,有哪些人物是争议最多,以及有哪些人物争议最少.结果在统计红楼梦中人物时,在遍历了数据库所收集的红楼梦研究著作之后,发现了一个老问题. 这个问题就是:在红楼梦中究竟写了多少人 ...
- python爬b站评论_学习笔记(1):写了个python爬取B站视频评论的程序
学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...
最新文章
- SQLserver 常用函数适用方法(转载)
- 从小到大排列的数组中查找x,若x存在则删除,若不存在则添加,修改后的数组仍然有序
- .NET Core微服务之路:不断更新中的目录 (v0.42)
- java amp amp 怎么用,java中amp;与amp;amp;的区别
- 年度最期待游戏废土2登陆Linux
- ajax方式表单拦截
- 吐血解决python中文写入文件问题
- photo-sphere-viewer.js使用时图片拉伸的问题
- block inline 和inline-block 块级元素和内联元素
- ubuntu12.04安装翻译软件stardict及卸载
- qt设置背景图片变黑色_PS软件如何快速制作一个黑色创意海报
- kd树 python实现_Python语言描述KNN算法与Kd树
- python 拼接 遥感影像_Python干货 | 遥感影像拼接
- 描述十二个异性追求者的拓展
- 原创程序|基于GDAL的遥感影像批量处理工具介绍(三)
- Python3实现向指定邮箱发送邮件(支持附件文件、图片等)
- java unpark_Java多线程学习:(wait,notify)--(await,signal)--(park,unpark)
- 请不要在该奋斗的年纪选择了安逸
- 蓝牙突然消失,ubuntu连接音箱没有声音问题
- TI公司之DSP结构与芯片
热门文章
- 中文 gbk gb2312 在线转换 编码码 对照表 自动转换 在线转换(推荐)
- ug10后处理安装步骤 ug后处理论坛网 ug后处理在什么位置 ug后处理报警大全 ug法兰克后处理下载 ug后处理器如何设置 ug三轴后处理制作教程 法兰克ug后处理文件 ug后处理构造器
- postman导出请求url_Postman教程——设置
- SQLite轻量级数据库jar包链接
- PMSM中常用的两种坐标变换——Park变换
- js字符串与64进制的转换
- 实现暂停一秒输出的效果_HID控制器与海康威视人脸识别amp;测温门禁一体机实现联动的改造方法...
- 距离保护整定计算中分支系数公式理解
- 四则运算web版需求规格说明书
- 【PyQt5】一行代码教你一件换头像