《三国演义》之人物出场统计
- 版权声明:该文是博主个人的学习笔记,如有错误,恳请看官在评论区指出,在下不胜感激~如要转载注明出处即可~
人物出场设计对词汇的统计。中文文章需要分词才能进行词频统计,这需要用到jieba库。
《三国演义》文本保存为三国演义》.txt,实现代码如下:
#CalThreekingdomsV1.py
import jieba
txt =open("三国演义.txt", "r", encoding = 'utf - 8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:#排除单个字符的分词结果continueelse:counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
items.sort(key = lambda x:x[1], reverse=True)
for i in range (15):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))
排除一些与人物名字无关的词汇,优化代码如下:
import jieba
excludes = {"将军","却说","荆州","二人","不可","不能","如此"}
txt = open("三国演义.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word == "诸葛亮" or word == "孔明曰":rword = "孔明"elif word == "关公" or word == "云长":rword = "关羽"elif word == "玄德" or word == "玄德曰":rword = "刘备"elif word == "孟德" or word == "丞相":rword = "曹操"else:rword = wordcounts[rword] = counts.get(rword,0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))
《三国演义》之人物出场统计相关推荐
- 三国演义人物出场统计代码含义_实例2之《三国演义》人物出场统计
大家好,我是人间富贵花下的贫穷草,简称人间富贵草. jieba(结巴)作为一个优秀的第三方中文分词函数库,今天我们就把它拉出来溜溜. <三国演义>txt文本下载地址: https://ww ...
- 《三国演义》人物出场统计
人物出场统计涉及对词汇的统计.中文文章需要分词才能进行词频统计.这就需要用到jieba库. 实现代码1: #三国演义 人物出场统计 import jieba txt=open("threek ...
- Python练习题18:《三国演义》人物出场统计
import jieba #中文分词第三方库,使用之前要额外安装(cmd --> pip install jieba) txt = open("E:\\LX\\threekingdom ...
- 三国演义人物出场统计
#Hamlet词频统计(含Hamlet原文文本)#CalHamletV1.py def getText():txt = open("hamlet.txt", "r&quo ...
- 红楼梦人物出场统计python_Python程序设计习题3——红楼梦人物出场次数统计
统计<红楼梦>中前20位出场最多的人物 使用Python编写程序,统计书籍<红楼梦>中前20位出场次数最多的人物 #红楼梦人物出场统计 import jieba txt=ope ...
- python三国演义人物出场统计ppt_Python统计三国演义主要人物出场次数
import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...
- python三国演义人物 统计分析_Python统计三国演义主要人物出场次数
import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...
- python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...
<三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...
- 【Python】 -- 使用jieba库实现对《三国演义》人物出场次数统计
需要借助一个中文词频分析工具--jieba库. 什么是jieba库 jieba是Python中一个重要的第三方中文分词函数库 通过指令pip install jieba 安装 使用: >> ...
最新文章
- 插槽 查看硬盘状态_摄影路上的“全能”伴侣 | LaCie DJI Copilot 移动硬盘
- asp.net创建文件夹出错的解决方案[转]
- windows下安装pygtk报g_assertion_message无法定位libglib-2.0-0.dll错误解决
- 通过HTTP协议上传文件
- 互联网巨头们的「中台战事」
- CVPR 2021 | 天津大学提出PISE:形状与纹理解耦的人体图像生成与编辑方法
- jQuery插件AjaxFileUpload文件上传实现Javascript多文件上传功能
- Fastboot Normal + Recovery
- 光猫的分类及应用范围有哪些?
- 3.9 创建数据类型
- 深入理解并发的关键字-volatile
- 中国电信回应“变相涨价说”:对原畅享套餐进行的优化升级
- java list 遍历查找_Java用list储存,遍历,查询指定信息过程详解
- numpy与pandas各种功能及其对比(超全)
- mysql的读写分离技术_mysql 读写分离方法
- python入门经典100题
- 条码打印软件如何实现二维码内容换行显示
- 计算机体系结构量化研究方法——学习(一)
- python调用java的方法-JPype的简单使用
- SQL查询条件传入参数为空查询全部数据,不为空指定查询,可选参数查询