• 版权声明:该文是博主个人的学习笔记,如有错误,恳请看官在评论区指出,在下不胜感激~如要转载注明出处即可~

人物出场设计对词汇的统计。中文文章需要分词才能进行词频统计,这需要用到jieba库。
《三国演义》文本保存为三国演义》.txt,实现代码如下:

#CalThreekingdomsV1.py
import jieba
txt =open("三国演义.txt", "r", encoding = 'utf - 8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:#排除单个字符的分词结果continueelse:counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
items.sort(key = lambda x:x[1], reverse=True)
for i in range (15):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))


排除一些与人物名字无关的词汇,优化代码如下:

import jieba
excludes = {"将军","却说","荆州","二人","不可","不能","如此"}
txt = open("三国演义.txt", "r", encoding='utf-8').read()
words  = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word == "诸葛亮" or word == "孔明曰":rword = "孔明"elif word == "关公" or word == "云长":rword = "关羽"elif word == "玄德" or word == "玄德曰":rword = "刘备"elif word == "孟德" or word == "丞相":rword = "曹操"else:rword = wordcounts[rword] = counts.get(rword,0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))

《三国演义》之人物出场统计相关推荐

  1. 三国演义人物出场统计代码含义_实例2之《三国演义》人物出场统计

    大家好,我是人间富贵花下的贫穷草,简称人间富贵草. jieba(结巴)作为一个优秀的第三方中文分词函数库,今天我们就把它拉出来溜溜. <三国演义>txt文本下载地址: https://ww ...

  2. 《三国演义》人物出场统计

    人物出场统计涉及对词汇的统计.中文文章需要分词才能进行词频统计.这就需要用到jieba库. 实现代码1: #三国演义 人物出场统计 import jieba txt=open("threek ...

  3. Python练习题18:《三国演义》人物出场统计

    import jieba #中文分词第三方库,使用之前要额外安装(cmd --> pip install jieba) txt = open("E:\\LX\\threekingdom ...

  4. 三国演义人物出场统计

    #Hamlet词频统计(含Hamlet原文文本)#CalHamletV1.py def getText():txt = open("hamlet.txt", "r&quo ...

  5. 红楼梦人物出场统计python_Python程序设计习题3——红楼梦人物出场次数统计

    统计<红楼梦>中前20位出场最多的人物 使用Python编写程序,统计书籍<红楼梦>中前20位出场次数最多的人物 #红楼梦人物出场统计 import jieba txt=ope ...

  6. python三国演义人物出场统计ppt_Python统计三国演义主要人物出场次数

    import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...

  7. python三国演义人物 统计分析_Python统计三国演义主要人物出场次数

    import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...

  8. python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  9. 【Python】 -- 使用jieba库实现对《三国演义》人物出场次数统计

    需要借助一个中文词频分析工具--jieba库. 什么是jieba库 jieba是Python中一个重要的第三方中文分词函数库 通过指令pip install jieba 安装 使用: >> ...

最新文章

  1. 插槽 查看硬盘状态_摄影路上的“全能”伴侣 | LaCie DJI Copilot 移动硬盘
  2. asp.net创建文件夹出错的解决方案[转]
  3. windows下安装pygtk报g_assertion_message无法定位libglib-2.0-0.dll错误解决
  4. 通过HTTP协议上传文件
  5. 互联网巨头们的「中台战事」
  6. CVPR 2021 | 天津大学提出PISE:形状与纹理解耦的人体图像生成与编辑方法
  7. jQuery插件AjaxFileUpload文件上传实现Javascript多文件上传功能
  8. Fastboot Normal + Recovery
  9. 光猫的分类及应用范围有哪些?
  10. 3.9 创建数据类型
  11. 深入理解并发的关键字-volatile
  12. 中国电信回应“变相涨价说”:对原畅享套餐进行的优化升级
  13. java list 遍历查找_Java用list储存,遍历,查询指定信息过程详解
  14. numpy与pandas各种功能及其对比(超全)
  15. mysql的读写分离技术_mysql 读写分离方法
  16. python入门经典100题
  17. 条码打印软件如何实现二维码内容换行显示
  18. 计算机体系结构量化研究方法——学习(一)
  19. python调用java的方法-JPype的简单使用
  20. SQL查询条件传入参数为空查询全部数据,不为空指定查询,可选参数查询

热门文章

  1. 坐地铁,玩Android
  2. Word怎么修改纸张方向
  3. linux 安装字体库
  4. java毕业设计教学平台mybatis+源码+调试部署+系统+数据库+lw
  5. 回首过去 展望未来
  6. 【spark使用】4. Dataset转换算子使用
  7. 氢原子光谱、类氢原子光谱和类氢离子光谱
  8. android 短信数据库在哪个文件夹,安卓手机的短信备份后存到了哪个文件夹下
  9. linux不识别ntfs分区,解决linux 不能识别ntfs分区问题(linux系统挂载移动硬盘)
  10. 打字练习。。又退步了