统计《三国演义》中出现次数较高的人物。

import jieba
excludes={"先主","将军","却说","荆州","二人","不可","不能","如此","忽然","下马","喊声","马岱","心中","大惊","以为","不得","下文","粮草","追赶","报知","一声","回报","分解","三千","分付","出马","只得","之兵","曹兵","随后","大将","一齐","许都","且说","众官","洛阳","商议","如何","主公","军士","左右","军马","引兵","次日","大喜","天下","于是","东吴","今日","不敢","魏兵","陛下","人马","不知","汉中","一人","众将","只见","蜀兵","大叫","上马","天子","此人","一面","太守","后人","背后","何不","城中","忽报","先锋","大军","先生","然后","何故","夫人","不如","令人","赶来","原来","江东","正是","成都","徐州","因此","未知","大败","百姓","大事","一军","起兵","之后","接应","不见","进兵","可以","引军","军中","大怒"}
txt=open("G:\study\Python\三国演义.txt","r",encoding="utf-8").read()#读取文件《三国演义》
words=jieba.lcut(txt)#通过jieba库中的精确模式把文本精确分开不存在冗余词组
counts={}#用于记录出现的次数
for word in words:if len(word)==1:continueelif word=="诸葛亮" or word=="孔明曰":rword="孔明"elif word=="关公" or word=="云长":rword="关羽"elif word=="玄德" or word=="玄德曰":rword="刘备"elif word=="孟德" or word=="丞相":rword="曹操"elif word=="后主" or word=="阿斗":rword="刘禅"elif word=="都督" or word=="公瑾":rword="周瑜"elif word=="子龙" :rword="赵云"else:rword=wordcounts[rword]=counts.get(rword,0)+1
for word in excludes:#若存在上述excludes里面的词组都不是词组,然后减一del(counts[word])
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)#通过出现的次数降序排序输出
for i in range(50):word,count=items[i]print("{0:<10}{1:>5}".format(word,count))#进行格式的调整

Python---统计《三国演义》中出现次数较高的人物相关推荐

  1. python爬取三国演义文本,统计三国演义中出场次数前30的人物,并生成词云、图表

    目录 1.目标 2.码前须知 3.操作流程 4.完整代码 5.总结 1.目标 python爬取三国演义,生成词云.图表 2.码前须知 项目目标:三国人物名称及出现次数-----数据统计分析 提出问题: ...

  2. python统计数组中出现次数最多的元素

    python查找数组中出现次数最多的元素 方法1-np.argmax(np.bincount()) array = [0,1,2,2,3,4,4,4,5,6] print(np.bincount(ar ...

  3. Python统计列表中重复次数最多的前N个元素

    from collections import Counter a = [1, 1, 7, 3, 6, 2, 5, 4, 4, 3, 9, 4, 4, 1] #统计列表中重复次数最多的前N个元素 N ...

  4. Python统计字符串中出现次数最多的人名

    人名最多数统计 题目摘自https://python123.io 描述 编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名.‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬ ...

  5. python统计excel中出现次数_使用pythonxlrd统计Excel表中特定单词的出现次数

    单元格可能包含多个单词,也可能不包含多个单词,因此必须在替换标点符号后split.在这里,这是一个翻译地图:import xlrd import os from string import punct ...

  6. python统计文件中每个单词出现的次数_Python统计单词出现的次数

    题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...

  7. python使用正则表达式统计字符串中出现次数最多的数字

    python使用正则表达式统计字符串中出现次数最多的数字 #python使用正则表达式统计字符串中出现次数最多的数字 # find the most occurring element import ...

  8. Python统计列表中的重复项出现的次数的方法

    本文实例展示了Python统计列表中的重复项出现的次数的方法,是一个很实用的功能,适合Python初学者学习借鉴.具体方法如下: 对一个列表,比如[1,2,2,2,2,3,3,3,4,4,4,4],现 ...

  9. python统计文件中每个单词出现的次数_python统计文本中每个单词出现的次数

    .python统计文本中每个单词出现的次数: #coding=utf-8 __author__ = 'zcg' import collections import os with open('abc. ...

最新文章

  1. nginx alias php,Nginx Alias 无法解析PHP的解决办法
  2. (十五)Java springcloud B2B2C o2o多用户商城 springcloud架构-commonservice-sso服务搭建(一)...
  3. oracle 10g rac重建crs
  4. 110余家企业聚集智博会 专家表示智慧城市需以打破数据堡垒为前提
  5. java-web前端 CSS
  6. python文件对象是可以迭代的_详解python可迭代对象、迭代器和生成器
  7. 让你的echo带颜色
  8. DFS(深度优先算法)难
  9. 计算机网络延展-令牌环网
  10. Windows安装宝塔后跳过绑定手机号
  11. 梯形面积php,梯形的面积公式是什么
  12. [导入]GIS的下个十年(Cary Mann, vice president, Bentley)
  13. 奇点云数据中台技术汇(一) | DataSimba——企业级一站式大数据智能服务平台
  14. 软件开发中的SD、SE、QA和RD是什么意思?
  15. Excel VBA小程序03-快速提取单元格中的数字和非数字
  16. MySQL连接速度太慢_mysql-连接速度非常慢(1秒)
  17. HTTP协议压缩格式和URL编码介绍
  18. Web全栈~17.购物车案例(JavaScript动态效果)
  19. cocos2d-x 如何制作一个类马里奥的横版平台动作游戏 1 献给所有对动作游戏有爱的朋友
  20. 网络socket编程实现并发服务器——多线程编程

热门文章

  1. 怎么把照片转换成jpg格式?jpg格式图片怎么弄
  2. WiFi的商业运作模式
  3. java开发名言_java实现收藏名言语句台词的app
  4. Ubuntu杀死进程
  5. 室内设计和平面设计哪个更适合女生学习?
  6. python数据收集整理教案_《数据收集整理》教学设计
  7. 暄桐教室的50本必读书 | 39《前朝梦忆》
  8. 【vue,SpringBoot,Mybatis】 关于多条件搜索表单
  9. 一款好用的基于vue的录屏插件recordrtc,拿走不谢
  10. 1017:浮点型数据类型存储空间大小