#三国演义人物的升级版
#1.给出排除词库
#CalThreeKingdomsV1.py
# import jieba
# txt = open("threekingdoms.txt", "r", encoding='utf-8').read()
# words  = jieba.lcut(txt)
# counts = {}
# for word in words:
#     if len(word) == 1:
#         continue
#     else:
#         counts[word] = counts.get(word,0) + 1
# items = list(counts.items())
# items.sort(key=lambda x:x[1], reverse=True)
# for i in range(15):
#     word, count = items[i]
#     print ("{0:<10}{1:>5}".format(word, count))#CalThreeKingdomsV2.py
import jieba
excludes = {"将军","却说","荆州","二人","不可","不能","如此","商议"}#将这些词语剔除
txt = open("threekingdoms.txt", "r", encoding='utf-8').read()
words  = jieba.lcut(txt)
counts = {}
for word in words:if len(word) == 1:continueelif word == "诸葛亮" or word == "孔明曰":rword = "孔明"elif word == "关公" or word == "云长":rword = "关羽"elif word == "玄德" or word == "玄德曰":rword = "刘备"elif word == "孟德" or word == "丞相":rword = "曹操"else:rword = wordcounts[rword] = counts.get(rword,0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))

词频统计——三国人物出场次数统计相关推荐

  1. 红楼梦人物出场次数统计

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  2. python三国演义人物 统计分析_python统计三国演义人物出场次数

    [Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...

  3. Python词频统计——《红楼梦》人物出场次数统计

    代码实现 import jieba as j names = ['贾母', '贾珍', '贾蓉', '贾赦', '贾政', '袭人', '王熙凤', '紫鹃', '翠缕', '香菱','豆官', '薛 ...

  4. 【Python】 -- 使用jieba库实现对《三国演义》人物出场次数统计

    需要借助一个中文词频分析工具--jieba库. 什么是jieba库 jieba是Python中一个重要的第三方中文分词函数库 通过指令pip install jieba 安装 使用: >> ...

  5. 红楼梦人物出场统计python_Python程序设计习题3——红楼梦人物出场次数统计

    统计<红楼梦>中前20位出场最多的人物 使用Python编写程序,统计书籍<红楼梦>中前20位出场次数最多的人物 #红楼梦人物出场统计 import jieba txt=ope ...

  6. Python零基础入门习题(六)红楼梦人物出场次数统计

    前言 Python语言简单易用,可读性强.在了解基础语法后,你就可以来尝试解决以下的题目.放心,本系列的文章都对新手非常友好. 一.生日悖论 生日悖论是指在不少于 23 个人中至少有两人生日相同的概率 ...

  7. python语言通过字典实现映射关系_利威平台Python编程语言:如何用字典类型来编程统计三国人物...

    上一篇文章小编对Python编程语言的组合数据学习分享给大家了,这一篇文章小编分享一下如何用字典类型来编程统计三国人物! 小编今天分享给大家用Python编程来统计三国人物出场次数,三国中的人物很多, ...

  8. python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  9. python统计小说人物出现次数_使用python统计《三国演义》小说里人物出现次数前十名,并实现可视化。...

    一.安装所需要的第三方库 jieba (jieba是优秀的中文分词第三分库) pyecharts (一个优秀的数据可视化库) 使用pycharm安装库 打开Pycharm选择[File]下的Setti ...

最新文章

  1. 博客园第一天,开放封闭原则
  2. linux文件属性 -rwxr-xrw,Linux文件属性
  3. 10.1引用数据类型的转换
  4. 【干货下载】聚美优品、中商惠民、倍全,如何让数据驱动“新零售”落地?...
  5. 【Linux系统编程】进程替换:exec 函数族
  6. python调试_Python调试坑
  7. [转载]jquery cookie的用法
  8. Nmap配合Masscan实现高效率扫描资产
  9. Linux more和less
  10. delphi三层架构中注册服务器
  11. GJB 质量保证大纲(模板)
  12. axure删除的页面怎么恢复_Axure高保真还原Web首页布局和交互教程
  13. SAP Java Connector 错误 - JCO_ERROR_COMMUNICATION
  14. 鼠标连点器同时点多个位置_C++自制鼠标连点器
  15. DICOM世界观·第二章 数字(D)、成像(I)与通讯(Co)
  16. mac显示和隐藏文件命令
  17. 设计师都在用的素材网站,真的纯免费,还能商用
  18. React中文文档之Rendering Elements
  19. 基于TCP协议的游戏代理接口测试工具<一>:设计初衷与工具构想
  20. Hyper-V虚拟机ping不通宿主机ip解决方案

热门文章

  1. 用js实现分页功能以及利用xml实现分页功能——数据岛
  2. mysql win linux性能对比,不同系统上 MySQL 的性能对比
  3. 微信小程序上传接口php,微信小程序API 上传、下载
  4. java type 简书_Java中的Type详解
  5. win32开发(鼠标)
  6. san分布式共享文件系统_基于SAN存储共享卷实现openstack高可用的方法与流程
  7. sql日期大于某天_(十五)sql/Linux 小技巧
  8. python服务端语言_使用Python实现简单的服务器功能
  9. mysql 5.7.29下载安装_deepin20 离线安装 MySQL5.7.29
  10. 阿里开发规范_阿里开发强制要求的11条SQL编写规范