【Python】统计《红楼梦》中出场次数前十的人物

  • 代码
  • 截图

代码

import jiebaexcludes = {'什么', "一个", "我们", "那里", "你们", "如今", "说道", "知道", "起来", "姑娘", "这里", "出来", "他们", "众人", "自己","一面","只见","怎么","两个","没有","不是","不知","这个","听见","这样","进来","咱们","告诉","就是","东西","袭人","回来","只是","大家","只得","老爷","丫头","这些","不敢","出去","所以","不过","的话","不好","姐姐","探春","鸳鸯","一时","不能","过来","心里","如此","今日","银子","几个","答应","二人","还有","只管","这么","说话","一回","那边","这话","外头","打发","自然","今儿","罢了","屋里","那些","听说","小丫头","不用","如何"}txt = open("红楼梦.txt","r",encoding='utf-8').read()words = jieba.lcut(txt)counts = {}for word in words:if len(word) == 1:      #如果长度是一,可能是语气词之类的,应该删除掉continueelse:counts[word] = counts.get(word,0) + 1for word in excludes:del(counts[word])items = list(counts.items())items.sort(key=lambda x:x[1],reverse = True)print("红楼梦中出场次数前十名:")
for i in range(10):word,count = items[i]print("{0:<10}{1:>5}".format(word,count))

截图

【Python】统计《红楼梦》中出场次数前十的人物相关推荐

  1. python爬取三国演义文本,统计三国演义中出场次数前30的人物,并生成词云、图表

    目录 1.目标 2.码前须知 3.操作流程 4.完整代码 5.总结 1.目标 python爬取三国演义,生成词云.图表 2.码前须知 项目目标:三国人物名称及出现次数-----数据统计分析 提出问题: ...

  2. VBS脚本统计红楼梦中贾宝玉出现的次数

    VBS脚本统计红楼梦中贾宝玉出现的次数 文件: 链接:https://pan.baidu.com/s/1T-XIbIHzMZiIX8IiSMcZdg 提取码:sti6 脚本代码: Dim fso, t ...

  3. python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  4. 用python统计红楼梦出场人数最多的20位_《红楼梦》人物统计,统计前20位出场最多的人物。...

    [单选题]Which of the following ideas apply to the neoclassical growth theory? I. The rate of technologi ...

  5. Python 统计红楼梦、Jane Eyre词频方法

    包含去除标点符号和换行.空格等因素 import pandas as pddef question1():words = ['贾宝玉', '宝玉', '林黛玉', '黛玉']with open(&qu ...

  6. python红楼梦词云_用Python读红楼梦之——二、词云美化

    原文链接 咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了. 我们先来找照片,这张照片不错,不过还是要 ...

  7. 用Python读红楼梦之——二、词云美化

    原文连接 咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了. 我们先来找照片,这张照片不错,不过还是要 ...

  8. python _ 统计红楼梦人员姓名出现次数

    python _ 统计红楼梦人员姓名出现次数 使用到jieba库 --Python 第三方中文分词库 1 安装jieba库 : 2 红楼梦 TXT 文档 import jieba txt = open ...

  9. python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计

    python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...

最新文章

  1. mysql中检索以名字_【MySQL必知必会】第四章 检索数据
  2. IE6 / IE7 / Firefox 的margin问题解决办法
  3. Python学习笔记:循环语句
  4. 先判断对象是否为NULL再进行操作
  5. cf体验服_CF手游体验服_穿越火线枪战王者体验服申请_12月版本
  6. ttf_openfont可以多次调用吗_【译文】Rust futures: async fn中的thread::sleep和阻塞调用...
  7. 7-7 硬币找钱问题 (10 分)(思路+详解+double类型数据的处理)Come baby!!!!!!!!!!!!!!!!!!!!
  8. 《记得我们有约》17集
  9. 好用的下拉第三方——nicespinner
  10. php防止跨域提交,PHP防止跨域提交表单的简单示例
  11. 【华为云技术分享】一文带你了解Web前端发展历程
  12. 我与电脑1-初识电脑
  13. Kubernetes详解(十)——Pod对象高级控制命令
  14. C# 设置开机自启动
  15. 水经注万能地图下载器下载的瓦片如何应用到web端的cesium中
  16. win7下使用变色龙引导linux
  17. 微信小程序的组件传值
  18. 使用pip来对相应的版本进行降低的过程的
  19. AM335X 、AM5728 NOR flash启动
  20. 如何实现微信抢红包算法?

热门文章

  1. linux目录自动同步,linux 下面文件夹的自动同步 | Think in Drupal
  2. 1:1三相隔离变压器替代解决方案
  3. 计算机网络(二) | 网络编程基础、Socket套接字、UDP和TCP套接字编程
  4. 64位系统下编译PHP找不到库文件问题
  5. 汇编实例5——大小写的转换
  6. java项目下载后无法运行_eclipse不能在手机运行程序问题解决办法
  7. The Google File System(GFS)学习笔记
  8. 诛天者 pat basic 练习五十八 选择题
  9. STIL中的Pattern
  10. java 图片层级_UGUI图片层级和渲染顺序的奇怪关系