【Python】统计《红楼梦》中出场次数前十的人物
【Python】统计《红楼梦》中出场次数前十的人物
- 代码
- 截图
代码
import jiebaexcludes = {'什么', "一个", "我们", "那里", "你们", "如今", "说道", "知道", "起来", "姑娘", "这里", "出来", "他们", "众人", "自己","一面","只见","怎么","两个","没有","不是","不知","这个","听见","这样","进来","咱们","告诉","就是","东西","袭人","回来","只是","大家","只得","老爷","丫头","这些","不敢","出去","所以","不过","的话","不好","姐姐","探春","鸳鸯","一时","不能","过来","心里","如此","今日","银子","几个","答应","二人","还有","只管","这么","说话","一回","那边","这话","外头","打发","自然","今儿","罢了","屋里","那些","听说","小丫头","不用","如何"}txt = open("红楼梦.txt","r",encoding='utf-8').read()words = jieba.lcut(txt)counts = {}for word in words:if len(word) == 1: #如果长度是一,可能是语气词之类的,应该删除掉continueelse:counts[word] = counts.get(word,0) + 1for word in excludes:del(counts[word])items = list(counts.items())items.sort(key=lambda x:x[1],reverse = True)print("红楼梦中出场次数前十名:")
for i in range(10):word,count = items[i]print("{0:<10}{1:>5}".format(word,count))
截图
【Python】统计《红楼梦》中出场次数前十的人物相关推荐
- python爬取三国演义文本,统计三国演义中出场次数前30的人物,并生成词云、图表
目录 1.目标 2.码前须知 3.操作流程 4.完整代码 5.总结 1.目标 python爬取三国演义,生成词云.图表 2.码前须知 项目目标:三国人物名称及出现次数-----数据统计分析 提出问题: ...
- VBS脚本统计红楼梦中贾宝玉出现的次数
VBS脚本统计红楼梦中贾宝玉出现的次数 文件: 链接:https://pan.baidu.com/s/1T-XIbIHzMZiIX8IiSMcZdg 提取码:sti6 脚本代码: Dim fso, t ...
- python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数
这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...
- 用python统计红楼梦出场人数最多的20位_《红楼梦》人物统计,统计前20位出场最多的人物。...
[单选题]Which of the following ideas apply to the neoclassical growth theory? I. The rate of technologi ...
- Python 统计红楼梦、Jane Eyre词频方法
包含去除标点符号和换行.空格等因素 import pandas as pddef question1():words = ['贾宝玉', '宝玉', '林黛玉', '黛玉']with open(&qu ...
- python红楼梦词云_用Python读红楼梦之——二、词云美化
原文链接 咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了. 我们先来找照片,这张照片不错,不过还是要 ...
- 用Python读红楼梦之——二、词云美化
原文连接 咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了. 我们先来找照片,这张照片不错,不过还是要 ...
- python _ 统计红楼梦人员姓名出现次数
python _ 统计红楼梦人员姓名出现次数 使用到jieba库 --Python 第三方中文分词库 1 安装jieba库 : 2 红楼梦 TXT 文档 import jieba txt = open ...
- python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计
python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...
最新文章
- mysql中检索以名字_【MySQL必知必会】第四章 检索数据
- IE6 / IE7 / Firefox 的margin问题解决办法
- Python学习笔记:循环语句
- 先判断对象是否为NULL再进行操作
- cf体验服_CF手游体验服_穿越火线枪战王者体验服申请_12月版本
- ttf_openfont可以多次调用吗_【译文】Rust futures: async fn中的thread::sleep和阻塞调用...
- 7-7 硬币找钱问题 (10 分)(思路+详解+double类型数据的处理)Come baby!!!!!!!!!!!!!!!!!!!!
- 《记得我们有约》17集
- 好用的下拉第三方——nicespinner
- php防止跨域提交,PHP防止跨域提交表单的简单示例
- 【华为云技术分享】一文带你了解Web前端发展历程
- 我与电脑1-初识电脑
- Kubernetes详解(十)——Pod对象高级控制命令
- C# 设置开机自启动
- 水经注万能地图下载器下载的瓦片如何应用到web端的cesium中
- win7下使用变色龙引导linux
- 微信小程序的组件传值
- 使用pip来对相应的版本进行降低的过程的
- AM335X 、AM5728 NOR flash启动
- 如何实现微信抢红包算法?
热门文章
- linux目录自动同步,linux 下面文件夹的自动同步 | Think in Drupal
- 1:1三相隔离变压器替代解决方案
- 计算机网络(二) | 网络编程基础、Socket套接字、UDP和TCP套接字编程
- 64位系统下编译PHP找不到库文件问题
- 汇编实例5——大小写的转换
- java项目下载后无法运行_eclipse不能在手机运行程序问题解决办法
- The Google File System(GFS)学习笔记
- 诛天者 pat basic 练习五十八 选择题
- STIL中的Pattern
- java 图片层级_UGUI图片层级和渲染顺序的奇怪关系