python三国演义人物 统计分析_python统计三国演义人物出场次数
[Python] 纯文本查看 复制代码import jieba
excludes = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此", "商议", "如何", "主公",
"军士", "左右", "军马", "引兵", "次日", "大喜", "天下", "东吴", "于是", "今日",
"不敢", "魏兵","人马", "陛下", "一人", "不知", "汉中", "只见", "众将"} #排除
txt = open("三国演义.txt", "r", encoding="utf-8").read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
elif word == "诸葛亮" or word == "孔明曰":
rword = "孔明"
elif word == "关公" or word == "云长":
rword = "关羽"
elif word == "玄德" or word == "玄德曰":
rword = "刘备"
elif word == "孟德" or word == "丞相":
rword = "曹操"
elif word == "公瑾" or word == "周都督":
rword = "周瑜"
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
#如果word在counts中,返回word对应的值,否则返回0
for word in excludes:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
fo = open("三国人物出场次数.txt", "a")
for i in range(10):
word, count=items[i]
word = str(word)
count = str(count)
fo.write(word)
fo.write(' ')
fo.write(count)
fo.write('\n')
print (word, count)
fo.close()
python三国演义人物 统计分析_python统计三国演义人物出场次数相关推荐
- python三国演义人物 统计分析_Python统计三国演义主要人物出场次数
import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...
- python统计文件中每个单词出现的次数_Python统计单词出现的次数
题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...
- python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...
问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...
- python统计字符出现的次数最多的字符_Python统计字符串中出现次数最多的人名
人名最多数统计 题目摘自https://python123.io 描述 编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名. ...
- python股票历史最低点_Python统计某一只股票每天的开盘,收盘,最高,最低价格!...
模块:Numpy 码字不易,转载请注明出处!十分感谢! 准备工作: 抓取某一只股票的信息,每30min为一组数据,可以参考上一篇: Note: 只为演示如何统计,更精准的可以抓取每5min为一组数据 ...
- python 计算数字位数_Python 统计位数为偶数的数字的代码
问题描述 给出一个整数数组 nums,请返回其中位数为偶数的数字的个数. 示例 1: 输入:nums = [12,345,2,6,7896] 输出:2 解释: 12 是 2 位数字(位数为偶数) 34 ...
- python中英文字频率_python统计文本字符串里单词出现频率的方法
本文实例讲述了python统计文本字符串里单词出现频率的方法.分享给大家供大家参考.具体实现方法如下: # word frequency in a text # tested with Python2 ...
- python中英文字频率_python 统计英语文档词汇出现频率,以六级真题为例
很多人免不了参加各种英语考试,词汇量就是参加英语考试的一个拦路虎,单词不认识,技巧再多也枉然.但考试大纲要求的单词太多了,时间紧,任务重,背了又容易忘,如果能知道真题中词汇出现的频率高低,那么有意识的 ...
- python中文词频排序_python统计词频并排序
Python 贝叶斯文本分类模型从原理到实现朴素贝叶斯分类器是一种有监督学习, 常见有两种模型, 多项式模型(multinomial model) 即为词频型和伯努利模型(Bernoulli mode ...
最新文章
- inline-block各浏览器兼容以及水平间隙问题解决方案
- WPF messagebox生命周期的探讨
- C/C++中涉及存储方式的关键字:auto,static,register,extern2009-01-22 11:23auto关键字:
- 百练2757:最长上升子序列
- Resolving Strong Reference Cycles for Closures
- c语言各种变量的优缺点,C语言优缺点
- ES5-5 参数默认值、递归、预编译、暗示全局变量
- 【C++ grammar】引用
- mac 安装brew及设置国内镜像
- 【华为云技术分享】智能诊断和优化,华为云DAS服务云DBA平台让您无忧运维
- 【SpringBoot】Spring boot 多数据源 no transaction is in progress EntityManager flush
- 2021秋季“金九银十”跳槽必备:软件测试面试题(附带答案)
- windows+Ubuntu双系统引导修复(终极版)
- linux搭建认证服务器,Linux上搭建FreeRadius服务器
- JavaEE高级框架学习笔记(八)Struts高级ActionForm
- webp 图片格式_使用WebP图像格式的完整指南
- 精益物流设计毕业论文【Flexsim仿真】
- 从正则表达式到NFA(Thompson算法)
- 树形动态规划之树的最大独立集
- 格林函数求解泊松方程介绍