Python实现英文词频统计:以hamlet为例
代码和hamlet.txt需要置于同一目录
#CalWordNum.py
def GetTxt():txt=open("hamlet.txt",'r').read()txt=txt.lower()for ch in "!'#$%&()*+,-./:'<=>?@[\\]^-‘{|}~": #将特殊符号替换为空格txt=txt.replace(ch," ")return txthamlet=GetTxt()
words=hamlet.split() #split返回列表类型
count={} #创建字典
for word in words:count[word]=count.get(word,0)+1
items=list(count.items()) #转换成列表
items.sort(key=lambda x:x[-1],reverse=True)
for i in range(10):word,count=items[i]print("{0:<10}{1:>5}".format(word,count))
RESTART: C:/Users/QinJX/AppData/Local/Programs/Python/Python37-32/python编程学习/10CalWordNum.py
the 1143
and 966
to 762
of 669
i 629
a 546
you 544
my 514
hamlet 467
in 451
Python实现英文词频统计:以hamlet为例相关推荐
- python英文词频统计去除定冠词_使用Python进行英文词频统计
对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...
- 使用Python进行英文词频统计
对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...
- Python 《Hamlet》哈姆雷特英文词频统计
英文词频统计 关键问题: 1.词语 -- 键 2.相同词语的累加 -- 值 讨论:定义什么数据类型 -- 字典类型 问题描述: I:文件的输入 P:采用字典类型的结构统计词语出现的频率 O:每个单词及 ...
- Python英文词频统计(哈姆雷特)程序示例
今天继续给大家介绍Python相关知识,本文主要内容是Python英文词频统计程序示例,主要是对英文文本--<哈姆雷特>进行分词. 一.英文文本词频统计思路 想要对<哈姆雷特> ...
- 浅析如何用Python进行中英文词频统计
浅析如何用Python进行中英文词频统计 主要思路: 读取数据 数据预处理 分词 词频统计 结果显示 词频统计 TF-IDF(term frequency–inverse document frequ ...
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(1/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
- 组合数据类型练习,英文词频统计实例上(2017.9.22)
字典实例:建立学生学号成绩字典,做增删改查遍历操作. sno=['33号','34号','35号','36号'] grade=[100,90,80,120] d={'33号':100,'34号':90 ...
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
- 组合数据类型练习,英文词频统计实例上
1.name=['陈楠芸','陈文琪','刘书签','杨必须'] scores=[7,6,6,5] d={'陈楠芸':7,'陈文琪':6,'刘书签':6,'杨必须':5} print(d) #增加 d ...
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(2/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
最新文章
- 谷歌的深度学习在AI芯片中找到了一条关键路径
- vs2013编译apr时遇到的疑难杂症
- spring mvc 文件上传 form表单
- 【案例】无线串口模块 星型网络组网 案例
- controller控制器怎么写_I2C控制器编程_框架
- 怎么做95置信区间图_这种动态的OD图怎么做?简单3步快速搞定
- CentOS7安装Python3.4 ,让Python2和3共存
- Java7并发编程指南——第七章:定制并发类
- java 有序容器_Java 容器集合框架概览
- 关于实现servlet中心控制的Front Controller Pattern
- lfw分类 python_LFW精确度验证__python读写txt
- 李佳琦、薇娅们的残酷生存物语
- Linux查看服务器SN序列码
- Python Data mining - Enron Email Dataset
- vue延迟渲染组件_Vue 动态组件渲染问题分析
- 百变小鹿机器人金鸡奖登场,成为首个走上红毯的机器人
- 从阿里云下载centos的步骤
- 讯飞语音——文字转换语音
- 如何批量在图片上加统一的文字?
- 第二批计算机专业有哪些学校,本科第二批院校名单
热门文章
- 统计学之算术平均数、调和平均数、几何平均数、位置平均数详解
- 鸡你太美,用大数据扒一扒蔡徐坤的真假流量粉
- 【网络通信 -- 直播】网络通信协议简介 -- RTP 协议的 H264 封包
- python绘制网络拓扑图_python 画网络拓扑图
- BZOJ 2339 [HNOI2011]卡农
- 飞鱼星路由器如何限制外网访问服务器网站,飞鱼星路由器指定ip/mac禁止上网设置教程...
- 为什么大厂程序员的另一半全职太太比例特别多?
- 实验室信息管理系统LIMS的25个典型模块
- JDK1.5版本新增特性
- linux/debian安装wps以及缺失字体,亲测可用