代码和hamlet.txt需要置于同一目录

#CalWordNum.py
def GetTxt():txt=open("hamlet.txt",'r').read()txt=txt.lower()for ch in "!'#$%&()*+,-./:'<=>?@[\\]^-‘{|}~":   #将特殊符号替换为空格txt=txt.replace(ch," ")return txthamlet=GetTxt()
words=hamlet.split()    #split返回列表类型
count={}    #创建字典
for word in words:count[word]=count.get(word,0)+1
items=list(count.items())   #转换成列表
items.sort(key=lambda x:x[-1],reverse=True)
for i in range(10):word,count=items[i]print("{0:<10}{1:>5}".format(word,count))

RESTART: C:/Users/QinJX/AppData/Local/Programs/Python/Python37-32/python编程学习/10CalWordNum.py
the        1143
and         966
to          762
of          669
i           629
a           546
you         544
my          514
hamlet      467
in          451

Python实现英文词频统计:以hamlet为例相关推荐

  1. python英文词频统计去除定冠词_使用Python进行英文词频统计

    对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...

  2. 使用Python进行英文词频统计

    对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...

  3. Python 《Hamlet》哈姆雷特英文词频统计

    英文词频统计 关键问题: 1.词语 -- 键 2.相同词语的累加 -- 值 讨论:定义什么数据类型 -- 字典类型 问题描述: I:文件的输入 P:采用字典类型的结构统计词语出现的频率 O:每个单词及 ...

  4. Python英文词频统计(哈姆雷特)程序示例

    今天继续给大家介绍Python相关知识,本文主要内容是Python英文词频统计程序示例,主要是对英文文本--<哈姆雷特>进行分词. 一.英文文本词频统计思路 想要对<哈姆雷特> ...

  5. 浅析如何用Python进行中英文词频统计

    浅析如何用Python进行中英文词频统计 主要思路: 读取数据 数据预处理 分词 词频统计 结果显示 词频统计 TF-IDF(term frequency–inverse document frequ ...

  6. Hadoop的改进实验(中文分词词频统计及英文词频统计)(1/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  7. 组合数据类型练习,英文词频统计实例上(2017.9.22)

    字典实例:建立学生学号成绩字典,做增删改查遍历操作. sno=['33号','34号','35号','36号'] grade=[100,90,80,120] d={'33号':100,'34号':90 ...

  8. Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  9. 组合数据类型练习,英文词频统计实例上

    1.name=['陈楠芸','陈文琪','刘书签','杨必须'] scores=[7,6,6,5] d={'陈楠芸':7,'陈文琪':6,'刘书签':6,'杨必须':5} print(d) #增加 d ...

  10. Hadoop的改进实验(中文分词词频统计及英文词频统计)(2/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

最新文章

  1. 谷歌的深度学习在AI芯片中找到了一条关键路径
  2. vs2013编译apr时遇到的疑难杂症
  3. spring mvc 文件上传 form表单
  4. 【案例】无线串口模块 星型网络组网 案例
  5. controller控制器怎么写_I2C控制器编程_框架
  6. 怎么做95置信区间图_这种动态的OD图怎么做?简单3步快速搞定
  7. CentOS7安装Python3.4 ,让Python2和3共存
  8. Java7并发编程指南——第七章:定制并发类
  9. java 有序容器_Java 容器集合框架概览
  10. 关于实现servlet中心控制的Front Controller Pattern
  11. lfw分类 python_LFW精确度验证__python读写txt
  12. 李佳琦、薇娅们的残酷生存物语
  13. Linux查看服务器SN序列码
  14. Python Data mining - Enron Email Dataset
  15. vue延迟渲染组件_Vue 动态组件渲染问题分析
  16. 百变小鹿机器人金鸡奖登场,成为首个走上红毯的机器人
  17. 从阿里云下载centos的步骤
  18. 讯飞语音——文字转换语音
  19. 如何批量在图片上加统一的文字?
  20. 第二批计算机专业有哪些学校,本科第二批院校名单

热门文章

  1. 统计学之算术平均数、调和平均数、几何平均数、位置平均数详解
  2. 鸡你太美,用大数据扒一扒蔡徐坤的真假流量粉
  3. 【网络通信 -- 直播】网络通信协议简介 -- RTP 协议的 H264 封包
  4. python绘制网络拓扑图_python 画网络拓扑图
  5. BZOJ 2339 [HNOI2011]卡农
  6. 飞鱼星路由器如何限制外网访问服务器网站,飞鱼星路由器指定ip/mac禁止上网设置教程...
  7. 为什么大厂程序员的另一半全职太太比例特别多?
  8. 实验室信息管理系统LIMS的25个典型模块
  9. JDK1.5版本新增特性
  10. linux/debian安装wps以及缺失字体,亲测可用