统计哈姆雷特文本中高频词的个数

三国演义人物出场统计

开源代码
讲解视频

kou@ubuntu:~/python$ cat ClaHamlet.py
#!/usr/bin/env python
# coding=utf-8#e10.1CalHamlet.py
def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ")   #将文本中特殊字符替换为空格return txt
hamletTxt = getText()
words  = hamletTxt.split()
counts = {}
for word in words:          counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))

统计哈姆雷特文本中高频词的个数相关推荐

  1. 编写程序统计从键盘输入的一行文本中各个字母的个数。 输入以回车键结束。 不区分大小写,大写字母与相应的小写字母按照同一个字母看待。 要求输出按照各个字母出现的个数从大到小进行排序,出现的个数相同的,按

    编写程序统计从键盘输入的一行文本中各个字母的个数. 输入以回车键结束. 不区分大小写,大写字母与相应的小写字母按照同一个字母看待. 要求输出按照各个字母出现的个数从大到小进行排序,出现的个数相同的,按 ...

  2. python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...

    关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...

  3. python 统计哈姆雷特词汇频率_Python练习15:文本单词频率统计:哈姆雷特,练习题,英文版...

    文本词频统计::一篇文章,出现了哪些词?哪些词出现的最多? ‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬ ...

  4. 统计单词频率 java_java 统计一个(英文)文本中频率最高的10个单词

    要求: 统计一个(英文)文本中频率最高的10个单词 解决思路:1.通过java I/O操作读取文本文件 2.用BufferedReader每次读取文本的一行(即为一个String) 3.将取得的Str ...

  5. python 统计哈姆雷特词汇频率

    基础语法解决------>哈姆雷特词频统计 ''' Text word frequency statistics use wordcloud'''import wordcloud import ...

  6. python哈姆雷特词频统计_python—文本词频统计 哈姆雷特 txt 下载

    原博文 2020-05-13 15:49 − 文本词频统计 -- Hamlet Hamlet下载 链接:https://pan.baidu.com/s/1Is2mBAED57i6nI38lcnXAA ...

  7. Python快速统计文件中高频词

    思路: 1.通过jieba库获取所有词语列表: 2.计算列表里出现词语及其对应的词频,存储在字典中: 3.对字典里的词语按照频次进行排列: 4.输出频次前十的词语及其频次: jieba库的安装 需要c ...

  8. 文本挖掘(四万字总结篇:爬虫 - 文本预处理 - 高频词统计 - 聚类 - 情感分析)

    1 爬虫 1.1 爬虫原理 这部分内容可以跳过,掌握与否对后面内容的阅读影响并不大,但有兴趣的话可以看看呐~   实现一个爬虫,一般需要经过两个步骤:处理请求和解析源码/数据.   处理请求方面,我们 ...

  9. 统计文本中出现的单词个数频率

    import rewith open('a.txt','r') as f:dict={} # 对应存放 单词 和 频率for line in f.readlines():word_list = re. ...

最新文章

  1. Linux编程之自定义消息队列
  2. 逻辑漏洞-找回密码修改返回包
  3. 让Windwos Server 2008 R2 SP1的FTP真正能访问
  4. 《黑客秘笈——渗透测试实用指南(第2版)》—第2章2.7节总结
  5. requestIdleCallback函数
  6. Composer Player 属性设置
  7. 周报_2013第02周(2013/01/06-2013/01/12)
  8. atitit。ocr框架类库大全 attilax总结
  9. Ubuntu 安装sopcast-player看网络电视
  10. 函数发生器课程设计(Multisim仿真+PCB实物)
  11. 前端实训-遮罩+遮罩动画
  12. EN 15650: 通风口CE认证
  13. Householder变换、Givens旋转与QR分解
  14. 【WLAN】Wi-Fi Direct 用户指南
  15. java 网络流量统计_【Java】人流量统计-动态版之摄像头识别显示
  16. 怎么申请企业邮箱?注册流程是什么?【企业邮箱申请流程】
  17. 大气等离子表面处理机 金铂利莱
  18. spring的自定义标签
  19. java高级用法之:无所不能的java,本地方法调用实况
  20. 夏天到了,专家教你如何挤乳沟

热门文章

  1. 在 Snoop 中使用 PowerShell 脚本进行更高级的 UI 调试
  2. 《程序设计与数据结构》第3周学习总结
  3. [团队项目3.0]Scrum团队成立
  4. pat00-自测5. Shuffling Machine (20)
  5. struts2自定义拦截器一——模拟登陆权限验证
  6. HK-2000 数采仪系统说明之 5.H2000SService程序调用说明
  7. mootools框架【十】-mootools深层探讨
  8. mysql用户 11_MySQL-快速入门(11)用户管理
  9. jmeter找不到java.dll_Windows下Jmeter安装出现Not able to find Java executable or version问题解决方案...
  10. c语言c1变成e并输出,【图片】(原创)用纯C变了个变色输出字符的程序。。。【c语言吧】_百度贴吧...