统计哈姆雷特文本中高频词的个数
统计哈姆雷特文本中高频词的个数
三国演义人物出场统计
开源代码
讲解视频
kou@ubuntu:~/python$ cat ClaHamlet.py
#!/usr/bin/env python
# coding=utf-8#e10.1CalHamlet.py
def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ") #将文本中特殊字符替换为空格return txt
hamletTxt = getText()
words = hamletTxt.split()
counts = {}
for word in words: counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))
统计哈姆雷特文本中高频词的个数相关推荐
- 编写程序统计从键盘输入的一行文本中各个字母的个数。 输入以回车键结束。 不区分大小写,大写字母与相应的小写字母按照同一个字母看待。 要求输出按照各个字母出现的个数从大到小进行排序,出现的个数相同的,按
编写程序统计从键盘输入的一行文本中各个字母的个数. 输入以回车键结束. 不区分大小写,大写字母与相应的小写字母按照同一个字母看待. 要求输出按照各个字母出现的个数从大到小进行排序,出现的个数相同的,按 ...
- python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...
关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...
- python 统计哈姆雷特词汇频率_Python练习15:文本单词频率统计:哈姆雷特,练习题,英文版...
文本词频统计::一篇文章,出现了哪些词?哪些词出现的最多? ...
- 统计单词频率 java_java 统计一个(英文)文本中频率最高的10个单词
要求: 统计一个(英文)文本中频率最高的10个单词 解决思路:1.通过java I/O操作读取文本文件 2.用BufferedReader每次读取文本的一行(即为一个String) 3.将取得的Str ...
- python 统计哈姆雷特词汇频率
基础语法解决------>哈姆雷特词频统计 ''' Text word frequency statistics use wordcloud'''import wordcloud import ...
- python哈姆雷特词频统计_python—文本词频统计 哈姆雷特 txt 下载
原博文 2020-05-13 15:49 − 文本词频统计 -- Hamlet Hamlet下载 链接:https://pan.baidu.com/s/1Is2mBAED57i6nI38lcnXAA ...
- Python快速统计文件中高频词
思路: 1.通过jieba库获取所有词语列表: 2.计算列表里出现词语及其对应的词频,存储在字典中: 3.对字典里的词语按照频次进行排列: 4.输出频次前十的词语及其频次: jieba库的安装 需要c ...
- 文本挖掘(四万字总结篇:爬虫 - 文本预处理 - 高频词统计 - 聚类 - 情感分析)
1 爬虫 1.1 爬虫原理 这部分内容可以跳过,掌握与否对后面内容的阅读影响并不大,但有兴趣的话可以看看呐~ 实现一个爬虫,一般需要经过两个步骤:处理请求和解析源码/数据. 处理请求方面,我们 ...
- 统计文本中出现的单词个数频率
import rewith open('a.txt','r') as f:dict={} # 对应存放 单词 和 频率for line in f.readlines():word_list = re. ...
最新文章
- Linux编程之自定义消息队列
- 逻辑漏洞-找回密码修改返回包
- 让Windwos Server 2008 R2 SP1的FTP真正能访问
- 《黑客秘笈——渗透测试实用指南(第2版)》—第2章2.7节总结
- requestIdleCallback函数
- Composer Player 属性设置
- 周报_2013第02周(2013/01/06-2013/01/12)
- atitit。ocr框架类库大全 attilax总结
- Ubuntu 安装sopcast-player看网络电视
- 函数发生器课程设计(Multisim仿真+PCB实物)
- 前端实训-遮罩+遮罩动画
- EN 15650: 通风口CE认证
- Householder变换、Givens旋转与QR分解
- 【WLAN】Wi-Fi Direct 用户指南
- java 网络流量统计_【Java】人流量统计-动态版之摄像头识别显示
- 怎么申请企业邮箱?注册流程是什么?【企业邮箱申请流程】
- 大气等离子表面处理机 金铂利莱
- spring的自定义标签
- java高级用法之:无所不能的java,本地方法调用实况
- 夏天到了,专家教你如何挤乳沟
热门文章
- 在 Snoop 中使用 PowerShell 脚本进行更高级的 UI 调试
- 《程序设计与数据结构》第3周学习总结
- [团队项目3.0]Scrum团队成立
- pat00-自测5. Shuffling Machine (20)
- struts2自定义拦截器一——模拟登陆权限验证
- HK-2000 数采仪系统说明之 5.H2000SService程序调用说明
- mootools框架【十】-mootools深层探讨
- mysql用户 11_MySQL-快速入门(11)用户管理
- jmeter找不到java.dll_Windows下Jmeter安装出现Not able to find Java executable or version问题解决方案...
- c语言c1变成e并输出,【图片】(原创)用纯C变了个变色输出字符的程序。。。【c语言吧】_百度贴吧...