def getText(): #赋予txt哈姆雷特小说-全英文小写-全符号变空格-返回txt

txt = open('C:/Users/eternal/Desktop/hamlet.txt','r').read()  #路径要选好

txt = txt.lower()

for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':

txt = txt.replace(ch," ")

return txt

hamletTxt = getText()

words = hamletTxt.split()  #以空字符做列表返回

counts = {}

for word in words:

counts[word] = counts.get(word,0) + 1    #get不到word就创建word为下标的值0+1,如果get到了就在word的值上加1,然后更新字典

items = list(counts.items())            #字典的键值对变成列表

items.sort(key=lambda x:x[1],reverse=True)    #以出现次数为标准排列,从大到小

print(items)

for i in range(10):

word,count = items[i]

print('{0:<10}{1:>5}'.format(word,count))

python哈姆雷特词频统计_【Python】哈姆雷特字数统计相关推荐

  1. python哈姆雷特词频统计_《哈姆雷特与三国演义》词频统计,Hamlet,和

    利用python实现对中英文文本的词频统计 英文文本<Hamlet> code1: #CalHamlet.py def getText(): txt = open("hamlet ...

  2. 如何用python处理excel简单考勤统计_如何使用Excel快速考勤,统计迟到早退等情况?...

    作为人事考勤人员(我不是),每月面对成千上万的考勤打卡记录,用眼睛逐个考核....请问眼睛还好吗(手动滑稽) 文笔不好,直接上干货吧 有如下原始考勤数据:原始打卡数据 由于员工害怕打卡失败,会多次重复 ...

  3. python词云需要导入什么包_[python] 词云:wordcloud包的安装、使用、原理(源码分析)、中文词云生成、代码重写...

    词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思.常见于博客. ...

  4. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  5. webstorm代码行数统计_【Rust每周一库】Tokei 统计代码行数等信息的实用工具

    Tokei是一个按语言统计代码行数等统计信息的工具.其实这些信息还是非常有用的,首先程序猿可以用它来估计别人的实力或者观察自己实力成长的速度(神马,行数论英雄么?).其次,管理人员可以用它来估计工程的 ...

  6. 51cto python数据分析系列课程 55g_热图_ Python数据分析系列视频课程--玩转数据可视化_数据可视化视频-51CTO学院...

    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...

  7. 统计_偏态、峰值(Datawhale概率统计温习2)

    文章目录 一.偏度与峰度概念 1.1 偏度 1.2 峰度 二.python实现 一.偏度与峰度概念 1.1 偏度 偏度(skewness):也称为偏态,是统计数据分布偏斜方向和程度的度量,是统计数据分 ...

  8. mysql多字段数据统计_超详细的mysql元数据sql统计--information_schema

    概述 information_schema 数据库跟 performance_schema 一样,都是 MySQL 自带的信息数据库.其中 performance_schema 用于性能分析,而 in ...

  9. python调用百度地图画轨迹图_[python]百度地图API,正/逆地理编码,路线规划接口的调用,实现输出出行的距离和......

    [Python] 纯文本查看 复制代码''' 文件名:L17.py 作者:小饭团 创建时间:2019年1月11日15:17:03 文件描述:调用Web服务API接口,百度地图路线规划 正/逆地理编码 ...

  10. java字符数统计_【JAVA300例】51、统计输入的字符串中各种字符的字符数

    char类型需要单引号. import java.util.Scanner; public class Test054{ public static void main(String[] args){ ...

最新文章

  1. 基于RDKit的Python脚本:SDF格式转SMILES格式
  2. leetcode : Reverse Linked List II [two pointers]
  3. Android开发常用开源框架:图片处理
  4. Python函数中apply、map、applymap的区别
  5. 限制排列与棋盘多项式
  6. go 用 mysql web开发环境_简单讲解Go程序中使用MySQL的方法
  7. 全网首发 PowerBI 秒级实时大屏通用解决方案
  8. ASP.Net/C# - PayPal接口文档
  9. aix系统输入oracle命令,aix 简单的系统命令
  10. bzoj 1673: [Usaco2005 Dec]Scales 天平(DFS)
  11. scrapy xpath空列表_我的第一个爬虫——Scrapy爬虫详细操作入门指南(1)
  12. 对计算机硬盘进行格式化时,在安装操作系统之前,如何对硬盘进行分区和格式化(新手必看)...
  13. 用微PE安装KALI LINUX到U盘,【U盘安装kali】U盘 kali pe三合一教程!装机,存储
  14. 荣耀笔记本linux版拆机,拆机荣耀 MagicBook 锐龙版,真材实料一眼看到
  15. Java SE 12 新增特性
  16. serviceWorker 服务器与浏览器之间的代理
  17. 什么是搜索引擎关键词?搜索引擎关键词优化
  18. 快速拥有自己的博客,语雀或许是不错的选择
  19. 海康威视主码流和子码流的区别
  20. 开源的压力测试工具 PyLot

热门文章

  1. C++构造函数初始化列表与构造函数中的赋值的区别
  2. 什么是舆情监控,舆情监控是什么?
  3. 如何在Windbg中安装mona
  4. mysql vb.net odbc_在VB.net中连接MySql的类库_MySQL
  5. couldnt find pybind11Config.cmake
  6. 多语言机器翻译 | (2) 编解码器结构
  7. DirectX 图形接口指南
  8. 面试必问题之Docker分布式搭建
  9. 学习笔记19—dpabi错误集
  10. Camera Tuning