def getText(): #赋予txt哈姆雷特小说-全英文小写-全符号变空格-返回txt

txt = open('hamlet.txt','r').read()#注意文本的路径

txt = txt.lower()#文本字符全部转变为小写字母

for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':

txt = txt.replace(ch," ") #使用空格字符替换掉文本中所有特殊字符

return txt

hamletTxt = getText() #调用函数

words = hamletTxt.split()#以空字符做列表返回

counts = {}#创建一个空字典

for word in words:

counts[word] = counts.get(word,0) + 1#get不到word就创建word为下标的值0+1,如果get到了就在word的值上加1,然后更新字典

items = list(counts.items())#字典的键值对变成列表

items.sort(key=lambda x:x[1],reverse=True)#以出现次数为标准排列,从大到小

for i in range(10):

word,count = items[i]

print('{0:<10},{1:>5}'.format(word,count))

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com

特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

python哈姆雷特字数统计_python 哈姆雷特 字数统计 词云相关推荐

  1. Python零基础速成班-第12讲-Python获取网络数据Socket,API接口,网络爬虫Crawler(制作弹幕词云)

    Python零基础速成班-第12讲-Python获取网络数据Socket,API接口,网络爬虫Crawler(制作弹幕词云) 学习目标 获取网络数据Socket API接口 网络爬虫Crawler(制 ...

  2. 数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化...

    全文下载链接:http://tecdat.cn/?p=28877 作者:Yunfan Zhang Twitter是一家美国社交网络及微博客服务的网站,致力于服务公众对话.迄今为止,Twitter的日活 ...

  3. python爬取bilibili弹幕_python爬虫:bilibili弹幕爬取+词云生成

    如果你懒得看下边的文字,我录了一个完整的教学视频在b站上. 我的B站教学:https://www.bilibili.com/video/av75377135?p=2 工作原理 b站是提供弹幕接口的,所 ...

  4. python wordcloud详解_Python+wordcloud十分钟学会生成英文词云

    基于python生成的wordcloud 词云在这两年一直都热门话题,如果你耐下性子花个10分钟看看这篇文章,或许你就再也不用羡慕那些会词云的人了.这不是一项高深莫测的技术,你也可以学会.快来试试吧! ...

  5. Python文本分析实战:《跨越星弧》TapTap玩家评论内容词云分析

    许久之前写了一篇<Python网络爬虫实战>的博客,里面讲了爬虫的过程,但是没有讲如何分析.这次讲述一下用如何通过词云分析,来从这些文本数据里面获得结论 首先,回顾一下分析背景 主要是看了 ...

  6. bilibili怎么设置弹幕数量_python爬虫:bilibili弹幕爬取+词云生成

    如果你懒得看下边的文字,我录了一个完整的教学视频在b站上. 我的B站教学:https://www.bilibili.com/video/av75377135?p=2 工作原理 b站是提供弹幕接口的,所 ...

  7. Python爬虫之js加密破解,抓取网易云音乐评论生成词云

    js破解历程 前言 技能点 界面概况 静态网页动态网页 页面解析 step1: 找参数step2:分析js函数step3:分析参数step4: 校验step5:转为python代码 编写爬虫 很多人学 ...

  8. python生成QQ机器人爬取百度文库链接推送好友并生成词云

    QQ机器人爬取百度文库链接推送好友并生成词云 一.环境准备 二.实现QQ机器人 1.QQ机器人介绍 2.安装方法 3.实现自己的QQ机器人 三.百度文库内容链接爬取推送好友 代码实现: 思路分析 1. ...

  9. python哈姆雷特词频统计_Python练习题15:文本词频统计:英文版哈姆雷特

    文本词频统计::一篇文章,出现了哪些词?哪些词出现的最多? ‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬ ...

最新文章

  1. html5 data url,HTML5 / Javascript – DataURL到Blob和Blob到DataURL
  2. c语言u64数据类型打印,小谈C语言中常见数据类型在32及64位机上的使用
  3. 单日2000W+订单,如何忙中不错?美团外卖业务异常检测实践详解
  4. python将一组数据转化为列表_python如何将一个全部为int的列表,转化为全部为str的列表...
  5. C++实现AOE网中的关键路径算法及机动时间计算算法(邻接表存储)
  6. JAVA读写文件模板
  7. 训练赛20160403
  8. qt qss设置字体大小_Qt编写输入法V2019终极版
  9. 欧姆龙cp1h指令讲解_欧姆龙PLC功能指令
  10. 《Gradle实战》如何配置利用Maven本地仓库
  11. 蚌埠学院计算机基础,蚌埠学院电子教务登录
  12. linux中括号的用法,【shell】Linux shell中括号的用法
  13. eNom域名转出图文教程:域名解锁、获取域名转移密码
  14. 基本的Dos命令以及Windows常用命令
  15. canvas画圆环(一)之渐变色,纯色
  16. Unhandled promise rejection --解决办法
  17. 中国式IT运维,趟出自己的“长期主义”河流
  18. 【企业微信开发】企业微信开发测试推送应用消息流程
  19. 在新学期,立新规划!
  20. 记 · H2-2光猫telnet破解超管密码

热门文章

  1. 【打开方式问题解决】该文件没有与之关联的应用来执行该操作。请安装应用,若已经安装应用,请在“默认应用设置“页面中创建关联。
  2. FilterChain 过滤器链和拦截路径
  3. php程序员述职材料_php程序员述职报告(多篇范文)
  4. 秒懂Android属性动画
  5. VUE+WebPack游戏设计:欲望都市城市图层的设计
  6. 奇虎360_2017校园招聘笔试编程题第二题
  7. python findall函数用法_Python--re模块的findall等用法
  8. ✨【Code皮皮虾】一次通过99.90%,思路详解【找到需要补充粉笔的学生编号】
  9. 幸存者偏差(survivorship bias)
  10. 极智读书 | 《树莓派开始,玩转Linux》读书分享