python英文文本高频词统计
统计出现频率最高的20个词,代码:
def getText():txt = open('comment.text','r',encoding='utf-8').read()txt = txt.lower()for ch in '`~!@#$%^&*()_+-={}[];":,./<>?\|':txt = txt.replace(ch," ")return txtcommentText = getText()
words = commentText.split()
# print(words)
counts = {}
for word in words:counts[word] = counts.get(word,0)+1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
print("出现频率最高的20个词:")
print("单词 出现次数")
for i in range(20):word,count = items[i]print("{0:<10}{1:>5}".format(word,count))
结果:
python英文文本高频词统计相关推荐
- 【编译原理】Python实现对一个英文文本的词频统计
利用Python实现对一个英文文本的词频统计.文本链接:https://www.philippinetimes.com/news/257886068/australia-blocks-chinese- ...
- python英文文本词频统计_python实现简单的英文词频统计
1 __author__ = 'Oscar_Yang' 2 #-*- coding= utf-8 -*- 3 #copyRight by OSCAR 4 """ 5 本脚 ...
- python英文文本词频统计代码_Python小程序:文本词频统计(英文+中文)
在学习了组合数据类型和文件操作之后就可以做出下面的文本词频统计的小程序了: 1. 下面是英文文本的词频统计,统计了作者的一篇英文论文 #文本词频统计:英文文本 def gettext(): #从文件中 ...
- python如何分析高频词_利用Python统计演讲高频词
1月9日被誉为中国最牛的产品经理张小龙做了微信的年度演讲[1],引爆朋友圈. 1月10日采铜写了篇<张小龙四个小时的演讲没有讲什么?>[2],又引爆朋友圈.在现在几乎所有人张口就谈&quo ...
- MATLAB计算英文符号信源熵,基于matlab的英文文本信息量的统计-正确.doc
基于matlab的英文文本信息量的统计-正确.doc 实验一英文文本信息量的计算一. 实验目的及要求a) 实验目的1. 通过本实验熟悉Matlab软件编程环境2. 编写M文件实现对英文文本信息量的统计 ...
- python根据文本生成词云图
python根据文本生成词云图 效果 代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analy ...
- python高频词统计_python几万条微博高频词分析
python几万条微博高频词分析 看到别人有做影视热评的分析统计,觉得挺好玩的,就来试试 看看效果 Screenshot_2018-05-21-11-00-42-879_com.master.wei. ...
- Python 英文文本字母跳转概率统计
# 英文文本字母跳转概率统计.py # 文本示例:hemlet.txt import csv def getText():txt = open("hamlet.txt"," ...
- python英文文本词频统计_Python英文文章词频统计(14份剑桥真题词频统计)
Python剑桥真题词频统计 最好还是要学以致用,自主搜集了19年最近的14份剑桥真题之后,通过Python提供的jieba第三方库,对所有的文章信息进行了词频统计,并选择性地剔除了部分简易词汇,比如 ...
最新文章
- 快速目标检测--YOLO-LITE: A Real-Time Object Detection Algorithm Optimized for Non-GPU Computers
- ubuntu下使用crontab定时器
- rabbitmq 延迟队列_框架系列|中间件RabbitMQ必看17道面试题
- 腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊
- 【Linux学习篇】This virtual machine is configured for 64-bit guest operating systems.……
- 华为鸿蒙安全认证,手机系统哪家强,华为鸿蒙系统获得国际安全标准最高等级认证,强不强?...
- 买二手房满二满五怎么理解?什么意思?
- 怀疑chinaitlab的一个Linux模块被黑了!!
- 【转载】Log4j配置详解之log4j.xml
- Java Reflection
- kinect相机的安装环境搭建以及测试
- 默认关闭IDEA的注释doc的rendered view模式
- spring 事物(一)—— 事物详解
- 学习Python,怎能不懂点PEP呢? 1
- 大扇区硬盘的出现与分析
- Unable to interpret the implicit parameter configuration with dataType
- 软科2018大学计算机,2018中国大学排名新发:软科2018中国大学排名结果
- 新研究!AI扫描视网膜即可预测心脏病;康奈尔大学『智能系统机器学习』课程;MLOps简化平台;公益活动报名小程序(开源);前沿论文 | ShowMeAI资讯日报
- Shell脚本中 双引号(“”)单引号(‘’)反引号(``)的区别
- SqlPlus访问oracle