python 统计英文词频 (以1986-2017年考研英语真题为例)

运行截图:

代码:

import re
#除去简单词、序号等
excludes = ['the', 'of', 'to', 'and', 'in', 'a', 'is', 'were', 'was', 'you','I', 'he', 'his', 'there', 'those', 'she', 'her', 'their','that', '[a]', '[b]', '[c]', '[d]', 'them', 'or','for','as','are','on','it','be','with','by','have','from','not','they','more','but','an','at','we','has','can','this','your','which','will','one','should','points)','________','________.','all','than','what','people','if','been','its','new','our','would','part','may','some','i','who','answer','when','most','so','section','no','into','do','only','each','other','following','had','such','much','out','--','up','these','even','how','directions:','use','because','(10','time','(15','[d].','-','it.','[b],','[a],','however,','1','c','1','2','b','d','a','(10','2','12','13','29','3','4','5','6','7','8','9','10','11','14','15','20','22','23','24','25','26','27']def gettext():txt=open("1986年到2017年考研英语2真题.txt","r").read()txt=txt.lower()for ch in '! " #$%&()*+,_./:;<=>?@[\\]^_`{|}~ ':txt=txt.replace(ch,"")return txtTxt=gettext()
words=Txt.split()
counts={}
for word in words:flag=Truefor word1 in excludes:if word==word1:flag=Falseelse:continue            if flag is True:counts[word]=counts.get(word,0)+1else:continuecountslist=list(counts.items())
countslist.sort(key=lambda x:x[1],reverse=True)for i in range(10):word,count=countslist[i]print("{0:<10}{1:>5}".format(word,count))

python 统计英文词频相关推荐

  1. python统计中英文字符个数-Python统计英文、中文、数字、空格等字符数

    Python统计字母.中文.数字.空格等字符数 # 统计一行字符的不同字符个数 str = input("请输入一行字符:") count1 = count2 = count3 = ...

  2. Python统计英文、中文、数字、空格等字符数

    Python统计字母.中文.数字.空格等字符数 参考文章:https://blog.csdn.net/Guo_Apple/article/details/69390107 # 统计一行字符的不同字符个 ...

  3. 用Python统计中英文词频

    本设计基于Python3.6实现中英文词频统计功能 英文词频统计 统计哈姆雷特英文版,txt格式文件地址: hamlet.txt 思路分析: 获取文件中词汇 转换为统一格式,如小写或者大写 切割词汇 ...

  4. python统计英文文章中单词出现的次数并排序_Python读取英文文件并记录每个单词出现次数后降序输出示例...

    Python读取英文文件并记录每个单词出现次数后降序输出示例 发布时间:2020-09-19 23:07:12 来源:脚本之家 阅读:126 作者:菜鸟虫师 本文实例讲述了Python读取英文文件并记 ...

  5. python统计英文文本词频和提取文本关键词

    统计一段英文的词频,以下代码只将标点符号省去,没有去除英文中介词,数词,人称代词等,如需要改进在统计时候直接去除相应词汇即可. #读取文本 txt = open("english.txt&q ...

  6. python英文词频统计去除定冠词_使用Python进行英文词频统计

    对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...

  7. 使用Python进行英文词频统计

    对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词.本文以<飘>为例,统计词频最高的前十位. 1.读取文件,通过lower().replace()函数将所有单词 ...

  8. 用python统计英文文章词频

    import rewith open("text.txt") as f:#读取文件中的字符串txt = f.read()#去除字符串中的标点.数字等txt = re.sub('[, ...

  9. python统计英文句子每个单词字数_Python小书3-文本英文单词统计

    之前写Python Web小书第三小节本来用的垃圾邮件的案例三郎:Python贝叶斯推理垃圾邮件分类​zhuanlan.zhihu.com 后来发现里面的东西,涉及到概率,程序太复杂了...哈哈哈 所 ...

最新文章

  1. 连接ORACLE实例
  2. install flash player plugin: linux 11.10 --chrome
  3. 046_Unicode对照表十二
  4. C/C++常见报错问题描述及解决方案
  5. 2016年8月份学习总结,读书《书都不会读,你还想成功》
  6. SecureCRT 或者 超级终端 始终无法ping通主机
  7. arcgis中的python字符串比较
  8. ajax post form上传图片,ajax怎样提交form表单与实现文件上传
  9. 平板电脑连接投影仪_苹果电脑如何连接投影仪 苹果Mac连接投影仪方法【详解】...
  10. 中telnet_web开发中的编码问题
  11. 记个SwitchButton笔记
  12. 编译android源码 太慢,记编译Android源码的经历
  13. 多线程JAVA篇(一)
  14. 用js判断ie版本,ie11被识别为ie7
  15. Clearcase no version selected issue
  16. 二叉树叶子结点个数——C++
  17. uni-app实现APP中打开第三方app
  18. word文档被锁定,无法编辑怎么办?(…
  19. mongoose时间自动转化为格林尼治标准时间的解决方案
  20. html生日快乐源代码

热门文章

  1. MFC中新建类在classview中没有显示问题
  2. 五子棋的禁手c++语言实现,C++实现简单五子棋游戏
  3. 寻找某个数c语言,C++_C语言实现两个递减数列中寻找某一个数,本文实例讲述了C语言实现两个 - phpStudy...
  4. opengl png图片 qt_QT中使用OpenGL绘图
  5. 配置python开发环境搭建_Eclipse配置Python开发环境
  6. argument type mismatch怎么解决_iPhone用户超10亿,iphone12隐藏优势终于被发现了_Type...
  7. linux 进程线程限制,LINUX停每进程限制线程数量
  8. python写小猪佩奇_【python】使用python自动画一只小猪佩奇(源码)-Go语言中文社区...
  9. php攻击方式及防御方法,Syn Flood 攻击 及其一般防御方法
  10. java 枚举 面试题_java 枚举(面试题)基本知识总结即简例