用python统计英文文章词频
import rewith open("text.txt") as f:#读取文件中的字符串txt = f.read()#去除字符串中的标点、数字等txt = re.sub('[,\.()":;!@#$%^&*\d]|\'s|\'', '', txt)#替换换行符,大小写转换,拆分成单词列表word_list = txt.replace('\n',' ').replace(' ',' ').lower().split(' ')word_count_dict = {}for word in word_list:#统计字典中的词频if word in word_count_dict.keys():word_count_dict[word] += 1else:word_count_dict[word] =1#按照单词出现次数排序word_count_dict = sorted(word_count_dict.items(), key=lambda x:x[1], reverse=True)#输出到文件with open("word_count.txt", 'w')as f1:for i in word_count_dict:f1.write("%s\t%s\n" %(i[0],str(i[1])))
结果大概就是这样子了:
the 8
to 6
a 6
has 3
us 2
criminal 2
subpoenas 2
president 2
发现还有很多不完善的地方,在后续的学习中再改进!
用python统计英文文章词频相关推荐
- python 英语词频统计软件_Python实现统计英文文章词频的方法分析
本文实例讲述了Python实现统计英文文章词频的方法.分享给大家供大家参考,具体如下: 应用介绍: 统计英文文章词频是很常见的需求,本文利用python实现. 思路分析: 1.把英文文章的每个单词放到 ...
- python英文词频统计-Python实现统计英文文章词频的方法分析
本文实例讲述了Python实现统计英文文章词频的方法.分享给大家供大家参考,具体如下: 应用介绍: 统计英文文章词频是很常见的需求,本文利用python实现. 思路分析: 1.把英文文章的每个单词放到 ...
- python英文词频统计并按顺序输出_Python实现统计英文文章词频的方法分析
本文实例讲述了python实现统计英文文章词频的方法.分享给大家供大家参考,具体如下: 应用介绍: 统计英文文章词频是很常见的需求,本文利用python实现. 思路分析: 1.把英文文章的每个单词放到 ...
- 如何用python统计英语文章词频?
如何用python统计英语文章词频? **环境:**python3.0 需要统计的词频的txt文件(无中文) tips:word文档中一键替换中文([一-龥]) 代码如下 file = open('F ...
- python统计英文文本词频和提取文本关键词
统计一段英文的词频,以下代码只将标点符号省去,没有去除英文中介词,数词,人称代词等,如需要改进在统计时候直接去除相应词汇即可. #读取文本 txt = open("english.txt&q ...
- python统计英文文章中单词出现的次数并排序_Python读取英文文件并记录每个单词出现次数后降序输出示例...
Python读取英文文件并记录每个单词出现次数后降序输出示例 发布时间:2020-09-19 23:07:12 来源:脚本之家 阅读:126 作者:菜鸟虫师 本文实例讲述了Python读取英文文件并记 ...
- python统计英文文章中单词的个数无文件_求Python统计英文文件内单词个数的思路...
感谢微博上@刘鑫-MarsLiu的TAG每天一个小程序. 你会如何实现上述题目的要求? #!/usr/bin/env python # -*- coding: utf-8 -*- "&quo ...
- python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...
关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...
最新文章
- java中建立单链表_Java数据结构,单链表的建立
- JS代码报错 Uncaught SyntaxError: Unexpected token ,
- 百度搜索结果图文标识规则分析
- ceph rbdmap遇到的一个问题
- 菏泽合村并居促土地流转-农业大健康·万祥军:集约谋定高效
- AI 质检学习报告——学习篇——AI质检产生背景和发展过程
- java 分析excel模板_java如何读取Excel简单模板
- hive 时间转字符串_大数据面试杀招——Hive高频考点,还不会的进来挨打
- 31省份开学时间一览表
- 双表查询java代码_多表增删改查
- pb的webserver增加的方法发布后没有显示_震惊!!!Diboot 2.0.5 发布,让开发工作又快又爽...
- struts_login实例
- SQL order by的用法
- 互联网专用计算机屏保,18个Windows 98屏保,简直怀念!
- struts全局视图与局部视图
- C++ 赛码打字编程题
- 相似度计算(2)——皮尔逊相关系数
- 管理 Office com 加载项
- python等高线图平滑_用Matplotlib平滑等高线图中的数据
- 真不戳,基于C++泛型编程的职工管理系统
热门文章
- 20150615-OrCAD中自顶向下绘制层次原理图
- AIF (SAP Application Interface Framework)
- 计算机键盘上打分数如何表示,电脑excel中分数怎么打出来(图解excel分数输入法)...
- LDF explorer使用问题记录
- 智慧工地之基坑监测(转载)
- 对于“微信”和“微博”两款产品,从“社交”维度上来说,你认为二者有何区别?
- 一群微型四轴飞行器怎么玩
- 测试用例设计案例-登陆
- PBOC/EMV-交易流程详解--POS与卡片的数据交互进行分析
- 微信授权登录流程以及公众号配置方法(golang后端)