python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...
本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:
题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:
#coding=utf-8
import collections
import re
import os
useless_words=('the','a','an','and','by','of','in','on','is','to')
def get_important_word(file):
f=open(file)
word_counter=collections.Counter()
for line in f:
words=re.findall('\w+',line.lower())
word_counter.update(words)
f.close()
most_important_word=word_counter.most_common(1)[0][0]
count=2
while(most_important_word in useless_words):
most_important_word=word_counter.most_common(count)[count-1][0]
count+=1
num=word_counter.most_common(count)[count-1][1]
print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)
if __name__=='__main__':
filepath='.'
for dirpath,dirname,dirfiles in os.walk(filepath):
for file in dirfiles:
if os.path.splitext(file)[1]=='.txt':
abspath=os.path.join(dirpath,file)
if os.path.isfile(abspath):
get_important_word(abspath)
学习笔记:
collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法
PS:这里再为大家推荐2款相关统计工具供大家参考:
希望本文所述对大家Python程序设计有所帮助。
您可能感兴趣的文章:
python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...相关推荐
- python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...
关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...
- 学校作业5_3字符串_统计英文文件中的单词数(头哥作业[Python])
本系列文章为同学困扰的python做出作业答案汇总,答案皆为本学生自己边学边做汇总上传的,编排不易,希望大家喜欢. 本作业所有内容均在github上有留存,每次作业github上会最先发布,CSDN上 ...
- java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...
- 统计英文句子中的单词个数,并且输出每个单词
package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...
- java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...
- Python代码 | 文本操作 统计英文文本中,每个字母出现的次数
Python代码 | 文本操作 统计英文文本中,每个字母出现的次数 # -*- coding: utf-8 -*- # 使用oepn获取文件路径 # path=open("arrogant. ...
- 【java】统计英文文本中某些字母出现的次数
如何统计英文文本中某些字母出现的次数 public class Java_3 {public static void main(String[] args) {String text = " ...
- python 如何删除excel中带有删除线的特定字符串保留没有删除线的单词
python 如何删除excel中带有删除线的特定字符串保留没有删除线的单词 注意:经验证 Mac必须安装Microsoft Excel app 但不一定OK import xlwings as xw ...
- 编程从键盘输入一个字符串,统计该字符串中从‘a‘到‘z‘共26个小写字母各自出现的次数, 将结果存入数组中,并输出
/*编程从键盘输入一个字符串,统计该字符串中从'a'到'z'共26个小写字母各自出现的次数, 将结果存入数组中,并输出*/ #include<stdio.h> #include<st ...
最新文章
- 黑马程序员Linux系统开发视频之VIM使用教程
- mysql-5.5.8_MySQL5.5.8安装
- 利用envi对landsat8数据进行处理
- Python操作MySQL存储,这些你都会了吗?
- 传统形态抗锯齿 2.0
- 斯蒂文斯理工学院计算机专业,斯蒂文斯理工学院的计算机专业如何?
- iOS如何完成蓝牙打印机功能
- 长白县积极建设精准扶贫云平台
- 【百度地图API】JS版本的常见问题
- iOS 加密算法之MD5加密使用
- 服务器四通道内存性能提升,三通道和四通道的性能差距是多少
- 我的企业使用虚拟信用卡支付有什么优势
- React全家桶+AntD 实战二
- Scroller源码详解
- 新人程序员必须知道的,不然等你回过神来的时候,一切已晚矣。
- 五子棋——人机博弈(Java实现)
- hao123网站需要服务器吗,我已经设置“www.hao123.com”为我的主页了,可是打开IE还是“http://www.k986.com/”这个网站,也查不出毒,怎么办?...
- Java开源 之随机生成中文姓名,手机号,邮编,住址
- 本地代码如何提交到远程,克隆的和不克隆,两种方法
- Revenge Storm高帮 x_这次给大家介绍一下Revenge x Storm