本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:

题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:

#coding=utf-8

import collections

import re

import os

useless_words=('the','a','an','and','by','of','in','on','is','to')

def get_important_word(file):

f=open(file)

word_counter=collections.Counter()

for line in f:

words=re.findall('\w+',line.lower())

word_counter.update(words)

f.close()

most_important_word=word_counter.most_common(1)[0][0]

count=2

while(most_important_word in useless_words):

most_important_word=word_counter.most_common(count)[count-1][0]

count+=1

num=word_counter.most_common(count)[count-1][1]

print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)

if __name__=='__main__':

filepath='.'

for dirpath,dirname,dirfiles in os.walk(filepath):

for file in dirfiles:

if os.path.splitext(file)[1]=='.txt':

abspath=os.path.join(dirpath,file)

if os.path.isfile(abspath):

get_important_word(abspath)

学习笔记:

collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法

PS:这里再为大家推荐2款相关统计工具供大家参考:

希望本文所述对大家Python程序设计有所帮助。

您可能感兴趣的文章:

python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...相关推荐

  1. python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...

    关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...

  2. 学校作业5_3字符串_统计英文文件中的单词数(头哥作业[Python])

    本系列文章为同学困扰的python做出作业答案汇总,答案皆为本学生自己边学边做汇总上传的,编排不易,希望大家喜欢. 本作业所有内容均在github上有留存,每次作业github上会最先发布,CSDN上 ...

  3. java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...

  4. 统计英文句子中的单词个数,并且输出每个单词

    package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...

  5. java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...

  6. Python代码 | 文本操作 统计英文文本中,每个字母出现的次数

    Python代码 | 文本操作 统计英文文本中,每个字母出现的次数 # -*- coding: utf-8 -*- # 使用oepn获取文件路径 # path=open("arrogant. ...

  7. 【java】统计英文文本中某些字母出现的次数

    如何统计英文文本中某些字母出现的次数 public class Java_3 {public static void main(String[] args) {String text = " ...

  8. python 如何删除excel中带有删除线的特定字符串保留没有删除线的单词

    python 如何删除excel中带有删除线的特定字符串保留没有删除线的单词 注意:经验证 Mac必须安装Microsoft Excel app 但不一定OK import xlwings as xw ...

  9. 编程从键盘输入一个字符串,统计该字符串中从‘a‘到‘z‘共26个小写字母各自出现的次数, 将结果存入数组中,并输出

    /*编程从键盘输入一个字符串,统计该字符串中从'a'到'z'共26个小写字母各自出现的次数, 将结果存入数组中,并输出*/ #include<stdio.h> #include<st ...

最新文章

  1. 黑马程序员Linux系统开发视频之VIM使用教程
  2. mysql-5.5.8_MySQL5.5.8安装
  3. 利用envi对landsat8数据进行处理
  4. Python操作MySQL存储,这些你都会了吗?
  5. 传统形态抗锯齿 2.0
  6. 斯蒂文斯理工学院计算机专业,斯蒂文斯理工学院的计算机专业如何?
  7. iOS如何完成蓝牙打印机功能
  8. 长白县积极建设精准扶贫云平台
  9. 【百度地图API】JS版本的常见问题
  10. iOS 加密算法之MD5加密使用
  11. 服务器四通道内存性能提升,三通道和四通道的性能差距是多少
  12. 我的企业使用虚拟信用卡支付有什么优势
  13. React全家桶+AntD 实战二
  14. Scroller源码详解
  15. 新人程序员必须知道的,不然等你回过神来的时候,一切已晚矣。
  16. 五子棋——人机博弈(Java实现)
  17. hao123网站需要服务器吗,我已经设置“www.hao123.com”为我的主页了,可是打开IE还是“http://www.k986.com/”这个网站,也查不出毒,怎么办?...
  18. Java开源 之随机生成中文姓名,手机号,邮编,住址
  19. 本地代码如何提交到远程,克隆的和不克隆,两种方法
  20. Revenge Storm高帮 x_这次给大家介绍一下Revenge x Storm

热门文章

  1. 中国可降解塑料行业深度分析及未来发展趋势展望2021年版
  2. long和Long的区别
  3. 党政机关安全综合协同办公业务系统
  4. 决策树原理和案例应用-泰坦尼克号生存预测
  5. map的常用用法详解(新手入门!!!)
  6. 【英文SEO】Google网站管理员工具是什么?
  7. 【Java】从Java代码到网络编程,三次握手又该如何理解
  8. ZSD017出货达成率
  9. 雇佣兵(YZOJ-1089)
  10. feign调用的重试机制,如何关闭