本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:

题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:

#coding=utf-8

import collections

import re

import os

useless_words=('the','a','an','and','by','of','in','on','is','to')

def get_important_word(file):

f=open(file)

word_counter=collections.Counter()

for line in f:

words=re.findall('\w+',line.lower())

word_counter.update(words)

f.close()

most_important_word=word_counter.most_common(1)[0][0]

count=2

while(most_important_word in useless_words):

most_important_word=word_counter.most_common(count)[count-1][0]

count+=1

num=word_counter.most_common(count)[count-1][1]

print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)

if __name__=='__main__':

filepath='.'

for dirpath,dirname,dirfiles in os.walk(filepath):

for file in dirfiles:

if os.path.splitext(file)[1]=='.txt':

abspath=os.path.join(dirpath,file)

if os.path.isfile(abspath):

get_important_word(abspath)

学习笔记:

collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法

PS:这里再为大家推荐2款相关统计工具供大家参考:

希望本文所述对大家Python程序设计有所帮助。

python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例相关推荐

  1. python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例

    本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...

  2. python统计文章单词次数_Python实现的统计文章单词次数功能示例

    本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...

  3. java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...

  4. 输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度。

    105,输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度. 提示:空格数+1就是单词数. str=input() n=str.count(' ')+1 list=list(str.s ...

  5. 统计英文句子中的单词个数,并且输出每个单词

    package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...

  6. java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...

    搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...

  7. python统计英文句子每个单词字数_Python小书3-文本英文单词统计

    之前写Python Web小书第三小节本来用的垃圾邮件的案例三郎:Python贝叶斯推理垃圾邮件分类​zhuanlan.zhihu.com 后来发现里面的东西,涉及到概率,程序太复杂了...哈哈哈 所 ...

  8. python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...

    本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...

  9. 统计英文句子中有多少个英文单词 单词之间用空格分开

    #include<iostream> #include<string.h> using namespace std; void main() { int i,j=0; char ...

最新文章

  1. 摄像头图像桶形畸变校正测试
  2. Maven学习总结(二)——Maven项目构建过程练习
  3. 高阶数据结构:SSTable
  4. SAP Spartacus Spinner控件显示原理
  5. dubbo中的Filter顺序是如何确定的
  6. Java是发展的垫脚石。 学习吧!
  7. Linux 命令之 curl 的选项(英文版)
  8. 熊猫分发_熊猫新手:第二部分
  9. 埃夫特机器人离线编程软件_工业机器人离线编程与虚拟仿真软件
  10. 2013大数据全球技术峰会PPT
  11. 《数学建模与数学实验》第1章学习笔记
  12. 批处理之 FOR循环
  13. [译] 移动应用设计新趋势
  14. MySQL指南之SQL语句基础
  15. staruml 依赖于 libgcrypt11 (= 1.4.5);然而:未安装软件包 libgcrypt11。
  16. 内存管理之:页和页框地址变换结构
  17. 黑盒子法探索人脑逻辑模型备忘录
  18. Linux下往github上传项目
  19. Supporting Online Material for Lab Experiments for the Study of Social-Ecological Systems
  20. 在虚拟机上搭建云平台环境(5)yum配置

热门文章

  1. oracle nvl函数 mysql_关于Oracle数据库中的nvl函数
  2. 《移动互联网时代下的信息安全与防护》学习总结
  3. python制作表情包教程_使用Python制作表情包实现换脸功能
  4. 结构化文本计算示例(一)
  5. Spring Boot 实现万能文件在线预览-开源学习一
  6. “双十一”大战引发四大疑问(图)
  7. linux 虚拟地址空间在哪,Linux虚拟地址空间
  8. 黄河三角洲近40年来面积变化遥感监测提取
  9. oracle数据库中unpivot函数,oracle pivot 和 unpivot 函数的使用
  10. 如何将扫描件转换成word文档