python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例
本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:
题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:
#coding=utf-8
import collections
import re
import os
useless_words=('the','a','an','and','by','of','in','on','is','to')
def get_important_word(file):
f=open(file)
word_counter=collections.Counter()
for line in f:
words=re.findall('\w+',line.lower())
word_counter.update(words)
f.close()
most_important_word=word_counter.most_common(1)[0][0]
count=2
while(most_important_word in useless_words):
most_important_word=word_counter.most_common(count)[count-1][0]
count+=1
num=word_counter.most_common(count)[count-1][1]
print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)
if __name__=='__main__':
filepath='.'
for dirpath,dirname,dirfiles in os.walk(filepath):
for file in dirfiles:
if os.path.splitext(file)[1]=='.txt':
abspath=os.path.join(dirpath,file)
if os.path.isfile(abspath):
get_important_word(abspath)
学习笔记:
collections模块,是python内建的模块,提供了许多有用的集合类。我们这里用到了Counter类和其中的most_common()方法
PS:这里再为大家推荐2款相关统计工具供大家参考:
希望本文所述对大家Python程序设计有所帮助。
python统计英文句子每个单词字数_Python实现的统计文章单词次数功能示例相关推荐
- python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例
本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...
- python统计文章单词次数_Python实现的统计文章单词次数功能示例
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出现的次数 ...
- 输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度。
105,输入一段英文句子(无标点),每两个单词空格隔开,统计单词的平均长度. 提示:空格数+1就是单词数. str=input() n=str.count(' ')+1 list=list(str.s ...
- 统计英文句子中的单词个数,并且输出每个单词
package new_test; import java.util.Scanner; import java.util.StringTokenizer; //任务:统计英文句子中的单词个数,并且输出 ...
- java 单词出现次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
搜索热词 本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法.分享给大家供大家参考,具体如下: import java.util.*; /** * 统计出现次数最多的单词和它出 ...
- python统计英文句子每个单词字数_Python小书3-文本英文单词统计
之前写Python Web小书第三小节本来用的垃圾邮件的案例三郎:Python贝叶斯推理垃圾邮件分类zhuanlan.zhihu.com 后来发现里面的东西,涉及到概率,程序太复杂了...哈哈哈 所 ...
- python统计英文文章中单词出现的次数并排序_Python实现的统计文章单词次数功能示例...
本文实例讲述了Python实现的统计文章单词次数功能.分享给大家供大家参考,具体如下: 题目是这样的:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认 ...
- 统计英文句子中有多少个英文单词 单词之间用空格分开
#include<iostream> #include<string.h> using namespace std; void main() { int i,j=0; char ...
最新文章
- 摄像头图像桶形畸变校正测试
- Maven学习总结(二)——Maven项目构建过程练习
- 高阶数据结构:SSTable
- SAP Spartacus Spinner控件显示原理
- dubbo中的Filter顺序是如何确定的
- Java是发展的垫脚石。 学习吧!
- Linux 命令之 curl 的选项(英文版)
- 熊猫分发_熊猫新手:第二部分
- 埃夫特机器人离线编程软件_工业机器人离线编程与虚拟仿真软件
- 2013大数据全球技术峰会PPT
- 《数学建模与数学实验》第1章学习笔记
- 批处理之 FOR循环
- [译] 移动应用设计新趋势
- MySQL指南之SQL语句基础
- staruml 依赖于 libgcrypt11 (= 1.4.5);然而:未安装软件包 libgcrypt11。
- 内存管理之:页和页框地址变换结构
- 黑盒子法探索人脑逻辑模型备忘录
- Linux下往github上传项目
- Supporting Online Material for Lab Experiments for the Study of Social-Ecological Systems
- 在虚拟机上搭建云平台环境(5)yum配置
热门文章
- oracle nvl函数 mysql_关于Oracle数据库中的nvl函数
- 《移动互联网时代下的信息安全与防护》学习总结
- python制作表情包教程_使用Python制作表情包实现换脸功能
- 结构化文本计算示例(一)
- Spring Boot 实现万能文件在线预览-开源学习一
- “双十一”大战引发四大疑问(图)
- linux 虚拟地址空间在哪,Linux虚拟地址空间
- 黄河三角洲近40年来面积变化遥感监测提取
- oracle数据库中unpivot函数,oracle pivot 和 unpivot 函数的使用
- 如何将扫描件转换成word文档