本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:

统计文本文件的字数,从当前目录下的file.txt取文件

# -*- coding: GBK -*-

import string

import sys

reload(sys)

def compareItems((w1,c1), (w2,c2)):

if c1 > c2:

return - 1

elif c1 == c2:

return cmp(w1, w2)

else:

return 1

def main():

fname = "file.txt"

try:

text = open(fname,'r').read()

text = string.lower(text)

except:

print " file.txt is not exist!!! or There is a R/W error! "

sys.exit()

for ch in '!"#$%&()*+,-./:;<=>?@[\]^_`{|}~':

text = string.replace(text, ch, ' ')

words = string.split(text)

counts = {}

for w in words:

counts[w] = counts.get(w,0) + 1

n = input(" 输入要统计的top单词数:")

items = counts.items()

items.sort(compareItems)

max = len(items)

print " 单词总计:" + str(len(words))

print "单词净个数(已去重):" + str(max)

print " "

if n > max:

n = max

for i in range(n):

print "%-10s%5d" % items[i]

if __name__ == '__main__':

main()

PS:这里再为大家推荐2款非常方便的统计工具供大家参考使用:

希望本文所述对大家Python程序设计有所帮助。

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

python统计文件中的中文字数-Python实现统计文本文件字数的方法相关推荐

  1. python查找文件中某些字符串_python - Python无法从2个文件的字符串搜索中提取数据吗? - 堆栈内存溢出...

    我使用此代码在2个文件中搜索和比较字符串 fsig = open('file1.txt', 'r', encoding="utf8") fresult = open('file2. ...

  2. java统计文件中字符串出现的次数_统计一个字符串在文本文件中的出现次数

    代码实现: package com.jn.test; import java.io.File; import java.io.FileInputStream; import java.io.FileN ...

  3. excel调用python编程-使用Python和xlwt向Excel文件中写入中文的实例

    sheet1.write(row_num,0,f) row_num = 1 book.save('demo.xls') 程序执行结果如下: grey@DESKTOP-3T80NPQ:/mnt/e/01 ...

  4. linux字符串排序文件,Linux awk+uniq+sort 统计文件中某字符串出现次数并排序

    https://blog.csdn.net/qq_28766327/article/details/78069989 在服务器开发中,我们经常会写入大量的日志文件.有时候我们需要对这些日志文件进行统计 ...

  5. python统计有几个单词_统计文件中单词的个数---Shell及python版

    最近在看shell中有个题目为统计单词的个数,使用了awk功能,代码如下 #!/bin/bash if [ $# -ne ];then echo "Usage:basename $0 fil ...

  6. Python:统计文件中所有英文单词的数量

    #!/usr/bin/env python # coding:UTF-8""" @version: python3.x @author:曹新健 @contact: 617 ...

  7. python读excel乱码_解决Python2.7读写文件中的中文乱码问题

    Python2.7对于中文编码的问题处理的并不好,这几天在爬数据的时候经常会遇到中文的编码问题.但是本人对编码原理不了解,也没时间深究其中的原理.在此仅从应用的角度做一下总结, 1.设置默认编码 在P ...

  8. 5.1统计英文文件中的单词数python

    本关任务:编写一个能统计文件中单词数量的小程序,用replace替换文本内的标点 代码如下: # 补充你的代码 a = input() import string with open(f'/data/ ...

  9. python统计出现次数最多的词语_python编程:统计文件中出现次数最多的前10个词,并按出现次数排列它们...

    python编程:统计文件中出现次数最多的前10个词,并按出现次数排列它们. 下面我编写的这个程序可以用作:统计文件中所有的字符数.行数.出现次数最多的单词. # -*- coding:utf-8 - ...

最新文章

  1. linux 内核网络协议栈--数据从接收到IP层(二)
  2. UA MATH523A 实分析2 测度论基础2 集族与单调类
  3. transform css3 的使用及理解
  4. 8-1 回溯法实验报告 (15 分)(思路+详解)
  5. sharepoint服务器安装已安装netframework4.5,仍提示未安装
  6. IOS学习之多线程(2)--创建线程
  7. 用Java描述数据结构之栈和队列,以及栈和队列的常用方法
  8. 微信公众号-百度通用翻译API接入文档
  9. jq将php时间戳转化日期格式,JQuery将时间戳转换为时间
  10. 批量压缩pdf文件大小,pdf批量压缩步骤
  11. 意超级杯-国米狂追四球逆转罗马夺冠 新援下三城
  12. Redis HyperLogLog 是什么?这些场景使用它,让我枪出如龙,一笑破苍穹
  13. 随机返回经典语句接口API
  14. AD多层板拼板内电层网络丢失处理
  15. Java matlab车牌识别,车牌识别matlab实现(蓝色车牌和新能源车牌)
  16. android 尺寸转换工具,Android APP界面标注、尺寸换算和APP标注工具
  17. 苹果上网本报价_1小时一个价 iPhone12加价300元起
  18. 理解Session State模式+FAQ [翻译]
  19. 触发器(Trigger)
  20. 诗仙诗圣,你还知道诗什么

热门文章

  1. poj 3481 平衡树
  2. mysql修改表和列
  3. Hibernate 中lazy的作用
  4. you need to build uWSGI with SSL support to use the websocket handshake api function !!!
  5. 获取DataTable前几条数据
  6. PLAY2.6-SCALA(十一) 模板常用场景
  7. 视频编码名词参数解释——非常全面详细
  8. pdf.js 使用实例
  9. .NET Core使用EF分页查询数据报错:OFFSET语法错误问题
  10. iBatis学习网站推荐