python统计文件中的中文字数-Python实现统计文本文件字数的方法
本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:
统计文本文件的字数,从当前目录下的file.txt取文件
# -*- coding: GBK -*-
import string
import sys
reload(sys)
def compareItems((w1,c1), (w2,c2)):
if c1 > c2:
return - 1
elif c1 == c2:
return cmp(w1, w2)
else:
return 1
def main():
fname = "file.txt"
try:
text = open(fname,'r').read()
text = string.lower(text)
except:
print " file.txt is not exist!!! or There is a R/W error! "
sys.exit()
for ch in '!"#$%&()*+,-./:;<=>?@[\]^_`{|}~':
text = string.replace(text, ch, ' ')
words = string.split(text)
counts = {}
for w in words:
counts[w] = counts.get(w,0) + 1
n = input(" 输入要统计的top单词数:")
items = counts.items()
items.sort(compareItems)
max = len(items)
print " 单词总计:" + str(len(words))
print "单词净个数(已去重):" + str(max)
print " "
if n > max:
n = max
for i in range(n):
print "%-10s%5d" % items[i]
if __name__ == '__main__':
main()
PS:这里再为大家推荐2款非常方便的统计工具供大家参考使用:
希望本文所述对大家Python程序设计有所帮助。
如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!
python统计文件中的中文字数-Python实现统计文本文件字数的方法相关推荐
- python查找文件中某些字符串_python - Python无法从2个文件的字符串搜索中提取数据吗? - 堆栈内存溢出...
我使用此代码在2个文件中搜索和比较字符串 fsig = open('file1.txt', 'r', encoding="utf8") fresult = open('file2. ...
- java统计文件中字符串出现的次数_统计一个字符串在文本文件中的出现次数
代码实现: package com.jn.test; import java.io.File; import java.io.FileInputStream; import java.io.FileN ...
- excel调用python编程-使用Python和xlwt向Excel文件中写入中文的实例
sheet1.write(row_num,0,f) row_num = 1 book.save('demo.xls') 程序执行结果如下: grey@DESKTOP-3T80NPQ:/mnt/e/01 ...
- linux字符串排序文件,Linux awk+uniq+sort 统计文件中某字符串出现次数并排序
https://blog.csdn.net/qq_28766327/article/details/78069989 在服务器开发中,我们经常会写入大量的日志文件.有时候我们需要对这些日志文件进行统计 ...
- python统计有几个单词_统计文件中单词的个数---Shell及python版
最近在看shell中有个题目为统计单词的个数,使用了awk功能,代码如下 #!/bin/bash if [ $# -ne ];then echo "Usage:basename $0 fil ...
- Python:统计文件中所有英文单词的数量
#!/usr/bin/env python # coding:UTF-8""" @version: python3.x @author:曹新健 @contact: 617 ...
- python读excel乱码_解决Python2.7读写文件中的中文乱码问题
Python2.7对于中文编码的问题处理的并不好,这几天在爬数据的时候经常会遇到中文的编码问题.但是本人对编码原理不了解,也没时间深究其中的原理.在此仅从应用的角度做一下总结, 1.设置默认编码 在P ...
- 5.1统计英文文件中的单词数python
本关任务:编写一个能统计文件中单词数量的小程序,用replace替换文本内的标点 代码如下: # 补充你的代码 a = input() import string with open(f'/data/ ...
- python统计出现次数最多的词语_python编程:统计文件中出现次数最多的前10个词,并按出现次数排列它们...
python编程:统计文件中出现次数最多的前10个词,并按出现次数排列它们. 下面我编写的这个程序可以用作:统计文件中所有的字符数.行数.出现次数最多的单词. # -*- coding:utf-8 - ...
最新文章
- linux 内核网络协议栈--数据从接收到IP层(二)
- UA MATH523A 实分析2 测度论基础2 集族与单调类
- transform css3 的使用及理解
- 8-1 回溯法实验报告 (15 分)(思路+详解)
- sharepoint服务器安装已安装netframework4.5,仍提示未安装
- IOS学习之多线程(2)--创建线程
- 用Java描述数据结构之栈和队列,以及栈和队列的常用方法
- 微信公众号-百度通用翻译API接入文档
- jq将php时间戳转化日期格式,JQuery将时间戳转换为时间
- 批量压缩pdf文件大小,pdf批量压缩步骤
- 意超级杯-国米狂追四球逆转罗马夺冠 新援下三城
- Redis HyperLogLog 是什么?这些场景使用它,让我枪出如龙,一笑破苍穹
- 随机返回经典语句接口API
- AD多层板拼板内电层网络丢失处理
- Java matlab车牌识别,车牌识别matlab实现(蓝色车牌和新能源车牌)
- android 尺寸转换工具,Android APP界面标注、尺寸换算和APP标注工具
- 苹果上网本报价_1小时一个价 iPhone12加价300元起
- 理解Session State模式+FAQ [翻译]
- 触发器(Trigger)
- 诗仙诗圣,你还知道诗什么