s

转的,出处找不到了。

还有这个也不错:https://code.google.com/p/pyzh/

统计文本文件的字数,从当前目录下的file.txt取文件

# -*- coding: GBK -*-

import string

import sys

reload(sys)

def compareItems((w1,c1), (w2,c2)):

if c1 > c2:

return - 1

elif c1 == c2:

return cmp(w1, w2)

else:

return 1

def main():

fname = "file.txt"

try:

text = open(fname,'r').read()

text = string.lower(text)

except:

print "\nfile.txt is not exist!!! or There is a R/W error! "

sys.exit()

for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':

text = string.replace(text, ch, ' ')

words = string.split(text)

counts = {}

for w in words:

counts[w] = counts.get(w,0) + 1

n = input("\n输入要统计的top单词数:")

items = counts.items()

items.sort(compareItems)

max = len(items)

print "\n单词总计:" + str(len(words))

print "单词净个数(已去重):" + str(max)

print "\n"

if n > max:

n = max

for i in range(n):

print "%-10s%5d" % items[i]

if __name__ == '__main__':

main()

s

python统计文件字数_python统计文本文件的字数相关推荐

  1. python字典统计男女比例_python统计男女比例-女性时尚流行美容健康娱乐mv-ida网...

    女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页  > 高级搜索 python 实现代码行数 统 ...

  2. 用python统计字母个数_python统计字母个数 python 统计文本中字母个数

    python 统计文本中字母个数 作业文件等有人回答小编再发,之前发文件被屏蔽了明明转身就有一个温馨的港湾,却偏偏还要去追逐那无望的孤船. l = 0with open('file.txt', 'r' ...

  3. python中英文字频率_python 统计英语文档词汇出现频率,以六级真题为例

    很多人免不了参加各种英语考试,词汇量就是参加英语考试的一个拦路虎,单词不认识,技巧再多也枉然.但考试大纲要求的单词太多了,时间紧,任务重,背了又容易忘,如果能知道真题中词汇出现的频率高低,那么有意识的 ...

  4. python爬取托福_Python 统计托福作文词频

    随着 AI 的大热,我的好奇心也受到了吸引.阅读了一些文章后发现,Pyhton 是一个非常适合 AI 编程的语言.于是开始了对其打怪升级的探索. 探索中发现,Python 提供丰富的库来帮助开发者们进 ...

  5. python实现文件管理系统_Python使用文件操作实现一个XX信息管理系统的示例

    大家好,我是第一次python学了一个学期,期末要完成一个毕业生信息管理系统大作业的小韩了,由于上次没有仔细看开发实现的要求,实现了一个简单的毕业生信息管理系统,而这次专门整理了两种使用文件进行保存数 ...

  6. python教程文件 txt_Python读写txt文本文件的操作方法全解析

    filename = 'array_reflection_2D_TM_vertical_normE_center.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径 pos = [] ...

  7. 如何用python整理文件夹_python按照文件创建日期整理文件至文件夹

    # -*- coding: utf-8 -*- # @Time : 2019-02-15 13:31 # @Author : cxa # @File : sortbydate.py # @Softwa ...

  8. python判断文件后缀_Python 判断文件后缀是否被篡改

    自己用Python写了个对文件后缀判断的脚本, 目前支持的文件类型还不是很多,还有待完善. 支持Microsoft Office (.pptx .docx .xlsx) Pyhton版本为3.6 #! ...

  9. python对文件的_python对文件的读写

    文件 File 什么是文件 文件是用于数据存储和单位 文件通常用来长期存储数据 文件中的数据是以字节为单位进行顺序存储的 文件的操作流程: 1. 打开文件 2. 读/写文件 3. 关闭文件 注: 任何 ...

最新文章

  1. sql根据年月日查询注册数或者和值
  2. laravel 文件上传
  3. spss process插件_SPSS教程:绘制调节效应图
  4. 基于 HanLP 的 ES 中文分词插件
  5. maven项目依赖被改为文件夹时如何改回lib
  6. 北大开源分词工具包: 准确率远超THULAC、jieba 分词
  7. mysql statistics cpu_(2条消息) Mysql占用CPU过高如何优化,如何解决
  8. 使用iScroll时,input等不能输入内容的解决方法
  9. 前端面试准备---浏览器和网络篇(一)
  10. 开创交互式电脑绘图先河,虚拟现实之父传奇
  11. mysql binlog限流问题总结
  12. 怎么利用c 语言编程进行进制计算,编程达人 《汇编、C语言基础教程》第一章 进制1.1 进制的定义(连载)...
  13. 1小时场景生活圈来了!苏宁双十一引领零售体验革命
  14. 解决java.io.EOFException 异常
  15. 卡方检验c语言算法,R语言 | 卡方检验(Chi-squaretest)
  16. 网站建设应该怎样建?建站流程说明
  17. 有什么好用的在线图表制作网站吗?试试这个吧
  18. 迷你播放器--第一阶段(6)--添加搜索定位功能(进阶)-使用filter过滤以及对汉语拼音的排序匹配
  19. IP地址划分【分类:A类 B类 C类 D类 E类】
  20. Hadoop  HA

热门文章

  1. iOS 随笔 允许所有不安全网络访问项目
  2. 我的MVVM框架 v0.1发布
  3. C# 向Com口发送数据
  4. IPv6与IPv4比较
  5. 路由器用PPP0E上网
  6. IE与Firefox的CSS兼容大全~~论坛推荐~!!!
  7. java游戏破解版盒子,37游戏盒子-37游戏盒子最新版 v4.0.0.4 官方版
  8. 信息学奥赛一本通(1169:大整数减法)
  9. 初中的算术(51Nod-1873)
  10. 踩方格(信息学奥赛一本通-T1196)