感谢微博上@刘鑫-MarsLiu的TAG每天一个小程序。 你会如何实现上述题目的要求?

#!/usr/bin/env python

# -*- coding: utf-8 -*-

"""

python实现任一个英文的纯文本文件,统计其中的单词出现的个数、行数、字符数

"""

file_name = "movie.txt"

line_counts = 0

word_counts = 0

character_counts = 0

with open(file_name, 'r') as f:

for line in f:

words = line.split()

line_counts += 1

word_counts += len(words)

character_counts += len(line)

print "line_counts ", line_counts

print "word_counts ", word_counts

print "character_counts ", character_counts

以上代码,有哪些改进的地方?如何改进才更加pythonic?

python有1个collections库可以解决你这个问题#!/usr/bin/python

# 这么着,您看您乐意不?

import re

file_name = 'test.txt'

lines_count = 0

words_count = 0

chars_count = 0

words_dict = {}

lines_list = []

with open(file_name, 'r') as f:

for line in f:

lines_count = lines_count + 1

chars_count = chars_count + len(line)

match = re.findall(r'[^a-zA-Z0-9]+', line)

for i in match:

# 只要英文单词,删掉其他字符

line = line.replace(i, ' ')

lines_list = line.split()

for i in lines_list:

if i not in words_dict:

words_dict[i] = 1

else:

words_dict[i] = words_dict[i] + 1

print 'words_count is', len(words_dict)

print 'lines_count is', lines_count

print 'chars_count is', chars_count

for k,v in words_dict.items():

print k,v

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd20162.html

相关文章 Recommend

python统计英文文章中单词的个数无文件_求Python统计英文文件内单词个数的思路...相关推荐

  1. python3学习笔记之三——统计英文文章中出现次数最多的单词前三

    思路:英文文章中的标点符号的处理,单词大小写的处理,再将单词通过字典的统计出现次数,最后用sorted()排序 #利用maketrans函数将标点符号映射为空格 table =str.maketran ...

  2. 统计一篇英文文章中出现次数最多的10个单词

    https://blog.csdn.net/u010512607/article/details/40005641 思路: 1.读入文件,按行将文字拼接成字符串str 2.用正则过滤字符串中的标点,再 ...

  3. 统计一篇英文文章中单词出现的频数

    1.题目内容:如何统计一篇英文文章中单词出现的频数,依次从键盘中输入该文章. 2.思路:使用map一一映射 3.程序清单: #include<iostream> #include<s ...

  4. 统计一篇英文文章中出现的 单词 和 词频

    统计一篇英文文章中出现的单词和词频, 统计一篇英文文章中出现的单词和词频. 输入:某篇文章的绝对路径 输出:词典(词典中的内容为每一行都是一个"词频 单词 ") #include ...

  5. 统计一篇英文文章中26 字母出现的概率

    统计一篇英文文章中26 字母出现的概率 //统计英文文章中26 字母出现的概率 #include <stdio.h> void main() { float number[26]={0}; ...

  6. Python中可以使用字符串处理函数来删除指定的字符或者字符集合。在这篇文章中,我们将会介绍如何使用Python来删除一个或多个指定字符。作为标题,《用Pyth...

    Python中可以使用字符串处理函数来删除指定的字符或者字符集合.在这篇文章中,我们将会介绍如何使用Python来删除一个或多个指定字符.作为标题,<用Python删除指定字符(Removing ...

  7. 如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件?

    如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件? 1.问题描述 2.解决过程 2.1 问题分析: 2.2 解决思路 3.运行结果 1.问题描述 最近在处理一堆工 ...

  8. Java—统计一篇英文文章中出现的不重复单词的个数

    题目: 输入一篇英文文章,碰到"!!!"的时候停止,输出文章中出现的不重复单词的个数(注意:单词不区分大小写,如:The和the为一个单词) 输入格式: 一篇英文文章,以" ...

  9. python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...

    关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...

最新文章

  1. TeX 家族(TeX, pdfTeX, XeTeX, LuaTeX, LaTeX, pdfLaTeX, XeLaTeX …)
  2. iOS之深入解析多环境配置的实现方案
  3. 如何对计算属性进行修改_「计算摄影」计算机如何学会自动地进行图像美学增强?...
  4. 项目经理问我Java内存区域模型!急急急
  5. 容器 | Docker 如此之好,你为什么还要用k8s
  6. 区分PO,VO,DAO,BO,POJO
  7. 如何轻松使用阿里云得矢量图标库
  8. macOS Monterey 12.3 (21E230) 正式版 ISO、IPSW、PKG 下载
  9. flutter app使用大量网络图片导致频繁崩溃
  10. 解决Referenced file contains errors
  11. AD域详细介绍和部署
  12. 使用STM32F4标准外设库实现网线热插拔- 分析STM3240G-EVAL官方工程
  13. linux看磁带内容命令,Linux下磁带管理命令
  14. 【Java】java9的of方法
  15. 如何用Python制作一个简单的二维码生成器
  16. eclipse常见问题
  17. 如何成为一名Top DevOps Engineer
  18. 索尼的hlg是什么_索尼的HLG使用方法
  19. 大型ERP系统在线体验账号
  20. logisim 文档

热门文章

  1. 骨传导耳机对听力有危害吗,骨传导耳机会不会伤害耳朵
  2. 头歌 MongoDB 文档的高级查询操作(全部关卡)
  3. WannaCrypt0r分析报告
  4. MySQL 运维 - 从零开始学习 | 超详细
  5. 关于图片大小超过div盒子的讨论——补充
  6. 【干货】电商知识图谱构建及搜索推荐场景下的应用.pdf(附下载链接)
  7. DataGrip连接Mysql报08S01解决方案
  8. 一种工控蜜罐识别与反识别技术研究与应用实践
  9. 【cocos2d-x 大型ARPG手游研发----地图活起来了】
  10. 电脑连上网却无法使用浏览器,显示远程计算机或设备将不接受连接的解决办法