python统计英文文章中单词的个数无文件_求Python统计英文文件内单词个数的思路...
感谢微博上@刘鑫-MarsLiu的TAG每天一个小程序。 你会如何实现上述题目的要求?
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
python实现任一个英文的纯文本文件,统计其中的单词出现的个数、行数、字符数
"""
file_name = "movie.txt"
line_counts = 0
word_counts = 0
character_counts = 0
with open(file_name, 'r') as f:
for line in f:
words = line.split()
line_counts += 1
word_counts += len(words)
character_counts += len(line)
print "line_counts ", line_counts
print "word_counts ", word_counts
print "character_counts ", character_counts
以上代码,有哪些改进的地方?如何改进才更加pythonic?
python有1个collections库可以解决你这个问题#!/usr/bin/python
# 这么着,您看您乐意不?
import re
file_name = 'test.txt'
lines_count = 0
words_count = 0
chars_count = 0
words_dict = {}
lines_list = []
with open(file_name, 'r') as f:
for line in f:
lines_count = lines_count + 1
chars_count = chars_count + len(line)
match = re.findall(r'[^a-zA-Z0-9]+', line)
for i in match:
# 只要英文单词,删掉其他字符
line = line.replace(i, ' ')
lines_list = line.split()
for i in lines_list:
if i not in words_dict:
words_dict[i] = 1
else:
words_dict[i] = words_dict[i] + 1
print 'words_count is', len(words_dict)
print 'lines_count is', lines_count
print 'chars_count is', chars_count
for k,v in words_dict.items():
print k,v
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd20162.html
相关文章 Recommend
python统计英文文章中单词的个数无文件_求Python统计英文文件内单词个数的思路...相关推荐
- python3学习笔记之三——统计英文文章中出现次数最多的单词前三
思路:英文文章中的标点符号的处理,单词大小写的处理,再将单词通过字典的统计出现次数,最后用sorted()排序 #利用maketrans函数将标点符号映射为空格 table =str.maketran ...
- 统计一篇英文文章中出现次数最多的10个单词
https://blog.csdn.net/u010512607/article/details/40005641 思路: 1.读入文件,按行将文字拼接成字符串str 2.用正则过滤字符串中的标点,再 ...
- 统计一篇英文文章中单词出现的频数
1.题目内容:如何统计一篇英文文章中单词出现的频数,依次从键盘中输入该文章. 2.思路:使用map一一映射 3.程序清单: #include<iostream> #include<s ...
- 统计一篇英文文章中出现的 单词 和 词频
统计一篇英文文章中出现的单词和词频, 统计一篇英文文章中出现的单词和词频. 输入:某篇文章的绝对路径 输出:词典(词典中的内容为每一行都是一个"词频 单词 ") #include ...
- 统计一篇英文文章中26 字母出现的概率
统计一篇英文文章中26 字母出现的概率 //统计英文文章中26 字母出现的概率 #include <stdio.h> void main() { float number[26]={0}; ...
- Python中可以使用字符串处理函数来删除指定的字符或者字符集合。在这篇文章中,我们将会介绍如何使用Python来删除一个或多个指定字符。作为标题,《用Pyth...
Python中可以使用字符串处理函数来删除指定的字符或者字符集合.在这篇文章中,我们将会介绍如何使用Python来删除一个或多个指定字符.作为标题,<用Python删除指定字符(Removing ...
- 如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件?
如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件? 1.问题描述 2.解决过程 2.1 问题分析: 2.2 解决思路 3.运行结果 1.问题描述 最近在处理一堆工 ...
- Java—统计一篇英文文章中出现的不重复单词的个数
题目: 输入一篇英文文章,碰到"!!!"的时候停止,输出文章中出现的不重复单词的个数(注意:单词不区分大小写,如:The和the为一个单词) 输入格式: 一篇英文文章,以" ...
- python统计英文文章中单词出现的次数并排序_python,_关于统计某一个 单词 在 文本中 出现的次数,python - phpStudy...
关于统计某一个 单词 在 文本中 出现的次数 人生苦短,我用Python.用了不会,来到segment. 我是一个python 初学者,想要实现一个"模块",可以让用户输入某个单词 ...
最新文章
- TeX 家族(TeX, pdfTeX, XeTeX, LuaTeX, LaTeX, pdfLaTeX, XeLaTeX …)
- iOS之深入解析多环境配置的实现方案
- 如何对计算属性进行修改_「计算摄影」计算机如何学会自动地进行图像美学增强?...
- 项目经理问我Java内存区域模型!急急急
- 容器 | Docker 如此之好,你为什么还要用k8s
- 区分PO,VO,DAO,BO,POJO
- 如何轻松使用阿里云得矢量图标库
- macOS Monterey 12.3 (21E230) 正式版 ISO、IPSW、PKG 下载
- flutter app使用大量网络图片导致频繁崩溃
- 解决Referenced file contains errors
- AD域详细介绍和部署
- 使用STM32F4标准外设库实现网线热插拔- 分析STM3240G-EVAL官方工程
- linux看磁带内容命令,Linux下磁带管理命令
- 【Java】java9的of方法
- 如何用Python制作一个简单的二维码生成器
- eclipse常见问题
- 如何成为一名Top DevOps Engineer
- 索尼的hlg是什么_索尼的HLG使用方法
- 大型ERP系统在线体验账号
- logisim 文档