python--英文文章单词数量统计
目的:从txt文件中读取英文文章数据,并对出现的英文单词数量进行统计,将结果整体保存在一个新的txt文件中,并将单词数量排行前50的单词直接展示出来
# coding:UTF-8
try:#将txt文件和当前py文件放在一个目录下,正确输入文件名称fp=open("[英文]绿野仙踪(英文版).txt",mode='r',encoding='UTF-8')
#进行文件的读取,将读取的文件内容返回到一个列表str1中str1=fp.readlines()fp.close()
except FileNotFoundError:print("打开文件错误,请重新检查文件")
else:print("文件打开成功!")
#将列表中的第一个元素存到一个字符串str2中
str2=''
for i in str1:str2+=i
#创建一个字典
str3=[]
#将字符串中的各种标点符号转换为空格
for i in '"".,;/?:!@#$%^&*()_-=+][{}`~\|1234567890':str2 = str2.replace(i, " ")
str2=str2.lower()
#以空格分割字符串中的内容,同时返回一个列表
str2=str2.split()
dict1={}
for i in str2:dict1[i]=str2.count(i)#直接使用字典转换后的元组作为迭代对象)
print('将统计后的结果,按照单词数量进行降序后,数量为前50个的结果为:')
list1=sorted(dict1.items(),key=lambda x:x[1],reverse=True)
for i in range(0, 50):if (i % 4 == 0 and i!=0):print()try:print((15-len(list1[i][0])-len(str(list1[i][1])))*" "+"单词'"+list1[i][0]+"'的个数为:"+str(list1[i][1])+"个",end='')except ValueError:print('发生错误,错误为:字符串下标大于或等于字符串的长度')
#将结果保存到一个新的文件中
try:f = open('test1.txt',mode='w',encoding='UTF-8')for i in range(0,len(list1)):if (i % 4 == 0 and i!=0):f.write('\n')f.write((13-len(list1[i][0])-len(str(list1[i][1])))*" "+"单词'"+list1[i][0]+"'的个数为:"+str(list1[i][1])+"个")f.close()
except FileNotFoundError:print("打开文件错误,请重新检查文件")
else:print("\n文件写入保存成功!")
统计结果展示:
统计结果保存在文件中:
python--英文文章单词数量统计相关推荐
- Python轻松实现对英文文章单词总数统计
一篇英文文章,要统计其中单词总数.在Python中可以很轻松的实现,假如英文文章为this.txt,里面的内容就是import this这个彩蛋的内容. >>> import thi ...
- python英文字符串单词个数统计_python统计字符串中单词数量
展开全部 使用比较基本的方法写的参考代码:#!/usr/bin/env python # -*- coding: utf-8 -*- #python 2.7 import re print u'请输入 ...
- python英文字符串单词个数统计_Python实现统计英文单词个数及字符串分割代码
字符串分割 代码如下: str="a|and|hello|||ab" alist = str.split('|') print alist 结果 代码如下: str="a ...
- 统计一篇英文文章单词个数
代码实现 import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException;/** ...
- python统计单词个数算法_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...
题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...
- split函数python统计英文单词_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...
题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...
- 二叉排序树实现英文文章单词统计
二叉排序树实现英文文章中目标单词统计 [输入形式] 打开当目录下文件C:\Users\Administrator\Desktop\essay.txt,从中读取英文单词进行词频统计.输入单词查询个数和单 ...
- java把一段英文拆成单词_java编程题,输入一段英文文章,单词之间都已经用空格分隔,本人想以每5个单词为一行输出,怎么写?请指教...
我的问题是不会输出5个单词为一行.求指导!!我的代码是以下:importjava.io.*;importjava.util.*;publicclassTest2{publicstaticvoidmai ...
- 英文文章单词自动查找脚本
文章目录 1. 引言 2. 脚本介绍: 3. 使用前准备 4. 使用方法 5. 脚本下载 1. 引言 我们有时候会遇到一些自己比较感兴趣的英语书籍或者文章,阅读这些文章的过程中会遇到一些生词,但查找单 ...
最新文章
- 乾颐堂军哥HCIE5-OSPF的NSSA区域细节和中间系统到中间系统基础
- 引号快捷键_就业有“位”来 能让你早下班的常用快捷键
- CString类型的头文件、CString的输出、CString的常用用法
- Tyznn人脸识别温度检测智能门禁系统现货发售,助力疫情防控
- 技能系统设计笔记 3
- Linux重器 vi编辑器
- 谷歌免费GPU,在线Jupyter notebook深度学习环境
- eclipse git 上传工程 提交项目到 github
- 拼图复原_玩过上百款拼图后,我总结出这份超详细的拼图年龄对照表!(收藏贴)...
- 抓取百度页面html,百度蜘蛛不抓取页面的解决方法
- 一文搞懂大比例尺地形图测绘
- Golang实现IP地址匹配
- python怎么把照片转成卡通_python用OpenCV转卡通照片报错,好像是pyrdown的使用有问题?...
- 解决 openwrt/Lede pppoe拨号频繁掉线的问题
- Cesium 可视域分析代码段(源码)补充
- 俗话说别在一棵树上吊死,那为什么那么多NOSQL都喜欢在LSM树上吊死呢?
- ocp 考试相关资料
- 摩拜单车的“黑科技”
- 数据编织 (Data Fabric) vs 数据网格 (Data Mesh)
- 也谈零基础学编程,需要学什么