统计一篇英语文章每个单词出现的频率
从文件中读取一篇英语文章,统计每个单词出现的频率,输出十个最长出现的单词及次数图像。
import turtlecount = 10
xscale = 30
yscale = 6
data = []
words = []def replacepunctuations(line):for ch in line:if ch in "~@#$%^&*()_-+=<>?/,.:;{}[]|\'""":line = line.replace(ch," ")return linedef processline(line,wordcounts):line = replacepunctuations(line)words = line.split()for word in words:if word in wordcounts:wordcounts[word] += 1else:wordcounts[word] = 1def line(t,x1,y1,x2,y2): #作x,y轴t.penup()t.goto(x1,y1)t.pendown()t.goto(x2,y2)def drawtext(t,x,y,text): #写出每个坐标对应的单词和柱体表示的数量t.penup()t.goto(x,y)t.pendown()t.write(text)def drawline(t,x1,y1,x2,y2):t.penup()t.goto(x1,y1)t.pendown()t.goto(x2,y2)def drawrectangle(t,x,y): #作长方形x = x*xscaley = y*yscaledrawline(t,x-5,0,x-5,y)drawline(t,x-5,y,x+5,y)drawline(t,x+5,y,x+5,0)drawline(t,x+5,0,x-5,0)def drawbar(t): #作单词对应的图形for i in range(count):drawrectangle(t,i+1,data[i])def drawgraph(t): #作图表drawline(t,0,0,360,0)drawline(t,0,300,0,0)for x in range(count):x += 1drawtext(t,x*xscale-5,-20,(words[x-1]))drawtext(t,x*xscale-5,data[x-1]*yscale+10,data[x-1])drawbar(t)def main():filename = input("enter a filename:").strip()infile = open(filename,"r")wordcounts = {}for line in infile:processline(line.lower(),wordcounts) #lower()把大写字母改成小写pairs = list(wordcounts.items())items = [[x,y] for (y,x) in pairs]items.sort()for i in range(len(items)-1,len(items)-count-1,-1):print(items[i][1]+"\t"+str(items[i][0]))data.append(items[i][0])words.append(items[i][1])infile.close()turtle.title('词频结果柱状图')turtle.setup(900,750,0,0)t = turtle.Turtle()t.width(3)drawgraph(t)main()
统计一篇英语文章每个单词出现的频率相关推荐
- python 统计一篇英语文章中每个单词出现的次数
""" 统计一篇英语文章中每个单词出现的次数 """ import stringdef get_dict_word_times(file): ...
- 【作业】随机数+参数可变的方法+实验任务(输出素数+使用递归,判断是否为回文+统计一篇英语问斩单词出现频率)...
(1)随机数 取余的m很大可以保证随机的更彻底,更不容易重复 1 import java.util.Scanner; 2 public class Text_001 3 { 4 5 public st ...
- 统计一篇英文文章中单词出现的频数
1.题目内容:如何统计一篇英文文章中单词出现的频数,依次从键盘中输入该文章. 2.思路:使用map一一映射 3.程序清单: #include<iostream> #include<s ...
- python统计一篇英文短文中单词出现的频率、内存使用分析
怎么统计一篇文档或者一段字符串中某个单词出现的次数.这是在数据分析或者统计学,或者在python的机器学习中常常要做的工作. 统计单词出现的频率的方法有两种:一种是使用for循环,一种是使用pytho ...
- 统计一篇英语文章中每个单词出现次数并输出出现频率最高的10个单词
具体思路:首先将用creatArray()函数将文件中的内容读入到一个char型的动态数组,然后统计共有多少个英文单词,知道数目后创建两个char型指针valueA,valueB,valueA记录挨个 ...
- 面试题:选择一篇英语文章,统计文章中所有单词出现的次数,单词的长度以及每个单词中每个字母出现的次数
选择一篇英语文章,统计文章中所有单词出现的次数,单词的长度以及每个单词中每个字母出现的次数 这里我们把这个题目可以分为三个步骤也就是三个方法: 统计单词中每个字符出现的次数 统计每个单词在文章中出现的 ...
- 统计一篇英文文章中出现次数最多的10个单词
https://blog.csdn.net/u010512607/article/details/40005641 思路: 1.读入文件,按行将文字拼接成字符串str 2.用正则过滤字符串中的标点,再 ...
- python统计单词个数算法_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...
题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...
- split函数python统计英文单词_统计一篇英文文章单词个数,取出出现频次前10的单词(Python实现)...
题目: 用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数. 常规解法 怎么判定单词? 1 不是字母的特殊字符作为分隔符分割字符串 (避免特殊字符的处 ...
最新文章
- 算法工程师面试必考项:二叉树
- R语言构建catboost模型:构建catboost模型并基于网格搜索获取最优模型参数(Select hyperparameters)、计算特征重要度
- colab加载google drive并且调试时跳过不运行
- mongoDB非关系型数据库
- 去掉xcode中警告的一些经验
- 手机连接投影机的步骤_投影机安装过程详解
- 网页mysql命令大全_Mysql命令大全
- 血泪八条---给中国IT教育培训机构
- 如何将两部手机内容互换_两部iPhone手机之间如何大量互传照片?
- C++ 构造函数和析构函数
- 以后给孩子起名字不用发愁了,先存着
- oracle数据库常用的函数总结
- wps带阴影的边框怎么设置_wps文字加阴影边框怎么设置
- 2021年的10种突破性技术
- 终于有人把分布式机器学习讲明白了
- msxml 6.0 dll 导入问题
- java创建无法确定大小的数组
- Java8 jdk1.8新特性
- pandas 实操函数使用合集
- 向《数据科学实战》作者Cathy O'Neil提问!
热门文章
- bat(batch)
- 光学分辨率光声显微镜中基于深度学习的运动校正算法
- 单选按钮、复选框、下拉框的回显
- 【热更新】游戏热更新方案
- 低代码之间到底有些什么区别?对比编译型平台“iVX 无远 牛刀”以及接口型平台“明道 宜搭 简道 轻流 氚云 ”
- [PCL教程]PCL漫游之Registration,Visualization
- Qemu 调试内核 出错 Remote 'g' packet reply is too long:
- kafka-整理-重试机制
- 微凉大大,教你一步一步在linux中正确的安装Xcache加速php。
- 科比自传读后感 --曼巴精神