python统计文章中的高频词汇_使用Python 统计高频字数的方法
使用Python 统计高频字数的方法
发布时间:2020-09-17 00:52:12
来源:脚本之家
阅读:112
作者:Silent_Summer
问题
(来自Udacity机器学习工程师纳米学位预览课程)
用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词。返回值是一个元组列表,包含出现次数最高的 n 个单词及其次数,即 [(, ), (, ), ... ],按出现次数降序排列。
可以假设所有输入都是小写形式,并且不含标点符号或其他字符(只包含字母和单个空格)。如果出现次数相同,则按字母顺序排列。
例如:
print count_words("betty bought a bit of butter but the butter was bitter",3)
输出
[('butter', 2), ('a', 1), ('betty', 1)]
解法
"""Count words."""
def count_words(s, n):
"""Return the n most frequently occuring words in s."""
w = {}
sp = s.split()
# TODO: Count the number of occurences of each word in s
for i in sp:
python统计文章中的高频词汇_使用Python 统计高频字数的方法相关推荐
- python向mysql中添加数据标签_用python在MySQL中写入数据和添加数据
在笔者之前的博文中,已介绍了用python连接与mysql数据库的知识.包括如何安装python连接mysql的pymysql包,如何通过cusor语句将python与mysql连接起来,以及如何用p ...
- python下载网页中的pdf文件_【Python】Python的urllib模块、urllib2模块批量进行网页下载文件...
由于需要从某个网页上下载一些PDF文件,但是需要下载的PDF文件有几百个,所以不可能用人工点击来下载.正好Python有相关的模块,所以写了个程序来进行PDF文件的下载,顺便熟悉了Python的url ...
- python 从excel中抓取数据_使用Python抓取美团数据存于Excel中
0.程序是针对美团中的美食部分数据按好评排序采集. 要抓取保存的数据为: 商家名类型 地理位置 评论人数 均价 最低价格 1.首先编写网页数据采集函数,使用request采集网页源码,具体实现如 ...
- python 获取表格中的空数据_在python beautifulsoup中获取表格单元格值为空时的文本输出...
我正在编写一个beauthulsoup/python代码来从html表中获取数据.该表的问题是某些列可能有空白数据(单元格为空).当我运行这段代码时,当它第一次遇到表中的空白单元格时,它会以一个&qu ...
- python在excel中数据画线_在python中使用excel工作表中的数据绘制图形
我做了一些假设.假设你的数据是这样的:x y yerr_positive yerr_negative 1 1 0.1 0.2 2 2 0.1 0.2 3 3 0.1 0.2 4 4 0.1 0.2 我 ...
- python去掉列表中的单引号_从Python中的列表中删除单引号
我有一个输入字符串: result = '"testing","0.8841","642000.0","80.014521&quo ...
- python从文件中提取特定文本_使用Python从HTML文件中提取文本
我发现最好的一段代码用于提取文本,而不需要javascript或不需要的东西:import urllibfrom bs4 import BeautifulSoupurl = "http:// ...
- python中统计单词出现的次数_python统计文章中单词出现次数实例
python统计单词出现次数 做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名 ...
- python统计有几个单词_统计文件中单词的个数---Shell及python版
最近在看shell中有个题目为统计单词的个数,使用了awk功能,代码如下 #!/bin/bash if [ $# -ne ];then echo "Usage:basename $0 fil ...
最新文章
- C++实现int与string之间的相互转换
- (深入理解)model.eval() 、model.train()以及torch.no_grad() 的区别
- hadoop hive 安装
- 32位系统和64位系统的选择
- 以太币(Ether)的单位
- hdfs web_ui深入讲解、服务启动日志分析、NN SNN关系
- asp.net mysql打包_Asp.net与SQL一起打包部署安装
- 山东自考c语言程序设计停考了吗,山东自考教育类停考专业遗留问题的通知
- 用C++ 设计一个不能被继承的类
- 【转】程序员的十种级别
- 网站跨站点脚本,Sql注入等攻击的处理
- Item 16: Avoid Creating Unnecessary Objects(Effective C#)
- SQLite:在Julia中判断一个表是否存在数据库中?
- jQuery EasyUI/TopJUI实现数据表格的增删改查功能(不写js,纯HTML实现!!!)
- 如何写好项目会议纪要?
- python输入两个坐标求距离_python计算两个地址之间的距离方法
- 线性代数笔记1-二阶行列式和三阶行列式
- 全球及中国焦磷酸钠行业“十四五”规划建议与创新环境分析报告2022-2028年版
- ios error90096 错误
- 拉格朗日乘数法(Lagrange multiplier)