使用Python 统计高频字数的方法

发布时间:2020-09-17 00:52:12

来源:脚本之家

阅读:112

作者:Silent_Summer

问题

(来自Udacity机器学习工程师纳米学位预览课程)

用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词。返回值是一个元组列表,包含出现次数最高的 n 个单词及其次数,即 [(, ), (, ), ... ],按出现次数降序排列。

可以假设所有输入都是小写形式,并且不含标点符号或其他字符(只包含字母和单个空格)。如果出现次数相同,则按字母顺序排列。

例如:

print count_words("betty bought a bit of butter but the butter was bitter",3)

输出

[('butter', 2), ('a', 1), ('betty', 1)]

解法

"""Count words."""

def count_words(s, n):

"""Return the n most frequently occuring words in s."""

w = {}

sp = s.split()

# TODO: Count the number of occurences of each word in s

for i in sp:

python统计文章中的高频词汇_使用Python 统计高频字数的方法相关推荐

  1. python向mysql中添加数据标签_用python在MySQL中写入数据和添加数据

    在笔者之前的博文中,已介绍了用python连接与mysql数据库的知识.包括如何安装python连接mysql的pymysql包,如何通过cusor语句将python与mysql连接起来,以及如何用p ...

  2. python下载网页中的pdf文件_【Python】Python的urllib模块、urllib2模块批量进行网页下载文件...

    由于需要从某个网页上下载一些PDF文件,但是需要下载的PDF文件有几百个,所以不可能用人工点击来下载.正好Python有相关的模块,所以写了个程序来进行PDF文件的下载,顺便熟悉了Python的url ...

  3. python 从excel中抓取数据_使用Python抓取美团数据存于Excel中

    0.程序是针对美团中的美食部分数据按好评排序采集. 要抓取保存的数据为: 商家名类型  地理位置 评论人数  均价  最低价格 1.首先编写网页数据采集函数,使用request采集网页源码,具体实现如 ...

  4. python 获取表格中的空数据_在python beautifulsoup中获取表格单元格值为空时的文本输出...

    我正在编写一个beauthulsoup/python代码来从html表中获取数据.该表的问题是某些列可能有空白数据(单元格为空).当我运行这段代码时,当它第一次遇到表中的空白单元格时,它会以一个&qu ...

  5. python在excel中数据画线_在python中使用excel工作表中的数据绘制图形

    我做了一些假设.假设你的数据是这样的:x y yerr_positive yerr_negative 1 1 0.1 0.2 2 2 0.1 0.2 3 3 0.1 0.2 4 4 0.1 0.2 我 ...

  6. python去掉列表中的单引号_从Python中的列表中删除单引号

    我有一个输入字符串: result = '"testing","0.8841","642000.0","80.014521&quo ...

  7. python从文件中提取特定文本_使用Python从HTML文件中提取文本

    我发现最好的一段代码用于提取文本,而不需要javascript或不需要的东西:import urllibfrom bs4 import BeautifulSoupurl = "http:// ...

  8. python中统计单词出现的次数_python统计文章中单词出现次数实例

    python统计单词出现次数 做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名 ...

  9. python统计有几个单词_统计文件中单词的个数---Shell及python版

    最近在看shell中有个题目为统计单词的个数,使用了awk功能,代码如下 #!/bin/bash if [ $# -ne ];then echo "Usage:basename $0 fil ...

最新文章

  1. C++实现int与string之间的相互转换
  2. (深入理解)model.eval() 、model.train()以及torch.no_grad() 的区别
  3. hadoop hive 安装
  4. 32位系统和64位系统的选择
  5. 以太币(Ether)的单位
  6. hdfs web_ui深入讲解、服务启动日志分析、NN SNN关系
  7. asp.net mysql打包_Asp.net与SQL一起打包部署安装
  8. 山东自考c语言程序设计停考了吗,山东自考教育类停考专业遗留问题的通知
  9. 用C++ 设计一个不能被继承的类
  10. 【转】程序员的十种级别
  11. 网站跨站点脚本,Sql注入等攻击的处理
  12. Item 16: Avoid Creating Unnecessary Objects(Effective C#)
  13. SQLite:在Julia中判断一个表是否存在数据库中?
  14. jQuery EasyUI/TopJUI实现数据表格的增删改查功能(不写js,纯HTML实现!!!)
  15. 如何写好项目会议纪要?
  16. python输入两个坐标求距离_python计算两个地址之间的距离方法
  17. 线性代数笔记1-二阶行列式和三阶行列式
  18. 全球及中国焦磷酸钠行业“十四五”规划建议与创新环境分析报告2022-2028年版
  19. ios error90096 错误
  20. 拉格朗日乘数法(Lagrange multiplier)

热门文章

  1. HDFS文件系统(含hdfs常用命令,java对hdfs API的简单操作)
  2. 做搞笑小视频在哪找素材?灵感可以从这来
  3. 【网络】报文封装整体结构
  4. bloc币_使用bloc扑动应用程序的导航状态和菜单模式
  5. XML解析的几种方式
  6. 公网IP和私网IP有什么区别?
  7. mediasoup和ffmpeg对接音视频流
  8. sqli——labs初学者通关详
  9. 学会这几招,让你的项目顺利通过验收
  10. 手把手带你封装一个vue移动端的脚手架