python中统计单词出现的次数_python统计文章中单词出现次数实例
python统计单词出现次数
做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。
下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。
# -*- coding:utf-8 -*-
import io
import re
class Counter:
def __init__(self, path):
"""
:param path: 文件路径
"""
self.mapping = dict()
with io.open(path, encoding="utf-8") as f:
data = f.read()
words = [s.lower() for s in re.findall("\w+", data)]
for word in words:
self.mapping[word] = self.mapping.get(word, 0) + 1
def most_common(self, n):
assert n > 0, "n should be large than 0"
return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
if __name__ == '__main__':
most_common_5 = Counter("importthis.txt").most_common(5)
for item in most_common_5:
print(item)
执行效果:
('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)
知识点补充:
1、如何正确读写文件
2、如何对数据进行排序
3、字典数据类型的运用
4、正则表达式的运用
到此这篇关于python统计文章中单词出现次数实例的文章就介绍到这了,更多相关python统计单词出现次数内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
本文标题: python统计文章中单词出现次数实例
本文地址: http://www.cppcns.com/jiaoben/python/301688.html
python中统计单词出现的次数_python统计文章中单词出现次数实例相关推荐
- python统计文件中每个单词出现的次数_Python统计单词出现的次数
题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...
- python中的object是什么意思_Python object类中的特殊方法代码讲解
python版本:3.8class object: """ The most base type """ # del obj.xxx或del ...
- python中demo函数是什么意思_Python函数(中)
本文标识 :Python_7 本文编辑 :Jack 风 编程工具 : Anaconda.Pycharm 阅读时长 :8分钟 Python函数(中) 1.回顾函数应用 函数的嵌套应用 程序设计的思路,复 ...
- python找不到scripts文件夹_Python目录下中没有Script文件夹
其中需要将C:\python27\Scripts 和 C:\python27 添加到系统路径中. 计算机属性-远程设置-高级(环境变量)-系统变量PATH后面添加Scrips的路径 而我的Python ...
- python两个csv表数据合并_python – 根据列中的数据合并两个CSV文件
我有两个csv文件,如下所示. CSV1 data13 data23 d main_data1;main_data2 data13 data23 data12 data22 d main_data1; ...
- arrays中copyof复制两个数组_Python数组切片中的复制与否问题-list篇
说到Python中数组的切片操作,稍有了解的想必都不陌生.以Python的内置数据类型list(列表)为例, L = [5, 2, 0, 1, 3, 1, 4] L1 = L[3:7] 我们称L[3: ...
- python好用的模块和包_Python模块和包详细讲解与实例分析
一丶模块 我们经常说模块模块的,究竟什么是模块呢? 一个模块就是包含了Python定义和声明的文件,文件名就是模块名字加上.py的后缀 但其实import加载的模块分为四个通用类别: 1.使用Pyth ...
- python统计文件中每个单词出现的次数_python统计文本中每个单词出现的次数
.python统计文本中每个单词出现的次数: #coding=utf-8 __author__ = 'zcg' import collections import os with open('abc. ...
- python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...
问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...
最新文章
- python那么多库怎么学_这个 Python 库有必要好好学学
- android launcher
- 连接mysql次数_matlab2020b通过JDBC连接mysql8.0.22
- 如何创建字符串(OC)
- Python 初学者的最佳学习资源
- 单开双控_卧室或者楼梯灯怎么安装单联双控
- [archlinux][hardware] 查看SSD的使用寿命
- 转载:35岁前成功的12条黄金法则
- ExpressJS入门指南
- 相比于深度学习,传统的机器学习算法难道就此没落了吗,还有必要去学习吗?...
- 1.3_对于Servlet规范的一点理解
- 含泪整理最优质草坪灯光域网素材,你想要的这里都有
- 【机器学习基石】感知机模型+PLA(二)
- vue+原生js实现从excel复制内容粘贴至table中展示
- html网页表格相同行自动合并,jQuery实现HTML表格单元格的合并功能
- 微信小程序接入知晓云插件sdk入门
- 因果性与因果模型 | 中国人民大学哲学与认知科学明德讲坛
- JS验证身份证号码合法性
- 翻译之:数据页面和数据行
- attention综述论文阅读:An Overview of the Attention Mechanisms in ComputerVision
热门文章
- Redis学习笔记1-安装配置
- OC的项目网址(自己编写的项目)
- ecshop后台增加栏目查询会员是否重复注册
- Vijos P1067Warcraft III 守望者的烦恼
- vim - 查找替换
- 我的Delphi开发经验谈(转)
- java 静态变量 存储_Java学习笔记9---类静态成员变量的存储位置及JVM的内存划分...
- oracle脚本刷错了怎么办,Oracle故障处理中常用的脚本
- matlab图像相加例子,MATLAB图像处理例子
- 7系列mrcc xilinx_XILINX 7系列FPGA_时钟篇