python统计重复的数_python统计一个文本中重复行数的方法
本文实例讲述了python统计一个文本中重复行数的方法。分享给大家供大家参考。具体实现方法如下:
比如有下面一个文件
2
3
1
2
我们期望得到
2,2
3,1
1,1
解决问题的思路:
出现的文本作为key, 出现的数目作为value,然后按照value排除后输出
最好按照value从大到小输出出来,可以参照:
复制代码 代码如下:
in recent Python 2.7, we have new OrderedDict type, which remembers the order in which the items were added.
>>> d = {"third": 3, "first": 1, "fourth": 4, "second": 2}
>>> for k, v in d.items():
... print "%s: %s" % (k, v)
...
second: 2
fourth: 4
third: 3
first: 1
>>> d
{'second': 2, 'fourth': 4, 'third': 3, 'first': 1}To make a new ordered dictionary from the original, sorting by the values:
>>> from collections import OrderedDict
>>> d_sorted_by_value = OrderedDict(sorted(d.items(), key=lambda x: x[1]))The OrderedDict behaves like a normal dict:
>>> for k, v in d_sorted_by_value.items():
... print "%s: %s" % (k, v)
...
first: 1
second: 2
third: 3
fourth: 4
>>> d_sorted_by_value
OrderedDict([('first': 1), ('second': 2), ('third': 3), ('fourth': 4)])
代码如下:
复制代码 代码如下:
#coding=utf-8
import operator
f = open("f.txt")
count_dict = {}
for line in f.readlines():
line = line.strip()
count = count_dict.setdefault(line, 0)
count += 1
count_dict[line] = count
sorted_count_dict = sorted(count_dict.iteritems(), key=operator.itemgetter(1), reverse=True)
for item in sorted_count_dict:
print "%s,%d" % (item[0], item[1])
补充说明:1. python的dict对象的两个方法:
items方法将所有的字典项以列表的方式返回, 这些列表项中每一项都来自于(键, 值)
iteritems方法与items的作用大致相同, 但是返回一个迭代器对象而不是列表
2. python的内建函数sorted
复制代码 代码如下:
>>> help(sorted)
Help on built-in function sorted in module __builtin__:
sorted(...)
sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
希望本文所述对大家的Python程序设计有所帮助。
本文标题: python统计一个文本中重复行数的方法
本文地址: http://www.cppcns.com/jiaoben/python/116202.html
python统计重复的数_python统计一个文本中重复行数的方法相关推荐
- python excel处理重复行并统计个数_python统计一个文本中重复行数的方法
python统计一个文本中重复行数的方法 这篇文章主要介绍了python统计一个文本中重复行数的方法,涉及针对Python中dict对象的使用及相关本文的操作,具有一定的借鉴价值,需要的朋友可以参考下 ...
- python 文件行数_python—文件和数据(文件行数 文件字符分布)
文件行数 描述 打印输出附件文件的有效行数,注意:空行不计算为有效行数. 文件下载地址: 链接:https://pan.baidu.com/s/1xURpGrALY0aZaoIEZI1LpA 提取码: ...
- java 只显示文本文件_Java设计并实现一个应用程序,能够读取一个文本文件中的内容并显示,同时能够计算出文本中的行数。...
展开全部 java编写显示文本的应用程序, 需要用到图形界面GUI编程技术. 步骤一: 需要搭建一个整体的外观32313133353236313431303231363533e4b893e5b19e3 ...
- python模糊查找文件夹名字_python实现在目录中查找指定文件的方法
本文实例讲述了python实现在目录中查找指定文件的方法.分享给大家供大家参考.具体实现方法如下: 1. 模糊查找 复制代码 代码如下: import os from glob import glob ...
- python查找指定文件夹_python实现在目录中查找指定文件的方法
本文实例讲述了python实现在目录中查找指定文件的方法.分享给大家供大家参考.具体实现方法如下: 1. 模糊查找 复制代码 代码如下: import os from glob import glob ...
- python随机打乱一个文本中每行数据
如果你有一个文本,其中有很大数据,每行为一条数据,按照某种顺序进行着排列,出于某种目的,你需要将所有的数据顺序进行随机打乱. 可以用如下python代码瞬间实现: import randomout_f ...
- python统计字符串汉字个数_Python使用递归计算字符串中的字符数
第一步是把这个问题分解成碎片: 1.如何确定字符是否在字符串中? 如果是递归地执行此操作,则需要检查字符串的是否是第一个字符. 2.如何比较两个字符? Python有一个==运算符,用于确定两个事物是 ...
- python查看文件行数_python如何获取打开文件的行数?
距离上次写爬虫文章已经过了许久了,之前写过一篇20行Python代码爬取王者荣耀全英雄皮肤 ,反响强烈,其中有很多同学希望我再写一篇针对英雄联盟官网的皮肤爬取,但苦于事情繁多,便 2020-11-28 ...
- jdbc获取结果行数_如何获取JDBC中的行数?
I've executed a JDBC query to obtain a resultset. Before iterating over it, I'd like to quickly find ...
最新文章
- Battery electric vehicles (BEVs) 快充技术
- 【HTTP】之HTTP 错误 401.3 - 访问被资源 ACL 拒绝
- 【Linux】一步一步学Linux——usermod命令(86)
- 2019牛客暑期多校训练营(第五场)F - maximum clique 1 (最大团:补图最大独立集)
- Objective-C学习中对 C语言的扩展
- 只会用console.log调试?快来试试这些高效的调试方法
- 哔哩哔哩APP导出缓存视频并合并成MP4
- 淘宝/天猫:畅销榜 API 返回值说明
- 给大家推荐一本书:你只是看起来很努力
- networks.XXX.ipam.config value Additional properties are not allowed (‘gateway‘ was unexpected) 解决办法
- CentOS下切换桌面模式与命令行模式
- 测试手机电池性能的软件,电池性能早知道!安兔兔电池测试帮您忙
- Win7获KB4493132更新
- POI检查EXCEL版本(2003或2007)
- 记录下Tesla V100s vmware EXTI 7.0 虚拟机直通显卡cuda、cudnn安装
- java后端系统学习总结 03_java Web基础学习
- uva 10074 Take the Land
- Java开发的电子政务管理系统软件
- 针对NFT的网络钓鱼
- 我愿称之为最容易上手的编程语言——Yaklang(I)