本文实例讲述了python统计一个文本中重复行数的方法。分享给大家供大家参考。具体实现方法如下:

比如有下面一个文件

2

3

1

2

我们期望得到

2,2

3,1

1,1

解决问题的思路:

出现的文本作为key, 出现的数目作为value,然后按照value排除后输出

最好按照value从大到小输出出来,可以参照:

复制代码 代码如下:

in recent Python 2.7, we have new OrderedDict type, which remembers the order in which the items were added.

>>> d = {"third": 3, "first": 1, "fourth": 4, "second": 2}

>>> for k, v in d.items():

...     print "%s: %s" % (k, v)

...

second: 2

fourth: 4

third: 3

first: 1

>>> d

{'second': 2, 'fourth': 4, 'third': 3, 'first': 1}To make a new ordered dictionary from the original, sorting by the values:

>>> from collections import OrderedDict

>>> d_sorted_by_value = OrderedDict(sorted(d.items(), key=lambda x: x[1]))The OrderedDict behaves like a normal dict:

>>> for k, v in d_sorted_by_value.items():

...     print "%s: %s" % (k, v)

...

first: 1

second: 2

third: 3

fourth: 4

>>> d_sorted_by_value

OrderedDict([('first': 1), ('second': 2), ('third': 3), ('fourth': 4)])

代码如下:

复制代码 代码如下:

#coding=utf-8

import operator

f = open("f.txt")

count_dict = {}

for line in f.readlines():

line = line.strip()

count = count_dict.setdefault(line, 0)

count += 1

count_dict[line] = count

sorted_count_dict = sorted(count_dict.iteritems(), key=operator.itemgetter(1), reverse=True)

for item in sorted_count_dict:

print "%s,%d" % (item[0], item[1])

补充说明:1. python的dict对象的两个方法:

items方法将所有的字典项以列表的方式返回, 这些列表项中每一项都来自于(键, 值)

iteritems方法与items的作用大致相同, 但是返回一个迭代器对象而不是列表

2. python的内建函数sorted

复制代码 代码如下:

>>> help(sorted)

Help on built-in function sorted in module __builtin__:

sorted(...)

sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list

希望本文所述对大家的Python程序设计有所帮助。

本文标题: python统计一个文本中重复行数的方法

本文地址: http://www.cppcns.com/jiaoben/python/116202.html

python统计重复的数_python统计一个文本中重复行数的方法相关推荐

  1. python excel处理重复行并统计个数_python统计一个文本中重复行数的方法

    python统计一个文本中重复行数的方法 这篇文章主要介绍了python统计一个文本中重复行数的方法,涉及针对Python中dict对象的使用及相关本文的操作,具有一定的借鉴价值,需要的朋友可以参考下 ...

  2. python 文件行数_python—文件和数据(文件行数 文件字符分布)

    文件行数 描述 打印输出附件文件的有效行数,注意:空行不计算为有效行数. 文件下载地址: 链接:https://pan.baidu.com/s/1xURpGrALY0aZaoIEZI1LpA 提取码: ...

  3. java 只显示文本文件_Java设计并实现一个应用程序,能够读取一个文本文件中的内容并显示,同时能够计算出文本中的行数。...

    展开全部 java编写显示文本的应用程序, 需要用到图形界面GUI编程技术. 步骤一: 需要搭建一个整体的外观32313133353236313431303231363533e4b893e5b19e3 ...

  4. python模糊查找文件夹名字_python实现在目录中查找指定文件的方法

    本文实例讲述了python实现在目录中查找指定文件的方法.分享给大家供大家参考.具体实现方法如下: 1. 模糊查找 复制代码 代码如下: import os from glob import glob ...

  5. python查找指定文件夹_python实现在目录中查找指定文件的方法

    本文实例讲述了python实现在目录中查找指定文件的方法.分享给大家供大家参考.具体实现方法如下: 1. 模糊查找 复制代码 代码如下: import os from glob import glob ...

  6. python随机打乱一个文本中每行数据

    如果你有一个文本,其中有很大数据,每行为一条数据,按照某种顺序进行着排列,出于某种目的,你需要将所有的数据顺序进行随机打乱. 可以用如下python代码瞬间实现: import randomout_f ...

  7. python统计字符串汉字个数_Python使用递归计算字符串中的字符数

    第一步是把这个问题分解成碎片: 1.如何确定字符是否在字符串中? 如果是递归地执行此操作,则需要检查字符串的是否是第一个字符. 2.如何比较两个字符? Python有一个==运算符,用于确定两个事物是 ...

  8. python查看文件行数_python如何获取打开文件的行数?

    距离上次写爬虫文章已经过了许久了,之前写过一篇20行Python代码爬取王者荣耀全英雄皮肤 ,反响强烈,其中有很多同学希望我再写一篇针对英雄联盟官网的皮肤爬取,但苦于事情繁多,便 2020-11-28 ...

  9. jdbc获取结果行数_如何获取JDBC中的行数?

    I've executed a JDBC query to obtain a resultset. Before iterating over it, I'd like to quickly find ...

最新文章

  1. Battery electric vehicles (BEVs) 快充技术
  2. 【HTTP】之HTTP 错误 401.3 - 访问被资源 ACL 拒绝
  3. 【Linux】一步一步学Linux——usermod命令(86)
  4. 2019牛客暑期多校训练营(第五场)F - maximum clique 1 (最大团:补图最大独立集)
  5. Objective-C学习中对 C语言的扩展
  6. 只会用console.log调试?快来试试这些高效的调试方法
  7. 哔哩哔哩APP导出缓存视频并合并成MP4
  8. 淘宝/天猫:畅销榜 API 返回值说明
  9. 给大家推荐一本书:你只是看起来很努力
  10. networks.XXX.ipam.config value Additional properties are not allowed (‘gateway‘ was unexpected) 解决办法
  11. CentOS下切换桌面模式与命令行模式
  12. 测试手机电池性能的软件,电池性能早知道!安兔兔电池测试帮您忙
  13. Win7获KB4493132更新
  14. POI检查EXCEL版本(2003或2007)
  15. 记录下Tesla V100s vmware EXTI 7.0 虚拟机直通显卡cuda、cudnn安装
  16. java后端系统学习总结 03_java Web基础学习
  17. uva 10074 Take the Land
  18. Java开发的电子政务管理系统软件
  19. 针对NFT的网络钓鱼
  20. 我愿称之为最容易上手的编程语言——Yaklang(I)

热门文章

  1. xmind贴纸_如何使用彩色背景或大贴纸创建Facebook状态
  2. MATLAB强化学习实战(七) 在Simulink中训练DDPG控制倒立摆系统
  3. html颜色代码 糖果色,75平米糖果色跃层家 绚丽色彩散发迷人魅力
  4. 【机器学习】为什么机器学习难于应用
  5. SoC第一讲——Vivado的Block Design 的使用
  6. 嵌入式面试(笔试)笔记2
  7. 字符串的几个常用属性
  8. Redis上踩过的一些坑-美团
  9. 3dsmax-uv展开
  10. 如何保证GIS图件中字体大小是所要求的