如何快速的统计出那些是重复的呢?

形如aa=[1,2,2,3,2,4]的一个list,其中有重复元素,由于集合中重复元素无意义,所以

bb=list(set(aa))可很容易得到去除重复的列表[1,2,3,4]

若比较aa和bb的长度,很容易发现有重复,但无法指出重复的元素是哪些。

那么用网上一个比较两个list差集的方法可行吗?

print list(set(aa).difference(set(bb))),结果是不行,因为bb和aa的差正好都是重复的元素,而set(aa)的转换已经去除了重复元素,所以得到aa和bb的差值是[]。可见这种方法只能用于比较两个列表中有不同元素的情况。

最简单的方法其实是引入Counter包:

from collections import Counter

然后Counter(aa),即可得到一个显示出所有元素重复次数的dict。

Counter({2: 3, 1: 1, 3: 1, 4: 1})

出现频度最高的元素会默认在前面,也可用dict()操作符将其转换为一个普通的dict来进行额外处理。

比如采用列表解析表达式来处理:

print [ str(k)+':'+str(v) for k,v in dict(Counter({2: 3, 1: 1, 3: 1, 4: 1})).items() if v>1]

将显示出仅含重复项的列表:

['2:3']

python统计列表中重复_查找统计python列表中的重复元素相关推荐

  1. python统计词频 创建字典_如何利用Python进行文本词频统计

    问题描述 Python在自然语言处理这个方面,有其天然的优势:简单,快捷.所以我们经常会遇到利用Python从一篇文档中,统计文本词频的问题.以<三国演义>这部名著为例,文中哪些人物的出场 ...

  2. python列表去空值_如何在Python列表中的列表中删除nan / null值? - python

    因此,我有一个具有NaN值的数据框,并将该数据框中的所有行转换为一个列表,然后将其添加到另一个列表中. Index 1 2 3 4 5 6 7 8 9 10 ... 71 72 73 74 75 76 ...

  3. python中列表的查_每日一记----python中的列表【查询和插入】

    首先说说什么是列表,先看官方解释:列表是python中的最基本的数据结构.那么既然是数据结构,肯定是用来存储数据的,我的理解中:列表就是一组数据按照一定的顺序进行存储.那我们用什么区确定每一个元素的位 ...

  4. python怎么打下划线符号_详解 Python 中的下划线命名规则

    在 python 中,下划线命名规则往往令初学者相当 疑惑:单下划线.双下划线.双下划线还分前后--那它们的作用与使用场景 到底有何区别呢?今天 就来聊聊这个话题. 1.单下划线(_) 通常情况下,单 ...

  5. python列表使用判断_浅谈Python数据类型判断及列表脚本操作

    数据类型判断 在python(版本3.0以上)使用变量,并进行值比较时.有时候会出现以下错误: TypeError: unorderable types: NoneType() < int() ...

  6. python二维数组初始化_如何在Python中初始化二维数组?

    这种方式比嵌套列表推导更快[x[:] for x in [[foo] * 10] * 10] # for immutable foo! 这里有一些python3时序,适用于小型和大型列表$python ...

  7. python语法糖的本质_科学网—Python语法糖之:列表解析、集合解析和字典解析 - 陈同的博文...

    Python的列表解析 (list comprehensions)是在Python 2.0以来一直都有的功能,特别简洁.实用.而字典解析虽然曾经在Python 2.3版本中引入过,但后来因为与dict ...

  8. python迭代是什么意思_如何理解python中的迭代

    迭代:是通过重复执行的代码处理相似的数据集的过程,并且本次迭代的处理数据要依赖上一次的结果继续往下做,上一次产生的结果为下一次产生结果的初始状态,如果中途有任何停顿,都不能算是迭代.例如: (1)非迭 ...

  9. python视觉开发书籍推荐_机器视觉十佳图书列表

    计算机视觉赋予机器或者计算机人类感官的计算机的科学.计算机视觉包括获取,处理.分析和理解数字图像以及提取高维数据的方法.本文虫虫给你推荐业界选出的计算机视觉最佳的图书. 1.计算机视觉:算法和应用(计 ...

最新文章

  1. [转载]Surging 分布式微服务框架使用入门
  2. python计算最大公约数和最小公倍数_python怎么求最大公约数和最小公倍数
  3. idea如何导出war文件
  4. mysql 主从 binlog_mysql 主从 binlog
  5. node js、npm、homebrew、cocoapod、git、hexo
  6. GIS中的基本概念收集
  7. 「leetcode」383. 赎金信:哈希表的经典题目
  8. vibe的matlab实现,Matlab調用VIBE算法
  9. ZBrush建模的15个小技巧,萌新小白都用得上的干货,速看
  10. VOC数据集解析 VOC2007解析
  11. SQL Server 中“dbo”到底是什么
  12. 邮箱登录入口官网是哪个?域名邮箱登录入口展示
  13. 关于RS-485总线,这篇很详细
  14. eclipse IDE
  15. 用牛顿迭代法求方程的根matlab,牛顿迭代法求方程根的MATLAB程序
  16. 360公司2016校园招聘笔试题大题一
  17. 怎么制作app系统软件,大概需要多少钱
  18. 测试大咖漫谈测试人职业发展
  19. 搜索引擎登录站点-提交网站(大全)
  20. 微电网管理系统优化调度研究 能源管理系统(EMS)有助于优化微电网中分布式能源(DERs)的使用

热门文章

  1. 关于数字档案馆建设实践与思考
  2. c语言中的关键词有哪些及其作用意思,C语言中各个关键字的意思和作用
  3. 苹果手机左上角的数字怎么弄_出了新朋友,莫忘老朋友,苹果Macbook这款小键盘能让你键步如飞...
  4. PID控制算法基础介绍
  5. 记录Unity WebGL发布到IIS服务器时遇到的坑
  6. 14.深入浅出:信号的运算——参考《模拟电子技术基础》清华大学华成英主讲
  7. postek二次开发_各类标签一机打尽 博思得C168条码机热促
  8. 简单几步 对Liunx服务器的宽带进行测速
  9. iOS 随机数(Fixed)
  10. 标准技术方案指标体系研究报告国标策文件技术标准技术规范,政策GB行业报告白皮书数据资源