Python--几种set集合去重的方法
1.set集合的去重机制
ps: set集合在内部执行时,首先会先对对象执行hash算法,存储到内存空间,
(但在同一次运行过程中两个值相等的对象hash值一样)所以如果两个对象值相等,这时会做出第二步操作,
判断这两个对象的值是否相等,若相等覆盖,若不等则进行二次寻址,存储到空间;
*****那么问题来了!!!*****
看下面这道题:
1)创建一个员工管理系统 2)对象的属性为:姓名,年龄,性别,部门
3)在公司的日志中可能有的员工会出现内部转岗的情况,所以会有重复的信息
4)现有200个员工,如果几个员工对象的姓名和性别相同,那么这是同一个人,进行去重操作
class Person:def __init__(self,name,sex,age,partment):self.name = nameself.sex = sexself.age = ageself.partment = partmentdef __hash__(self):return hash((self.name,self.sex))def __eq__(self, other):if self.name == other.name and self.age == other.age:return True
employeeList = []
for i in range(3):employeeList.append(Person('li','男',15,'Python'))
for i in range(3):employeeList.append(Person('wu', '男', 15, '运维'))
for i in range(3):employeeList.append(Person('alex', '男', 15, 'linux'))obj = set(employeeList)
for i in obj:print(i.__dict__)
#set集合会先触发对象的__hash__方法,如果hash值相等,再触发__eq__方法进行去重操作
输出结果:
{'name': 'li', 'sex': '男', 'age': 15, 'partment': 'Python'}
{'name': 'wu', 'sex': '男', 'age': 15, 'partment': '运维'}
{'name': 'alex', 'sex': '男', 'age': 15, 'partment': 'linux'}
总结:set集合去重机制是先对对象进行hash,如若hash值相等,再比较两个值是否相等,如若不等,则进行二次寻址;
这个算法设计具有一定的可靠性;
2.几种set集合去重的办法
1)直接使用
ls = [1,2,2,3,5,5,4,4]
print(list(set(ls)))#结果:[1, 2, 3, 4, 5]
#为什么结果是排序之后的结果呢,因为数字的hash值是它本身
2)列表推导式
ls = [1,2,2,3,5,5,4,4]
new_ls = []
[new_ls.append(i) for i in ls if i not in new_ls]
print(new_ls)#结果:[1, 2, 3, 5, 4]
3)keys()方法:
ls = [1,2,2,3,5,5,4,4]
print(list(dict.fromkeys(ls).keys()))#结果:[1, 2, 3, 5, 4]
4.按照索引再次排序:
ls = [1,2,2,3,5,5,4,4]
obj = list(set(ls))
obj.sort(key=ls.index)
print(obj)
#结果:[1, 2, 3, 5, 4]
装饰器
# ----展开版(装饰器携带参数----
def test2():print('test2')def fn(f):# 嵌套多层,接收参数def outter(fun):def inner():print(f)fun()print('hou')return innerreturn outteroutter = fn('qq')
inner = outter(test2)
inner()
# ---正规版---
def fun(f):def outter(fun):def inner():print(f)fun()print('后')return innerreturn outter@fun('qq')
def test1():print('test1')test1()
关于装饰器的题目:
- 实现一个装饰器,限制该函数调用频率,如10秒一次
import timedef fun(fn):dic = {}def inner(*args, **kwargs):if not dic.get(fn):print('执行函数')dic.setdefault(fn, time.time())return fn(*args, **kwargs)else:print(time.time())if time.time() - dic.get(fn) > 0.01:return '不执行函数'else:print('时间通过,执行函数')return fn(*args, **kwargs)return inner@fun def test(f):return 111# for i in range(0, 800): # print(test(i))@fun def test2():return 222print(test2())
Python--几种set集合去重的方法相关推荐
- Python四种读取数据文件的方法
下面介绍读取数据文件的方法: 首先说明下数据文件的格式 第一行为列名,第一列为编号 第一种:手写读取数据 f = file(路径名)x = []y = []for i, d in enumerate( ...
- Python几种基本的字符串格式化方法
1.旧式 % 格式化 % 百分号格式化和 C 语言的 printf 格式化差不多. # '%%' 格式化成 '%' print('%% %d' % 1) #输出百分号和数字 # %c 字符及其ASCI ...
- python两种获取剪贴板内容的方法
第一种 import win32clipboard import time #速度快 容易出错 class niubi(): def lihai(self): while True: #jiantin ...
- Python几种常用的数据导入方法
1.通过标准的Python库导入CSV文件: Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文件.当CSV文件被读入后,可以利用这些数据生成一个NumP ...
- python 三种打开mat文件的方法
1. import mat4py mat4py.loadmat(mat_path) 2. import scipy.io as io io.loadmat(mat_path) 前两种方法有时会因为ma ...
- python五种调试或排错的方法
1.print,直接打印,比较简单而且粗暴 在代码中直接输入print+需要输出的结果,根据打印的内容判断即可 2.assert断言,很方便,测试人员常常在写自动化用例的时候用的比较多 如下,直接将预 ...
- Python 五种图片相似度比较方法
均值哈希算法 # -*- coding: utf-8 -*- import cv2 import numpy as np# Hash值对比 def cmpHash(hash1, hash2,shape ...
- List 集合去重的 3 种方法
问题由来 在实际开发的时候,我们经常会碰到这么一个困难:一个集合容器里面有很多重复的对象,里面的对象没有主键,但是根据业务的需求,实际上我们需要根据条件筛选出没有重复的对象. 比较暴力的方法,就是根据 ...
- python数据库去重_python redis连接 有序集合去重的代码
python redis连接 有序集合去重的代码如下所述: # -*- coding: utf-8 -*- import redis from constant import redis_ip, re ...
最新文章
- 计算机课程认识,认识计算机课程教案.doc
- P3531 [POI2012]LIT-Letters(求逆序对)
- 怎样才能算是一个好的应用程序?
- 老王学linux-ftp
- 人脸识别研究任务及开源项目调研
- 异常检测3——AutoEncoder异常检测
- 【Java】关于学习while do-while for循环知识点的总结
- git 生成ssh key
- 数字电子技术基础(四):门电路(二极管)
- android sonar 简书,Sonar使用指南
- u3d商业级开心消消乐源码开发总结
- 轻量级 android模拟器,【分享中控】轻量级中控系统
- 【拥塞管理】配置低延迟队列LLQ
- 电脑垃圾太多?这几个清理电脑的软件来看看吗?
- 基于 Retina-GAN 的视网膜图像血管分割
- Word使用技巧-分页符-分节符
- 开发自己的DJI四旋翼无人机(A3飞控Onboard SDK和Mobile SDK介绍)
- 大强考研英语词汇5500课
- Excel所有批注相关的操作都在这里了。
- Android绝黑剑之AutoCompleteTextView、MultiAutoCompleteTextView之智能联想