python数据结构之 set
在数学概念中,被意为整合元素的定义区域
在python中,set最大的作用是用来去重
set常见操作:
In [158]: s ={1,1,1,1,2,22,33,3,3,3}
In [159]: s
Out[159]: {1,2, 3, 22, 33}
在定义一个集合的时候,只能使用大括号定义最少一个值,不然会被认为字典进行定义
在set中不能加入不可哈希的对象类型
In [161]:hash('a')
Out[161]:4952964627402403516
查看列表的哈希值,可以发现这个对象不可被哈希
In [162]: a =[1,2,3]
In [163]:hash(a)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-163-fe724719d9a1>in <module>()
----> 1hash(a)
TypeError:unhashable type: 'list'
set元素必须是可以哈希运算,但是需要元素可以迭代的
只要是能被迭代的元素都可以被加入到set中
In [171]:list(s)
Out[171]:['abc', b'abc']
In [172]: a =list(s)
In [173]: a
Out[173]:['abc', b'abc']
In [174]:set(a)
Out[174]:{'abc', b'abc'}
set.add增加元素
增加一个元素到set中,如果存在则什么都不做,因为存在其值
In [176]:s.add(1)
In [177]: s
Out[177]: {1,'abc', b'abc'}
In [178]:s.add(2)
In [179]: s
Out[179]: {1,'abc', 2, b'abc'}
set可以收集多个集合,同样的可以合并多个集合
使用update进行更新
In [180]:s.update({1,2,3},{5,7},(1,9,1))
In [181]: s
Out[181]: {1,'abc', 2, b'abc', 3, 5, 7, 9}
In [185]:s.update({1})
In [186]: s
Out[186]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9}
In [187]:s.update({10})
In [188]: s
Out[188]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9, 10}
set.remove删除
remove,将要删除的值转为hash,并按当前hash值定位其位置进行删除,这个hash将作为一个key进行操作
In [193]: s
Out[193]: {1,2, b'abc', 3, 5, 7, 4, 9, 10}
In [194]:s.remove(b'abc')
In [195]: s
Out[195]: {1,2, 3, 4, 5, 7, 9, 10}
查找元素的过程是非常快,因为是直接定义hash,并非是从头到尾去遍历
discard 从集合移除一个元素
与remove功能一样,但是discard并不会弹出异常:
remove 删除一个异常索引会报出keyerror
In [196]:s.remove('hahaha')
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-196-185a5cf4c543>in <module>()
----> 1s.remove('hahaha')
KeyError:'hahaha'
discard 删除一个索引则不会返回任何信息
In [197]:s.discard('hahaha')
In [198]:
pop 随机挑选一个弹出并返回
pop只是随机弹出,并不能跟参数
In [202]:s.pop()
Out[202]: 2
In [203]:s.pop()
Out[203]: 3
In [204]: s
Out[204]: {4,5, 7, 9, 10}
clear 清除集合内所有元素,但是要考虑GC内存回收问题
set修改及查询
在set中没有修改的概念,只有两种操作:
删除元素 和追加元素
查询:非线性结构,无法进行索引查询
遍历:可以遍历所有可迭代的元素
成员运算符
成员运算符 in , not in ,效率很高
非线性结构如果找哈希值,时间复杂度相当于索引遍历列表大O(1)
看似通过值在遍历,实际上是用哈希值进行定位
可哈希的类型
数值型:int、float、complex
布尔类:True、False
字符串: str Bytes
Tuple、None都是不可变类型,称为哈希类型
对比list和set执行效率
查看set执行效率
导入模块timeit
import timeit
In [3]:%%timeit lst1 = set(range(1000))
...: a = -1 in lst1
...:
38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)
查看list效率
In [1]:%%timeit lst1 = list(range(1000))
...: a = -1 in lst1
...:
14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
总结:
线性结构查询的复杂度是O(n), 随着规模增大耗时间越来越高
set和字典都属于特殊结构,其中都存了hash作为key,时间复杂度可以做到O(1),查询时间与数据规模无关
python数据结构之 set相关推荐
- python3 namedtuple_你不能低估的Python数据结构Namedtuple(二)
上篇你不能低估的Python数据结构Namedtuple(一)讲了namedtuple的一些基本用法,本篇继续. namedtuples和数据类(Data Class)之间有什么区别? 功能 在Pyt ...
- python线性表和队列_[笔记]python数据结构之线性表:linkedlist链表,stack栈,queue队列...
python数据结构之线性表 python内置了很多高级数据结构,list,dict,tuple,string,set等,在使用的时候十分舒心.但是,如果从一个初学者的角度利用python学习数据结构 ...
- python数据结构 树_python数据结构之二叉树的建立实例
先建立二叉树节点,有一个data数据域,left,right 两个指针域 复制代码 代码如下: # -*- coding: utf - 8 - *- class TreeNode(object): d ...
- python数据结构包括什么_Python中的数据结构详解
概述 在深入研究数据科学和模型构建之前,Python中的数据结构是一个需要学习的关键内容 了解Python提供的不同数据结构,包括列表.元组等 介绍 数据结构听起来是一个非常直截了当的话题,但许多数据 ...
- python数据结构树和二叉树,python数据结构树和二叉树简介
一.树的定义 树形结构是一类重要的非线性结构.树形结构是结点之间有分支,并具有层次关系的结构.它非常类似于自然界中的树. 树的递归定义: 树(Tree)是n(n≥0)个结点的有限集T,T为空时称为空树 ...
- python数据结构推荐书-关于数据结构,有哪些不错的参考书推荐?
学习编程,数据结构是你必须要掌握的基础知识,那么数据结构到底是什么呢? 其实数据结构就是用来描述计算机里存储数据的一种数学模型,因为计算机里要存储很多乱七八糟的数据,所以也需要不同的数据结构来描述. ...
- CodeSalt | Python数据结构的实现 — 链表
Python数据结构实现-链表 1. 简单介绍 链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是并不会按线性的顺序存储数据,而是在每一个节点里存到下一个节点的指针(Point ...
- Python数据结构——tuple
tuple 元组 什么是tuple 元组是一种和列表非常相似的线性数据结构,也支持不同的数据类型. 最大的区别就是元组一旦创建不可改变,和string一样,所有改变元组内容的操作都会返回一个新的元组. ...
- Python数据结构——list
list 列表 什么是list 列表是Python中特有的一种线性数据结构,列表是可变的,有序的,我们可以用选择操作符来改变任意位置的值,和数组不同的是,列表可以同时保存不同类型的元素(异构). 在C ...
- Python数据结构——array
array 数组 array是什么 一般来说,array基本是所有程序语言都有的一种基础线性结构,元素以特定的顺序存储在一段连续的内存中. 在Python中其实也有array这种数据结构,和其他语言的 ...
最新文章
- jpa删除数据后数据库无修改_java – JPA不删除数据库行
- NCBI下载SRA数据的4种方法
- char怎么比较_C语言的 main 函数到底怎么写才是对的?
- java证明ArrayList是线程不安全的
- django后台多页面分页逻辑python代码
- Java中的StringBuffer、StringBuilder和包装器类型
- 全球开源正当时,第 19 届中日韩三国 IT 局长 OSS 会议暨东北亚开源软件推进论坛圆满落幕
- 获取列表的最后一个元素
- abaqus dat文件 matlab_基于MPCCI的FLUENT与ABAQUS流固耦合分析步骤
- java png生成webp图片_PNG转WEBP格式的动态图
- 关于getResource和getClassLoader().getResource()
- Qt 启动应用程序的3种方式
- 计算机导论论文论题,计算机导论专业论文题目 计算机导论毕业论文题目怎么定...
- 微信app支付签名错误
- 使用带有响应的Hypermedia API来保留v6
- 《深入学习VMware vSphere 6》——2.2 vSphere 6实验环境需求
- 虾米带你轻松搞定Vuejs 系列
- AI修图!pix2pix网络介绍与tensorflow实现
- shell 获取当前目录的路径
- 本周白银市场再刮超级旋风
热门文章
- Coursera NLP 笔记02
- C# 按钮美化技巧
- UpdatePanel的妙用:Incremental Content
- ${ctx} 的那些事
- 重复数据_MongoDB 自动过滤重复数据
- 来电语音播报软件下载apk_消息语音播报app下载-消息语音播报安卓版 v1.0.1 - 安下载...
- php中常用的运算符和表达式有哪几种,php 运算符与表达式详细介绍
- wshttpbinding java_WCF自定义用户账号密码之WCF系结模式wsHttpBinding的Java调用
- ElasticSearch 复合查询
- 使用 bind 搭建DNS 服务器