python高斯求和_利用Python进行数据分析(3)- 列表、元组、字典、集合
本文主要是对Python的数据结构进行了一个总结,常见的数据结构包含:列表list、元组tuple、字典dict和集合set。
image
索引
左边0开始,右边-1开始
通过index()函数查看索引编号
lang = ['python', 'java', 'html']
lang.index('python')
0 # 索引从0开始
lang.index('html')
2
切片
索引左边从0开始,右边-1开始
含头不含尾
步长可正可负
lst = [1, 2, 3, 4, 5, 6]
print(lst[:]) # 相当于是复制 lst
[1, 2, 3, 4, 5, 6]
print(lst[::2]) # 步长是2 [开始:结束:步长]
[1, 3, 5]
print(lst[-3:-1])
lst = [1,2,3,4,5,6]
print(lst[1:5:2]) # 常规用法
print(lst[-5:-2:2]) # 标号-5代表的是元素2,标号-2代表的是5,步长为2
print(lst[-5:4:2])
print(lst[1:-2:2])
[2,4]
list列表[]
特点
长度可变的
内容是可以修改的
创建
直接通过[]
通过list()函数
list(range(10))
list(1,2,3,4)
操作
列表和字符串一样,都是序列,里面的元素是有序的,也有索引和切片。索引index左边从0开始,右边从-1开始,index()函数可以查看某个元素的索引编号。
追加
append:末尾追加,单个追加
insert(location, obj):指定位置追加元素
extend:整体的扩编
删除
pop(2):删除指定索引为2的元素,有返回值即删除的元素值
remove(obj):删除指定元素,没有返回值;如果存在多个,则删除第一个元素
排序
sort:obj.sort(key=len)
sorted:sorted(obj);默认是从小到大排序
bisect模块:import bisect
bisect.bisect(obj,col):返回插入的位置
bisect.insort(obj,col):直接插入元素
反转
通过步长-1进行反转,[::-1]
通过reversed()进行反转,得到的是可迭代对象,并且将迭代对象转为为列表显示
# 反转1
print(lst[::-1]) # 通过步长为-1进行反转
print(lst) # 不影响原来对象
[6, 5, 4, 3, 2, 1]
[1, 2, 3, 4, 5, 6]
# 反转2
print(list(reversed(lst))) # 通过reversed函数进行反转
[6,5,4,3,2,1]
print(list(reversed('abcde'))) # 对字符串进行反转,列表显示
['e', 'd', 'c', 'b', 'a']
元组tuple()
特点
固定长度、不可变
元组中的元素可以是任意类型
如果内部存在列表等可变的元素,则内部元素能够进行修改
元组中的元素能够通过索引进行访问
创建
使用小括号,元素之间用逗号隔开;若只有元素,末尾也必须加上逗号:(5,)
通过tuple函数进行创建
tup = () # 创建空元组
print(tup)
tup1 = ('python', ) # 创建单个元组,必须在最后带上逗号
print(tup1)
tup2 = (1, 2, (3, ), ["python", "java", "php"]) # 创建多重元组
元组和列表之间是互通的,通过list()和tuple()能够实现列表和元组之间的转化。通过dir(tuple)能够查看元组对象的方法
操作
统计
统计元素出现的个数count()
嵌套拆包
tup = 4,5,(6,7)
a,b,(c,d) = tup # 嵌套拆包
遍历序列
seq = [(1,2,3), (4,5,6), (7,8,9)]
for a, b, c in seq:
print('a={0}, b={1}, c={2}'.format(a,b,c))
# 结果
a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9
image
高级功能
特殊语法*rest
values = 1,2,3,4,5
a,b,*rest = values
rest
[3,4,5]
如果想丢弃某些元素,将rest换成下划线_
a,b,*_ = values
用途
元组表列表操作速度快;
在进行遍历操作的时候,请用元组代替列表
如果对不需要修改的数据进行“写保护”,即改数据是常量,也要使用元组;如果需要改变这些值,转换为列表进行修改
元组在字典中可以当做key来使用,但是列表不可以
字典dict{}
特点
常用的名字是哈希表或者关联数组
由键值对组成,键是不可变的(哈希的),值是可变的
创建
通过dict函数
直接通过{}中括号创建,中间用逗号隔开
操作
删除
del:del dict[k1],内存中也没有了
clear:D.clear()变成了空字典,但内存中仍存在
pop:D.pop(k[,d]),以字典的键为参数,删除键值对
更新
update:更新字典,没有返回值
获取键、值
关于键值对、键、值的获取主要用到的是items()、keys()、values()三种方法,三种方法得到的结果都能够用for进行遍历,获取单个元素:
函数
作用
items
获取键值对
keys
获取所有的键
values
获取所有的值
默认值相关
get
获取某个键key的值value:dict.get(k, [,d])键不存在返回指定的值d
setdefault
类似get方法,如果键不存在,返回指定的值,并在字典中增加这个键值对;如果不指定返回值,默认是None
看一个具体的例子
ab = {'language': 'python', 'city': 'shenzhen', 'code': '101'}
print(ab.get("language"))
print(ab['language']) # 当键存在时,二者作用相同
print(ab.get('number')) # 返回的是None,但是原来的字典不变
# print(ab['number']) 报错
print(ab.get('number', '1234')) # 返回值是1234,但是原来的字典不变
print(ab.setdefault('number', '1234')) # 返回值是1234,并且原来的字典添加了键值对'number':'1234'
# 执行setdefault()后的结果
{'language': 'python', 'city': 'shenzhen', 'code': '101', 'number': '1234'}
栗子
根据首字母分类为包含列表的字典
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}
for word in words:
letter = word[0] # 取出每个单词的首字母
if letter not in by_letter:
by_letter[letter] = [word] # 首字母第一次不存在则创建
else:
by_letter[letter].append(word) # 当首字母之后,直接进行追加
使用setdefault来解决
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}
for word in words:
letter = word[0]
by_letter.setdefault(letter, []).append(word) # 创建letter为首字母的键,值为word组成的列表的键值对
使用内建模块defaultdict来解决,defaultdict(function_factory)构建的是一个类似dictionary的对象
keys的值,自行确定赋值;values的类型,是function_factory的类实例,而且具有默认值。
比如default(int)则创建一个类似dictionary对象,里面任何的values都是int的实例,而且就算是一个不存在的key, d[key] 也有一个默认值,这个默认值是int()的默认值0
from collections import defaultdict
by_letter = defaultdict(list) # 创建一个类似dict的对象,values都是list类型
for word in words:
by_letter[word[0]].append(word)
集合set{}
特点
无序的,没有索引,不属于序列
元素唯一,不重复
元素不可变,可哈希
空集合只能通过set()创建
创建
set方法
通过{}直接创建,还带去重功能
方法
常见的集合方法及其作用
方法
作用
add()
给一个集合增加元素,参数只能有一个:增加的元素
update
用原有集合自身和其他东西构成的新集合,来更新原来的集合
pop
随机删除一个元素,返回元素本身;不能指定参数,不能指定删除某个元素
remove(obj)
obj必须是集合set中的元素,否则报错;没有返回值
discard(obj)
obj如果在集合中就执行删除,否则不进行任何操作,与remove不同
clear()
删除所有元素,bool(set)为False
操作
常见的操作
并集:union、|
交集:intersection、&
子集(包含于):issubset()
超集(包含):issuperset()
image
内建函数
enumerate
遍历序列的同事跟踪其索引,使用enumerate(),返回的是(i, value)
lst = ["foo", "bat", "bar"]
mapping = {}
for i,v in enumerate(lst):
mapping[v] = i # 键是lst中的元素,值是该元素的索引
sorted
sorted函数返回的是排序好的一个列表,默认是从小到大
sorted([1,3,4,2,6,5])
[1,2,3,4,5,6]
zip
配对
将列表、元组或者其他序列中的元素进行配对组合,新建一个元组构成的列表
image-20200407172659855
生成的长度由最短的序列决定。有时和enumerate()连用:
for i, (a,b) in enumerate(zip(seq1, seq2)):
print('{0}:{1},{2}'.format(i,a,b))
拆分
将已经配对的序列用zip进行拆分,注意*的使用
first_name, last_name = zip(*pitchers)
image
利用zip实现矩阵转置
list2 = [[1, 2], [3, 4], [5, 6]]
list(zip(*list2))
[(1,3,5), (2,4,6)]
map
方法中有两个参数,一个是函数,另一个是待运行的序列,基本样式:map(func, seq)
func是一个函数对象,seq是序列对象
执行:可迭代序列对象seq中的元素,依次取出来放入函数func对象进行执行,相当于是for循环。
返回值被放入一个列表
items = list(range(10))
def square(x):
return x*2
list(map(square, items)) # 函数+序列
list1 = range(1, 6)
list2 = range(6, 11)
list(map(lambda x, y: x + y, list1, list2)) # 将两个list中的对象一次相加
求出两个列表中对应位置的较大值
a = [1, 2, 3, 4, 5]
b = [2, 3, 2, 4, 8]
list(map(lambda x: max(x), zip(a,b)))
reduce
在Python3中reduce已经被转移到functools模块里面了,使用的时候需要进行导入:
from functools import reduce
两个参数 reduce(function, seq)
执行:从左到右根据函数一次执行
返回值是一个value
image
高斯求和利用reduce函数实现
lst = range(1, 101)
reduce(lambda x, y: x+y, lst)
filter
filter翻译成中文就是过滤器的意思,在Python起到了过滤的作用,将满足条件的对象进行输出:
两个参数:函数+可迭代对象
满足条件的对象进行输出
numbers = range(-5, 5)
list(filter(lambda x: x < 0, numbers)) # 选出小于0的数,返回列表list
推导式
列表推导式
[x.upper() for x in strings if len(x) > 2]
image
字典推导式
dict_comp = {key-expr: value-expr for value in collections if condition}
创建一个字符串与其位置相匹配的字典
loc_mapping = {val: index for index, val in enumerate(strings)}
集合推导式
set-comp = {expr for value in collection if condition}
unique_len = {len(x) for x in strings}
上述功能使用map函数
set(map(len, strings))
嵌套推导式
some_tuples = [(1,2,3),(4,5,6),(7,8,9)]
# 方法1
flattened = [x for tup in some_tuples for x in tup]
# 方法2:列表推导式中的列表推导式
[[x for x in tup] for tup in some_tuples]
# 方法3:for循环
flattened = []
for tup in some_tuples:
for x in tup:
flattened.append(x) # 不断地追加到末尾
python高斯求和_利用Python进行数据分析(3)- 列表、元组、字典、集合相关推荐
- python列表元组字典集合实验心得_python学习小总结(列表、元组、字典、集合、字符串)...
---恢复内容开始--- 一.列表(list) 1.添加 append():追加,在列表末尾添加元素. 列表名.append(添加的元素) extend():扩展,在列表末尾添加元素. 列表名.ext ...
- python中列表 元组 字典 集合的区别
参考文章:python中列表 元组 字典 集合的区别
- python多元非线性回归_利用Python进行数据分析之多元线性回归案例
线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量).例如,餐厅根据每天的营业数据(包括菜谱价格.就餐人数.预定人数.特价菜折扣等)预测就餐规 ...
- 如何用python制作画像_利用Python搭建用户画像系统
用户画像是当下很多企业都会提及的概念,多数情况下会和大数据以及营销挂钩.本文将对用户画像的相关知识进行进行简单的介绍,并利用Python去实现一个简单的用户画像系统. 1.什么是用户画像 用户画像可以 ...
- python照片墙地图_利用python生成照片墙的示例代码
PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...
- python图色检测_利用python打开摄像头及颜色检测方法
最近两周由于忙于个人项目,一直未发言了,实在是太荒凉了....,上周由于项目,见到Python的应用极为广泛,用起来也特别顺手,于是小编也开始着手学习Python,-下面我就汇报下今天的学习成果吧 小 ...
- python音频聚类_利用python的KMeans和PCA包实现聚类算法
题目: 通过给出的驾驶员行为数据(trip.csv),对驾驶员不同时段的驾驶类型进行聚类,聚成普通驾驶类型,激进类型和超冷静型3类 . 利用Python的scikit-learn包中的Kmeans算法 ...
- python mysql 分页_利用python对mysql表做全局模糊搜索并分页实例
在写django项目的时候,有的数据没有使用模型管理(数据表是动态添加的),所以要直接使用mysql.前端请求数据的时候可能会指定这几个参数:要请求的页号,页大小,以及检索条件. "&quo ...
- python过去日期_利用python获取当前日期前后N天或N月日期的方法示例
前言 最近因为工作原因,发现一个Python的时间组件,很好用分享出来!(忘记作者名字了,在这里先感谢了),下面话不多说,来一起看看详细的介绍吧. 示例代码: # -*- coding: utf-8 ...
最新文章
- 一种安全的static变量Get/Set方式
- 找出最具竞争力的子序列_力扣300——最长上升子序列
- pat 乙级 1031 查验身份证(C++)
- vc++中画线时xor_C ++'xor_eq'关键字和示例
- 无法在只读编辑器中编辑_Mol Plant中国农科院作物科学研究所夏兰琴课题组成功利用 优化的引导基因编辑器在水稻中实现高效精准基因编辑...
- JS学习笔记5-JavaScript 变量
- 微信3.3.0 for Mac全新发布:新增视频号 可搜索微信号添加朋友
- Spring源码解读(1)-IOC容器BeanDefinition的加载
- 并联机构工作空间求解_断路器机构弹簧的设计
- (转载)计算机英语名词简释
- 4741G BIOS修复工具,黑刷bios有需要的收藏
- Solidworks工程图预备工作-----模板设置
- 求解平稳分布matlab,生灭过程的拟平稳分布
- 28KHZ/40KHZ老款超声波开关线路板
- # 数值计算:三角形积分
- 健康管理项目第九天(套餐预约之占比饼形图、运营数据统计、报表导出 )
- 第六章 网络学习相关技巧1(最优路径梯度)
- key_t键和ftok函数(转)
- 《卓有成效的管理者》——学习心得(五)
- 一文掌握项目如何进行分类,项目工时如何计算【实例】