Python中的defaultdict方法
字典(dictionary)是Python中一种常用的数据类型。不同于其他由数字索引的序列,字典是用"键"(key)来索引的。通常表示为dict(key: val, ...)
,有以下特征:
- 键可以是任何不可变(immutable)数据类型,如数字,字符串和仅包含不可变数据类型的元组
- 每个键必须是唯一的
- 字典中每一项的顺序是任意的
1. KeyError异常
在Python中如果访问字典里不存在的键,会出现KeyError
异常。有些时候,字典中每个键都存在默认值是很方便的,例如下面的例子:
>>> bag = ['apple', 'orange', 'cherry', 'apple',
... 'apple', 'cherry', 'blueberry'}]
>>> count = {}
>>> for fruit in bag:
... count[fruit] += 1
...
Traceback (most recent call last):File "<stdin>", line 2, in <module>
KeyError: 'apple'
上例统计列表bag中单词出现次数,并记录在字典count中。单词没出现一次,count中对应的键值会增加一。但是在实习运行代码时,每当单词第一次被统计就会出现'KeyError'异常,这是因为它并不在字典count中,Python中dict
对象并不存在默认值。
2. 使用判断语句检查
因此,在单词第一次被统计时,需要在count中给每个键设定一个默认值1,这可以用一个判断语句来实现:
>>> for fruit in bag:
... if fruit not in count: #如果不存在,添加
... count[fruit] = 1
... else:
... count[fruit] += 1
...
>>> count
{'apple': 3, 'blueberry': 1, 'orange': 1, 'cherry': 2}
3. 使用dict.setdefault()方法
dict.setdefault(key[,default])
方法接受两个参数,第一个是键的名称,第二个参数是默认值。在调用时如果键存在字典中,会返回它的值;如果不存在,则会自动把它添加进字典中并返回默认值,default的默认值为None
。此外,default的值还可以是列表,元组,集合和字典等。
>>> d = {'a': 1, 'b': 2}
>>> d.setdefault('a') #键存在并返回他的值
1
>>> d.setdefault('c', 3) #添加键-值
3
>>> d.setdefault('d') #只添加键,默认值为None
>>> d
{'a': 1, 'b': 2, 'c': 3, 'd': None}
接下来用它来实现上一个例子:
>>> count = {}
>>> for fruit in bag:
... count.setdefault(fruit, 0)
... count[fruit] += 1
...
>>> count
{'apple': 3, 'orange': 1, 'cherry': 2, 'blueberry': 1}
或者更简洁一些:
>>> for fruit in bag:
... count[fruit] = count.setdefault(fruit, 0) + 1
4. 使用collections.defaultdict类
class collections.defaultdict([default_factory[, ...]])
defaultdict
是Python内建dict类的一个子类,第一个参数为default_factory属性提供初始值,默认为None
。它覆盖一个方法并添加一个可写实例变量。它的其他功能与dict
相同,但会为一个不存在的键提供默认值,从而避免KeyError
异常。之前例子的实现如下:
>>> from collections import defaultdict
>>> count = defaultdict(int)
>>> for fruit in bag:
... count[fruit] += 1
...
>>> count
defaultdict(<class 'int'>, {'apple': 3, 'orange': 1, 'cherry': 2, 'blueberry': 1})
4.1. 类型名称作为初始化函数参数
首先它可以接受类型名称来作为初始化函数的参数,比如之前的例子中以int
类名称作为参数。除了标准dict
操作,它还支持__missing__(key)
方法,通过参考官方文档,它的机制如下:
如果default_factory为None
,会抛出以key为参数的KeyError异常。
>>> d = defaultdict() #default_factory为None
>>> d['eric']
Traceback (most recent call last):File "<stdin>", line 1, in <module>
KeyError: 'eric'
如果default_factory不为None
, 此处原文为:
"It is called without arguments to provide a default value for the given key, this value is inserted in the dictionary for the key, and returned."。
大概翻译了下:它会在不接收任何参数的情况下被调用,来为给定的键提供默认值,这个值会被添加进字典并被返回。
>>> d = defaultdict(list) #default_factory是列表名称
>>> d['eric'] #访问一个不存在的键
[] #添加并返回默认值(一个空列表)
>>> d
defaultdict(<class 'list'>, {'eric': []})
因为defaultdict
是dict
的一个子类,事实上访问一个不存在的键时,dict
类中的__getitem__
方法会调用子类中__missing__()
方法(但它不能直接被dict的实例调用),并且返回或抛出__missing__()
方法所返回的值和抛出的异常。因此,如果调用default_factory引发一个异常,该异常传播不变(propagated unchanged)。
请注意除__getitem__()
之外的任何操作都不会调用__missing __()
。 这意味着像正常的字典一样,get()
将返回None作为默认值,而不是使用default_factory。
另外,还可以给字典中的键映射多个值,具体方法是把多个值储存在另一个容器里(如列表,元组,字典等)。是否使用列表或集合的选择取决于预期用途:使用列表来保存每一项的插入顺序;如果要消除重复的项(不关心顺序),可以使用元组。
>>> from collections import defaultdict
>>> d = defaultdict(list)
>>> for i in [1,2,3]:
... d['eric'].append(i)
...
>>> d
defaultdict(<class 'list'>, {'eric': [1, 2, 3]})>>> d['amy'] = {}
>>> d['amy']['a'] = 1
>>> d
defaultdict(<class 'list'>, {'eric': [1, 2, 3], 'amy': {'a': 1}})
可以看出,给定默认值的类型之后并不意味着字典中所有值都必须是此类型,也可以是其他类型。还能使用相应的方法来对行操作,如列表的append
和pop
等方法。
4.2. 可调用函数作为初始化函数参数
除了接受类型名称作为初始化函数的参数之外,还可以使用任何不带参数的可调用函数,并以该函数返回值作为默认值。例如,定义函数zero()
让默认值为0:
>>> from collections import defaultdict
>>> def zero():
... return 0
...
>>> d = defaultdict(zero)
>>> d['eric']
0
>>> d
defaultdict(<function zero at 0x100662e18>, {'eric': 0})
或者使用lambda
函数:
>>> d = defaultdict(lambda: 0)
>>> d['amy']
0
>>> d
defaultdict(<function <lambda> at 0x1019d3d90>, {'amy': 0})
需要注意的是, defaultdict
接受的参数必须是可调用的。若直接传递数字0,就会出现TyptError
的异常。
>>> d = defaultdict(0)
Traceback (most recent call last):File "<stdin>", line 1, in <module>
TypeError: first argument must be callable or None
声明:
文章仅供学习及参考,禁止转载。
参考:
- Python3.6: defaultdict
- Python中defaultdict方法的使用
Python中的defaultdict方法相关推荐
- python中函数和方法的区别?Python编程判断当前获取的对象是函数还是方法
python中函数和方法的区别?Python编程判断当前获取的对象是函数还是方法 目录
- python使用方法-在Python中使用next()方法操作文件的教程
next()方法当一个文件被用作迭代器,典型例子是在一个循环中被使用,next()方法被反复调用.此方法返回下一个输入行,或引发StopIteration异常EOF时被命中. 与其它文件的方法,如Re ...
- python中range 10 0_如何在python中使用range方法
如何在python中使用range方法 发布时间:2021-01-05 16:55:23 来源:亿速云 阅读:94 作者:Leah 如何在python中使用range方法?很多新手对此不是很清楚,为了 ...
- Python中sys.argv方法的一些典型用法
本文整理汇总了Python中sys.argv方法的典型用法代码示例. 示例1: weather_icons # 需要导入模块: import sys [as 别名] # 或者: from sys im ...
- python中函数和方法的区别
本篇内容主要介绍从几个维度来介绍下python中函数和方法的区别: 首先,从分类的角度来分析. (1)函数的分类: 内置函数:python内嵌的一些函数. 匿名函数:一行代码实现一个函数功能. 递归函 ...
- python脚本怎么使用_在Python中使用next()方法操作文件的教程
next()方法当一个文件被用作迭代器,典型例子是在一个循环中被使用,next()方法被反复调用.此方法返回下一个输入行,或引发StopIteration异常EOF时被命中. 与其它文件的方法,如Re ...
- Python 中的特殊方法(定制类):__str__、__cmp__、__len__、数学运算、类型转换、@property运用、__slots__和__call__函数
Python中的特殊方法 Python的特殊方法定义在 class中,不需要直接进行显示调用,Python的某些操作符或者函数会自动调用对应的特殊方法.这些方法如:__str__().__len__( ...
- python方法测试怀孕_在Python中测试私有方法(例外)
在阅读了关于在Python中测试私有方法的内容之后,特别是在How do I unit test the methods in a method object?处引用了接受的答案,看来最好只测试公共接 ...
- python计时器timeit返回秒数_一日一技:Python中的timeit()方法
timeit()方法 python中的timeit()方法, 它用于获取代码的执行时间.该库将代码语句运行一百万次,并提供从集合中花费的最短时间.这是一种有用的方法,有助于检查代码的性能. 语法如下: ...
最新文章
- 使用脚本编写 Vim 编辑器,第 2 部分: 用户定义函数
- es6 数组合并_九个前端开发必学超级实用的 ES6 特性
- XAML Workflow Schema
- jQuery的.live()和.die()
- 【竞赛题解】Codeforces Round #710 (Div. 3)
- 【HDU - 5468】Puzzled Elena(容斥原理,dfs序,数学,素因子分解,有坑)
- LeetCode 971. 翻转二叉树以匹配先序遍历(DFS)
- Linux系统编程24:基础IO之在Linux下深刻理解C语言中的动静态库以及头文件和库的关系
- [CF808B] Average Sleep Time([强行]树状数组,数学)
- 基于JavaWeb的汽车销售管理系统
- python的官网下载安装教程
- 君威u0073故障码解决_U0073故障码_U0073故障码是什么故障、排除方法、怎么消除_车主指南...
- 从《大国崛起》(英国)看中国软件的发展
- Dao和Repository,你还傻傻分不清吗?
- java中立方根方法,Java Math.cbrt() 方法
- C语言-单词长度统计
- 对于目标检测中mAP@0.5的理解
- QScrollBar垂直滚动条简单样式定制
- C/C++程序员必看——豆瓣评分9.0+的经典
- 自我刷新2.5次后工资涨了1.5倍!