作者:豌豆花下猫

来源:Python猫

在,我有一个核心的发现:Python 内置类型的特殊方法(含魔术方法与其它方法)由 C 语言独立实现,在 Python 层面不存在调用关系。

但是,文中也提到了一个例外:一个非常神秘的魔术方法。

这个方法非常不起眼,用途狭窄,我几乎从未注意过它,然而,当发现它可能是上述“定律”的唯一例外情况时,我认为值得再写一篇文章来详细审视一下它。

本文主要关注的问题有:

(1) __missing__()到底是何方神圣?

(2) __missing__()有什么特别之处?擅长“大变活人”魔术?

(3) __missing__()是否真的是上述发现的例外?如果是的话,为什么会有这种特例?

1、有点价值的__missing__()

从普通的字典中取值时,可能会出现 key 不存在的情况:

dd = {'name':'PythonCat'}

dd.get('age') # 结果:None

dd.get('age', 18) # 结果:18

dd['age'] # 报错 KeyError

dd.__getitem__('age') # 等同于 dd['age']

对于 get() 方法,它是有返回值的,而且可以传入第二个参数,作为 key 不存在时的返回内容,因此还可以接受。但是,另外两种写法都会报错。

为了解决后两种写法的问题,就可以用到 __missing__() 魔术方法。

现在,假设我们有一个这样的诉求:从字典中取某个 key 对应的 value,如果有值则返回值,如果没有值则插入 key,并且给它一个默认值(例如一个空列表)。

如果用原生的 dict,并不太好实现,但是,Python 提供了一个非常好用的扩展类collections.defaultdict:

如图所示,当取不存在的 key 时,没有再报 KeyError,而是默认存入到字典中。

为什么 defaultdict 可以做到这一点呢?

原因是 defaultdict 在继承了内置类型 dict 之后,还定义了一个 __missing__() 方法,当 __getitem__取不存在的值时,它就会调用入参中传入的工厂函数(上例是调用 list(),创建空列表)。

作为最典型的示例,defaultdict 在文档注释中写到:

简而言之,__missing__()的主要作用就是由__getitem__在缺失 key 时调用,从而避免出现 KeyError。

另外一个典型的使用例子是collections.Counter,它也是 dict 的子类,在取未被统计的 key 时,返回计数 0:

2、神出鬼没的__missing__()

由上可知,__missing__()在__getitem__()取不到值时会被调用,但是,我不经意间还发现了一个细节:__getitem__()在取不到值时,并不一定会调用__missing__()。

这是因为它并非内置类型的必要属性,并没有在字典基类中被预先定义。

如果你直接从 dict 类型中取该属性值,会报属性不存在:AttributeError: type object 'object' has no attribute '__missing__'。

使用 dir() 查看,发现确实不存在该属性:

如果从 dict 的父类即 object 中查看,也会发现同样的结果。

这是怎么回事呢?为什么在 dict 和 object 中都没有__missing__属性呢?

然而,查阅最新的官方文档,object 中分明包含这个属性:

出处:https://docs.python.org/3/reference/datamodel.html?highlight=__missing__#object.__missing__

也就是说,理论上 object 类中会预定义__missing__,其文档证明了这一点,然而实际上它并没有被定义!文档与现实出现了偏差!

如此一来,当 dict 的子类(例如 defaultdict 和 Counter)在定义__missing__ 时,这个魔术方法事实上只属于该子类,也就是说,它是一个诞生于子类中的魔术方法!

据此,我有一个不成熟的猜想:__getitem__()会判断当前对象是否是 dict 的子类,且是否拥有__missing__(),然后才会去调用它(如果父类中也有该方法,则不会先作判断,而是直接就调用了)。

我在交流群里说出了这个猜想,有同学很快在 CPython 源码中找到验证:

而这就有意思了,在内置类型的子类上才存在的魔术方法,纵观整个 Python 世界,恐怕再难以找出第二例。

我突然有一个联想:这神出鬼没的__missing__(),就像是一个擅长玩“大变活人”的魔术师,先让观众在外面透过玻璃看到他(即官方文档),然而揭开门时,他并不在里面(即内置类型),再变换一下道具,他又完好无损就出现了(即 dict 的子类)。

3、被施魔法的__missing__()

__missing__() 的神奇之处,除了它本身会变“魔术”之外,它还需要一股强大的“魔法”才能驱动。

在 ,我发现原生的魔术方法间相互独立,它们在 C 语言界面可能有相同的核心逻辑,但是在 Python 语言界面,却并不存在着调用关系:

魔术方法的这种“老死不相往来”的表现,违背了一般的代码复用原则,也是导致内置类型的子类会出现某些奇怪表现的原因。

官方 Python 宁肯提供新的 UserString、UserList、UserDict 子类,也不愿意复用魔术方法,唯一合理的解释似乎是令魔术方法相互调用的代价太大。

但是,对于特例__missing__(),Python 却不得不妥协,不得不付出这种代价!

__missing__() 是魔术方法的“二等公民”,它没有独立的调用入口,只能被动地由 __getitem__() 调用,即__missing__() 依赖于__getitem__()。

不同于那些“一等公民”,例如 __init__()、__enter__()、__len__()、__eq__() 等等,它们要么是在对象生命周期或执行过程的某个节点被触发,要么由某个内置函数或操作符触发,这些都是相对独立的事件,无所依赖。

__missing__() 依赖于__getitem__(),才能实现方法调用;而 __getitem__() 也要依赖 __missing__(),才能实现完整功能。

为了实现这一点,__getitem__()在解释器代码中开了个后门,从 C 语言界面折返回 Python 界面,去调用那个名为“__missing__”的特定方法。

而这就是真正的“魔法”了,目前为止,__missing__()似乎是唯一一个享受了此等待遇的魔术方法!

4、小结

Python 的字典提供了两种取值的内置方法,即__getitem__() 和 get(),当取值不存在时,它们的处理策略是不一样的:前者会报错KeyError,而后者会返回 None。

为什么 Python 要提供两个不同的方法呢?或者应该问,为什么 Python 要令这两个方法做出不一样的处理呢?

这可能有一个很复杂(也可能是很简单)的解释,本文暂不深究了。

不过有一点是可以确定的:即原生 dict 类型简单粗暴地抛KeyError的做法有所不足。

为了让字典类型有更强大的表现(或者说让__getitem__()作出 get() 那样的表现),Python 让字典的子类可以定义__missing__(),供__getitem__()查找调用。

本文梳理了__missing__()的实现原理,从而揭示出它并非是一个毫不起眼的存在,恰恰相反,它是唯一一个打破了魔术方法间壁垒,支持被其它魔术方法调用的特例!

Python 为了维持魔术方法的独立性,不惜煞费苦心地引入了 UserString、UserList、UserDict 这些派生类,但是对于 __missing__(),它却选择了妥协。

本文揭示出了这个魔术方法的神秘之处,不知你读后有何感想呢?欢迎留言讨论。

Python猫技术交流群开放啦!群里既有国内一二线大厂在职员工,也有国内外高校在读学生,既有十多年码龄的编程老鸟,也有中小学刚刚入门的新人,学习氛围良好!想入群的同学,请在公号内回复『交流群』,获取猫哥的微信 (谢绝广告党,非诚勿扰!)~

python创建实例会调用哪些魔术方法_Python最会变魔术的魔术方法,我觉得是它!...相关推荐

  1. 使用类名称创建实例并调用构造函数

    本文翻译自:Creating an instance using the class name and calling constructor Is there a way to create an ...

  2. python创建实例属性_Python学习笔记__6.5章 实例属性和类属性

    # 这是学习廖雪峰老师python教程的学习笔记 1.概览 1.1.实例绑定属性 class Student(object): def __init__(self, name): self.name ...

  3. 将python中的小数直接进位的函数_python保留小数位的三种实现方法

    python保留小数位的三种实现方法 前言 保留小数位是我们经常会碰到的问题,尤其是刷题过程中.那么在python中保留小数位的方法也非常多,但是笔者的原则就是什么简单用什么,因此这里介绍几种比较简单 ...

  4. python类的内置方法_python面向对象之类中的内置方法

    __setattr__,__delattr__,__getattr__,__getattribute__以及标准类型的二次加工 __setattr__,__delattr__,__getattr__的 ...

  5. python通过对象不能调用类方法和静态方法_Python实例方法、类方法和静态方法

    Python类的组成主要包含两个部分,类的属性和类的方法.类的属性是对数据的封装,这些数据是用来描述类所抽象的事物的特征:类的方法是用来表示对象的特定行为.Python的类的方法又可以进一步细分为三种 ...

  6. python创建和删除文件有什么区别_python创建与删除临时文件夹的例子

    本节主要内容: python创建与删除临时文件夹. 1,python创建文件夹 代码示例: import tempfile, os tempfd, tempname = tempfile.mkstem ...

  7. 计算机慢的解决方法,几种电脑变慢的解决方法

    很多朋友在使用电脑的过程中会发现电脑会越来越卡吗,运行速度越来越慢,那么出现电脑变慢有没有解决方法呢?今天IT之家小编就给您带来几种电脑变慢的解决方法. 方法一:重装系统 用户在使用电脑的过程中,电脑 ...

  8. python创建函数如何调用字典对象_我不知道如何用Python创建一个调用我函数的字典...

    除了不传递值并尝试调用dict之外,您正在计算列表完全填充之前的平均值,在代码中,当您完成附加后,在循环外计算平均值:def posNumAvg(values): pos = [] # average ...

  9. python创建实例时显示没有参数-OSError无法创建文件无效参数

    我在Tensorflow上面使用Python和Keras来训练我的神经网络. 当我从Ubuntu16.04切换到Windows10时,当我运行以下命令时,我的模型将无法保存:filepath = &q ...

最新文章

  1. linux ico图标大小,带、你了解ico图标文件格式
  2. 谷歌希望通过 Adiantum 为更多人提供加密功能
  3. python按键盘上哪个键运行_pythonshell哪个键执行命令
  4. linux根文件系统创建过程
  5. [Leetcode456]132模式 - 单调栈
  6. 遍历字典时用与不用iter的区别
  7. 网络集成方案_用户需要的综合性解决方案:网络安全架构集成的价值凸显
  8. 《中国人史纲》读书笔记:第二章 神话时代 第三章 传说时代
  9. js 数组、对象转json 以及json转 数组、对象
  10. Java集合类源码分析汇总
  11. 支付宝扫码支付开发配置详解
  12. java微信新增永久素材_微信公众号开发之新增永久图文素材(十)
  13. 纯swift开发,弹幕,演唱会广告牌
  14. 遥感、遥感技术、遥感卫星、卫星遥感、卫星遥感技术
  15. 华为云跨云迁移工具案例实践:阿里云迁移到华为云
  16. 【百度大脑新品体验】人脸面部动作识别
  17. 知识分享 | Oracle的官方ACE是个啥 and如何搞定一个ACE!
  18. python方位角计算
  19. Altium designer中文化设置
  20. java火车站售票源代码_火车站售票管理系统 JavaSe

热门文章

  1. 使用Win7时,出现无法切换电视墙
  2. Google搜索语法
  3. CentOs6.6安装Python3
  4. CodeForces 877C
  5. delphi ,安装插件
  6. Linux命令——压缩和解压缩
  7. 安装操作系统的过程图解
  8. hadoop 命令行运行
  9. 反编译 破解crash html editor winform [WinHTMLEditorControl.dll][.NET Win HTML Editor Control]
  10. 模式实例之——访问者实例