那些年我们踩过的那些坑

坑01 - 整数比较的坑

在 Python 中一切都是对象,整数也是对象,在比较两个整数时有两个运算符==is,它们的区别是:

  • is比较的是两个整数对象的id值是否相等,也就是比较两个引用是否代表了内存中同一个地址。
  • ==比较的是两个整数对象的内容是否相等,使用==时其实是调用了对象的__eq__()方法。

知道了is==的区别之后,我们可以来看看下面的代码,了解Python中整数比较有哪些坑:

def main():x = y = -1while True:x += 1y += 1if x is y:print('%d is %d' % (x, y))else:print('Attention! %d is not %d' % (x, y))breakx = y = 0while True:x -= 1y -= 1if x is y:print('%d is %d' % (x, y))else:print('Attention! %d is not %d' % (x, y))breakif __name__ == '__main__':main()

上面代码的部分运行结果如下图所示,出现这个结果的原因是Python出于对性能的考虑所做的一项优化。对于整数对象,Python把一些频繁使用的整数对象缓存起来,保存到一个叫small_ints的链表中,在Python的整个生命周期内,任何需要引用这些整数对象的地方,都不再重新创建新的对象,而是直接引用缓存中的对象。Python把频繁使用的整数对象的值定在[-5, 256]这个区间,如果需要这个范围的整数,就直接从small_ints中获取引用而不是临时创建新的对象。因为大于256或小于-5的整数不在该范围之内,所以就算两个整数的值是一样,但它们是不同的对象。

当然仅仅如此这个坑就不值一提了,如果你理解了上面的规则,我们就再看看下面的代码。

import dis
a = 257def main():b = 257  # 第6行c = 257  # 第7行print(b is c)  # Trueprint(a is b)  # Falseprint(a is c)  # Falseif __name__ == "__main__":main()

程序的执行结果已经用注释写在代码上了。够坑吧!看上去abc的值都是一样的,但是is运算的结果却不一样。为什么会出现这样的结果,首先我们来说说Python程序中的代码块。所谓代码块是程序的一个最小的基本执行单位,一个模块文件、一个函数体、一个类、交互式命令中的单行代码都叫做一个代码块。上面的代码由两个代码块构成,a = 257是一个代码块,main函数是另外一个代码块。Python内部为了进一步提高性能,凡是在一个代码块中创建的整数对象,如果值不在small_ints缓存范围之内,但在同一个代码块中已经存在一个值与其相同的整数对象了,那么就直接引用该对象,否则创建一个新的对象出来,这条规则对不在small_ints范围的负数并不适用,对负数值浮点数也不适用,但对非负浮点数和字符串都是适用的,这一点读者可以自行证明。所以 b is c返回了True,而ab不在同一个代码块中,虽然值都是257,但却是两个不同的对象,is运算的结果自然是False了。
为了验证刚刚的结论,我们可以借用dis模块(听名字就知道是进行反汇编的模块)从字节码的角度来看看这段代码。如果不理解什么是字节码,可以先看看《谈谈 Python 程序的运行原理》这篇文章。可以先用import dis导入dis模块并按照如下所示的方式修改代码。

if __name__ == "__main__":main()dis.dis(main)

代码的执行结果如下图所示。可以看出代码第6行和第7行,也就是main函数中的257是从同一个位置加载的,因此是同一个对象;而代码第9行的a明显是从不同的地方加载的,因此引用的是不同的对象。

如果还想对这个问题进行进一步深挖,推荐大家阅读《Python整数对象实现原理》这篇文章。

坑02 - 嵌套列表的坑

Python中有一种内置的数据类型叫列表,它是一种容器,可以用来承载其他的对象(准确的说是其他对象的引用),列表中的对象可以称为列表的元素,很明显我们可以把列表作为列表中的元素,这就是所谓的嵌套列表。嵌套列表可以模拟出现实中的表格、矩阵、2D游戏的地图(如植物大战僵尸的花园)、棋盘(如国际象棋、黑白棋)等。但是在使用嵌套的列表时要小心,否则很可能遭遇非常尴尬的情况,下面是一个小例子。

def main():names = ['关羽', '张飞', '赵云', '马超', '黄忠']subjs = ['语文', '数学', '英语']scores = [[0] * 3] * 5for row, name in enumerate(names):print('请输入%s的成绩' % name)for col, subj in enumerate(subjs):scores[row][col] = float(input(subj + ': '))print(scores)if __name__ == '__main__':main()

我们希望录入5个学生3门课程的成绩,于是定义了一个有5个元素的列表,而列表中的每个元素又是一个由3个元素构成的列表,这样一个列表的列表刚好跟一个表格是一致的,相当于有5行3列,接下来我们通过嵌套的for-in循环输入每个学生3门课程的成绩。程序执行完成后我们发现,每个学生3门课程的成绩是一模一样的,而且就是最后录入的那个学生的成绩。

要想把这个坑填平,我们首先要区分对象和对象的引用这两个概念,而要区分这两个概念,还得先说说内存中的栈和堆。我们经常会听人说起“堆栈”这个词,但实际上“堆”和“栈”是两个不同的概念。众所周知,一个程序运行时需要占用一些内存空间来存储数据和代码,那么这些内存从逻辑上又可以做进一步的划分。对底层语言(如C语言)有所了解的程序大都知道,程序中可以使用的内存从逻辑上可以为五个部分,按照地址从高到低依次是:栈(stack)、堆(heap)、数据段(data segment)、只读数据段(static area)和代码段(code segment)。其中,栈用来存储局部、临时变量,以及函数调用时保存现场和恢复现场需要用到的数据,这部分内存在代码块开始执行时自动分配,代码块执行结束时自动释放,通常由编译器自动管理;堆的大小不固定,可以动态的分配和回收,因此如果程序中有大量的数据需要处理,这些数据通常都放在堆上,如果堆空间没有正确的被释放会引发内存泄露的问题,而像Python、Java等编程语言都使用了垃圾回收机制来实现自动化的内存管理(自动回收不再使用的堆空间)。所以下面的代码中,变量a并不是真正的对象,它是对象的引用,相当于记录了对象在堆空间的地址,通过这个地址我们可以访问到对应的对象;同理,变量b是列表容器的引用,它引用了堆空间上的列表容器,而列表容器中并没有保存真正的对象,它保存的也仅仅是对象的引用。

a = object()
b = ['apple', 'pitaya', 'grape']

知道了这一点,我们可以回过头看看刚才的程序,我们对列表进行[[0] * 3] * 5操作时,仅仅是将[0, 0, 0]这个列表的地址进行了复制,并没有创建新的列表对象,所以容器中虽然有5个元素,但是这5个元素引用了同一个列表对象,这一点可以通过id函数检查scores[0]scores[1]的地址得到证实。所以正确的代码应该按照如下的方式进行修改。

def main():names = ['关羽', '张飞', '赵云', '马超', '黄忠']subjs = ['语文', '数学', '英语']scores = [[]] * 5for row, name in enumerate(names):print('请输入%s的成绩' % name)scores[row] = [0] * 3for col, subj in enumerate(subjs):scores[row][col] = float(input(subj + ': '))print(scores)if __name__ == '__main__':main()

或者

def main():names = ['关羽', '张飞', '赵云', '马超', '黄忠']subjs = ['语文', '数学', '英语']scores = [[0] * 3 for _ in range(5)]for row, name in enumerate(names):print('请输入%s的成绩' % name)scores[row] = [0] * 3for col, subj in enumerate(subjs):scores[row][col] = float(input(subj + ': '))print(scores)if __name__ == '__main__':main()

如果对内存的使用不是很理解,可以看看PythonTutor网站上提供的代码可视化执行功能,通过可视化执行,我们可以看到内存是如何分配的,从而避免在使用嵌套列表或者复制对象时可能遇到的坑。

坑03 - 访问修饰符的坑

用Python做过面向对象编程的人都知道,Python的类提供了两种访问控制权限,一种是公开,一种是私有(在属性或方法前加上双下划线)。而用惯了Java或C#这类编程语言的人都知道,类中的属性(数据抽象)通常都是私有的,其目的是为了将数据保护起来;而类中的方法(行为抽象)通常都是公开的,因为方法是对象向外界提供的服务。但是Python并没有从语法层面确保私有成员的私密性,因为它只是对类中所谓的私有成员进行了命名的变换,如果知道命名的规则照样可以直接访问私有成员,请看下面的代码。

class Student(object):def __init__(self, name, age):self.__name = nameself.__age = agedef __str__(self):return self.__name + ': ' + str(self.__age)def main():stu = Student('骆昊', 38)# 'Student' object has no attribute '__name'# print(stu.__name)# 用下面的方式照样可以访问类中的私有成员print(stu._Student__name)print(stu._Student__age)if __name__ == '__main__':main()

Python为什么要做出这样的设定呢?用一句广为流传的格言来解释这个问题:“We are all consenting adults here”(我们都是成年人)。这句话表达了很多Python程序员的一个共同观点,那就是开放比封闭要好,我们应该自己对自己的行为负责而不是从语言层面来限制对数据或方法的访问。

所以在Python中我们实在没有必要将类中的属性或方法用双下划线开头的命名处理成私有的成员,因为这并没有任何实际的意义。如果想对属性或方法进行保护,我们建议用单下划线开头的受保护成员,虽然它也不能真正保护这些属性或方法,但是它相当于给调用者一个暗示,让调用者知道这是不应该直接访问的属性或方法,而且这样做并不影响子类去继承这些东西。

需要提醒大家注意的是,Python类中的那些魔法方法,如__str__、__repr__等,这些方法并不是私有成员哦,虽然它们以双下划线开头,但是他们也是以双下划线结尾的,这种命名并不是私有成员的命名,这一点对初学者来说真的很坑。

Python开发系列课程(10) - 那些年我们踩过的那些坑(上)相关推荐

  1. Python开发系列课程(9) - 面向对象编程基础

    面向对象编程基础 活在当下的程序员应该都听过"面向对象编程"一词,也经常有人问能不能用一句话解释下什么是"面向对象编程",我们先来看看比较正式的说法. 把一组数 ...

  2. Python开发系列课程(0) - 公告

    从2017开始有一个名叫Python的编程语言开始受到各界的重视并逐渐成为在各大榜单霸榜的编程语言.截止到2020年2月,在TIOBE Index排行榜.IEEE最受欢迎语言排行榜和GitHub最受欢 ...

  3. Python开发系列课程(12) - 图形用户界面和游戏开发

    图形用户界面和游戏开发 基于tkinter模块的GUI GUI是图形用户界面的缩写,图形化的用户界面对使用过计算机的人来说应该都不陌生,在此也无需进行赘述.Python默认的GUI开发模块是tkint ...

  4. [转载] Python开发系列课程(16) - 进程和线程

    参考链接: Python | 使用Tkinter进行消息编码-解码 进程和线程 今天我们使用的计算机早已进入多CPU或多核时代,而我们使用的操作系统都是支持"多任务"的操作系统,这 ...

  5. Python开发系列课程(11) - 面向对象编程进阶

    面向对象编程进阶 在前面的章节我们已经了解了面向对象的入门知识,知道了如何定义类,如何创建对象以及如何给对象发消息.为了能够更好的使用面向对象编程思想进行程序开发,我们还需要对Python中的面向对象 ...

  6. Python开发系列课程(7) - 函数和模块的使用

    函数和模块的使用 在讲解本章节的内容之前,我们先来研究一道数学题,请说出下面的方程有多少组正整数解. x1+x2+x3+x4=8x1+x2+x3+x4=8 x_1 + x_2 + x_3 + x_4 ...

  7. Python开发系列课程(15) - Python参考书籍

    Python参考书籍 入门读物 <Python基础教程>(Beginning Python From Novice to Professional) <Python学习手册>( ...

  8. iOS开发系列课程(10) --- 表格视图

      UITableView(表格视图)是iOS应用程序开发中应用最广泛的一个控件,几乎十有八九的应用程序中都会用到它,它是基于滚动视图的列表互动类.使用UITableView可以在屏幕上显示单元格的列 ...

  9. Python开发系列课程(8) - 字符串和常用数据结构

    字符串和常用数据结构 使用字符串 第二次世界大战促使了现代电子计算机的诞生,当初的想法很简单,就是用计算机来计算导弹的弹道,因此在计算机刚刚诞生的那个年代,计算机处理的信息主要是数值,而世界上的第一台 ...

最新文章

  1. 2011年中国程序员薪水调查报告
  2. 杭电1171(01背包求解)
  3. 网页制作中绝对路径和相对路径的区别
  4. 转 从内核文件系统看文件读写过程
  5. 计算机系学生的简单立体宿舍装潢大赏
  6. java注释模板_Java注释模板设置
  7. 汇编.s文件包含头文件处理
  8. python自己做个定时器_python 创建一个自己的类计时器
  9. mysql把一个表的字段赋值到另一张表,多表之间常用的操作
  10. 新职业英语计算机unit5,新职业英语2Unit5.ppt
  11. Bailian2856 计算邮资【入门】
  12. Markdown数学公式参考表
  13. 拓端tecdat|R语言深度学习:用keras神经网络回归模型预测时间序列数据
  14. Linux内核中Netfilter架构介绍
  15. 2022年江西省研究生数学建模竞赛冰壶运动求解全过程文档及程序
  16. 【CAD】机械类制图实用功能总结
  17. Github每日精选(第35期):移动设备数据库Realm
  18. Cesium 编辑空间测量功能,任意修改
  19. 伽罗瓦理论笔记暂记2
  20. windows无法连接到某个wifi_笔记本电脑连接wifi时一直显示“windows无法连接到。。(wifi)”是怎么回事...

热门文章

  1. random.seed(seed)、np.random.seed(seed)、torch.manual_seed(seed)作用
  2. 我的独家快速美容去痘秘方
  3. dedecms教程:采集教程
  4. LeetCode:292. Nim Game Nim 游戏(C语言)
  5. 北工大计算机学院职称评定,北工大将教师担任班主任经历与职称晋升挂钩--科技--人民网...
  6. Mali Offline Compiler 的 FMA CVT等GPU Shader结果参数说明
  7. zucc c语言上机答案,ZUCC第三章 习题答案.doc
  8. Oreo对A2DP codec的支持
  9. Eclipse 3.6 M7(太阳神版)发布
  10. 波澜不惊 波澜不惊波澜不惊