什么是内存管理器(what)

Python作为一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,与大多数编程语言不同,Python中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管理,Python解释器给你自动回收。开发人员不用过多的关心内存管理机制,这一切全部由python内存管理器承担了复杂的内存管理工作。

内存不外乎创建和销毁两部分,本文将围绕python的内存池和垃圾回收两部分进行分析。

Python内存池

为什么要引入内存池(why)

当创建大量消耗小内存的对象时,频繁调用new/malloc会导致大量的内存碎片,致使效率降低。内存池的作用就是预先在内存中申请一定数量的,大小相等的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片,提升效率。python中的内存管理机制为Pymalloc

内存池是如果工作的(how)

首先,我们看一张CPython(python解释器)的内存架构图:

python的对象管理主要位于Level+1~Level+3层

Level+3层:对于python内置的对象(比如int,dict等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用

Level+2层:当申请的内存大小小于256KB时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施

Level+1层:当申请的内存大小大于256KB时,由Python原生的内存分配器进行分配,本质上是调用C标准库中的malloc/realloc等函数关于释放内存方面,当一个对象的引用计数变为0时,Python就会调用它的析构函数。调用析构函数并不意味着最终一定会调用free来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。

垃圾回收机制

Python的垃圾回收机制采用引用计数机制为主,标记-清除和分代回收机制为辅的策略。其中,标记-清除机制用来解决计数引用带来的循环引用而无法释放内存的问题,分代回收机制是为提升垃圾回收的效率。

引用计数

Python通过引用计数来保存内存中的变量追踪,即记录该对象被其他使用的对象引用的次数。

Python中有个内部跟踪变量叫做引用计数器,每个变量有多少个引用,简称引用计数。当某个对象的引用计数为0时,就列入了垃圾回收队列。

>>> a=[1,2]

>>> import sys

>>> sys.getrefcount(a) ## 获取对象a的引用次数

2

>>> b=a

>>> sys.getrefcount(a)

3

>>> del b ## 删除b的引用

>>> sys.getrefcount(a)

2

>>> c=list()

>>> c.append(a) ## 加入到容器中

>>> sys.getrefcount(a)

3

>>> del c ## 删除容器,引用-1

>>> sys.getrefcount(a)

2

>>> b=a

>>> sys.getrefcount(a)

3

>>> a=[3,4] ## 重新赋值

>>> sys.getrefcount(a)

2注意:当把a作为参数传递给getrefcount时,会产生一个临时的引用,因此得出来的结果比真实情况+1引用计数增加的情况:

一个对象被分配给一个新的名字(例如:a=[1,2])

将其放入一个容器中(如列表、元组或字典)(例如:c.append(a))

引用计数减少的情况:

使用del语句对对象别名显式的销毁(例如:del b)

对象所在的容器被销毁或从容器中删除对象(例如:del c )

引用超出作用域或被重新赋值(例如:a=[3,4])引用计数能够解决大多数垃圾回收的问题,但是遇到两个对象相互引用的情况,del语句可以减少引用次数,但是引用计数不会归0,对象也就不会被销毁,从而造成了内存泄漏问题。针对该情况,Python引入了标记-清除机制。

标记-清除

标记-清除用来解决引用计数机制产生的循环引用,进而导致内存泄漏的问题 。 循环引用只有在容器对象才会产生,比如字典,元组,列表等。

顾名思义,该机制在进行垃圾回收时分成了两步,分别是:标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达

清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收

>>> a=[1,2]

>>> b=[3,4]

>>> sys.getrefcount(a)

2

>>> sys.getrefcount(b)

2

>>> a.append(b)

>>> sys.getrefcount(b)

3

>>> b.append(a)

>>> sys.getrefcount(a)

3

>>> del a

>>> del ba引用b,b引用a,此时两个对象各自被引用了2次(去除getrefcout()的临时引用)

执行del之后,对象a,b的引用次数都-1,此时各自的引用计数器都为1,陷入循环引用

标记:找到其中的一端a,因为它有一个对b的引用,则将b的引用计数-1

标记:再沿着引用到b,b有一个a的引用,将a的引用计数-1,此时对象a和b的引用次数全部为0,被标记为不可达(Unreachable)

清除: 被标记为不可达的对象就是真正需要被释放的对象上面描述的垃圾回收的阶段,会暂停整个应用程序,等待标记清除结束后才会恢复应用程序的运行。为了减少应用程序暂停的时间,Python 通过“分代回收”(Generational Collection)以空间换时间的方法提高垃圾回收效率。

分代回收分代回收是基于这样的一个统计事实,对于程序,存在一定比例的内存块的生存周期比较短;而剩下的内存块,生存周期会比较长,甚至会从程序开始一直持续到程序结束。生存期较短对象的比例通常在 80%~90%之间。 因此,简单地认为:对象存在时间越长,越可能不是垃圾,应该越少去收集。这样在执行标记-清除算法时可以有效减小遍历的对象数,从而提高垃圾回收的速度,是一种以空间换时间的方法策略。

Python将所有的对象分为年轻代(第0代)、中年代(第1代)、老年代(第2代)三代。所有的新建对象默认是 第0代对象。当在第0代的gc扫描中存活下来的对象将被移至第1代,在第1代的gc扫描中存活下来的对象将被移至第2代。gc扫描次数(第0代>第1代>第2代)

当某一代中被分配的对象与被释放的对象之差达到某一阈值时,就会触发当前一代的gc扫描。当某一代被扫描时,比它年轻的一代也会被扫描,因此,第2代的gc扫描发生时,第0,1代的gc扫描也会发生,即为全代扫描。

>>> import gc

>>> gc.get_threshold() ## 分代回收机制的参数阈值设置

(700, 10, 10)700=新分配的对象数量-释放的对象数量,第0代gc扫描被触发

第一个10:第0代gc扫描发生10次,则第1代的gc扫描被触发

第二个10:第1代的gc扫描发生10次,则第2代的gc扫描被触发

思考

在标记-清除中,如果对象c也引用a,执行del操作后,会发生什么?

对象a,b,c的引用关系如下图所示:

>>> a=[1,2]

>>> b=[3,4]

>>> c=a

>>> a.append(b)

>>> b.append(a)

ref_count表示引用计数

对象a,b,c全部为reachable

执行del之后,引用关系如下图所示:

>>> del a

>>> del b

a,b,c的ref_count减1

执行gc扫描标记: a引用b,将b的ref_count减1到0,b引用a,将a的ref_count减1到1,将b放在unreachable下

再循环:因为a是可达的,所以会递归地将从a节点出发可以达到的所有节点标记为reachable下,即为:

清除:unreachable下没有可清除的对象,因此a,b,c对象不会被清除

总结

总体而言,python通过内存池来减少内存碎片化,提高执行效率。主要通过引用计数来完成垃圾回收,通过标记-清除解决容器对象循环引用造成的问题,通过分代回收提高垃圾回收的效率。

欢迎大家【关注】我,我们一起学习进步。

另外,有问题大家评论区讨论,积极沟通。

如果本文对你有帮助,不要忘记【点赞】、【收藏】,拒绝伸手党!

python会自动释放内存吗_没白熬夜,终于把Python的内存管理机制搞明白了相关推荐

  1. python为什么这么火知乎_没想到 Google 排名第一的编程语言,为什么会这么火?...

    没想到吧,Python 又拿第一了! 在 Google 公布的编程语言流行指数中,Python 依旧是全球范围内最受欢迎的技术语言! 01 为什么 Python 会这么火? 核心还是因为企业需要用它! ...

  2. 没学过编程可以学python吗_没编程基础可以学python吗

    Python是一门高级编程语言,而且Python语言适合零基础人员学习,也是初学者的首选. 如何学习好Python: 1. 要有决心 做任何事情,首先要有足够的决心和坚持,才能做好事情.学好Pytho ...

  3. python抖音涨粉代码_百万点赞怎么来?Python批量制作抖音的卡点视频原来这么简单!...

    1 目 标 场 景 玩抖音的朋友都应该知道,最近「卡点视频」简直不要太火.抖音上很多大神也出了剪辑各种卡点视频的教程. 实际上,利用很多手机 APP 或者 PR.FCPX 软件也可以制作卡点视频,但是 ...

  4. python做表格好用吗_吊打Excel!用Python来办公到底有多强?

    现如今无论是工作汇报.产品设计.后台设计甚至是数据大屏,越来越多的行业都离不开与数据打交道! 做数据图表,谁不会?打开Excel,就可以制作各种模板图表! 但是,你的图表是这样的么? Excel作为数 ...

  5. python函数使用易错点_大部分人都会忽略的Python易错点总结

    python中复数实现(-2) ** 0.5和开根号sqrt(-2)的区别 (-2)**0.5和sqrt(-2)是不同的,前者是复数后者是会报错的. print((-2)**0.5) #输出:(8.6 ...

  6. python真是最烂的语言_在大型项目上,Python 是个烂语言吗?

    展开全部 是存在的东西就不能用烂来形容,也许只是不对某些人的爱.e68a84e8a2ad3231313335323631343130323136353331333363396464 用 Boost 去 ...

  7. java 二维数组内存溢出_程序员:学习心得,Java内存区域,内存溢出异常

    Java 内存区域 Heap 线程公有 存放实例对象 是GC主要管理区域,因此可以更细致的划分为:新生代.老年代 再细致一点划分:Eden区.From Survivor区.To Survivor区 内 ...

  8. python执行js脚本安全吗_手把手教你如何使用Python执行js代码

    前言 各位小伙伴,大家好,这次咱们来说一下关于爬虫方向的一个知识,Python如何执行js,快来看看吧!!! 为什么要引出Python执行js这个问题? 都说术业有专攻,每个语言也都有自己的长处和短处 ...

  9. python做数据分析有什么优势_六星教育:使用Python做数据分析的优点是什么?

    原标题:六星教育:使用Python做数据分析的优点是什么? 大数据越来越火的发展,越来越多的企业也使用大数据分析,数据分析行业的需求人才也趋向上涨趋势,做数据分析的也需要学会一些编程语言的,比如MAT ...

  10. java 堆外内存 查看_超干货!Cassandra Java堆外内存排查经历全记录

    背景 最近准备上线cassandra这个产品,同事在做一些小规格ECS(8G)的压测.压测时候比较容易触发OOM Killer,把cassandra进程干掉.问题是8G这个规格我配置的heap(Xmx ...

最新文章

  1. Go 学习笔记(68)— goroutine 并发控制神器 Context
  2. debian10 ftp简单搭建
  3. 在Java连接hbase时出现的问题
  4. 支持app需要多大的服务器,上海app开发需要多大服务器空间?
  5. go数组详解:数组的定义、遍历、使用细节、二维数组的定义及其遍历
  6. hibernate_day03_MySQL数据库-表与表之间的多对多关系-实例
  7. JavaBean和Servlet
  8. 事务及其传播行为的通俗易懂的讲解
  9. matlab确定物体影子,用MATLAB浅析太阳影子定位问题
  10. cmmi实践访谈测试ppt_CMMI3_实践篇.ppt
  11. win10下的VMware还原网络设置,无法创建VMware网络适配器解决办法
  12. <博弈论> HDU1846
  13. 星座 member.php,php 通过生日获取对应的星座
  14. Android数据存储(二)----PreferenceFragment详解
  15. -Xms -Xmx等jvm参数的含义
  16. Python实现利用MMR提取自动摘要
  17. 观未见,行不止 —— Power BI 两周年技术和方案交流圆桌会议纪实
  18. 技术分享 | 浅谈滴滴派单算法
  19. 小程序 模拟今日头条导航栏,点击锚点跳转对应楼层
  20. 告别慢SQL,如何去写一手好SQL ?

热门文章

  1. 多功能s扫描器 php168,S扫描器–速度惊人的扫描器
  2. C# 从入门到精通 学习笔记2 第3章 方法和作用域
  3. 韩顺平oracle教学笔记,韩顺平 - 玩转oracle教程笔记(转)
  4. 远视图+五环(css练习)
  5. mapbox之点击图斑更换图斑图片
  6. XcodeGhost事件冷思考:智能时代的达摩克利斯之剑
  7. 第二篇:基于小米手机的,第三方recovery教学
  8. html运行页面一直处在加载状态的解决
  9. c++的学习——画矩形
  10. Java开发 明华usbkey_v3 明华二次开发包,usbkey 内有很多demo程序。 USB develop 238万源代码下载- www.pudn.com...