前言

垃圾收集器是一种动态存储分配器,它自动释放程序不再需要的已分配的块,这些块也称为垃圾。在程序员看来,垃圾就是不再被引用的对象。自动回收垃圾的过程则称为垃圾收集(garbage collection)。在一个支持垃圾收集的语言中,程序显式地申请内存,但从不需要显式的释放它们。垃圾收集器会定期识别垃圾块,并将垃圾块放回空闲链表中。显然,C语言的malloc包不是一个带GC功能的分配器,程序员显式 调用malloc分配内存,也需要显式调用free释放它。而像java、C#这些语言等则提供了垃圾收集器。这篇文章的内容为介绍一些常用的GC算法,同时简单提一下C++的GC机制。

基本概念

有向可达图与根集

垃圾收集器将存储器视为一张有向可达图。图中的节点可以分为两组:一组称为根节点,对应于不在堆中的位置,这些位置可以是寄存器、栈中的变量,或者是虚拟存储器中读写数据区域的全局变量;另外一组称为堆节点,对应于堆中一个分配块,如下图:

当存在一个根节点可到达某个堆节点时,我们称该堆节点是可达的,反之称为不可达。不可达堆节点为垃圾。可见垃圾收集的目标即是从从根集出发,寻找未被引用的堆节点,并将其释放。

三种基本的垃圾收集算法及其改进算法

垃圾收集算法是一个重要而活跃的研究领域,自从20世纪60年代开始对垃圾收集进行研究以来,垃圾算法的研究从未停止。常见的垃圾收集算法有一下这几种类型:

1、引用计数算法

引用技术算法是唯一一种不用用到根集概念的GC算法。其基本思路是为每个对象加一个计数器,计数器记录的是所有指向该对象的引用数量。每次有一个新的引用指向这个对象时,计数器加一;反之,如果指向该对象的引用被置空或指向其它对象,则计数器减一。当计数器的值为0时,则自动删除这个对象。这个思路可以参考C++ 引用计数技术及智能指针的简单实现。

引用计数算法的优点是实现简单,在原生不支持GC的语言中也能容易实现出来。另一个优点这种垃圾收集机制是即时回收,也即是对象不再被引用的瞬间就立即被释放掉。而其缺点是若存在对象的循环引用,无法释放这些对象,例图:

缺点二是多个线程同时对引用计数进行增减时,引用计数的值可能会产生不一致的问题,必须使用并发控制机制解决这一问题,也是一个不小的开销。

2、 Mark & Sweep 算法

这个算法也称为标记清除算法,为McCarthy独创。它也是目前公认的最有效的GC方案。Mark&Sweep垃圾收集器由标记阶段和回收阶段组成,标记阶段标记出根节点所有可达的对节点,清除阶段释放每个未被标记的已分配块。典型地,块头部中空闲的低位中的一位用来表示这个块是否已经被标记了。通过Mark&Sweep算法动态申请内存时,先按需分配内存,当内存不足以分配时,从寄存器或者程序栈上的引用出发,遍历上述的有向可达图并作标记(标记阶段),然后再遍历一次内存空间,把所有没有标记的对象释放(清除阶段)。因此在收集垃圾时需要中断正常程序,在程序涉及内存大、对象多的时候中断过程可能有点长。当然,收集器也可以作为一个独立线程不断地定时更新可达图和回收垃圾。该算法不像引用计数可对内存进行即时回收,但是它解决了引用计数的循环引用问题,因此有的语言把引用计数算法搭配Mark & Sweep 算法构成GC机制。

3、 节点复制算法

Mark & Sweep算法的缺点是在分配大量对象时,且对象大都需要回收时,回收中断过程可能消耗很大。而节点复制算法则刚好相反,当需要回收的对象越多时,它的开销很小,而当大部分对象都不需要回收时,其开销反而很大。
算法的基本思路是这样的:从根节点开始,被引用的对象都会被复制到一个新的存储区域中,而剩下的对象则是不再被引用的,即为垃圾,留在原来的存储区域。释放内存时,直接把原来的存储区域释放掉,继续维护新的存储区域即可。过程如图:

可以看到,当被引用对象(非垃圾对象)很多时,需要复制很多的对象到新存储区域。

分代回收

以上三种基本算法各有各的优缺点,也各自有许多改进的方案。通过对这三种方式的融合,出现了一些更加高级的方式。而高级GC技术中最重要的一种为分代回收。它的基本思路是这样的:程序中存在大量的这样的对象,它们被分配出来之后很快就会被释放,但如果一个对象分配后相当长的一段时间内都没有被回收,那么极有可能它的生命周期很长,尝试收集它是无用功。为了让GC变得更高效,我们应该对刚诞生不久的对象进行重点扫描,这样就可以回收大部分的垃圾。为了达到这个目的,我们需要依据对象的”年龄“进行分代,刚刚生成不久的对象划分为新生代,而存在时间长的对象划分为老生代,根据实现方式的不同,可以划分为多个代。

一种回收的实现策略可以是:首先从根开始进行一次常规扫描,扫描过程中如果遇到老生代对象则不进行递归扫描,这样可大大减少扫描次数。这个过程可使用标记清除算法或者复制收集算法。然后,把扫描后残留下来的对象划分到老生代,若是采用标记清除算法,则应该在对象上设置某个标志位标志其年龄;若是采用复制收集,则只需要把新的存储区域内对象设置为老生代就可以了。而实际的实现上,分代回收算法的方案五花八门,常常会融合几种基本算法。

而其他的改进算法数量非常庞大,但大都基于上述的三种基本算法。

C++垃圾回收机制

C语言本身没有提供GC机制,而C++ 0x则提供了基于引用计数算法的智能指针进行内存管理。也有一些不作为C++标准的垃圾回收库,如著名的Boehm库。借助其他的算法也可以实现C/C++的GC机制,如前面所说的标记清除算法。

当应用程序使用malloc试图从堆上获得内存块时,通常都是以常规方式来调用malloc,而当malloc找不到合适空闲块的时候,它就会去调用垃圾收集器,以回收垃圾到空闲链表。此时,垃圾收集器将识别出垃圾块,并通过free函数将它们返回给堆。这样看来,垃圾收集器代替我们调用了free函数,从而让我们显式分配,而无须显式释放。

上图中的垃圾收集器为一个保守的垃圾收集器。保守的定义是:每个可达的块都能够正确地被标记为可达,而一些不可达块却可能被错误地标记为可达。其根本原因在于C/C++语言不会用任何类型信息来标记存储器的位置,即对于一个整数类型来说,语言本身没有一种显式的方法来判断它是一个整数还是一个指针。因此,如果某个整数值所代表的地址恰好的某个不可达块中某个字的地址,那么这个不可达块就会被标记为可达。所以,C/C++所实现的垃圾收集器都不是精确的,存在着回收不干净的现象。而像JAVA的垃圾收集器则是精确回收。在《关于C++ 0x 里垃圾收集器的讲座》这篇文章里提到,C++标准提案中使用gc_strict、 gc_relax这样的关键字来描述一个内存区内有没有指针,但无法精确到每个数据上。实际上,早在07年,一份C++标准提案N2670就提出要将垃圾回收机制作为加入C++,最后提案是没有通过,其原因大概是因为实现复杂,由于语言本身原因存在这样那样的限制。所以在C++ 0x中除了shard_ptr、weak_ptr这些智能指针外,我们并没看看到GC机制的身影。而至于C++是如何解决引用计数的循环引用问题以及并发控制问题,我们将以另外一篇文章进行介绍。

(完)

参考书籍

深入理解计算机系统 [美]Randal E.Bryant / David O'Hallaron 机械工业出版社

代码的未来 [日] 松本行弘 人民邮电出版社

C++标准提案N2670 http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2008/n2670.htm
关于C++ 0x 里垃圾收集器的讲座 http://blog.csdn.net/g9yuayon/article/details/1702694

转载于:https://www.cnblogs.com/QG-whz/p/5079638.html

GC基本算法及C++GC机制相关推荐

  1. java_opts gc回收器_JVM之垃圾回收机制(GC)

    JVM之垃圾回收机制全解(GC)文章底部有思维导图,较为清晰,可参考 导读:垃圾回收是Java体系中最重要的组成部分之一,其提供了一套全自动的内存管理方案,要想掌握这套管理方案,就必须了解垃圾回收器的 ...

  2. 4、JVM垃圾回收机制、新生代的GC、GC(Minor GC、FullGC)、GC日志、JVM参数选项、元空间(笔记)

    4.JVM垃圾回收机制 4.1.新生代的GC 4.1.1.串行GC(SerialGC) 4.1.2.并行回收GC(Parallel Scavenge) 4.1.3.并行GC(ParNew) 4.2.G ...

  3. java gc g1_Java 分代式GC与G1算法

    前言:最近浏览了不少分代式GC和G1算法的文章,好多文章的知识点都比较分散,要几篇文章结合起来对比才能明白,特别是R大的文章,很精辟但不好理解,这里我就把我最近收集并结合自己理解的有关分代式GC和G1 ...

  4. Java内存模型 gc算法_JVM内存模型及GC回收算法

    该篇博客主要对JVM内存模型以及GC回收算法以自己的理解和认识做以记录. 内存模型 GC垃圾回收 1.内存模型 从上图可以看出,JVM分为 方法区,虚拟机栈,本地方法栈,堆,计数器 5个区域.其中最为 ...

  5. 数据结构与算法+JVM调优和GC常用算法+数据库高级+复杂sql手写

    数据结构 双向链表 二叉排序树 红黑树 散列表 双向链表: 什么是双向链表 双向链表是一种数据结构,是由若干个节点构成,每个节点由三部分构成, 分别是前驱节点,元素,后继节点,且双向链表中的节点在内存 ...

  6. JVM学习之GC常用算法

    2019独角兽企业重金招聘Python工程师标准>>> 出处:博客园左潇龙的技术博客--http://www.cnblogs.com/zuoxiaolong,多谢分享 GC策略解决了 ...

  7. .net 把一个对象赋值给一个参数_Java GC回收算法-判定一个对象是否可以回收

    开源推荐 推荐一款一站式性能监控工具(开源项目) Pepper-Metrics是跟一位同事一起开发的开源组件,主要功能是通过比较轻量的方式与常用开源组件(jedis/mybatis/motan/dub ...

  8. java gc回收算法_Java GC回收算法-判定一个对象是否可以回收

    开源推荐 推荐一款一站式性能监控工具(开源项目) Pepper-Metrics是跟一位同事一起开发的开源组件,主要功能是通过比较轻量的方式与常用开源组件(jedis/mybatis/motan/dub ...

  9. 4. GC 算法(实现篇) - GC参考手册

    您应该已经阅读了前面的章节: 垃圾收集简介 - GC参考手册 Java中的垃圾收集 - GC参考手册 GC 算法(基础篇) - GC参考手册 学习了GC算法的相关概念之后, 我们将介绍在JVM中这些算 ...

最新文章

  1. jconsole_我的Wiki:使用JConsole对WildFly(或JBoss AS7)进行远程JMX访问
  2. [GRYZ2015]快排练习
  3. postgresql 集群_谁说postgresql 没有靠谱的高可用(2)
  4. Matplotlib实例教程(十五) 3D散点图
  5. latex自动生成中文目录_自动生成工作表目录三种方法,看哪种适合你?
  6. 麦克纳姆轮运动原理_麦克纳姆轮介绍
  7. jquery:TypeError: $(...).on is not a function
  8. python调用程序call_call在Python中改进数列的实例讲解
  9. Domino学习笔记之邮件发送程序
  10. FMEA-MSR 步骤五:风险分析(一)
  11. 身份证,邮箱等的验证
  12. bind9智能dns配置
  13. Vue 钩子函数activated未触发
  14. 98% after emitting CopyPlugin问题
  15. C代码如何跑起来(程序编译和预处理)
  16. java俄罗斯方块七中图形类_shell脚本俄罗斯方块--代码真正详解
  17. CPU卡技术学习笔记1
  18. C语言程序对夏令时的处理
  19. 知识付费存在的问题及未来的发展
  20. Linux系统目录树结构以及解释

热门文章

  1. 四川大学金融转计算机,[请教]川大和西财哪个金融系好?!
  2. 华南理工计算机接口技术随堂练习_研究生考试计算机408跟845有什么区别?
  3. C语言:如何定义一个和库函数名一样的函数,并在函数中调用该库函数
  4. 信工干货||C语言中的运算符和表达式
  5. 文科女生单招学计算机,文科女生走单招学什么专业好
  6. linux继续执行上一个命令快捷键,整理了上linux 命令行上常用的 快捷键
  7. gradle-com.android.build.api.transform.TransformException:Error while generating the main dex list
  8. pdh光端机相关知识介绍
  9. 10835k1_行政组织学_21秋考试
  10. 【渝粤教育】电大中专计算机常用工具软件 (2)作业 题库