Garbage-First(后文简称G1)收集器是当今收集器技术发展的最前沿成果,在Sun公司给出的JDK RoadMap里面,它被视作JDK 7的HotSpot VM 的一项重要进化特征。从JDK 6u14中开始就有Early Access版本的G1收集器供开发人员实验、试用,虽然在JDK 7正式版发布时,G1收集器仍然没有摆脱“Experimental”的标签,但是相信不久后将会有一个成熟的商用版本跟随某个JDK 7的更新包发布出来。
  因版面篇幅限制,笔者行文过程中假设读者对HotSpot其他收集器(例如CMS)及相关JVM内存模型已有基本的了解,涉及到基础概念时,没有再延伸介绍,读者可参考相关资料。

G1收集器的特点  
  G1是一款面向服务端应用的垃圾收集器,Sun(Oracle)赋予它的使命是(在比较长期的)未来可以替换掉JDK 5中发布的CMS(Concurrent Mark Sweep)收集器,与其他GC收集器相比,G1具备如下特点:

  • 并行与并发:G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU(CPU或者CPU核心)来缩短Stop-The-World停顿的时间,部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以通过并发的方式让Java程序继续执行。
  • 分代收集:与其他收集器一样,分代概念在G1中依然得以保留。虽然G1可以不需其他收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。
  • 空间整合:与CMS的“标记-清理”算法不同,G1从整体看来是基于“标记-整理”算法实现的收集器,从局部(两个Region之间)上看是基于“复制”算法实现,无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。
  • 可预测的停顿:这是G1相对于CMS的另外一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器特征了。

实现思路  
  在G1之前的其他收集器进行收集的范围都是整个新生代或者老年代,而G1不再是这样。使用G1收集器时,Java堆的内存布局与就与其他收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。
  G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回价值最大的Region(这也就是Garbage-First名称的来由)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内获可以获取尽可能高的收集效率。
  G1把内存“化整为零”的思路,理解起来似乎很容易理解,但其中的实现细节却远远没有现象中简单,否则也不会从04年Sun实验室发表第一篇G1的论文拖至今将近8年时间都还没有开发出G1的商用版。笔者举个一个细节为例:把Java堆分为多个Region后,垃圾收集是否就真的能以Region为单位进行了?听起来顺理成章,再仔细想想就很容易发现问题所在:Region不可能是孤立的。一个对象分配在某个Region中,它并非只能被本Region中的其他对象引用,而是可以与整个Java堆任意的对象发生引用关系。那在做可达性判定确定对象是否存活的时候,岂不是还得扫描整个Java堆才能保障准确性?这个问题其实并非在G1中才有,只是在G1中更加突出了而已。在以前的分代收集中,新生代的规模一般都比老年代要小许多,新生代的收集也比老年代要频繁许多,那回收新生代中的对象也面临过相同的问题,如果回收新生代时也不得不同时扫描老年代的话,Minor GC的效率可能下降不少。 
  在G1收集器中Region之间的对象引用以及其他收集器中的新生代与老年代之间的对象引用,虚拟机都是使用Remembered Set来避免全堆扫描的。G1中每个Region都有一个与之对应的Remembered Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(在分代的例子中就是检查引是否老年代中的对象引用了新生代中的对象),如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。当进行内存回收时,GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。

运作过程  
  如果不计算维护Remembered Set的操作,G1收集器的运作大致可划分为以下几个步骤:

  • 初始标记(Initial Marking)
  • 并发标记(Concurrent Marking)
  • 最终标记(Final Marking)
  • 筛选回收(Live Data Counting and Evacuation)

  对CMS收集器运作过程熟悉的读者,一定已经发现G1的前几个步骤的运作过程和CMS有很多相似之处。初始标记阶段仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短。并发标记阶段是从GC Root开始对堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行。而最终标记阶段则是为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,但是可并行执行。最后筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划,从Sun透露出来的信息来看,这个阶段其实也可以做到与用户程序一起并发执行,但是因为只回收一部分Region,时间是用户可控制的,而且停顿用户线程将大幅提高收集效率。通过图1可以比较清楚地看到G1收集器的运作步骤中并发和需要停顿的阶段。


图1 G1收集器运行示意图

G1收集器的实际性能  
  由于目前还没有成熟的版本,G1收集器几乎可以说还没有经过实际应用的考验,网上关于G1收集器的性能测试非常贫乏,笔者没有Google到有关的生产环境下的性能测试报告。强调“生产环境下的测试报告”是因为对于垃圾收集器来说,仅仅通过简单的Java代码写个Microbenchmark程序来创建、移除Java对象,再用-XX:+PrintGCDetails等参数来查看GC日志是很难做到准衡量其性能的(为何Microbenchmark的测试结果不准确可参见笔者这篇博客:http://icyfenix.iteye.com/blog/1110279 )。因此关于G1收集器的性能部分,笔者引用了Sun实验室的论文《Garbage-First Garbage Collection》其中一段测试数据,以及一段在StackOverfall.com上同行们对G1在真实生产环境下的性能分享讨论。
  Sun给出的Benchmark的执行硬件为Sun V880服务器(8×750MHz UltraSPARC III CPU、32G内存、Solaris 10操作系统)。执行软件有两个,分别为SPECjbb(模拟商业数据库应用,堆中存活对象约为165MB,结果反映吐量和最长事务处理时间)和telco(模拟电话应答服务应用,堆中存活对象约为100MB,结果反映系统能支持的最大吞吐量)。为了便于对比,还收集了一组使用ParNew+CMS收集器的测试数据。所有测试都配置为与CPU数量相同的8条GC线程。
  在反应停顿时间的软实时目标(Soft Real-Time Goal)测试中,横向是两个测试软件的时间片段配置,单位是毫秒,以(X/Y)的形式表示,代表在Y毫秒内最大允许GC时间为X毫秒(对于CMS收集器,无法直接指定这个目标,通过调整分代大小的方式大致模拟)。纵向是两个软件在对应配置和不同的Java堆容量下的测试结果,V%、avgV%和wV%分别代表的含义为:

  • V%:表示测试过程中,软实时目标失败的概率,软实时目标失败即某个时间片段中实际GC时间超过了允许的最大GC时间。
  • avgV%:表示在所有实际GC时间超标的时间片段里,实际GC时间超过最大GC时间的平均百分比(实际GC时间减去允许最大GC时间,再除以总时间片段)。
  • wV%:表示在测试结果最差的时间片段里,实际GC时间占用执行时间的百分比。

 测试结果如下表所示: 
  表1:软实时目标测试结果

  从上面结果可见,对于telco来说,软实时目标失败的概率控制在0.5%~0.7%之间,SPECjbb就要差一些,但也控制在2%~5%之间,概率随着(X/Y)的比值减小而增加。另一方面,失败时超出允许GC时间的比值随着总时间片段增加而变小(分母变大了嘛),在(100/200)、512MB的配置下,G1收集器出现了某些时间片段下100%时间在进行GC的最坏情况。而相比之下,CMS收集器的测试结果对比之下就要差很多,3种Java堆容量下都出现了100%时间进行GC的情况,
  在吞吐量测试中,测试数据取3次SPECjbb和15次telco的平均结果。在SPECjbb的应用下,各种配置下的G1收集器表现出了一致的行为,吞吐量看起来只与允许最大GC时间成正比关系,而在telco的应用中,不同配置对吞吐量的影响则显得很微弱。与CMS收集器的吞吐量对比可以看到,在SPECjbb测试中,在堆容量超过768M时,CMS收集器有5%~10%的优势,而在telco测试中CMS的优势则要小一些,只有3%~4%左右。


图2:吞吐量测试结果

  在更大规模的生产环境下,笔者引用一段在StackOverflow.com上看到的经验分享:“我在一个真实的、较大规模的应用程序中使用过G1:大约分配有60~70GB内存,存活对象大约在20~50GB之间。服务器运行Linux操作系统,JDK版本为6u22。G1与PS/PS Old相比,最大的好处是停顿时间更加可控、可预测,如果我在PS中设置一个很低的最大允许GC时间,譬如期望50毫秒内完成GC(-XX:MaxGCPauseMillis=50),但在65GB的Java堆下有可能得到的直接结果是一次长达30秒至2分钟的漫长的Stop-The-World过程;而G1与CMS相比,它们都立足于低停顿时间,CMS仍然是我现在的选择,但是随着Oracle对G1 的持续改进,我相信G1会是最终的胜利者。如果你现在采用的收集器没有出现问题,那就没有任何理由现在去选择G1,如果你的应用追求低停顿,那G1现在已经可以作为一个可尝试的选择,如果你的应用追求吞吐量,那G1并不会为你带来什么特别的好处。”
  在这节笔者引了两段别人的测试结果、经验后,对于G1给出一个自己的建议:直到现在为止还没有一款“最好的”收集器出现,更加没有“万能的”收集器,所以我们选择的只是对具体应用最合适的收集器。对于不同的硬件环境、不同的软件应用、不同的参数配置、不同的调优目标都会对调优时的收集器选择产生影响,选择适合的收集器,除了理论和别人的数据经验作为指导外,最终还是应当建立在自己应用的实际测试之上,别人的测试,大可抱着“至于你信不信,反正我自己没测之前是不信的”的态度。

参考资料  
  本文撰写时主要参考了以下资料:

  • Sun实验室的论文《Garbage-First Garbage Collection》,作者为:David Detlefs、Christine Flood、Steve Heller、Tony Printezis:http://portal.acm.org/citation.cfm?id=1029879
  • 《The Garbage-First Garbage Collector》:http://www.oracle.com/technetwork/java/javase/tech/g1-intro-jsp-135488.html
  • 《G1: Java's Garbage First Garbage Collector》:http://drdobbs.com/java/219401061?pgno=1

java G1垃圾收集器相关推荐

  1. 转:深入理解Java G1垃圾收集器

    本文首先简单介绍了垃圾收集的常见方式,然后再分析了G1收集器的收集原理,相比其他垃圾收集器的优势,最后给出了一些调优实践. 一,什么是垃圾回收 首先,在了解G1之前,我们需要清楚的知道,垃圾回收是什么 ...

  2. 深入理解 Java G1 垃圾收集器--转

    原文地址:http://blog.jobbole.com/109170/?utm_source=hao.jobbole.com&utm_medium=relatedArticle 本文首先简单 ...

  3. 深入理解 Java G1 垃圾收集器

    本文首先简单介绍了垃圾收集的常见方式,然后再分析了G1收集器的收集原理,相比其他垃圾收集器的优势,最后给出了一些调优实践. 一,什么是垃圾回收 首先,在了解G1之前,我们需要清楚的知道,垃圾回收是什么 ...

  4. 深入理解 Java G1 垃圾收集器GC调优

    本文首先简单介绍了垃圾收集的常见方式,然后再分析了G1收集器的收集原理,相比其他垃圾收集器的优势,最后给出了一些调优实践. 一,什么是垃圾回收 首先,在了解G1之前,我们需要清楚的知道,垃圾回收是什么 ...

  5. java -g_【JVM】7、深入理解Java G1垃圾收集器

    本文首先简单介绍了垃圾收集的常见方式,然后再分析了G1收集器的收集原理,相比其他垃圾收集器的优势,最后给出了一些调优实践. 一,什么是垃圾回收 首先,在了解G1之前,我们需要清楚的知道,垃圾回收是什么 ...

  6. java g1垃圾收集器优化参考

    1. G1适用场景 G1从jdk7开始,jdk9被设为默认垃圾收集器:在jdk8就需要指定参数配置,目标就是彻底替换掉CMS. G1的首要目标是为需要大量内存的系统提供一个保证GC低延迟的解决方案,也 ...

  7. Java虚拟机垃圾收集器初步学习

    Java虚拟机-垃圾收集器 1.概述 如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现.     这里讨论的收集器基于JDK 1.7 Update 14之后的HotSpot虚拟机 ...

  8. GC之G1垃圾收集器

    GC之G1垃圾收集器 目录 以前收集器的特点 G1是什么 G1特点 G1底层原理 G1回收步骤 和CMS相比的优势 小总结 1. 以前收集器的特点 年轻代和老年代是各自独立且连续的内存块 年轻代收集必 ...

  9. JVM性能调优实践:G1 垃圾收集器介绍篇

    前言 前面两篇主要整理了性能测试的主要观察指标信息:性能测试篇,以及JVM性能调优的工具:JVM篇.这一篇先简单总结一下GC的种类,然后侧重总结下G1(Garbage-First)垃圾收集器的分代,结 ...

最新文章

  1. 河北计算机课本初中,河北:2019-2020学年中小学教学用书有变
  2. mysql curd操作_(四):CURD操作详解(增删改查)
  3. python 用户输入_Python 用户输入(input)
  4. 在大量数据迁移期间oracle学习笔记
  5. 华为机试HJ72:百钱买百鸡问题
  6. zz Oracle存储过程总结
  7. 三种方法在地图上绘制网络图
  8. PyCharm2018 汉化激活
  9. Gerber文件总结
  10. 网易邮箱大师使用排雷
  11. codeforces 558D Guess Your Way Out! II
  12. 关于IE浏览器加载图片报206错误的一个解决方法
  13. 什么是combo复用口,光电类型如何转换?
  14. js 根据中文获取拼音首字母
  15. php代码审计文件包含,PHP代码审计之远程文件包含(RFI)
  16. java java算法题目_java常见算法题目
  17. 学习日志 - Openwrt安装python然后wallproxy
  18. 怎么对人像抠图 在线PS怎么处理图片
  19. C语言printf()中i++和++i的问题解决
  20. c语言 语法错误 标识符,C++ C2760 语法错误: 意外标记 标识符,应为 ; 如何严谨的解决 - Sprite is learning...

热门文章

  1. 小诗偶得(五)——潭桥雨后
  2. matlab三相触发电路图,基于MatlabSimulink的三相交流调压电路仿真.doc
  3. Windows注册表--32位和64位程序写注册表位置
  4. 英语语法最终珍藏版笔记- 22反意疑问句
  5. 计算机高手也不能编出俄罗斯方块——计算机达人成长之路(16)
  6. 2020年中国人工智能产业发展形势展望
  7. 聚类分析——SPSS实例分析
  8. Java banner解析
  9. Revit structure 2012
  10. 【学术相关】西北大学博士论文鸣谢感人涕下, 抛弃“铁饭碗”的勇气激励迷茫的你...