JVM监控

1. ParNew表示CMS收集器在新生代采用多线程进行垃圾回收。DefNew表示顺序垃圾收集器在新生代采用单线程进行垃圾回收。
2.系统做完CMS cycle后,观察minorGC的日志,如果日志中发现CMS收集前后的heap占用下降不明显,那要么是已有的对象太少,以至于找到的unreachable对象很少,这样浪费费CPU;要么是对象从新生代提拔到老生代的速率超过了CMS所能承受的范围。总之,出现以上情况表示需要进行性能调优。
3. -XX:+CMSClassUnloadingEnabled -XX:+CMSPermGenSweepingEnabled,PermGen一般存放一些JVM的元数据(Class/反射代理等),比如Spring/Hibernate大量采用cglib,导致生成的Proxy会比较多,而这些都是存放在PermGen区域,默认情况下CMS不会去做回收,因此,为了保证PermGen空间正常可以设置以上两个参数实现垃圾的回收。另外,-XX:CMSInitiatingPermOccupancyFraction=<percent>可以知道持久代的占用百分比。
4. -XX:MaxTenuringThreshold=10,意思是说对象在survivor区域中经过10minorGC还存活的话就提拔到老生代。再比如 -XX:SurvivorRatio=65536 -XX:MaxTenuringThreshold=0这样的配置实际上就是去掉了survivor区域,直接将对象从eden区域提拔到老生代。
5. 在CMS中如果监控到它的两个暂停阶段initial mark or remark的暂停时间比一次minorGC的暂停时间还长,那么需要进行性能优化。
6. 当fullGC发生时伴随着持久代class的unload,那么需要考虑调大持久代空间的大小。
Java代码  
  1. [Full GC[Unloading class sun.reflect.GeneratedConstructorAccessor3]
  2. [Unloading class sun.reflect.GeneratedConstructorAccessor8]
  3. [Unloading class sun.reflect.GeneratedConstructorAccessor11]
  4. [Unloading class sun.reflect.GeneratedConstructorAccessor6]
  5. 8566K->5871K(193856K), 0.0989123 secs]
7. 使用jstack去挖掘锁竞争的方法:Observing multiple thread stack traces trying to lock the same lock address is an indication the application is experiencing lock contention,查看那些处在同一lock地址上的线程栈。     
8. JVM监控常用到的命令:-XX:+PrintGCDetails、-XX:+PrintGCTimeStamps、-XX:+PrintGCDateStamps、-Xloggc:<filename>、-XX:+PrintGCApplicationConcurrentTime and -XX:+PrintGCApplicationStoppedTime。
9.JVM监控常用的可视化工具:GCHisto、JConsolejvisualvm
JVM调优
方法论
1.The client runtime is specialized for rapid startup, small memory footprint, and a JIT compiler with rapid code generation。The server runtime offers
more sophisticated code generation optimizations, which are more desirable in server applications。现在还出来一个新的runtime—tiered,但是还不成熟,tiered combines the best of the client and server runtimes, that is, rapid startup time and high performing generated code。
2. 选择JVM为32bit还是64bit取决于内存和第三方本地库的使用,All native components using the Java Native Interface (JNI) in a 64-bit JVM must be compiled in 64-bit mode。
3. -XX:+UseParallelOldGC 和 -XX:+UseParallelGC的区别:前者会启动新生代和老生代的多线程收集;而后者只启动新生代的多线程收集,老生代是单线程的。
4. 决定JVM性能的属性:1. 吞吐量;2. 延时(latency);3.内存占用量
5. JVM调优的三原则:1. Minor GC Reclamation Principle—在minorGC时要最大化回收对象数;2. GC Maximize Memory Principle;3. 2 of 3 GC Tuning
Principle—调优点放在占总性能2/3的几个属性上:吞吐量/延时(latency)/内存占用量。
6. 推荐的GC日志配置:-XX:+PrintGCTimeStamps -XX:+PrintGCDetails -Xloggc:<filename>。 如果要调优为低延时, -XX:+PrintGCApplicationStoppedTime(GC时应用暂停的时间)、-XX:+PrintGCApplicationConcurrentTime(GC时应用并发执行的时间)很有用。、
推荐的log配置:
7.  当-Xmx 和-Xms不相同时,堆size可能会发生作自动调整,但是调整时,并不会调整新生代的大小。因此-Xmn只能用于-Xmx 和-Xms拥有相同值。事实上,把-Xmx 和-Xms设置为相同的值是一个好的习惯。
8. -XX:-ScavengeBeforeFullGC可以避免fullGC时收集新生代。
9. jmap -histo:live pid命令可以强制执行一次fullGC。
10. GC时,以下因素影响到延时:1. 一次minorGC的持续时间;2. minorGC的频率;3. 一次fullGC的持续时间;4. fullGC的频率;1和2决定了是否需要重新定义young generation size。3和4决定了是否需要重新定义old generation size,及是否要启用并发GC(-XX:+UseConcMarkSweepGC)。
11. 可以通过像下面这样的gclog来计算平均minorGC发生频率和平均持续时间,如果发现平均平均持续时间〉期望的应用延时时间,那么就需要进一步调优:
12. 当需要调优某一个代的size时,一般不要改变其他代的大小,而是通过调整堆堆和要调优的代的大小来实现。
13. 关于各代size的大小,请关注以下guidelines:
1)The old generation space size should be not be much smaller than 1.5x the live data size。
2) Young generation space size should be at least 10% of the Java heap size, the value specified as -Xmx and -Xms。
3)When increasing the Java heap size, be careful not to exceed the amount of physical memory available to the JVM。
14. 提拔率的计算: rate=每秒提拔到老生代的数据量=每次minorGC提拔的数据量/收集频率(s)=minorGC前后老生代空间占用量之差/收集频率(s)。如果知道现在老生代剩余的空间(用y代表),那么就可以计算出可以算出多久后,这些剩余的空间会被提拔的对象占满,公式为:m(s)=y/rate,这个m值就应该是fullGC的理想频率。
15. 对CMS的调优重点是:avoid a stop-the-world compacting garbage collection。
16. 从其它垃圾收集器转到CMS时,一个常见的原则是扩大原有老生代20%-30%。
17. 调优CMS要注意三个元素:提拔率、fragmentation(live对象之间的hole)、并发线程回收率。解决fragmentation的一种方法就是compacting 内存,但是会造成很大的延时(这个就是叫stop-the-world ),另一个解决方法是增大内存空间(使用Maximize Memory Principle),这不能完全解决fragmentation问题,但是能够减少发生的频率,最后一个方法是减低提拔率(这个可以使用Minor GC Reclamation Principle)。
Survivor的调优:
18. survivor space计算公式:survivor space size = -Xmn<value>/(-XX:SurvivorRatio=<ratio> + 2)。
19. Tenuring Threshold的概念:每次minorGC时都会计算该值,看啥时能够将一个对象提拔到老生代,它的值其实就是对象age(经历的minorGC数),对象被分配时的age=0。如果某个时刻对象的age大于Tenuring Threshold就会被提拔到老生代。事实上,-XX:MaxTenuringThreshold=<n>命令可以指定这个值(该值的范围:ranging from 0–15 for Java 5 Update 6 and later, 0–31 for Java 5 Update 5 and earlier),default maximum value=15。
20. 如果需要Tenuring Threshold监控的值,可以通过下面命令启动-XX:+PrintTenuringDistribution。下面是日志格式,其中,Desired survivor size 8388608 bytes的值=一个survivor大小*target survivor ratio(target survivor space occupancy,默认值为50%)。要保证survivor能够容纳16690480 total的live对象需要survivor拥有16690480 /50% = 33,380,960的空间也就是32M。假设原来的配置为:-Xmx1536m -Xms1536m -Xmn512m -XX:SurvivorRatio=30,现在我们采用增加新生代空间不动eden空间的调优方式,那么配置应该变成-Xmx1568m -Xms1568m -Xmn544m -XX:SurvivorRatio=15。注意Xmn变为了544(512+32),SurvivorRatio=15=544/32-2。当然也可以通过不动新生代空间减小eden空间的办法,但还是尽量使用第一种方法。
-XX:TargetSurvivorRatio=<percent>能够指定target survivor space occupancy,默认值为50%。
Java代码  
  1. Desired survivor size 8388608 bytes, new threshold 1 (max 15)
  2. - age 1: 16690480 bytes, 16690480 total
21. 以下现象暗示survivor的空间太小:1. new tenuring threshold<max tenuring threshold;2.  desired survivor size(见上图)< total surviving bytes数。
从上图来看,1〈15;8388608<16690480所以需要调优survivor大小。再看下图,15==15;16777216>7320248所以是一个比较合理的survivor配置。
Java代码  
  1. Desired survivor size 16777216 bytes, new threshold 15 (max 15)
  2. - age 1: 6115072 bytes, 6115072 total
  3. - age 2: 286672 bytes, 6401744 total
  4. - age 3: 115704 bytes, 6517448 total
  5. - age 4: 95932 bytes, 6613380 total
  6. - age 5: 89465 bytes, 6702845 total
  7. - age 6: 88322 bytes, 6791167 total
  8. - age 7: 88201 bytes, 6879368 total
  9. - age 8: 88176 bytes, 6967544 total
  10. - age 9: 88176 bytes, 7055720 total
  11. - age 10: 88176 bytes, 7143896 total
  12. - age 11: 88176 bytes, 7232072 total
  13. - age 12: 88176 bytes, 7320248 total
CMS的调优:
22. CMS garbage collector的调优主要目标是保持老生代有足够可获得的空间和后续避免stop-the-world compacting garbage collections。
23. concurrent mode failure暗示了Stop-the-world compacting garbage collections in CMS,如下图,如果发生了这种情况需要通过命令-XX:CMSInitiatingOccupancyFraction=65(这里表示老生代空间占用65%)修改CMS garbage collection cycle启动时间。另外还有一个相关的命令-XX:+UseCMSInitiatingOccupancyOnly,它保证所有的CMS garbage collection cycle都按照设定的比例来启动,如果没有设置后者,那么仅有第一个CMS garbage collection cycle是按照设定的比例启动,之后会根据JVM自适应的方式调整启动时间。建议一起使用这两个命令。
CMSInitiatingOccupancyFraction值应该大于live data size(一个fullGC后heap的占用量),如果小于这个值,那么CMS collector会运行得过于频繁。一个经验值是至少1.5倍live data size。
Java代码  
  1. 174.445: [GC 174.446: [ParNew: 66408K->66408K(66416K), 0.0000618
  2. secs]174.446: [CMS (concurrent mode failure): 161928K->162118K(175104K),
  3. 4.0975124 secs] 228336K->162118K(241520K)
24. 如果观察到CMS-initial-mark——〉CMS-concurrent-reset过程中heap的占用变化不大(比如说就几M或几十M),说明CMS cycle工作的太早,表示需要通过-XX:CMSInitiatingOccupancyFraction and -XX:+UseCMSInitiatingOccupancyOnly来增大老生代空间占用率。296358K-〉292925K变化不大。
Java代码  
  1. [ParNew 390868K-><strong><em>296358K</em></strong>(773376K), 0.1882258 secs]
  2. [CMS-initial-mark 298458K(773376K), 0.0847541 secs]
  3. [ParNew 401318K->306863K(773376K), 0.1933159 secs]
  4. [CMS-concurrent-mark: 0.787/0.981 secs]
  5. [CMS-concurrent-preclean: 0.149/0.152 secs]
  6. [CMS-concurrent-abortable-preclean: 0.105/0.183 secs]
  7. [CMS-remark 374049K(773376K), 0.0353394 secs]
  8. [ParNew 407285K->312829K(773376K), 0.1969370 secs]
  9. [ParNew 405554K->311100K(773376K), 0.1922082 secs]
  10. [ParNew 404913K->310361K(773376K), 0.1909849 secs]
  11. [ParNew 406005K->311878K(773376K), 0.2012884 secs]
  12. [CMS-concurrent-sweep: 2.179/2.963 secs]
  13. [CMS-concurrent-reset: 0.010/0.010 secs]
  14. [ParNew 387767K-><strong><em>292925K</em></strong>(773376K), 0.1843175 secs]
下面这个就比较正常了,546360K-〉350518K变化比较大。
Java代码  
  1. [ParNew 640710K-><strong><em>546360K</em></strong>(773376K), 0.1839508 secs]
  2. [CMS-initial-mark 548460K(773376K), 0.0883685 secs]
  3. [ParNew 651320K->556690K(773376K), 0.2052309 secs]
  4. [CMS-concurrent-mark: 0.832/1.038 secs]
  5. [CMS-concurrent-preclean: 0.146/0.151 secs]
  6. [CMS-concurrent-abortable-preclean: 0.181/0.181 secs]
  7. [CMS-remark 623877K(773376K), 0.0328863 secs]
  8. [ParNew 655656K->561336K(773376K), 0.2088224 secs]
  9. [ParNew 648882K->554390K(773376K), 0.2053158 secs]
  10. [ParNew 489586K->395012K(773376K), 0.2050494 secs]
  11. [ParNew 463096K->368901K(773376K), 0.2137257 secs]
  12. [CMS-concurrent-sweep: 4.873/6.745 secs]
  13. [CMS-concurrent-reset: 0.010/0.010 secs]
  14. [ParNew 445124K-><strong><em>350518K</em></strong>(773376K), 0.1800791 secs]
  15. [ParNew 455478K->361141K(773376K), 0.1849950 secs]
说明CMS cycle工作的太晚的例子(下图),CMS周期还没有走完就马上执行了fullGC。因此要减小XX:CMSInitiatingOccupancyFraction。
Java代码  
  1. [ParNew 742993K->648506K(773376K), 0.1688876 secs]
  2. [ParNew 753466K->659042K(773376K), 0.1695921 secs]
  3. [CMS-initial-mark 661142K(773376K), 0.0861029 secs]
  4. [Full GC 645986K->234335K(655360K), 8.9112629 secs]
  5. [ParNew 339295K->247490K(773376K), 0.0230993 secs]
  6. [ParNew 352450K->259959K(773376K), 0.1933945 secs]
总之,要得到一个合理的CMSInitiatingOccupancyFraction值需要设置各种尝试值,然后观察日志数据,最终方可作出选择。
25. 以下日志内容表明系统进行了显示的fullGC(System.gc()),RMI应用会在某些时刻执行显示GC。
Java代码  
  1. [Full GC (System)
  2. [CMS: 418061K->428608K(16384K), 0.2539726 secs]
  3. 418749K->4288608K(31168K),
  4. [CMS Perm : 32428K->32428K(65536K)],
  5. 0.2540393 secs]
  6. [Times: user=0.12 sys=0.01, real=0.25 secs]
26. -XX:ParallelGCThreads=<n>也能决定CMS中并发rermark线程数。在Java 6 Update 23中,ParallelGCThreads的默认值为:如果Runtime.availableProcessors()地值小于等于8,其值就是处理器的数目,否则,其值为处理数目*5/8。当机器上还运行有其他的应用时,需要将该值调整小于默认值。
27. -XX:+CMSScavengeBeforeRemark可以减少remark的duration值,因为老生代的对象有的会依赖于新生代的对象,当增加了这个命令时会在remark之前执行一次minorGC的操作,从而可以减少老生代到新生代的reachable对象数。
28. 如果应用有很多的Reference or finalizable objects,那么可以使用-XX:+ParallelRefProcEnabled来减少duration。
并行GC的调优:
29. 并行GC的调优主要是让其避免fullGC。
30. 并行GC支持(仅它支持)UseAdaptiveSizePolicy,它会自动地去调整新生代的空间,因此在对并行GC进行调优时需要关闭它-XX:-UseAdaptiveSizePolicy。调优前先要监控日志,使用如下配置:-XX:+PrintGCDateStamps, -XX:PrintGCDetails,-XX:+PrintAdaptiveSizePolicy。
31.当发生fullGC,首先确认old generation space是否大于等于1.5倍live data size,如果小就增大。其次查看日志看是否有overflow: true,如果有说明老生代空间不够大,或者说是survivor的空间太小。
Java代码  
  1. [GCAdaptiveSizePolicy::compute_survivor_space_size_and_thresh:
  2. survived: 446113911
  3. promoted: 10904856
  4. overflow: true
  5. [PSYoungGen: 6493788K->233888K(9437184K)]
  6. 7959281K->2662511K(13631488K), 0.0797732 secs]
  7. [Times: user=0.59 sys=0.00, real=0.08 secs]
32. 调优survivor空间,通过多次观察找到一个最大的sruvivored值(来自于上面的日志)假设这个值为500M,那么需要的survivor空间大小=500M/50%(TargetSurvivorRatio的默认值为50%)=1G。然后根据这个值来调整head的大小(在内存还可分配的情况下,尽量不要动老生代/eden空间的大小)。当没有办法下需要缩小老生代空间时必须保证老生代的空间值为1.5倍于live data size。如果实在内存紧张也可以考虑增大TargetSurvivorRatio值。
33. 一条原则:并行GC的开销不应该大于5%。
其他方面:
1. 如果应用有大的分配率,但是这些对象的存活期却很短,需要考虑更大的新生代空间,甚至超过老生代。
2. 如果应用的提拔率很低,那么可以考虑让old generation space<live data size。
3. 逃逸分析——Escape Analysis。-XX:+DoEscapeAnalysis
4. 偏向锁——Biased Locking。
5. 大内存页——Large Pages。

性能监控/优化系列——JVM监控/调优相关推荐

  1. CUDA性能优化系列——Kmeans算法调优(二)

    本篇介绍Kmeans算法中计算新的聚类中心部分.这部分主要逻辑:根据计算出的新的分类信息,对全部数据点依次对每个类别求出所属当前类别的数据点个数与坐标和.本质上就是进行规约运算. V1 Atomic实 ...

  2. 由美团技术文章整理---spark性能优化基础篇--开发调优与资源参数调优

    文章地址1:Spark性能优化指南--基础篇 - 美团技术团队 文章地址2:Spark性能优化指南--高级篇 - 美团技术团队 目录 一.关于性能优化基础篇--开发调优 1.避免创建重复RDD (1) ...

  3. JVM常用调优参数 ——JVM篇

    JVM常用性能调优参数详解 ​ 在学习完整个JVM内容后,其实目标不仅是学习了解整个JVM的基础知识,而是为了进行JVM性能调优做准备,所以以下的内容就是来说说JVM性能调优的知识. 一.性能调优 ​ ...

  4. 一文看尽 JVM GC 调优

    一个著名的学习方法论 向橡皮鸭求助 学会提问,提问也是一门艺术 提问前,先投入自己的时间做好功课 发生了什么事情 问题的基本情况 你投入的研究和发现 能正确提出你的问题,你的问题差不多已经解决一半 深 ...

  5. Java JVM参数调优配置

    JVM参数调优配置 Java虚拟机原理 Java内存结构 堆.栈.方法区概念区别 Java堆 Java栈 Java方法区 虚拟机参数配置 什么是虚拟机参数配置 堆的参数配置 设置最大堆内存 设置新生代 ...

  6. 深入理解jvm和jvm基本调优参数

    Java虚拟机原理 所谓虚拟机,就是一台虚拟的机器.他是一款软件,用来执行一系列虚拟计算指令,大体上虚拟机可以分为:系统虚拟机和程序虚拟机, 大名鼎鼎的Visual Box.Vmare就属于系统虚拟机 ...

  7. JVM参数调优总结 -Xms -Xmx

    "-Xmx1024m -Xms1024m -Xmn512m -Xss256k"--Java运行参数(转) JVM的堆的内存, 是通过下面面两个参数控制的 -Xms 最小堆的大小, ...

  8. JVM参数调优总结 -Xms -Xmx -Xmn -Xss

    "-Xmx1024m -Xms1024m -Xmn512m -Xss256k"--Java运行参数(转) JVM的堆的内存, 是通过下面面两个参数控制的 -Xms 最小堆的大小,  ...

  9. 关于JVM调优的工具及JVM 常见调优参数

    六个命令行排查工具 我们一般使用 JDK 自带的 6 个命令行工具来排查JVM.它们分别是:jps.jstat.jinfo.jmap.jhat 和 jstack,它们都位于 JDK 的 bin 目录下 ...

最新文章

  1. 第一个PhoneGap程序以及错误解决
  2. 2021-01-16交叉熵损失函数比均方误差损失函数优点在哪里
  3. 提高网站有效流量从三个方面出发
  4. day_6:验证码识别
  5. 血压测量:很重要的事情!
  6. poweramp最完美设置_2020年感恩节,你最想感谢的人是谁?
  7. 综述 | 生成对抗网络(GAN)在图网络中的应用
  8. [Java基础]复制文件的异常处理try...catch...finally的做法
  9. 【渝粤题库】国家开放大学2021春1078复变函数题目
  10. 终于有人把Elasticsearch原理讲明白了!
  11. django 1.8 官方文档翻译: 3-4-3 使用基于类的视图处理表单
  12. 在matlab中产生dsp程序学习
  13. sim800a指令_SIM800A_硬件设计手册-LCSC.PDF
  14. 传教士与野人过河问题
  15. 2022/7/9 考试总结
  16. 不畏将来,不念过往,如此安好
  17. 从Hadoop到Spark、Flink,大数据处理框架十年激荡发展史
  18. C语言程序设计——猜数字游戏
  19. 制作主生产计划MPS报表(概念+习题详解)
  20. instant run

热门文章

  1. 单臂路由与三层交换技术简单介绍
  2. 三星S7 android操作系统耗电,2K屏手机玩游戏耗电大、性能渣?三星S7:呵呵
  3. js reduce实现中间件_Laravel中间件实现原理及实例分析
  4. frp内网穿透-公网IP低成本使用高性能kali
  5. recyclerview item点击无效_Android列表布局专题(一)RecyclerView
  6. c语言 字符串 正序再倒序_新特性解读 | MySQL 8.0 索引特性3 -倒序索引
  7. java判断是否是doc文件_java判断文件类型
  8. python24.dll_2_48_python24.dll
  9. 计算机 游戏 排名2015年,2015十大高性能游戏笔记本电脑排行 最强游戏本推荐
  10. 文件自定义变量_awk 内置变量与自定义变量