Java服务出现了OOM(Out Of Memory)问题,总结了一些相对通用的方案,希望能帮助到Java技术栈的同学。

某Java服务(假设PID=10765)出现了OOM,最常见的原因为:

有可能是内存分配确实过小,而正常业务使用了大量内存

某一个对象被频繁申请,却没有释放,内存不断泄漏,导致内存耗尽

某一个资源被频繁申请,系统资源耗尽,例如:不断创建线程,不断发起网络连接

画外音:无非“本身资源不够”“申请资源太多”“资源耗尽”几个原因。

更具体的,可以使用以下工具逐一排查。

一、确认是不是内存本身就分配过小

方法:jmap -heap 10765

如上图,可以查看新生代,老生代堆内存的分配大小以及使用情况,看是否本身分配过小。

二、找到最耗内存的对象

方法:jmap -histo:live 10765 | more

如上图,输入命令后,会以表格的形式显示存活对象的信息,并按照所占内存大小排序:

实例数

所占内存大小

类名

是不是很直观?对于实例数较多,占用内存大小较多的实例/类,相关的代码就要针对性review了。

上图中占内存最多的对象是RingBufferLogEvent,共占用内存18M,属于正常使用范围。

如果发现某类对象占用内存很大(例如几个G),很可能是类对象创建太多,且一直未释放。例如:

申请完资源后,未调用close()或dispose()释放资源

消费者消费速度慢(或停止消费了),而生产者不断往队列中投递任务,导致队列中任务累积过多

画外音:线上执行该命令会强制执行一次fgc。另外还可以dump内存进行分析。

三、确认是否是资源耗尽

工具:

pstree

netstat

查看进程创建的线程数,以及网络连接数,如果资源耗尽,也可能出现OOM。

这里介绍另一种方法,通过

/proc/${PID}/fd

/proc/${PID}/task

可以分别查看句柄详情和线程数。

例如,某一台线上服务器的sshd进程PID是9339,查看

ll /proc/9339/fd

ll /proc/9339/task

如上图,sshd共占用了四个句柄

0 -> 标准输入

1 -> 标准输出

2 -> 标准错误输出

3 -> socket(容易想到是监听端口)

sshd只有一个主线程PID为9339,并没有多线程。

所以,只要

ll /proc/${PID}/fd | wc -l

ll /proc/${PID}/task | wc -l (效果等同pstree -p | wc -l)

就能知道进程打开的句柄数和线程数。

补充:Java内存溢出OOM

Java内存溢出OOM

经典错误

JVM中常见的两个错误

StackoverFlowError :栈溢出

OutofMemoryError: java heap space:堆溢出

除此之外,还有以下的错误

java.lang.StackOverflowError

java.lang.OutOfMemoryError:java heap space

java.lang.OutOfMemoryError:GC overhead limit exceeeded

java.lang.OutOfMemoryError:Direct buffer memory

java.lang.OutOfMemoryError:unable to create new native thread

java.lang.OutOfMemoryError:Metaspace

架构

OutOfMemoryError和StackOverflowError是属于Error,不是Exception

StackoverFlowError

堆栈溢出,我们有最简单的一个递归调用,就会造成堆栈溢出,也就是深度的方法调用

栈一般是512K,不断的深度调用,直到栈被撑破

public class StackOverflowErrorDemo {

public static void main(String[] args) {

stackOverflowError();

}

/**

* 栈一般是512K,不断的深度调用,直到栈被撑破

* Exception in thread "main" java.lang.StackOverflowError

*/

private static void stackOverflowError() {

stackOverflowError();

}

}

运行结果

Exception in thread "main" java.lang.StackOverflowError

at com.moxi.interview.study.oom.StackOverflowErrorDemo.stackOverflowError(StackOverflowErrorDemo.java:17)

OutOfMemoryError

java heap space

创建了很多对象,导致堆空间不够存储

/**

* Java堆内存不足

*/

public class JavaHeapSpaceDemo {

public static void main(String[] args) {

// 堆空间的大小 -Xms10m -Xmx10m

// 创建一个 80M的字节数组

byte [] bytes = new byte[80 * 1024 * 1024];

}

}

我们创建一个80M的数组,会直接出现Java heap space

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

GC overhead limit exceeded

GC回收时间过长时会抛出OutOfMemoryError,过长的定义是,超过了98%的时间用来做GC,并且回收了不到2%的堆内存

连续多次GC都只回收了不到2%的极端情况下,才会抛出。假设不抛出GC overhead limit 错误会造成什么情况呢?

那就是GC清理的这点内存很快会再次被填满,迫使GC再次执行,这样就形成了恶性循环,CPU的使用率一直都是100%,而GC却没有任何成果。

代码演示:

为了更快的达到效果,我们首先需要设置JVM启动参数

-Xms10m -Xmx10m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m

这个异常出现的步骤就是,我们不断的像list中插入String对象,直到启动GC回收

/**

* GC 回收超时

* JVM参数配置: -Xms10m -Xmx10m -XX:+PrintGCDetails

*/

public class GCOverheadLimitDemo {

public static void main(String[] args) {

int i = 0;

List list = new ArrayList<>();

try {

while(true) {

//1.6时intern()方法发现字符串常量池(存储永久代)没有就复制,物理拷贝

//1.7时intern()方法发现字符串常量池(存储堆)没有就在保存地址值映射实际堆内存对象

list.add(String.valueOf(++i).intern());

}

} catch (Exception e) {

System.out.println("***************i:" + i);

e.printStackTrace();

throw e;

} finally {

}

}

}

运行结果

[Full GC (Ergonomics) [PSYoungGen: 2047K->2047K(2560K)] [ParOldGen: 7106K->7106K(7168K)] 9154K->9154K(9728K), [Metaspace: 3504K->3504K(1056768K)], 0.0311093 secs] [Times: user=0.13 sys=0.00, real=0.03 secs]

[Full GC (Ergonomics) [PSYoungGen: 2047K->0K(2560K)] [ParOldGen: 7136K->667K(7168K)] 9184K->667K(9728K), [Metaspace: 3540K->3540K(1056768K)], 0.0058093 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]

Heap

PSYoungGen total 2560K, used 114K [0x00000000ffd00000, 0x0000000100000000, 0x0000000100000000)

eden space 2048K, 5% used [0x00000000ffd00000,0x00000000ffd1c878,0x00000000fff00000)

from space 512K, 0% used [0x00000000fff80000,0x00000000fff80000,0x0000000100000000)

to space 512K, 0% used [0x00000000fff00000,0x00000000fff00000,0x00000000fff80000)

ParOldGen total 7168K, used 667K [0x00000000ff600000, 0x00000000ffd00000, 0x00000000ffd00000)

object space 7168K, 9% used [0x00000000ff600000,0x00000000ff6a6ff8,0x00000000ffd00000)

Metaspace used 3605K, capacity 4540K, committed 4864K, reserved 1056768K

class space used 399K, capacity 428K, committed 512K, reserved 1048576K

Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded

at java.lang.Integer.toString(Integer.java:403)

at java.lang.String.valueOf(String.java:3099)

at com.moxi.interview.study.oom.GCOverheadLimitDemo.main(GCOverheadLimitDemo.java:18)

我们能够看到 多次Full GC,并没有清理出空间,在多次执行GC操作后,就抛出异常 GC overhead limit

Direct buffer memory

Netty + NIO:这是由于NIO引起的

写NIO程序的时候经常会使用ByteBuffer来读取或写入数据,这是一种基于通道(Channel) 与 缓冲区(Buffer)的I/O方式,它可以使用Native 函数库直接分配堆外内存,然后通过一个存储在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。

ByteBuffer.allocate(capability):第一种方式是分配JVM堆内存,属于GC管辖范围,由于需要拷贝所以速度相对较慢

ByteBuffer.allocteDirect(capability):第二种方式是分配OS本地内存,不属于GC管辖范围,由于不需要内存的拷贝,所以速度相对较快

但如果不断分配本地内存,堆内存很少使用,那么JVM就不需要执行GC,DirectByteBuffer对象就不会被回收,这时候堆内存充足,但本地内存可能已经使用光了,再次尝试分配本地内存就会出现OutOfMemoryError,那么程序就崩溃了。

一句话说:本地内存不足,但是堆内存充足的时候,就会出现这个问题

我们使用 -XX:MaxDirectMemorySize=5m 配置能使用的堆外物理内存为5M

-Xms20m -Xmx20m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m

然后我们申请一个6M的空间

// 只设置了5M的物理内存使用,但是却分配 6M的空间

ByteBuffer bb = ByteBuffer.allocateDirect(6 * 1024 * 1024);

这个时候,运行就会出现问题了

配置的maxDirectMemory:5.0MB

[GC (System.gc()) [PSYoungGen: 2030K->488K(2560K)] 2030K->796K(9728K), 0.0008326 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

[Full GC (System.gc()) [PSYoungGen: 488K->0K(2560K)] [ParOldGen: 308K->712K(7168K)] 796K->712K(9728K), [Metaspace: 3512K->3512K(1056768K)], 0.0052052 secs] [Times: user=0.09 sys=0.00, real=0.00 secs]

Exception in thread "main" java.lang.OutOfMemoryError: Direct buffer memory

at java.nio.Bits.reserveMemory(Bits.java:693)

at java.nio.DirectByteBuffer.(DirectByteBuffer.java:123)

at java.nio.ByteBuffer.allocateDirect(ByteBuffer.java:311)

at com.moxi.interview.study.oom.DIrectBufferMemoryDemo.main(DIrectBufferMemoryDemo.java:19)

unable to create new native thread

不能够创建更多的新的线程了,也就是说创建线程的上限达到了

在高并发场景的时候,会应用到

高并发请求服务器时,经常会出现如下异常java.lang.OutOfMemoryError:unable to create new native thread,准确说该native thread异常与对应的平台有关

导致原因:

应用创建了太多线程,一个应用进程创建多个线程,超过系统承载极限

服务器并不允许你的应用程序创建这么多线程,linux系统默认运行单个进程可以创建的线程为1024个,如果应用创建超过这个数量,就会报 java.lang.OutOfMemoryError:unable to create new native thread

解决方法:

想办法降低你应用程序创建线程的数量,分析应用是否真的需要创建这么多线程,如果不是,改代码将线程数降到最低

对于有的应用,确实需要创建很多线程,远超过linux系统默认1024个线程限制,可以通过修改linux服务器配置,扩大linux默认限制

/**

* 无法创建更多的线程

*/

public class UnableCreateNewThreadDemo {

public static void main(String[] args) {

for (int i = 0; ; i++) {

System.out.println("************** i = " + i);

new Thread(() -> {

try {

TimeUnit.SECONDS.sleep(Integer.MAX_VALUE);

} catch (InterruptedException e) {

e.printStackTrace();

}

}, String.valueOf(i)).start();

}

}

}

这个时候,就会出现下列的错误,线程数大概在 900多个

Exception in thread "main" java.lang.OutOfMemoryError: unable to cerate new native thread

如何查看线程数

ulimit -u

Metaspace

元空间内存不足,Matespace元空间应用的是本地内存

-XX:MetaspaceSize 的初始化大小为20M

元空间是什么

元空间就是我们的方法区,存放的是类模板,类信息,常量池等

Metaspace是方法区HotSpot中的实现,它与持久代最大的区别在于:Metaspace并不在虚拟内存中,而是使用本地内存,也即在java8中,class metadata(the virtual machines internal presentation of Java class),被存储在叫做Matespace的native memory

永久代(java8后背元空间Metaspace取代了)存放了以下信息:

虚拟机加载的类信息

常量池

静态变量

即时编译后的代码

模拟Metaspace空间溢出,我们不断生成类 往元空间里灌输,类占据的空间总会超过Metaspace指定的空间大小

代码

在模拟异常生成时候,因为初始化的元空间为20M,因此我们使用JVM参数调整元空间的大小,为了更好的效果

-XX:MetaspaceSize=8m -XX:MaxMetaspaceSize=8m

代码如下:

/**

* 元空间溢出

*

*/

public class MetaspaceOutOfMemoryDemo {

// 静态类

static class OOMTest {

}

public static void main(final String[] args) {

// 模拟计数多少次以后发生异常

int i =0;

try {

while (true) {

i++;

// 使用Spring的动态字节码技术

Enhancer enhancer = new Enhancer();

enhancer.setSuperclass(OOMTest.class);

enhancer.setUseCache(false);

enhancer.setCallback(new MethodInterceptor() {

@Override

public Object intercept(Object o, Method method, Object[] objects, MethodProxy methodProxy) throws Throwable {

return methodProxy.invokeSuper(o, args);

}

});

}

} catch (Exception e) {

System.out.println("发生异常的次数:" + i);

e.printStackTrace();

} finally {

}

}

}

会出现以下错误:

发生异常的次数: 201

java.lang.OutOfMemoryError:Metaspace

注意

在JDK1.7之前:永久代是方法区的实现,存放了运行时常量池、字符串常量池和静态变量等。

在JDK1.7:永久代是方法区的实现,将字符串常量池和静态变量等移出至堆内存。运行时常量池等剩下的还再永久代(方法区)

在JDK1.8及以后:永久代被元空间替代,相当于元空间实现方法区,此时字符串常量池和静态变量还在堆,运行时常量池还在方法区(元空间),元空间使用的是直接内存。

-XX:MetaspaceSize=N//设置Metaspace的初始(和最小大小) -XX:MaxMetaspaceSize=N//设置Metaspace的最大大小 与永久代很大的不同就是,如果不指定大小的话,随着更多类的创建,虚拟机会耗尽所有可用的系统内存。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

java from space to space_快速定位Java 内存OOM的问题相关推荐

  1. java 判断类型_如何快速入门Java编程学习(干货)

    一.初识Java 1.生活中的程序: 从起床到教室上课的过程 穿衣打扮>起床>洗漱>出宿舍>>吃早餐>到教室 按照特定的顺序去完成某一件事的过程我们叫做生活中的程序 ...

  2. java nio copy_使用NIO快速复制Java文件

    package com.test.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutpu ...

  3. java速学_5分钟快速入门Java,不看真的可惜了

    你好,世界! 源代码组织方式 Java程序由package+class组成,package对应目录的相对路径,class对应文件,如 关于class有如下几点规则: 文件的名字必须和class的名字一 ...

  4. Java入门教程[9天快速入门JAVA]

    第一章 Java概述 §1.1Java语言出现的背景.影响及应用前景 一.背景 最近一年多来,在Internet上出现的特别吸引人的事件就是Java语言和用 Java编写的浏览器HotJava. 19 ...

  5. 快速定位java系统的线上问题--转

    原文地址:http://m.blog.csdn.net/article/details?id=43376943 前言:我们的场景并没有像BAT等大型互联网公司里的系统那么复杂,但是基本上也有一定的规模 ...

  6. eclipse快速定位java对应的class

    当前设置值,只能定位class文件 设置eclipse External Tools Configurations... Program --> new New 创建viewclass.bat文 ...

  7. java虚拟机架构图,图解快速入门Java虚拟机JVM

    目录 一.JVM架构图 1.1.宏观jvm 1.2.JVM架构图 二.类装载器 2.1.类装载器 2.1.1.分类 加载器 存在位置 特点 BOOT(根加载器) Environment/jdk8/jr ...

  8. java headless_使用Chrome Headless 快速实现java版数据的抓取

    Java: cdp4j - Java library for CDP,使用这个类库实现. maven引入: io.webfolder cdp4j 1.1.0 官方例子: import io.webfo ...

  9. mat java heap space_Memory Analyzer Tool定位Java heap space内存泄漏

    java heap space是一个很蛋疼的问题,如果开发调试时遇到还好,如果是在项目上线后运行一段时间后,才抛出该异常,那真的很悲剧(那你得找代码中到底是哪里内存泄露了),这真是一个悲伤的故事. 1 ...

最新文章

  1. zoj4110 Strings in the Pocket(manacher)
  2. HDOJ 1082 模拟 水
  3. gearman mysql持久化_gearman + mysql方式实现持久化操作示例
  4. 《那些年啊,那些事——一个程序员的奋斗史》——35
  5. js 字符串、数值之间的转换
  6. 网页中加载flash的方法
  7. java用this-gt;,java基础之十四-&gt;常用类
  8. BoundsChecker使用说明(代码调试)
  9. 10KV变配电增容工程电力监控系统的设计与应用
  10. 教育行业 服务器虚拟化,教育行业桌面虚拟化方案
  11. USDT暴涨背后:溢价、套利和竞合
  12. 上网日志留存_中国移动5G上网日志留存系统招标:最高投标总限价10亿元
  13. phalapi做登录检测_欢迎使用PhalApi!
  14. python猜字游戏
  15. C专家编程 第1章 C:穿越时空的迷雾 1.4 KR C
  16. 苹果CMS怎么更换模板详细教程
  17. 中国区域地面气象要素驱动数据集(1979-2018)数据下载与处理
  18. 腾讯Java一面失利,四月凭借这份offer,直接进厂
  19. win10+Eclipse简单快速安装(以及中文汉化与安装插件)
  20. Appscan测试工具简介

热门文章

  1. 网易有道词典bug记录
  2. win7+linux双系统
  3. 科学的研究方法——笛卡尔
  4. AI 换脸术「Deepfakes」进化简史
  5. NOIP前的刷题记录
  6. 【CDOJ 1323】柱爷的下凡
  7. RSRP RSRQ RSSI SNR的含义和区别
  8. 56.com flash http://www.56.com/deux4_97177389.swf
  9. OpenJudge百炼习题解答(C++)--题4040:买书问题
  10. 【历史上的今天】11 月 16 日:RISC-V 掌门人出生;微软发布 Windows CE;电子管问世