问题描述

前几天在帮同事排查生产一个线上偶发的线程池错误,逻辑很简单,线程池执行了一个带结果的异步任务。

但是最近有偶发的报错:

java.util.concurrent.RejectedExecutionException: Task java.util.concurrent.FutureTask@a5acd19 rejected from java.util.concurrent.ThreadPoolExecutor@30890a38\[Terminated, pool size = 0, active threads = 0, queued tasks = 0, completed tasks = 0\]

本文中的模拟代码已经问题都是在HotSpot java8 (1.8.0_221)版本下模拟&出现的

下面是模拟代码,通过Executors.newSingleThreadExecutor创建一个单线程的线程池,然后在调用方获取Future的结果

public class ThreadPoolTest {    public static void main(String[] args) {final ThreadPoolTest threadPoolTest = new ThreadPoolTest();for (int i = 0; i < 8; i++) {new Thread(new Runnable() {@Overridepublic void run() {while (true) {Future<String> future = threadPoolTest.submit();try {String s = future.get();} catch (InterruptedException e) {e.printStackTrace();} catch (ExecutionException e) {e.printStackTrace();} catch (Error e) {e.printStackTrace();}}}}).start();}        //子线程不停gc,模拟偶发的gcnew Thread(new Runnable() {@Overridepublic void run() {while (true) {System.gc();}}}).start();}    /*** 异步执行任务* @return*/public Future<String> submit() {//关键点,通过Executors.newSingleThreadExecutor创建一个单线程的线程池ExecutorService executorService = Executors.newSingleThreadExecutor();FutureTask<String> futureTask = new FutureTask(new Callable() {@Overridepublic Object call() throws Exception {Thread.sleep(50);return System.currentTimeMillis() + "";}});executorService.execute(futureTask);return futureTask;}}

分析&疑问

第一个思考的问题是:线程池为什么关闭了,代码中并没有手动关闭的地方。看一下Executors.newSingleThreadExecotor的源码实现:

public static ExecutorService newSingleThreadExecutor() {return new FinalizableDelegatedExecutorService(new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()));
}

这里创建的实际上是一个FinalizableDelegatedExecutorService,这个包装类重写了finalize函数,也就是说这个类会在被GC回收之前,先执行线程池的shutdown方法。

问题来了,GC只会回收不可达(unreachable)的对象,在submit函数的栈帧未执行完出栈之前,executorService应该是可达的才对。

对于此问题,先抛出结论:

当对象仍存在于作用域(stack frame)时,finalize也可能会被执行

oracle jdk文档中有一段关于finalize的介绍:

A reachable object is any object that can be accessed in any potential continuing computation from any live thread.

Optimizing transformations of a program can be designed that reduce the number of objects that are reachable to be less than those which would naively be considered reachable. For example, a Java compiler or code generator may choose to set a variable or parameter that will no longer be used to null to cause the storage for such an object to be potentially reclaimable sooner.

大概意思是:可达对象(reachable object)是可以从任何活动线程的任何潜在的持续访问中的任何对象;java编译器或代码生成器可能会对不再访问的对象提前置为null,使得对象可以被提前回收。

也就是说,在jvm的优化下,可能会出现对象不可达之后被提前置空并回收的情况

举个例子来验证一下(摘自:https://stackoverflow.com/questions/24376768/can-java-finalize-an-object-when-it-is-still-in-scope):

class A {@Override protected void finalize() {System.out.println(this + " was finalized!");}    public static void main(String[] args) throws InterruptedException {A a = new A();System.out.println("Created " + a);for (int i = 0; i < 1\_000\_000\_000; i++) {if (i % 1\_000_00 == 0)System.gc();}System.out.println("done.");}
}//打印结果Created A@1be6f5c3
A@1be6f5c3 was finalized!
//finalize方法输出
done.

从例子中可以看到,如果a在循环完成后已经不再使用了,则会出现先执行finalize的情况;虽然从对象作用域来说,方法没有执行完,栈帧并没有出栈,但是还是会被提前执行。

现在来增加一行代码,在最后一行打印对象a,让编译器/代码生成器认为后面有对象a的引用,

...System.out.println(a);//打印结果
Created A@1be6f5c3
done.
A@1be6f5c3

从结果上看,finalize方法都没有执行(因为main方法执行完成后进程直接结束了),更不会出现提前finalize的问题了。

基于上面的测试结果,再测试一种情况,在循环之前先将对象a置为null,并且在最后打印保持对象a的引用

A a = new A();
System.out.println("Created " + a);
a = null;
//手动置null
for (int i = 0; i < 1\_000\_000\_000; i++) {if (i % 1\_000_00 == 0)System.gc();
}
System.out.println("done.");
System.out.println(a);
//打印结果Created
A@1be6f5c3
A@1be6f5c3 was finalized!
done.null

从结果上看,手动置null的话也会导致对象被提前回收,虽然在最后还有引用,但此时引用的也是null了


现在再回到上面的线程池问题,根据上面介绍的机制,在分析没有引用之后,对象会被提前finalize

可在上述代码中,return之前明明是有引用的executorService.execute(futureTask),为什么也会提前finalize呢?

猜测可能是由于在execute方法中,会调用threadPoolExecutor,会创建并启动一个新线程,这时会发生一次主动的线程切换,导致在活动线程中对象不可达。

结合上面Oracle Jdk文档中的描述“可达对象(reachable object)是可以从任何活动线程的任何潜在的持续访问中的任何对象”,可以认为可能是因为一次显示的线程切换,对象被认为不可达了,导致线程池被提前finalize了

下面来验证一下猜想:

//入口函数
public class FinalizedTest {    public static void main(String [] args) {final FinalizedTest finalizedTest = new FinalizedTest();for (int i = 0; i < 8; i++) {new Thread(new Runnable() {@Overridepublic void run() {while (true) {TFutureTask future = finalizedTest.submit();}}}).start();}new Thread(new Runnable() {@Overridepublic void run() {while (true) {System.gc();}}}).start();}public TFutureTask submit(){TExecutorService TExecutorService = Executors.create();TExecutorService.execute();return null;}
}//Executors.java,模拟juc的Executors
public class Executors {/*** 模拟Executors.createSingleExecutor* @return*/public static TExecutorService create(){return new FinalizableDelegatedTExecutorService(new TThreadPoolExecutor());}static class FinalizableDelegatedTExecutorService extends DelegatedTExecutorService {FinalizableDelegatedTExecutorService(TExecutorService executor) {super(executor);}/*** 析构函数中执行shutdown,修改线程池状态* @throws Throwable*/@Overrideprotected void finalize() throws Throwable {super.shutdown();}}static class DelegatedTExecutorService extends TExecutorService {protected TExecutorService e;public DelegatedTExecutorService(TExecutorService executor) {this.e = executor;}@Overridepublic void execute() {e.execute();}@Overridepublic void shutdown() {e.shutdown();}}
}//TThreadPoolExecutor.java,模拟juc的ThreadPoolExecutorpublic class TThreadPoolExecutor extends TExecutorService {/*** 线程池状态,false:未关闭,true已关闭*/private AtomicBoolean ctl = new AtomicBoolean();@Overridepublic void execute() {//启动一个新线程,模拟ThreadPoolExecutor.executenew Thread(new Runnable() {@Overridepublic void run() {}}).start();//模拟ThreadPoolExecutor,启动新建线程后,循环检查线程池状态,验证是否会在finalize中shutdown//如果线程池被提前shutdown,则抛出异常for (int i = 0; i < 1\_000\_000; i++) {if(ctl.get()){throw new RuntimeException("reject!!!\["+ctl.get()+"\]");}}}@Overridepublic void shutdown() {ctl.compareAndSet(false,true);}
}

执行若干时间后报错:

Exception in thread "Thread-1" java.lang.RuntimeException: reject!!!\[true\]

从错误上来看,“线程池”同样被提前shutdown了,那么一定是由于新建线程导致的吗?

下面将新建线程修改为Thread.sleep测试一下:

//TThreadPoolExecutor.java,修改后的execute方法
public void execute() {try {//显式的sleep 1 ns,主动切换线程TimeUnit.NANOSECONDS.sleep(1);} catch (InterruptedException e) {e.printStackTrace();}//模拟ThreadPoolExecutor,启动新建线程后,循环检查线程池状态,验证是否会在finalize中shutdown//如果线程池被提前shutdown,则抛出异常for (int i = 0; i < 1\_000\_000; i++) {if(ctl.get()){throw new RuntimeException("reject!!!\["+ctl.get()+"\]");}}
}

执行结果一样是报错

Exception in thread "Thread-3" java.lang.RuntimeException: reject!!!\[true\]

由此可得,如果在执行的过程中,发生一次显式的线程切换,则会让编译器/代码生成器认为外层包装对象不可达

总结

虽然GC只会回收不可达GC ROOT的对象,但是在编译器(没有明确指出,也可能是JIT)/代码生成器的优化下,可能会出现对象提前置null,或者线程切换导致的“提前对象不可达”的情况。

所以如果想在finalize方法里做些事情的话,一定在最后显示的引用一下对象(toString/hashcode都可以),保持对象的可达性(reachable)

上面关于线程切换导致的对象不可达,没有官方文献的支持,只是个人一个测试结果,如有问题欢迎指出

综上所述,这种回收机制并不是JDK的bug,而算是一个优化策略,提前回收而已;但Executors.newSingleThreadExecutor的实现里通过finalize来自动关闭线程池的做法是有Bug的,在经过优化后可能会导致线程池的提前shutdown,从而导致异常。

线程池的这个问题,在JDK的论坛里也是一个公开但未解决状态的问题https://bugs.openjdk.java.net/browse/JDK-8145304。

不过在JDK11下,该问题已经被修复:

JUC  Executors.FinalizableDelegatedExecutorServicepublic void execute(Runnable command) {    try {e.execute(command);} finally { reachabilityFence(this); }
}

作者:空无

https://segmentfault.com/a/1190000021109130

一个线程池 bug 引发的 GC 思考!相关推荐

  1. 一个JDK线程池BUG引发的GC机制思考

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 作者:空无 来源:https://urlify.cn/63QrYv ...

  2. 一个 Java 线程池bug引发的 GC 机制思考

    本文作者:空无 原文链接:https://segmentfault.com/a/1190000021109130 问题描述 前几天,在帮同事排查一个线上偶发的线程池错误 逻辑很简单,线程池执行了一个带 ...

  3. 一个有趣的问题 : 如何设计一个线程池

    理解Java并发工具包线程池的设计 深度解读 java 线程池设计思想及源码实现 分布式锁unlock 问题产生原因分析: Step 1 :线程A先上同一个锁(Key)(20秒), 然后执行耗时业务, ...

  4. 【重难点】【JUC 05】线程池核心设计与实现、线程池使用了什么设计模式、要你设计的话,如何实现一个线程池

    [重难点][JUC 05]线程池核心设计与实现.线程池使用了什么设计模式.要你设计的话,如何实现一个线程池 文章目录 [重难点][JUC 05]线程池核心设计与实现.线程池使用了什么设计模式.要你设计 ...

  5. java 手编线程池_死磕 java线程系列之自己动手写一个线程池

    欢迎关注我的公众号"彤哥读源码",查看更多源码系列文章, 与彤哥一起畅游源码的海洋. (手机横屏看源码更方便) 问题 (1)自己动手写一个线程池需要考虑哪些因素? (2)自己动手写 ...

  6. 随笔之如何实现一个线程池

    为什么80%的码农都做不了架构师?>>>    一 缘由:     最近因工作问题,需要实现一个简单的线程池,满足一下要求, 可伸缩,即一旦发现线程不够用,则可以动态增加线程.(至于 ...

  7. 一个线程池中的线程异常了,那么线程池会怎么处理这个线程?

    一个线程池中的线程异常了,那么线程池会怎么处理这个线程? 参考文章: (1)一个线程池中的线程异常了,那么线程池会怎么处理这个线程? (2)https://www.cnblogs.com/fangua ...

  8. 工作中如何使用线程池的?自己如何定义一个线程池?

    工作中如何使用线程池的?自己如何定义一个线程池? import java.util.concurrent.*;public class MyThreadPoolDemo {public static ...

  9. 设置iis网页服务器cpu占比,为什么iis的一个线程池占了100%cpu

    为什么iis的一个线程池占了快100%cpu, 这个站点是跑asp.net web api的,大多是数据库的操作. 当回收这个线程池后几分钟,cpu使用率就降下来了. 可是隔一天半天的再去服务器看,c ...

最新文章

  1. LAMP 关键数据集锦技术选项参考
  2. IOS纯手写代码支持旋屏
  3. 数字电路技术可能出现的简答题_技术货:模拟电路和数字电路PCB设计的区别
  4. php layui实现添加input,Layui实现input输入和选择的方法
  5. android 数据库 字节数组,Android上的GreenDAO:字节数组作为主键/构建包含字节数组属性Where子句的查询...
  6. Mysql中行转列和列转行
  7. 天锋w2019_什么样的商务手机才显得高端?这款天锋W2019可能适合你
  8. 2016年系统集成项目管理工程师最新考试说明
  9. 从摩托罗拉、诺基亚再到航空领域应用,这款开源数据库的成功如何成就天才程序员?...
  10. 玩转Python大数据分析 《Python for Data Analysis》的读书笔记-第08页
  11. jvisualvm 工具使用
  12. 新个人所得税计算公式
  13. 谷歌退出将会给中国互联网带来的10个变化
  14. 网站制作入门指导教程
  15. 网易云 音乐 url 引入步骤
  16. 如何更新服务器系统教程,服务器操作系统如何更新
  17. 数据库发展史2--数据仓库
  18. gdip - hatchBrush图案表
  19. 官网下载Git太慢的解决方法
  20. 大规模 C++ 编译性能优化系统 OMAX 介绍

热门文章

  1. 4.从单应矩阵中分离得到内参和外参(需要拍摄n=3张标定图片)
  2. ElementUI的组件拆解之Tooltip
  3. ReactNative用指定的设备/模拟器运行项目
  4. Windows远程Linux/Ubuntu桌面
  5. Ubuntu 16.04下减小/释放/清理VirtualBox虚拟硬盘文件的大小
  6. ffmpeg API 笔记:使用libavcodec/libavformat/libswscale ffmpeg例子
  7. 成功者网上创业的精华经验
  8. A Data Access Layer to persist business objects using attributes and reflection - Part II [无常译]...
  9. 【Python】监控视频中运动目标检测的代码实现及效果展示
  10. nginx源码分析—内存池结构ngx_pool_t及内存管理