一、业务背景#

二、服务架构#

服务使用线程池对请求进行业务处理,corePoolSize=32,maximumPoolSize=128。

三、问题描述#

服务部署到测试环境,将线上流量通过tcp-copy打到服务上后,测试反馈出现丢失消息的情况。查看服务日志,发现了

service overload discard msg

即业务线程处理缓慢造成消息堆积队列超限,后续消息被ExecutorService的Reject策略主动丢弃。

查询服务请求QPS为500/s,不算高。理论上业务处理流程没有很重很慢的操作,监控外部依赖接口的响应速度也在ms级别,所以很奇怪为什么服务的性能瓶颈这么低。

四、问题查解#

1、系统监控####

查询系统监控指标,包括CPU使用率(18%)、网卡流量、内存使用率和IO时间等,未发现异常。

查询jvm 内存使用及GC情况,未发现异常。

2、jvm 线程堆栈####

jstack pid >pid.txt打印服务进程线程栈信息:

线程堆栈信息

发现异常:

128个业务线程中有126个线程状态为java.lang.Thread.State: WAITING (on object monitor),只有2个线程状态为正常RUNNABLE。

WAITING状态线程数

RUNNABLE状态的两个业务线程

显然大量业务线程阻塞等待在异常位置:

等待处对应的代码位置

这段代码使用了java8提供的并行流parallelStream来将消息分发给下面的listeners集合进行处理。

在开发中,我们常常通过以下方法,实现并行流执行并行任务:

myList.parallelStream.map(obj -> longRunningOperation())

但是这存在一个严重的问题:在 JVM 的后台,使用通用的 fork/join 池来完成上述功能,该池是所有并行流共享的。默认情况,fork/join 池会为每个处理器分配一个线程。假设你有一台16核的机器,这样你就只能创建16个线程。对 CPU 密集型的任务来说,这样是有意义的,因为你的机器确实只能执行16个线程。但是真实情况下,不是所有的任务都是 CPU 密集型的,这就会导致线程因IO等待浪费CPU资源,降低系统处理性能。

而测试机的CPU核数确实是2核,这就解释了上面128个业务线程中只有2个线程处于RUNNABLE状态,而其他126个业务线程都在等待的原因。->因为业务线程内部使用了parallelStream处理业务数据,所以所有业务线程内部都需要使用jvm for/join线程进行业务处理,因为只有jvm fork/join线程,所以同时只能处理两个业务线程的执行逻辑,其他业务线程排队等待执行。

五、解决方法#

1、代码修改####

将并行流parallelStream()改为stream()。

修改后的代码

2、回归验证####

重新部署测试服务器后,发现已无消息丢失报错。

观察机器负载,CPU使用率上升到40%,说明CPU资源得到了更充分的利用。

jvm YongGC频率加快到10s一次,每次GC时间为10ms,可以接受。

jstack pid > pid.txt观察现在的线程栈:

RUNNABLE状态的业务线程数

剩余WAITING状态线程

1)同时有16个业务线程处于执行状态,系统并发性大幅提升;

2)剩余处于TIMED_WAITING状态的业务线程数也降为44个,栈信息显示其在等待从线程池任务队列中取出下一个任务执行,线程池任务队列无堆积。

至此,问题处理完毕。请大家注意Java8中并行流parallelStream的使用避免才坑。

java并行流 阻塞主线程_记一次使用Java8并行流导致的服务瓶颈问题排查相关推荐

  1. java并行流 阻塞主线程_多线程入门案例与java8的并行流

    java8 实例请移步https://www.cnblogs.com/ngLee/p/14021859.html 进程与线程 进程是所有线程的集合,每一个线程是进程中的一条执行路径. 多线程的创建方式 ...

  2. 模态对话框阻塞主线程的话不影响其他线程操作主线程控件(不阻塞)

    Task.Factory.StartNew(() => {Thread.Sleep(5000);this.Invoke(new Action(() => {this.button7.Tex ...

  3. 4.5.2.5_主线程_墨镜滤镜

    4.5.2.5_主线程_墨镜滤镜 <!DOCTYPE html> <html><head><meta charset="UTF-8"> ...

  4. 【Java并发编程】主线程等待子线程的多种方法

    文章目录 1.Thread sleep() 2.Thread join() 3.synchronized 等待唤醒机制 4.ExecutorService isTerminated() + while ...

  5. [Java][Android] 多线程同步-主线程等待全部子线程完毕案例

    有时候我们会遇到这种问题:做一个大的事情能够被分解为做一系列相似的小的事情,而小的事情无非就是參数上有可能不同样而已! 此时,假设不使用线程,我们势必会浪费许多的时间来完毕整个大的事情.而使用线程的话 ...

  6. python如何强制结束主线程_强制结束线程

    场景: 如果某个线程持续阻塞,无法退出,从而导致整个程序无法结束,此时就需要强制结束线程 思路:由于程序阻塞,比如卡在代码中的某一行后,一直无法向下执行,此时,无法通过常规方式结束线程 方法1: 采用 ...

  7. java中子线程与主线程通信_Android笔记(三十二) Android中线程之间的通信(四)主线程给子线程发送消息...

    之前的例子都是我们在子线程(WorkerThread)当中处理并发送消息,然后在主线程(UI线程)中获取消息并修改UI,那么可以不可以在由主线程发送消息,子线程接收呢?我们按照之前的思路写一下代码: ...

  8. java的main是主线程吗_main函数是主线程吗

    1.线程的概念: 线程是程序最基本的运行单位,而进程不能运行,所以能运行的,是进程中的线程. 2.线程是如何创建起来的: 进程仅仅是一个容器,包含了线程运行中所需要的数据结构等信息.一个进程创建时,操 ...

  9. android判断主线程_惊天秘密!从Thread开始,揭露Android线程通讯的诡计和主线程的阴谋...

    背景介绍 我们在Android开发过程中,几乎都离不开线程.但是你对线程的了解有多少呢?它完美运行的背后,究竟隐藏了多少不为人知的秘密呢?线程间互通暗语,传递信息究竟是如何做到的呢?Looper.Ha ...

最新文章

  1. SSH协议、HTTPS中SSL协议的完整交互过程
  2. java中final class的一点思考
  3. Git related
  4. 斯坦福大学机器学习第六课“逻辑回归(Logistic Regression)”
  5. Python中有用的字符串方法
  6. STM32开发 -- UTC、UNIX时间戳、北京时间之间的转换
  7. 实际的Reactor操作–检索Cloud Foundry应用程序的详细信息
  8. Mr.J--JS学习(闭包私有化)
  9. 世界首席WP(文字处理)布局绘制砖家横空出世
  10. 基于Java毕业设计医院药品管理系统源码+系统+mysql+lw文档+部署软件
  11. 【UE4学习】01——UE4下载与安装
  12. android10项目编译出错,android studio编译项目出错
  13. win10输入法突然变繁体解决办法
  14. 条件概率和全概率公式
  15. rhel6 中安装使用finger命令
  16. “第一股”争夺战:每日优鲜、叮咚买菜及美菜网谁能杀出重围?
  17. 华为荣耀首款双模 5G 手机来了!
  18. 一文搞懂0.1UF和10UF电容并联使用技巧
  19. python中的pymysql模块
  20. 了解Maxicode二维码

热门文章

  1. uni-app自定义组件
  2. RSS阅读器简单介绍
  3. Bps,bps,pps 等的计算
  4. android手机互联是什么软件,车机互联app哪个好_车联网和手机互联哪个好_车机互联软件排行...
  5. cyclone v QSPI烧写问题(not able to map flash id)
  6. 【Ansible自动化运维工具】Ansible变量之lookup生成变量方法
  7. debian10安装docker
  8. 【转】Andorid-APP 安全测试
  9. java能用绝对值吗_Java中绝对值函数的介绍与其妙用
  10. UserData使用总结