参考文献:
docker run hangs问题排查记录
https://www.cnblogs.com/edenlong/p/10972876.html
阿里巴巴 Kubernetes 集群问题排查思路和方法
https://www.infoq.cn/article/t_ZQeWjJLGWGT8BmmiU4

1.首先确认docker version一致

2.查看/var/log/message日志报错如下

The maximum number of pending replies per connection has been reached

3.排查过程

网上搜了下,说是系统为了防止程序占用过多系统资源导致拒绝服务而做的限制。看看/etc/dbus-1/session.conf文件属于哪个包,包含哪些文件
rpm -qf /etc/dbus-1/session.conf
rpm -ql dbus-1.10.24-12.el7.x86_64

/usr/share/dbus-1/session.conf文件末尾有个max_replies_per_connection参数和报错类似,默认是50000

我这通过重启dbus解决问题
systemctl restart dbus

最终并没有查到具体哪个参数导致的,不过确实有关联,下次复现这个问题再继续跟踪下

附:使用strace追踪进程调用链(可能用到)

strace docker run --rm image:tag

故障:到下面卡住了
clone(child_stack=0x7ff631ffafb0, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0x7ff631ffb9d0, tls=0x7ff631ffb700, child_tidptr=0x7ff631ffb9d0) = 25759
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
futex(0x55c38622c0a8, FUTEX_WAIT, 0, NULL) = 0

正常情况
clone(child_stack=0x7fa86cddffb0, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0x7fa86cde09d0, tls=0x7fa86cde0700, child_tidptr=0x7fa86cde09d0) = 15449
rt_sigprocmask(SIG_S) = 40
) = 4
write(2, “\33[K”, 3) = 3
) = 1
write(2, "8c5a7da1afbc: “, 148c5a7da1afbc: ) = 14
ioctl(1, TIOCGWINSZ, {ws_row=32, ws_col=138, ws_xpixel=0, ws_ypixel=0}) = 0
) = 18Pulling fs layer \r”, 18Pulling fs layer
write(2, “\33[1B”, 4) = 4


+++ exited with 0 +++

busctl tree
可以输出所有 bus 上对外暴露的接口

生产docker run 卡住没反应故障排查思路相关推荐

  1. 资源丨MySQL故障排查思路方法PPT视频24问答

    昨晚,墨天轮邀请到MySQL技术顾问崔虎龙做了题为<一小时掌握MySQL故障排查思路方法>的直播分享,引起了大家的广泛关注,直播后很多小伙伴来找小编询问PPT.思维导图.视频等,在这里小编 ...

  2. K8S集群中Pod与Pod之间网络故障排查思路

    K8S集群中Pod与Pod之间网络故障排查思路 文章目录 K8S集群中Pod与Pod之间网络故障排查思路 1.Pod与Pod之间通信故障 2.Pod与Pod之间网络通信故障排查思路 1.Pod与Pod ...

  3. K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路

    K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路 文章目录 K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路 1.Node节点资源不足可能会产生的故障 2.Node节点 ...

  4. 51CTO学习笔记--Linux运维故障排查思路与系统调优技巧视频课程(高俊峰)

    51CTO学习笔记--Linux运维故障排查思路与系统调优技巧视频课程 第一课 Linux运维经验分享与思路 1.一般把主机名,写到hosts下    127.0.0.1    hostname,因为 ...

  5. IT故障排查思路和方法交流

    1.故障处理原则 首要原则: 生产环境优先恢复业务(比如重启服务.修改负载均衡指向.恢复原有程序包等):保留现场以备查找故障原因 a.遇到问题不要慌:理清思路: b.首先要自行排查,不要遇到问题就甩到 ...

  6. 电脑连不上网故障排查思路

    面试经常被问到的一个问题,然后百度搜索整理出了三种回答思路: 网络故障排查 1.检查硬件,网线两端有没有插好,路由器是否有问题: 试一下ping路由器的IP地址: 使用拨号上网:将宽带网线从路由器中拔 ...

  7. mysql故障排查思路_Mysql高负载排查思路

    发现问题 top命令 查看服务器负载,发现 mysql竟然百分之两百的cpu,引起Mysql 负载这么高的原因,估计是索引问题和某些变态SQL语句. 排查思路 1. 确定高负载的类型,top命令看负载 ...

  8. 直播平台搭建后,直播网站打开慢的故障排查思路

    当直播网站打开速度慢时,用户体验将会受到不良影响,如果直播平台搭建者访问自家网站时发现,访问速度确实很慢,就需要排查网站慢的原因,排查思路大体如下: 1.检查搭建直播平台的服务器是否异常 检查服务器的 ...

  9. flink写入clickhouse遇到210错误故障排查思路

    java写的flink代码出现210报错,具体报错如下: Exception in thread "main" java.util.concurrent.ExecutionExce ...

最新文章

  1. 瞭望丨光子芯片能否让中国“换道超车”
  2. 解决非controller使用@Autowired注解注入报错为java.lang.NullPointerException问题
  3. TDI Filter 过滤驱动
  4. Golang gorouting 并发控制 sync.WaitGroup 介绍与使用
  5. ASP.NET-FineUI开发实践-9(四)
  6. 关于Swift中Struct,Class和Enum的哪些事儿
  7. “暧昧”的吉本,“疗伤”的芭娜娜
  8. 织梦DedeCMS实现 三级栏目_二级栏目_一级栏目_网站名称 的效果代码
  9. lambda不是python的保留字_python-nonlocal关键字的使用,lambda表达式(学习到function到变...
  10. c++引用另一个类的方法_利用CVE20191132:Windows内核中的另一个NULL指针取消引用...
  11. 常用代码块:java使用系统浏览器打开url
  12. Git — 解决“requested upstream branch ‘origin/master‘ does not exist“
  13. 计算不可压缩流体- NS方程求解算法
  14. C语言——超市商品管理系统
  15. 编译udf小软件(附视频教程)
  16. 微信与企业微信消息如何互通?
  17. Android开发酒店预定预约管理系统
  18. JSTL自定义标签(三)
  19. 嵌入式C语言学习笔记附图
  20. vscode 使用ES6调试js

热门文章

  1. JAVA生成热点图,JAVA 后端生成热力图图片返回
  2. 搜狗输入法怎样使用自定义短语
  3. Adobe Creative Suite 3 下载(包括MAC版) 和 收集的一些资料
  4. 娱乐_3D相册(HTML)_七夕
  5. idea ctrl+alt+鼠标左键和ctrl+鼠标左键的作用和区别
  6. 高并发如何处理,解决方案
  7. 第七章 本源时空(补充)
  8. HTML旅游网站设计与实现——东江湖旅游网站6个网页HTML+CSS+JavaScript
  9. 01背包问题深度理解
  10. Mac(Big Sur系统)安装tunnelblick(vpn)步骤