原标题:运维:k8s pod erro exit code 137

该问题由于引用触发oom,进而因为kill 信号,致使pod 终端停止。

Issue

If a container is no longer running, use the following command to find the status of the container:

docker container ls -a

This article explains possible reasons for the following exit code:

"task: non-zero exit (137)"

With exit code 137, you might also notice a status of Shutdown or the following failed message:

Failed 42 hours ago Resolution

The "task: non-zero exit (137)" message is effectively the result of a kill -9 (128 + 9). This can be due to a couple possibilities (seen most often with Java applications):返回搜狐,查看更多

The container received a docker stop, and the application didn't gracefully handle SIGTERM (kill -15) — whenever a SIGTERM has been issued, the docker daemon waits 10 seconds then issue a SIGKILL (kill -9) to guarantee the shutdown. To test whether your containerized application correctly handles SIGTERM, simply issue a docker stop against the container ID and check to see whether you get the "task: non-zero exit (137)". This is not something to test in a production environment, as you can expect at least a brief interruption of service. Best practices would be to test in a development or test Docker environment.

The application hit an OOM (out of memory) condition. With regards to OOM condition handling, review the node's kernel logs to validate whether this occurred. This would require knowing which node the failed container was running on, or proceed with checking all nodes. Run something like this on your node(s) to help you identify whether you've had a container hit an OOM condition:journalctl -k | grep -i -e memory -e oom Another option would be to inspect the (failed) container:docker inspect Review the application's memory requirements and ensure that the container it's running in has sufficient memory. Conversely, set a limit on the container's memory to ensure that wherever it runs, it does not consume memory to the detriment of the node. If the application is Java-based, you may want to review the maximum memory configuration settings.References

docker run command line options

Specify hard limits on memory available to containers (-m, –memory)

责任编辑:

java exit code 137_运维:k8s pod erro exit code 137相关推荐

  1. Java对接ansible自动运维化平台

    Java对接ansible自动运维化平台实现文件采集分发 经过大量查阅,网上使用Java对接ansible自动运维化平台的示例代码几乎没有,为了方便自己后期巩固以及有需要的小伙伴,特以记录!!! 此次 ...

  2. java 线上运维_一次java应用线上运维实战

    背景:今天深圳项目出现负载狂飙的情况,由我负责主要的运维,简单记录运维的情况 一.首先使用top命令查看java进程对资源的使用情况. 通过%CPU.%MEM的参数信息可以看出当前进程疯狂占用CPU( ...

  3. Java,php,运维工程师转型大数据开发怎么样?你属于哪一类?

    一:java转型大数据 "2019年可能会是过去十年里最差的一年,但却是未来十年里最好的一年".市场发展的受限,不仅波及了各个行业的从业者,就连IT领域也受到了影响,很多IT人开始 ...

  4. 基于java web的设备运维报修管理系统

    SSH电力公司设备运维报修管理系统主要包括部门管理,用户管理,类型管理,设备管理,维修管理,记录管理等模块.采用集成框架Ssh(struts+spring+hibernate),语言java,数据库m ...

  5. 阿里云大学python_阿里云大学「学习路线」,一站式从入门到高手——Python、Java、前端、运维、数据库、云原生……...

    阿里云大学有哪些学习路线? 已上线(免费学习+自测考试): 即将上线: 迁移上云.大数据技术.人工智能.微服务.IoT.小程序-- 为什么要做学习路线? 大家知道,学习一门技术,都要经历从理论到实战, ...

  6. java spring boot 自动化运维笔记-rancher

    rancher @ centos 7 @ hyperv 在 win10 hyperv 上 安装 centos7 启动centos7 github ip地址 不做这一步, k3s安装命令 "c ...

  7. Serverless 时代下大规模微服务应用运维的最佳实践

    微服务架构的优点和痛点 Aliware 1 微服务架构的诞生背景 回到互联网早期时代,也就是web1.0时代,当时主要是一些门户网站,单体应用是当时的主流应用,研发团队相对较小,这时候的挑战在于技术的 ...

  8. 阿里巴巴超大规模 Kubernetes 基础设施运维体系

    作者:仔仁.墨封.光南 序言 ASI:Alibaba Serverless infrastructure,阿里巴巴针对云原生应用设计的统一基础设施.ASI 基于阿里云公共云容器服务 ACK之上,支撑集 ...

  9. 阿里云运维架构实践秘籍 ——乔帮主的云技术实践绝学:降云十八掌

    传统IT正在向DT变革.未来,云计算将成为互联网的基础设施.作为技术过来人,亲历了中国互联网时代的发展.云计算云时代的发展,以及技术人员眼中云计算所带来的技术变革. 云对技术架构的变革 物理机体系阶段 ...

  10. 构建高效的研发与自动化运维

    为什么IT运维需要自动化? 所谓IT运维管理的自动化是指通过将日常IT运维中大量的重复性工作,小到简单的日常检查.配置变更和软件安装,大到整个变更流程的组织调度,由过去的手工执行转为自动化操作,从而减 ...

最新文章

  1. QUARK的增强版C-QUARK问世,有效提升蛋白质结构从头预测精度
  2. 这个主板制作的是一样的吗?
  3. 4 关卡流 进阶_儿童桌游要不要鸡血的过关?关卡制儿童桌游介绍与方法论
  4. matlab 倒数第二个位置_Matlab中在数据分析的使用
  5. 根据先序和中序序列重建二叉树
  6. 信息学奥赛一本通(C++)在线评测系统——基础(一)C++语言——1079:计算分数加减表达式的值
  7. linux 释放进程res_linux内存查看及释放
  8. paip.gui控件tabs控件加载内容的原理以及easyui最佳实现
  9. 【SparkStreaming学习之二】 SparkStreaming算子操作
  10. 【MPPT光伏】基于MPPT的光伏并网系统的simulink仿真
  11. 老板突然出现,游戏飞速隐藏,开源神器在手,摸鱼不怕被抓包丨不会写代码也能用...
  12. quartus频率计 时钟设置_FPGA021 基于QuartusⅡ数字频率计的设计与仿真
  13. Extjs的grid总计实现
  14. 美学心得(第一百七十九集) 罗国正
  15. idea切换工作目录后无法重启问题记录
  16. Nebula Graph - 集群模式部署
  17. 为程序员讨回失去的午觉,我被投诉了,差点吃官司
  18. 时间复杂度的计算详解
  19. 令人肝肠寸断的100个签名
  20. ARM系统的寻址方式

热门文章

  1. gis与一般计算机应用系统有哪些异同,gis概论各章练习题..doc
  2. nginx静态图片路径映射
  3. 软件耦合的分类及解决方法
  4. 我在印尼工作的日子-基本环境
  5. 什么是银行的表内表外业务?
  6. collect2:error:ld returned 1 exit status解决方案
  7. Apache详解(一)Internet和HTTP协议
  8. pip install镜像安装
  9. office2016镜像安装详细教程
  10. 计算机鼠标老跳动,用win10系统,鼠标总是乱飞乱跳怎么回事,找到原因及解决方案了...