1、为什么需要容器探针

只要将pod调度到某个节点,Kubelet将运行pod的容器,如果该pod的容器有一个或所有的都终止运行(容器的主进程崩溃),Kubelet将重新启动容器,那么即使应用程序本身没有做任何特殊的事,在Kubemetes中运行也能自动获得自我修复的能力。

自动重启容器以保证应用程序的正常运行,这是使用Kubernetes的优势,不过在某些情况下,即使进程没有崩溃,有时应用程序运行也会出错。有时情况下Kubernetes只是检查Pod容器是否正常运行,而容器正常运行并不一定代表应用健康,在以下两种情况下Kubernetes将不会重启容器:

  • 1.访问Web服务器时显示500内部错误

    该报错可能是系统超载,也可能是资源死锁,不过此时httpd进程依旧运行,重启容器可能是最直接有效的办法。

  • 2.具有内存泄漏的Java应用程序将开始引发OutOfMemoryErrors,此时JVM进程会一直运行,Kubernetes也不会重启容器,但此时应用被称为是异常的。

此时可以考虑从外部检查应用程序的运行状况:

  • Kubemetes可以通过存活探针(liveness probe)检查容器是否还在运行。

  • 通过就绪探针(readiness probe)保证只有准备好了请求的Pod才能接收客户端请求。

2、存活探针

Kubemetes可以通过存活探针(liveness probe)检查容器是否还在运行。可以为pod中的每个容器单独指定重复探针。如果检测失败,Kubemetes将定期执行探针并重新启动容器。

Kubernetes支持三种方式来执行探针:

  • exec:在容器中执行一个命令,如果命令退出码返回0则表示探测成功,否则表示失败。

  • httpGet:对指定的容器IP,端口和路径执行一个HTTP Get请求,如果返回的状态码在[200,400)之间则表示探测成功,否则表示失败。

  • tcpSocket:对指定的容错IP和端口执行一个TCP检查,如果端口是开放的则表示探测成功,否则表示失败。

3、exec探针

exec类型的探针通过在目标容器中执行由用户自定义的命令来判断容器的监控状态,若命令状态返回变量0则表示“成功”通过检测,其他值则变为“失败”状态。

3.1创建liveness-exec.yaml

 apiVersion: v1kind: Podmetadata:labels:test: liveness-execname: liveness-execspec:restartPolicy: OnFailurecontainers:-name: liveness-execimage: busyboxargs:-/bin/sh--c-touch/tmp/healthy; sleep15; rm-rf/tmp/healthy; sleep600livenessProbe:exec:command: ["test","-e","/tmp/healthy"]initialDelaySeconds: 5   #探测延时时长,第一次探测前等待5秒,默认为0periodSeconds: 5         #每5秒执行一次liveness探测,默认值10秒,最小1秒 timeoutSeconds: 2        #超长时长,默认为1s,最小值也为1sfailureThreshold: 3      #处于成功状态时,探测操作至少连续多少次的失败才被视为检测不通过,默认为3,最小为1

3.2查看Pod

 [root@yygh-de huqi]# kubectl apply -f liveness-exec.yaml pod/liveness-exec created[root@yygh-de huqi]# kubectl get po -o wideNAME           READY   STATUS             RESTARTS   AGE   IP       NODE     NOMINATED NODE   READINESS GATESliveness-exec   0/1     ContainerCreating   0        9s   <none>   yygh-te   <none>           <none>[root@yygh-de huqi]# kubectl describe po liveness-exec

3.3pod运行正常,10秒内文件/tmp/healthy还存在,probe检测正常。第15秒,probe再次检测,由于文件被删,检测失败,此后容器会进行多次重启操作

 [root@yygh-de huqi]# kubectl get po -o wideNAME           READY   STATUS             RESTARTS   AGE   IP             NODE     NOMINATED NODE   READINESS GATESliveness-exec   0/1     CrashLoopBackOff   5        7m3s   10.244.66.90   yygh-te   <none>           <none>

4、HTTP探针

基于HTTP的探测(HTTPGetAction)向目标容器发起一个HTTP请求,根据其相应码进行结果判定,响应码如2xx或3xx时表示检测通过。

4.1创建liveness-http.yaml

 [root@yygh-de huqi]# vim liveness-http.yaml apiVersion : v1kind: Podmetadata:labels:test: livenessname: liveness-httpspec:containers:-name: liveness-httpimage: nginxports:-name: httpcontainerPort: 80lifecycle:postStart:exec:command: ["/bin/sh","-c","echo liveness-http test > /usr/share/nginx/html/health"]livenessProbe:httpGet:path: /healthport: httpscheme: HTTP

4.2查看Pod

 [root@yygh-de huqi]# kubectl apply -f liveness-http.yaml pod/liveness-http created[root@yygh-de huqi]# kubectl get po -o wideNAME           READY   STATUS   RESTARTS   AGE     IP             NODE     NOMINATED NODE   READINESS GATESliveness-http   1/1     Running   0        12s     10.244.66.91   yygh-te   <none>           <none>[root@yygh-de huqi]# curl 10.244.66.91/healthliveness-http test

4.3删除测试页面health

 [root@yygh-de huqi]# kubectl exec -it liveness-http rm /usr/share/nginx/html/health[root@yygh-de huqi]# kubectl get pod -o wideNAME           READY   STATUS   RESTARTS   AGE     IP             NODE     NOMINATED NODE   READINESS GATESliveness-http   1/1     Running   1        4m28s   10.244.66.91   yygh-te   <none>           <none>[root@yygh-de huqi]# kubectl describe pod liveness-http Events:Type     Reason     Age                 From               Message----    ------    ----                ----              -------Normal   Scheduled 5m11s               default-scheduler Successfully assigned default/liveness-http to yygh-teNormal   Pulling   12s (x3 over 5m10s) kubelet, yygh-te   Pulling image "nginx"Warning Unhealthy 12s (x6 over 102s)   kubelet, yygh-te   Liveness probe failed: HTTP probe failed with statuscode: 404Normal   Killing   12s (x2 over 82s)   kubelet, yygh-te   Container liveness-http failed liveness probe, will be restartedNormal   Pulled     8s (x3 over 5m6s)   kubelet, yygh-te   Successfully pulled image "nginx"Normal   Created   8s (x3 over 5m6s)   kubelet, yygh-te   Created container liveness-httpNormal   Started   7s (x3 over 5m6s)   kubelet, yygh-te   Started container liveness-http[root@yygh-de huqi]# curl 10.244.66.91/healthliveness-http test# 探测失败,返回码404,重启容器。

5、TCP探针

基于TCP的存活性探测(TCPSocketAction)用于向容器的特定端口发起TCP请求并尝试建立连接,连接成功即为通过检测。

5.1 创建liveness-tcp.yaml

 [root@yygh-de huqi]# vim liveness-tcp.yamlapiVersion: v1kind: Podmetadata:labels:test: livenessname: liveness-tcpspec:containers:-name: liveness-tcpimage: nginxports:-name: httpcontainerPort: 80livenessProbe:tcpSocket:port: http

5.2查看pod

 [root@yygh-de huqi]# kubectl apply -f liveness-tcp.yaml pod/liveness-tcp created[root@yygh-de huqi]# kubectl get pod -o wideNAME           READY   STATUS   RESTARTS   AGE   IP             NODE     NOMINATED NODE   READINESS GATESliveness-tcp    1/1     Running   0        15s   10.244.66.92   yygh-te   <none>           <none>[root@yygh-de huqi]# kubectl get pod -o wideNAME           READY   STATUS   RESTARTS   AGE   IP             NODE     NOMINATED NODE   READINESS GATESliveness-tcp   1/1     Running   0        51s   10.244.66.92   yygh-te   <none>           <none>[root@yygh-de huqi]# curl 10.244.66.92:80

5.3修改默认端口

 [root@yygh-de huqi]# kubectl exec -it liveness-tcp -- sed -i 's/^ *listen       80/   listen       81/g' /etc/nginx/conf.d/default.conf[root@yygh-de huqi]# kubectl exec -it liveness-tcp -- nginx -s reload2020/06/17 08:54:27 [notice] 34#34: signal process started[root@yygh-de huqi]# curl 10.244.66.92:80curl: (7) Failed connect to 10.244.66.92:80; 拒绝连接[root@yygh-de huqi]# curl 10.244.66.92:81# 80是nginx的默认端口,开始发起TCP连接的端口也是80,默认端口改成81后连接报错,容器重启。

6、ReadinessProbe

6.1概念

用于容器的自定义准备状态检查。如果ReadinessProbe检查失败,Kubernetes会将该Pod从服务代理的分发后端去除,不再分发请求给该Pod。

6.2readinessprobe使用场景

Pod对象启动后,容器应用通常需要一段时间才能完成其初始化过程,例如加载配置或数据,甚至有些程序需要运行某类的预热过程,若在此阶段完成之前接入客户端的请求,势必会因为等待太久而影响用户体验,这时就需要就绪探针。   如果没有将就绪探针添加到pod中,它们几乎会立即成为服务端点。如果应用程序需要很长时间才能开始监听传入连接,则在服务启动但尚未准备好接收传入连接时,客户端请求将被转发到该pod。因此,客户端会看到"连接被拒绝"类型的错误。

6.3机制

与存活探针机制相同,就绪探针也支持Exec、HTTP GET和TCP Socket三种探测方式,且各自的定义机制相同,将容器定义中的livenessProbe字段名替换为readinessProbe即可定义出就绪探测的配置,这里不再赘述。

6.4创建

 [root@yygh-de huqi]# vim readiness-exec.yamlapiVersion: apps/v1kind: Deploymentmetadata:name: nginxspec:replicas: 3selector:matchLabels:app: nginxtemplate:metadata:labels:app: nginxspec:containers:-image: nginx:latestname: container-0resources:limits:cpu: 500mmemory: 1024Mirequests:cpu: 500mmemory: 1024MireadinessProbe:           # readinessProbehttpGet:                # HTTP GET定义path: /readport: 80imagePullSecrets:-name: imagepull-secret# Readiness Probe的配置与存活探针(livness probe)一样,都是在 Pod Template 的 containers 里面,如下所示,这个Readiness Probe向Pod发送HTTP请求,当Probe收到2xx或3xx返回时,说明Pod已经就绪。

6.5Readiness Probe高级配置(创建时默认设置,也可以手动配置)

 readinessProbe:      # Readiness Probeexec:              # 定义 ls /readiness/ready 命令command:-ls-/readiness/readyinitialDelaySeconds: 10   # 容器启动后多久开始探测timeoutSeconds: 2         # 表示容器必须在2s内做出相应反馈给probe,否则视为探测失败periodSeconds: 30         # 探测周期,每30s探测一次successThreshold: 1       # 连续探测1次成功表示成功failureThreshold: 3       # 连续探测3次失败表示失败

7、ReadinessProbe与livenessprobe区别

  • 如果容器中的进程能够在遇到问题或不健康的情况下自行崩溃,则不一定需要存活探针; kubelet 将根据Pod的restartPolicy自动执行正确的操作。

  • 如果您希望容器在探测失败时被杀死并重新启动,那么请指定一个存活探针,并指定restartPolicy为Always或OnFailure。

  • 如果要仅在探测成功时才开始向 Pod 发送流量,请指定就绪探针。在这种情况下,就绪探针可能与存活探针相同,但是spec中的就绪探针的存在意味着Pod将在没有接收到任何流量的情况下启动,并且只有在探针探测成功后才开始接收流量。

  • 两种探测的配置方法完全一样,支持的配置参数也一样,既可单独探测又可结合者一起执行。

如果文章有任何错误欢迎不吝赐教,其次大家有任何关于运维的疑难杂问,也欢迎和大家一起交流讨论。关于运维学习、分享、交流,笔者开通了微信公众号【运维猫】,感兴趣的朋友可以关注下,欢迎加入,建立属于我们自己的小圈子,一起学运维知识。群主还经营一家Orchis饰品店,喜欢的小伙伴欢迎????前来下单。

扫描二维码

获取更多精彩

运维猫公众号

有需要技术交流的小伙伴可以加我微信,期待与大家共同成长,本人微信:

扫描二维码

添加私人微信

运维猫博主

扫码加微信

最近有一些星友咨询我知识星球的事,我也想继续在星球上发布更优质的内容供大家学习和探讨。运维猫公众号平台致力于为大家提供免费的学习资源,知识星球主要致力于即将入坑或者已经入坑的运维行业的小伙伴。

点击阅读原文  查看更多精彩内容!!!

参考文献:https://cloud.tencent.com/developer/article/1501403

https://support.huaweicloud.com/devg-cci/cci_05_0026.html

kubernetes之容器探针(liveness and readiness probe)相关推荐

  1. Kubernetes(k8s)四、Pod生命周期(初始化容器的应用,探针liveness、readliness应用,)

    Pod生命周期 学习目标:初始化容器的应用及两个探针的应用 探针 是由 kubelet 对容器执行的定期诊断: Kubelet 可以选择是否执行在容器上运行的三种探针执行和做出反应: liveness ...

  2. pod配置Liveness和Readiness探针

    全栈工程师开发手册 (作者:栾鹏) 架构系列文章 本文将向您展示如何配置容器的存活和可读性探针. kubelet 使用 liveness probe(存活探针)来确定何时重启容器.例如,当应用程序处于 ...

  3. Liveness和Readiness两种Health Check手段在Kubernetes中的使用

    一.概述 强大的自愈能力是Kubernetes这一类容器编排管理引擎的一个重要特性.通常情况下,Kubernetes通过重启发生故障的容器来实现自愈.除此之外,我们还有其他方式来实现基于Kuberne ...

  4. 【Kubernetes】k8s的健康性检查详细说明【livenss probe、readiness probe】

    文章目录 探测的目的 环境准备 什么是 Container Probes 健康状态说明 yaml配置文件参数说明 perbe功能前测试 liveness probe command httpGet t ...

  5. Docker应用:Kubernetes(容器集群)

    Docker应用:Kubernetes(容器集群) 原文:Docker应用:Kubernetes(容器集群) 阅读目录: Docker应用:Hello World Docker应用:Docker-co ...

  6. k8s容器探针:就绪检测、存活检测

    容器探针 探测方式 检测探针-就绪检测 使用readinessProbe进行就绪检测 vim read.yaml 就绪检测:此时并不存在index1.html,所以不会成功 create kubect ...

  7. VMware、Pivotal和Google Cloud协力推出全新基于Kubernetes的容器服务——Pivotal Container Service(PKS)...

    本文讲的是VMware.Pivotal和Google Cloud协力推出全新基于Kubernetes的容器服务--Pivotal Container Service(PKS)[编者的话]定制化应用不再 ...

  8. 浅淡Kubernetes 与容器技术体系的最佳方法

    我们已经进入到容器化时代,Kubernetes成为了市场上容器编排的事实标准,而且k8S 同样具备了微服务所需要的服务注册与发现.负载均衡.配置中心.Spring cloud 的核心是Netflix微 ...

  9. 一文告诉你,如何在 Kubernetes 的容器引擎中运行 KVM 和 VMware VM!

    作者 | Gilson Melo 译者 | 天道酬勤 责编 | 徐威龙 封图| CSDN下载于视觉中国 随着微服务的出现,人们通常会问:"是否有可能通过Kubernetes上的微服务在基于内 ...

最新文章

  1. 加拿大阿尔伯塔大学韩杰教授招收电子与计算机专业博士/博后
  2. AI不会很快取代作家——但未来可能比你想象的更近
  3. 9-7NOIP模拟赛总结
  4. Android桌面组件App Widget开发三步走
  5. extjs 验证消息不显示
  6. AcWing 3195. 有趣的数
  7. 学习API HOOK,编写了一个winsock 的封包抓取程序,可免费使用;
  8. 苹果cms V10模板 手机端模板粉红色模板带会员中心
  9. 实现查询所有商品功能
  10. bootstrap input不允许为空_SpringCloud Stream你所不知道的进阶实战
  11. python中lstrip函数_python中strip(),lstrip(),rstrip()函数的使用讲解
  12. Github Star 7.2K,来自百度飞桨超级好用的OCR数据合成与半自动标注工具,强烈推荐!
  13. ORACLE 锁解释
  14. CSDN日报20170317——《转行穷三年?未必!》
  15. RESB 0x7dfe-$ 报错
  16. 2021-02-26构造函数
  17. 基于ZigBee的WPAN网络配置应用
  18. 【C语言】文件管理<2>
  19. BeanUtils拷贝对象
  20. 计算机科学与技术0812和0775,计算机科学与技术考研,计算机科学学什么

热门文章

  1. java判断白天黑夜,获取Java中的所有夜晚时间
  2. python汇率兑换_美元与人民币汇率 Python
  3. UI自动化框架如何设计及搭建?
  4. mysql网站设计_Flask+Mysql搭建网站之网页设计
  5. 计算机与昆虫关系的论文,趣味昆虫学论文 昆虫与人类的关系
  6. go gorm获取数据库报错:goexit: BYTE $0x90 // NOP
  7. 手机摄影你不能不知的 5 个拍照小技巧,原来这拍摄模式那么强大
  8. Nginx -- SSL模块
  9. python制作节日贺卡
  10. 求大家别秀智商了:请给我的头像一顶圣诞帽@微信官方