故障一

故障现象

kubelet 启动不了,通过命令 journalctl -u kubelet 查看日志,报 Failed to start ContainerManager failed to initialize top level QOS containers: failed to update top level Burstable QOS cgroup : failed to set supported cgroup subsystems for cgroup [kubepods burstable]: failed to find subsystem mount for required subsystem: pids

故障分析

根据报错,有用的信息是 failed to find subsystem mount for required subsystem: pids,通过命令 ls -l /sys/fs/cgroup/systemd/kubepods/burstable/ 查看,该目录下没有 pids 目录。

SupportPodPidsLimit 在 kubernetes 1.14+ 默认开启。SupportNodePidsLimit 在 1.15+ 默认开启。

相关Issues:https://github.com/kubernetes/kubernetes/issues/79046

解决方法

  • 方法一:编辑 kubelet 配置文件,添加 --feature-gates=SupportPodPidsLimit=false,SupportNodePidsLimit=false 参数,后面在重启 kubelet 服务。
  • 方法二:可以升级系统内核 5+ 版本

故障二

故障现象

Docker daemon oci 故障,日志报 docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:301: running exec setns process for init caused \"exit status 40\"": unknown.

解决方法

# 清理缓存$ echo 1 > /proc/sys/vm/drop_caches

# 永久生效$ echo "vm.min_free_kbytes=1048576" >> /etc/sysctl.conf$ sysctl -p

# 重启 docker 服务,让 docker 应用内核设置$ systemctl restart docker

故障三

报错现象

kubelet 日志报 network plugin is not ready: cni config uninitialized

解决方法

网络插件(flannel 或者 calico)没有安装或者安装失败。

故障四

故障现象

kubelet 日志报 Failed to connect to apiserver: the server has asked for the client to provide credentials

故障分析

从上面 kubelet 日志信息能得出,kubelet 客户端证书已过期,导致 Node节点状态处于 NotReady

也可以通过命令 openssl x509 -noout -enddate -in {证书路径} 来查看证书到期日期。

解决方法

kubeadm 部署的 Kubernetes 解决方法

kubernetes 1.15+ 版本可以直接通过命令 kubeadm alpha certs renew 更新。

kubernetes 小于 1.15 版本的,可以参考 https://github.com/yuyicai/update-kube-cert 项目更新

二进制部署的 Kubernetes 解决方法

# 删除旧的 kubelet 证书文件$ rm -f  /opt/kubernetes/ssl/kubelet*

# 删除 kubelet kubeconfig 文件$ rm -f /opt/kubernetes/cfg/kubelet.kubeconfig

# 重启 kubelet 服务,让 master 重新颁发客户端证书$ systemctl restart kubelet

参考链接

  • https://adoyle.me/Today-I-Learned/k8s/k8s-deployment.html

热门文章推荐

  • Kubernetes 临时存储需要限制吗?
  • Linux Used内存到底哪里去了?
  • K8S故障排查指南- but volume paths are still present on disk
  • Kubernetes故障排查指南-分析容器退出状态码
  • Kubernetes 升级填坑指南(一)
  • Kubernetes Pod 故障归类与排查方法

最后

  • 欢迎您加我微信【ypxiaozhan01】,拉您进技术群,一起交流学习...
  • 欢迎您关注【YP小站】,学习互联网最流行的技术,做个专业的技术人...


【文章让您有收获,? 或者在看支持我吧】

故障排查 node_Kubernetes 故障解决心得(一)相关推荐

  1. 故障排查 ❀ 路由器故障

    路由器故障部分案例解析 案例1 不堪重负,路由器外网口关闭 1.网络环境 某单位使用的是Cisco路由器,租用电信30MB做本地接入和l0MB教育网双线路上网,两年来网络运行稳定,路由器也没有发生故障 ...

  2. linux网络管理(链路聚合、桥接网络、故障排查、常用工具)

    文章目录 网络进阶管理 链路聚合 桥接网络 链路聚合配置 Centos7/RHEL7配置bond聚合链路 Centos7/RHEL7配置bond0 Centos7/RHEL7配置bond1 Cento ...

  3. NFS服务常见故障排查和解决方法

    NFS,全名叫Network File System,中文叫网络文件系统,是Linux.UNIX系统的分布式文件系统的一个组成部分,可实现在不同网络上共享远程文件系统.NFS由Sun公司开发,目前已经 ...

  4. oracle bug号,《一次Oracle bug的故障排查过程思考》的问题重现解决

    在<一次Oracle bug的故障排查过程思考>这个问题排查过程当中,当时和同事们一块儿猜想.实验.论证,昨天有幸,通过了精心设计,在生产环境中,进行了问题重现,以及解决的部分验证.sql ...

  5. xp路由器播放服务器无响应,路由器界面打不开的故障排查及解决方法全程图解...

    路由器界面打不开怎么办?别担心,下面为您图文并茂的讲解. 1. 路由器界面打不开之现象与故障排查. 1) 请确认自己的线路是否连接正确,点击该链接查看线路连接是否正确. 2) 现象1:本地连接显示已连 ...

  6. freeipa 故障排查和解决

    freeipa 故障排查和解决 资料 https://www.jianshu.com/p/8ca0e4e01b8a

  7. MySQL性能优化、故障排查及最佳实践秘籍,阿里云数据库专家玄惭的“武功”全记录...

    为什么80%的码农都做不了架构师?>>>    文章简介 玄惭,真名罗龙九,阿里云DBA专家,负责阿里云RDS线上稳定以及专家服务团队.他经历过阿里历年双11实战考验,积累了7年对阿 ...

  8. 桌面虚拟化XenDesktop常见故障排查宝典

    XD故障排查宝典(1) XenServer安装时注意一定配置正确的时区和时间. 建议使用NTP来同步时间. 如果时区不对,或者时间有问题,会使虚机时间不对,影响VDA注册等一系列问题. 使用XenSe ...

  9. IDEA 2021.3 正式发布:支持远程开发、故障排查、Java和Spring等多项优化改进

    点击上方蓝字关注我,开发资讯快人一步 昨天刚刚跟大家聊了Jetbrains即将推出的轻量级编辑器挑战 VS Code 的消息,今天又收到了IntelliJ IDEA 2021.3正式发布的推送. 不说 ...

  10. Atitit.播放系统的选片服务器,包厢记时系统 的说明,教程,维护,故障排查手册p825...

    Atitit.播放系统的选片服务器,包厢记时系统 的说明,教程,维护,故障排查手册p825 1. 播放系统服务器方面的维护 2 1.1. 默认情况下,已经在系统的启动目录下增加了俩个启动项目 2 1. ...

最新文章

  1. 创建docker用户组并加入
  2. c语言煎饼问题算法,C煎饼分类程序?
  3. Linux下安装Kafka(单机版)
  4. mysql ibdata1 损坏_mysql innodb文件ibdata1损坏导致mysql无法启动
  5. opencv puttext
  6. 新一代视频编解码标准正式公布!
  7. GUAVA常用方法总结整理 String list map转换
  8. Python连接SQLite
  9. 前端高效开发必备的 js 库大全
  10. 烽火路由路虚拟服务器,烽火路由器怎么设置?烽火路由器设置详解
  11. 视音频编解码H264,265,MPEG-4,VP8,VP9知识总结
  12. 三极管场效应参数全集
  13. [Beta]第四次 Scrum Meeting
  14. python 知乎 合并 pdf_有什么比较好的 PDF 分割、合并软件?
  15. 设计模式之禅【访问者模式】
  16. GNU宣言(自由软件联盟宣言书)
  17. 正交子空间投影的学习笔记
  18. 欧莱雅眉笔banner个人设计
  19. 单目标测向系统中CRLB推导及Matlab仿真验证
  20. tiri单片机_51单片机的SCON寄存器与C程序解析

热门文章

  1. [POJ2796]Feel Good
  2. LeetCode--Restore IP Addresses
  3. jQuery的实用特性扩展类库:jQuery++
  4. 加速VS2005 or VS2008
  5. Q:How to read attribute from a tag
  6. aspf ftp_【解析】文件传输协议:FTP、TFTP、SFTP有什么区别?
  7. 有界、无界队列对ThreadPoolExcutor执行的影响
  8. Spring Cloud Zuul网关集成JWT身份验证学习总结
  9. JVM初识之类加载器
  10. uploadify上传文件Firefox浏览器上传失败解决方法