故障排查 node_Kubernetes 故障解决心得(一)
故障一
故障现象
kubelet 启动不了,通过命令 journalctl -u kubelet
查看日志,报 Failed to start ContainerManager failed to initialize top level QOS containers: failed to update top level Burstable QOS cgroup : failed to set supported cgroup subsystems for cgroup [kubepods burstable]: failed to find subsystem mount for required subsystem: pids
故障分析
根据报错,有用的信息是 failed to find subsystem mount for required subsystem: pids
,通过命令 ls -l /sys/fs/cgroup/systemd/kubepods/burstable/
查看,该目录下没有 pids
目录。
SupportPodPidsLimit
在 kubernetes 1.14+
默认开启。SupportNodePidsLimit 在 1.15+
默认开启。
相关Issues:https://github.com/kubernetes/kubernetes/issues/79046
解决方法
- 方法一:编辑 kubelet 配置文件,添加
--feature-gates=SupportPodPidsLimit=false,SupportNodePidsLimit=false
参数,后面在重启 kubelet 服务。 - 方法二:可以升级系统内核
5+
版本
故障二
故障现象
Docker daemon oci 故障,日志报 docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:301: running exec setns process for init caused \"exit status 40\"": unknown.
解决方法
# 清理缓存$ echo 1 > /proc/sys/vm/drop_caches
# 永久生效$ echo "vm.min_free_kbytes=1048576" >> /etc/sysctl.conf$ sysctl -p
# 重启 docker 服务,让 docker 应用内核设置$ systemctl restart docker
故障三
报错现象
kubelet 日志报 network plugin is not ready: cni config uninitialized
解决方法
网络插件(flannel 或者 calico)没有安装或者安装失败。
故障四
故障现象
kubelet 日志报 Failed to connect to apiserver: the server has asked for the client to provide credentials
故障分析
从上面 kubelet 日志信息能得出,kubelet 客户端证书已过期,导致 Node节点状态处于 NotReady
。
也可以通过命令 openssl x509 -noout -enddate -in {证书路径}
来查看证书到期日期。
解决方法
kubeadm 部署的 Kubernetes 解决方法
kubernetes 1.15+ 版本可以直接通过命令 kubeadm alpha certs renew
更新。
kubernetes 小于 1.15 版本的,可以参考 https://github.com/yuyicai/update-kube-cert
项目更新
二进制部署的 Kubernetes 解决方法
# 删除旧的 kubelet 证书文件$ rm -f /opt/kubernetes/ssl/kubelet*
# 删除 kubelet kubeconfig 文件$ rm -f /opt/kubernetes/cfg/kubelet.kubeconfig
# 重启 kubelet 服务,让 master 重新颁发客户端证书$ systemctl restart kubelet
参考链接
- https://adoyle.me/Today-I-Learned/k8s/k8s-deployment.html
热门文章推荐
- Kubernetes 临时存储需要限制吗?
- Linux Used内存到底哪里去了?
- K8S故障排查指南- but volume paths are still present on disk
- Kubernetes故障排查指南-分析容器退出状态码
- Kubernetes 升级填坑指南(一)
- Kubernetes Pod 故障归类与排查方法
最后
- 欢迎您加我微信【ypxiaozhan01】,拉您进技术群,一起交流学习...
- 欢迎您关注【YP小站】,学习互联网最流行的技术,做个专业的技术人...
故障排查 node_Kubernetes 故障解决心得(一)相关推荐
- 故障排查 ❀ 路由器故障
路由器故障部分案例解析 案例1 不堪重负,路由器外网口关闭 1.网络环境 某单位使用的是Cisco路由器,租用电信30MB做本地接入和l0MB教育网双线路上网,两年来网络运行稳定,路由器也没有发生故障 ...
- linux网络管理(链路聚合、桥接网络、故障排查、常用工具)
文章目录 网络进阶管理 链路聚合 桥接网络 链路聚合配置 Centos7/RHEL7配置bond聚合链路 Centos7/RHEL7配置bond0 Centos7/RHEL7配置bond1 Cento ...
- NFS服务常见故障排查和解决方法
NFS,全名叫Network File System,中文叫网络文件系统,是Linux.UNIX系统的分布式文件系统的一个组成部分,可实现在不同网络上共享远程文件系统.NFS由Sun公司开发,目前已经 ...
- oracle bug号,《一次Oracle bug的故障排查过程思考》的问题重现解决
在<一次Oracle bug的故障排查过程思考>这个问题排查过程当中,当时和同事们一块儿猜想.实验.论证,昨天有幸,通过了精心设计,在生产环境中,进行了问题重现,以及解决的部分验证.sql ...
- xp路由器播放服务器无响应,路由器界面打不开的故障排查及解决方法全程图解...
路由器界面打不开怎么办?别担心,下面为您图文并茂的讲解. 1. 路由器界面打不开之现象与故障排查. 1) 请确认自己的线路是否连接正确,点击该链接查看线路连接是否正确. 2) 现象1:本地连接显示已连 ...
- freeipa 故障排查和解决
freeipa 故障排查和解决 资料 https://www.jianshu.com/p/8ca0e4e01b8a
- MySQL性能优化、故障排查及最佳实践秘籍,阿里云数据库专家玄惭的“武功”全记录...
为什么80%的码农都做不了架构师?>>> 文章简介 玄惭,真名罗龙九,阿里云DBA专家,负责阿里云RDS线上稳定以及专家服务团队.他经历过阿里历年双11实战考验,积累了7年对阿 ...
- 桌面虚拟化XenDesktop常见故障排查宝典
XD故障排查宝典(1) XenServer安装时注意一定配置正确的时区和时间. 建议使用NTP来同步时间. 如果时区不对,或者时间有问题,会使虚机时间不对,影响VDA注册等一系列问题. 使用XenSe ...
- IDEA 2021.3 正式发布:支持远程开发、故障排查、Java和Spring等多项优化改进
点击上方蓝字关注我,开发资讯快人一步 昨天刚刚跟大家聊了Jetbrains即将推出的轻量级编辑器挑战 VS Code 的消息,今天又收到了IntelliJ IDEA 2021.3正式发布的推送. 不说 ...
- Atitit.播放系统的选片服务器,包厢记时系统 的说明,教程,维护,故障排查手册p825...
Atitit.播放系统的选片服务器,包厢记时系统 的说明,教程,维护,故障排查手册p825 1. 播放系统服务器方面的维护 2 1.1. 默认情况下,已经在系统的启动目录下增加了俩个启动项目 2 1. ...
最新文章
- 创建docker用户组并加入
- c语言煎饼问题算法,C煎饼分类程序?
- Linux下安装Kafka(单机版)
- mysql ibdata1 损坏_mysql innodb文件ibdata1损坏导致mysql无法启动
- opencv puttext
- 新一代视频编解码标准正式公布!
- GUAVA常用方法总结整理 String list map转换
- Python连接SQLite
- 前端高效开发必备的 js 库大全
- 烽火路由路虚拟服务器,烽火路由器怎么设置?烽火路由器设置详解
- 视音频编解码H264,265,MPEG-4,VP8,VP9知识总结
- 三极管场效应参数全集
- [Beta]第四次 Scrum Meeting
- python 知乎 合并 pdf_有什么比较好的 PDF 分割、合并软件?
- 设计模式之禅【访问者模式】
- GNU宣言(自由软件联盟宣言书)
- 正交子空间投影的学习笔记
- 欧莱雅眉笔banner个人设计
- 单目标测向系统中CRLB推导及Matlab仿真验证
- tiri单片机_51单片机的SCON寄存器与C程序解析
热门文章
- [POJ2796]Feel Good
- LeetCode--Restore IP Addresses
- jQuery的实用特性扩展类库:jQuery++
- 加速VS2005 or VS2008
- Q:How to read attribute from a tag
- aspf ftp_【解析】文件传输协议:FTP、TFTP、SFTP有什么区别?
- 有界、无界队列对ThreadPoolExcutor执行的影响
- Spring Cloud Zuul网关集成JWT身份验证学习总结
- JVM初识之类加载器
- uploadify上传文件Firefox浏览器上传失败解决方法