本文转自 Cylon 的笔记收藏册,原文:https://www.cnblogs.com/Cylon/p/16611503.html,版权归原作者所有。欢迎投稿,投稿请添加微信好友:cloud-native-yang

本文将引入一个思路:“在 Kubernetes 集群发生网络异常时如何排查”。文章将引入 Kubernetes 集群中网络排查的思路,包含网络异常模型,常用工具,并且提出一些案例以供学习。

  • Pod 常见网络异常分类

  • 网络排查工具

  • Pod 网络异常排查思路及流程模型

  • CNI 网络异常排查步骤

  • 案例学习

Pod 网络异常

网络异常大概分为如下几类:

  • 网络不可达,主要现象为 ping 不通,其可能原因为:

    • 源端和目的端防火墙(iptables, selinux)限制

    • 网络路由配置不正确

    • 源端和目的端的系统负载过高,网络连接数满,网卡队列满

    • 网络链路故障

  • 端口不可达:主要现象为可以 ping 通,但 telnet 端口不通,其可能原因为:

    • 源端和目的端防火墙限制

    • 源端和目的端的系统负载过高,网络连接数满,网卡队列满,端口耗尽

    • 目的端应用未正常监听导致(应用未启动,或监听为 127.0.0.1 等)

  • DNS 解析异常:主要现象为基础网络可以连通,访问域名报错无法解析,访问 IP 可以正常连通。其可能原因为

    • Pod 的 DNS 配置不正确

    • DNS 服务异常

    • pod 与 DNS 服务通讯异常

  • 大数据包丢包:主要现象为基础网络和端口均可以连通,小数据包收发无异常,大数据包丢包。可能原因为:

    • 可使用 ping -s 指定数据包大小进行测试

    • 数据包的大小超过了 docker、CNI 插件、或者宿主机网卡的 MTU 值。

  • CNI 异常:主要现象为 Node 可以通,但 Pod 无法访问集群地址,可能原因有:

    • kube-proxy 服务异常,没有生成 iptables 策略或者 ipvs 规则导致无法访问

    • CIDR 耗尽,无法为 Node 注入 PodCIDR 导致 CNI 插件异常

    • 其他 CNI 插件问题

那么整个 Pod 网络异常分类可以如下图所示:

Pod network trouble hirarchy

总结一下,Pod 最常见的网络故障有,网络不可达(ping 不通);端口不可达(telnet 不通);DNS 解析异常(域名不通)与大数据包丢失(大包不通)。


插播一句,8 月 27 日 KubeSphere 将和极狐GitLab 在杭州联合主办一场云原生主题的 Meetup,想和我面基的同学欢迎报名

Kubernetes 网络排错骨灰级指南!相关推荐

  1. Kubernetes 网络排错指南

    本文介绍各种常见的网络问题以及排错方法,包括 Pod 访问异常.Service 访问异常以及网络安全策略异常等. 说到 Kubernetes 的网络,其实无非就是以下三种情况之一 Pod 访问容器外部 ...

  2. Kubernetes网络一年发展动态与未来趋势

    Kubernetes网络模型 谈到Kubernetes的网络模型,就不能不提它著名的"单Pod单IP"模型,即每个Pod都有一个独立的IP,Pod内所有容器共享网络namespac ...

  3. 有了这篇网络排错思路大总结:我帮了不少同事~

    点击上方 好好学java ,选择 星标 公众号重磅资讯.干货,第一时间送达 今日推荐:分享一套基于SpringBoot和Vue的企业级中后台开源项目,这个项目有点哇塞!个人原创100W+访问量博客:点 ...

  4. Kubernetes 网络入门

    原文作者:Brlan Ehlert of F5 原文链接:Kubernetes 网络入门 转载来源:NGINX 官方网站 NodePort.LoadBalancer.Ingress controlle ...

  5. Kubernetes网络与CNI插件介绍

    文章目录 Kubernetes网络总体架构图 kubernetes使用CNI网络插件的工作流程 k8s如何使用CNI kubernetes官方文档介绍CNI CNI简介 CNI原理 参考文献 Kube ...

  6. 爬虫书籍-Python网络爬虫权威指南OCR库 NLTK 数据清洗 BeautifulSoup Lambda表达式 Scrapy 马尔可夫模型

    Python网络爬虫权威指南 编辑推荐 适读人群 :需要抓取Web 数据的相关软件开发人员和研究人员 作为一种采集和理解网络上海量信息的方式,网页抓取技术变得越来越重要.而编写简单的自动化程序(网络爬 ...

  7. Kubernetes — 网络流量模型

    目录 文章目录 目录 Kubernetes Network 中的 IP 地址类型 Kubernetes 的网络流量模型 同 Pod 内部的 Containers 间的通信(Container 模式) ...

  8. python网络爬虫权威指南 百度云-分析《Python网络爬虫权威指南第2版》PDF及代码...

    对那些没有学过编程的人来说,计算机编程看着就像变魔术.如果编程是魔术(magic),那么网页抓取(Web scraping)就是巫术(wizardry),也就是运用"魔术"来实现精 ...

  9. python网络爬虫权威指南 豆瓣_福利分享:个人整理的Python书单,从基础到进阶...

    原标题:福利分享:个人整理的Python书单,从基础到进阶 我挑选的一些书籍,大家可以自行到书店或是网上自己选购.也由于个人水平有限,很可能大家觉得优秀的书籍没有列出,如果大家有觉得不错的书籍,欢迎大 ...

最新文章

  1. X.509 数字证书结构和实例
  2. NAGIOS安装指南
  3. php搜索图片不显示不出来了,PHP CURL采集百度搜寻结果图片不显示问题的解决方法【第1/4页】...
  4. OpenGL开发之旅基础知识介绍
  5. PostgreSQL 12系统表(9)pg_settings
  6. 菜鸟学做——三层交换综合模拟实验【1】
  7. Win10文件管理器那些你不知道的秘密
  8. GitHub简单教程
  9. 因为梦想 书送远方 《数据化运营》免费领取
  10. MPPT “最大功率点跟踪”
  11. java中继承applet类_Java - 33 Java Applet基础
  12. eda技术试卷_EDA技术及应用试卷D含答案
  13. ubuntu20.04【一键脚本安装wps并配置字体】
  14. RethinkDB创始人教你如何找到创业创意(完整篇)
  15. 下载苹果官网视频的方式
  16. 宫保虾球,酸甜微辣,一人就能干掉一盘
  17. 缺陷修改实践——replace函数的运用|思考?
  18. CommandArgument属性 绑定参数
  19. 网络设置巨形帧_NAS的巨型帧(Jumbo_Frame)设置对其传输速度的影响的评测与分析...
  20. Tomb.Finance的每周更新(5.23-5.29)

热门文章

  1. 使用DMA/Bridge Subsystem for PCI Express相关
  2. python 读取文件夹 增量文件_Python实现目录文件的全量和增量备份
  3. RAID 0/ 1/ 5/ 10./ JBOD是什么模式?什么意思?
  4. 《Arduino奇妙之旅:智能车趣味制作天龙八步》一2.3.2 开发环境
  5. 脑筋..柔软性? flexibility? 灵活性? 头脑体操?
  6. 腾讯云轻量4核8G12M应用服务器配置性能评测(全解析)
  7. Nginx配置文件(ubuntu)
  8. 超好看的Vscode软件的Windows和Mac快捷键大全
  9. linux隐藏文件导出,看我如何通过Linux Rootkit实现文件隐藏
  10. 上天入地下海HRG特种机器人亮相2019WRC