vSphere 故障排错思路总结

https://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650633515&idx=2&sn=6ae77d5f06c142b33481f7aa556546a2&chksm=bef90bad898e82bb4a6508367a22f04de216dc464db29043403b9c91cf80b6190caf59c0df5d&scene=21#wechat_redirect

twt企业IT社区 2018-04-23

1 、故障排查思维逻辑

故障排查涉及到整体的排错方法论,总体而言,故障排查需要遵循一个工作逻辑:

  • 确认问题状况

o 确认问题所在

o 收集故障相关问题

  • 确认导致故障的原因

o 确认什么原因导致的问题

o 诊断问题的根本原因是什么

  • 解决问题

o 制定可能的解决方案

o 评估数据安全风险

o 执行最佳解决方案

2 、故障排查逻辑图示(流程及细节)

图示说明:

  • 配置问题、软件 Bug、硬件故障是三种最为常见的故障

  • 软件 bug 示例

o 在 ESXi 5.5 u1 或 u2 中存在这样一个常见的软件 Bug:网卡原因紫屏事件

  • 硬件故障示例

o 若主机 HBA 卡电池出问题,可能会在写上面会有很差的表现

3 、vSphere  常规故障分层

4 、故障解决 E2E

故障状态

故障原因

1 个或多个 LUN 不可见

LUN 不可见,存储可能没有恰当的 MAP 到主机

无法通过 vSphere Web Client 连接 vCenter

VirtualCenter Service 没有启动

Virtual Machine 无法启动

文件可能被锁定,文件可能丢失

5 、案例流程 -  故障状态(示例)

6 、案例流程 -  日志搜集(收集日志信息,用于进行故障分析)

7 、案例流程 -  可能性分析

利用结构化思维来进行故障分析,可以有效提高排错效率;

根据问题的提示,按照下图所示排错流程来进行排错

图示说明:

  • 自上而下进行排错

  • 自下而上进行排错

  • 从中间环节排错

8 、案例流程 -  查找问题的根源

通过反复测试,来确认问题的根源所在,例如:VM 无响应的排错逻辑:

图示说明:

如果仅仅是单台虚拟机无响应,建议自上而下

若涉及很多虚拟机响应慢,建议从中间环节

存在告警,建议从下而上

9、案例流程 -  解决问题

  • 完成问题根源定位之后,评估问题可能带来的影响

o 较大影响 - 立即解决

o 一般影响 - 条件许可的情况下解决

o 较小影响 - 有空解决

  • 制定解决问题的方案

o 头疼医头 - 立刻就事论事解决问题

o 头疼医脚 - 避免同一个问题再次发生

o 长远考虑 - 整体考虑,从未来的思路触发去执行问题处理

10、vSphere  常规故障排查流程 -  追根溯源(图示)

图示说明:

此处以 vMotion 为例,其它故障与此类似

11、vSphere  排错组件归纳

上文摘自《技术资料整理归集——vSphere 虚拟化优化与排错》,由社区会员上传分享,具体排错步骤、工具,可以点击阅读原文下载该文档。或关注我们后续的推送文章。

vSphere 故障排错思路总结相关推荐

  1. vSphere 故障排错:针对 Virtual Machine 的故障排查

    vSphere 故障排错:针对 Virtual Machine 的故障排查 https://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650 ...

  2. 常见网络故障排错思路

    常见网络故障排错思路 OSPF排错思路总结: 1.检查设备之间的IP地址是否互通 2.检查设备是否可以发送ospf 报文 3.检查设备是否可以接收ospf 报文 4.检查设备之间的ospf 报文的关键 ...

  3. 运维工程师 常见的 trouble shooting 故障排错思路

    1. K8S troubleshooting

  4. VMware vSphere 5.1 群集深入解析(二十九)-故障排错

    VMware vSphere 5.1 Clustering Deepdive HA.DRS.Storage DRS.Stretched Clusters Duncan Epping &Fran ...

  5. vSphere 性能优化方法 故障排错方法及工具总结(一)

    转自@twt社区 本资料主要包括:性能优化方法:vSphere 性能优化逻辑.针对 VM 的性能优化.针对 CPU 的性能优化.针对 RAM 的性能优化.针对 DISK 的性能优化.针对 Networ ...

  6. vSphere 故障排除之工具篇

    vSphere 故障排除之工具篇(转) 这周上完了vSphere Troubleshooting的课,课堂上也有很多学员互动和讨论,关于vSphere的常见故障也是很多工程师工作中经常遇到的,于是我准 ...

  7. 有了这篇网络排错思路大总结:我帮了不少同事~

    点击上方 好好学java ,选择 星标 公众号重磅资讯.干货,第一时间送达 今日推荐:分享一套基于SpringBoot和Vue的企业级中后台开源项目,这个项目有点哇塞!个人原创100W+访问量博客:点 ...

  8. 路由添加失败 参数错误_路由器故障排错三大经典案例详解

    对于网络管理员来说,熟悉与掌握路由排错的思路和技巧是非常必要的.小e将通过三例典型的路由故障排错案例进行分析. 案例1:不堪重负,路由器外网口关闭 1.网络环境 某单位使用的是Cisco路由器,租用电 ...

  9. Windows电脑无法上网排错思路

    1.1 熟悉OSI七层模型与TCP/IP协议栈 这应该是网络排错要知道的最基本的知识了. 无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的 ...

最新文章

  1. linux svn使用方法
  2. iOS彩票项目--第三天,搭建竞技场和发现,搭建幸运选号和我的彩票界面
  3. [机器学习] Coursera ML笔记 - 逻辑回归(Logistic Regression)
  4. JavaScript 笔记(2) -- 类型转换 正则表达 变量提升 表单验证
  5. SLua 中继承 C# 类接口 Slua.Class 的一个 Bug。
  6. 暮色森林模组_我的世界怎样进入暮色森林
  7. Android之运行的错误:java.lang.UnsatisfiedLinkError: Couldn‘t find cibloger.so
  8. php 秒杀并发怎么做,PHP实现高并发下的秒杀功能–Laravel
  9. python反射详解
  10. 碎片试自学软件测试?我靠自己整理的这套方,案既充实了自己也得到了涨薪
  11. html表格怎样传入数据类型,Echarts图表中pie类型tooltip中formatter函数传递的参数从哪里来?...
  12. nginx https 根据应用不同的标识转发到不同的服务器端口
  13. 软件后台《积分制 / 绩效考核表》管理制度
  14. 信创云:打造自主可控云基础设施 | 厂商征集
  15. cesium 加载fbx模型
  16. VP9编码(3)-- 符号
  17. 安全测试找工作没有经验怎么办?
  18. 架构实践全景图 | 文末赠书
  19. OKR目标与关键结果法
  20. 如何区分奋斗者和奋斗b?

热门文章

  1. php获取时间格式的年份,PHP获取当前时间、时间戳的各种格式写法汇总
  2. python 堆栈溢出_内存 - 如何发生“堆栈溢出”,如何防止它?
  3. 力扣977,有序数组的平方(JavaScript)
  4. golang 绘图库_golang入门-- 一个2D的图形库学习
  5. oracle设为归档模式,设置oracle归档模式
  6. php post 二维数组,php curl模拟post请求和提交多维数组的示例代码
  7. php定时器使用,PHP定时器的说明
  8. C++之指针探究(四):指针和二维数组
  9. java求值不用后缀表达式_数据结构之后缀表达式求值(java实现)
  10. 图片变色_一张图看懂手机CMF史,附带手机渐变色工艺解析