vSphere 故障排错思路总结
vSphere 故障排错思路总结
https://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650633515&idx=2&sn=6ae77d5f06c142b33481f7aa556546a2&chksm=bef90bad898e82bb4a6508367a22f04de216dc464db29043403b9c91cf80b6190caf59c0df5d&scene=21#wechat_redirect
twt企业IT社区 2018-04-23
1 、故障排查思维逻辑
故障排查涉及到整体的排错方法论,总体而言,故障排查需要遵循一个工作逻辑:
确认问题状况
o 确认问题所在
o 收集故障相关问题
确认导致故障的原因
o 确认什么原因导致的问题
o 诊断问题的根本原因是什么
解决问题
o 制定可能的解决方案
o 评估数据安全风险
o 执行最佳解决方案
2 、故障排查逻辑图示(流程及细节)
图示说明:
配置问题、软件 Bug、硬件故障是三种最为常见的故障
软件 bug 示例
o 在 ESXi 5.5 u1 或 u2 中存在这样一个常见的软件 Bug:网卡原因紫屏事件
硬件故障示例
o 若主机 HBA 卡电池出问题,可能会在写上面会有很差的表现
3 、vSphere 常规故障分层
4 、故障解决 E2E
故障状态 |
故障原因 |
1 个或多个 LUN 不可见 |
LUN 不可见,存储可能没有恰当的 MAP 到主机 |
无法通过 vSphere Web Client 连接 vCenter |
VirtualCenter Service 没有启动 |
Virtual Machine 无法启动 |
文件可能被锁定,文件可能丢失 |
5 、案例流程 - 故障状态(示例)
6 、案例流程 - 日志搜集(收集日志信息,用于进行故障分析)
7 、案例流程 - 可能性分析
利用结构化思维来进行故障分析,可以有效提高排错效率;
根据问题的提示,按照下图所示排错流程来进行排错
图示说明:
自上而下进行排错
自下而上进行排错
从中间环节排错
8 、案例流程 - 查找问题的根源
通过反复测试,来确认问题的根源所在,例如:VM 无响应的排错逻辑:
图示说明:
如果仅仅是单台虚拟机无响应,建议自上而下
若涉及很多虚拟机响应慢,建议从中间环节
存在告警,建议从下而上
9、案例流程 - 解决问题
完成问题根源定位之后,评估问题可能带来的影响
o 较大影响 - 立即解决
o 一般影响 - 条件许可的情况下解决
o 较小影响 - 有空解决
制定解决问题的方案
o 头疼医头 - 立刻就事论事解决问题
o 头疼医脚 - 避免同一个问题再次发生
o 长远考虑 - 整体考虑,从未来的思路触发去执行问题处理
10、vSphere 常规故障排查流程 - 追根溯源(图示)
图示说明:
此处以 vMotion 为例,其它故障与此类似
11、vSphere 排错组件归纳
上文摘自《技术资料整理归集——vSphere 虚拟化优化与排错》,由社区会员上传分享,具体排错步骤、工具,可以点击阅读原文下载该文档。或关注我们后续的推送文章。
vSphere 故障排错思路总结相关推荐
- vSphere 故障排错:针对 Virtual Machine 的故障排查
vSphere 故障排错:针对 Virtual Machine 的故障排查 https://mp.weixin.qq.com/s?__biz=MjM5NTk0MTM1Mw==&mid=2650 ...
- 常见网络故障排错思路
常见网络故障排错思路 OSPF排错思路总结: 1.检查设备之间的IP地址是否互通 2.检查设备是否可以发送ospf 报文 3.检查设备是否可以接收ospf 报文 4.检查设备之间的ospf 报文的关键 ...
- 运维工程师 常见的 trouble shooting 故障排错思路
1. K8S troubleshooting
- VMware vSphere 5.1 群集深入解析(二十九)-故障排错
VMware vSphere 5.1 Clustering Deepdive HA.DRS.Storage DRS.Stretched Clusters Duncan Epping &Fran ...
- vSphere 性能优化方法 故障排错方法及工具总结(一)
转自@twt社区 本资料主要包括:性能优化方法:vSphere 性能优化逻辑.针对 VM 的性能优化.针对 CPU 的性能优化.针对 RAM 的性能优化.针对 DISK 的性能优化.针对 Networ ...
- vSphere 故障排除之工具篇
vSphere 故障排除之工具篇(转) 这周上完了vSphere Troubleshooting的课,课堂上也有很多学员互动和讨论,关于vSphere的常见故障也是很多工程师工作中经常遇到的,于是我准 ...
- 有了这篇网络排错思路大总结:我帮了不少同事~
点击上方 好好学java ,选择 星标 公众号重磅资讯.干货,第一时间送达 今日推荐:分享一套基于SpringBoot和Vue的企业级中后台开源项目,这个项目有点哇塞!个人原创100W+访问量博客:点 ...
- 路由添加失败 参数错误_路由器故障排错三大经典案例详解
对于网络管理员来说,熟悉与掌握路由排错的思路和技巧是非常必要的.小e将通过三例典型的路由故障排错案例进行分析. 案例1:不堪重负,路由器外网口关闭 1.网络环境 某单位使用的是Cisco路由器,租用电 ...
- Windows电脑无法上网排错思路
1.1 熟悉OSI七层模型与TCP/IP协议栈 这应该是网络排错要知道的最基本的知识了. 无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的 ...
最新文章
- linux svn使用方法
- iOS彩票项目--第三天,搭建竞技场和发现,搭建幸运选号和我的彩票界面
- [机器学习] Coursera ML笔记 - 逻辑回归(Logistic Regression)
- JavaScript 笔记(2) -- 类型转换 正则表达 变量提升 表单验证
- SLua 中继承 C# 类接口 Slua.Class 的一个 Bug。
- 暮色森林模组_我的世界怎样进入暮色森林
- Android之运行的错误:java.lang.UnsatisfiedLinkError: Couldn‘t find cibloger.so
- php 秒杀并发怎么做,PHP实现高并发下的秒杀功能–Laravel
- python反射详解
- 碎片试自学软件测试?我靠自己整理的这套方,案既充实了自己也得到了涨薪
- html表格怎样传入数据类型,Echarts图表中pie类型tooltip中formatter函数传递的参数从哪里来?...
- nginx https 根据应用不同的标识转发到不同的服务器端口
- 软件后台《积分制 / 绩效考核表》管理制度
- 信创云:打造自主可控云基础设施 | 厂商征集
- cesium 加载fbx模型
- VP9编码(3)-- 符号
- 安全测试找工作没有经验怎么办?
- 架构实践全景图 | 文末赠书
- OKR目标与关键结果法
- 如何区分奋斗者和奋斗b?
热门文章
- php获取时间格式的年份,PHP获取当前时间、时间戳的各种格式写法汇总
- python 堆栈溢出_内存 - 如何发生“堆栈溢出”,如何防止它?
- 力扣977,有序数组的平方(JavaScript)
- golang 绘图库_golang入门-- 一个2D的图形库学习
- oracle设为归档模式,设置oracle归档模式
- php post 二维数组,php curl模拟post请求和提交多维数组的示例代码
- php定时器使用,PHP定时器的说明
- C++之指针探究(四):指针和二维数组
- java求值不用后缀表达式_数据结构之后缀表达式求值(java实现)
- 图片变色_一张图看懂手机CMF史,附带手机渐变色工艺解析