VMware存储性能问题排错指南

介绍

当执行存储相关的命令时,VMware vSphere中存储相关的性能参数可能会出现峰值变化,同时这些存储命令也可能需要更长的时间来完成。本文将介绍当出现这种情况时的基本排错方法。

更多信息

存储设备性能衡量指标:

vSphere性能衡量指标由esxtop、resxtop提供,并且vSphere Client显示的是样本时间段内的平均数。在每个样本时间段结束时生成测量快照,对值进行平均,结果值作为该范围内的平均值进行报告。如果采样的衡量指标由非同类的数据集组成,则衡量指标可能会出乎意料地倾斜。

例如,如果所有样本中的命令不是以相同的速度完成,则存储设备命令延迟(DAVG/cmd) 的测量可能会生成比预期更高或更低的值。大多数存储设备命令在25ms内快速地完成,

但是还有极少数的命令(如,VAAI中使用的XCOPY命令)可能会花费更多的时间。但是,如果特定的采样时间段由少数的快速命令和一个非常慢的命令组成,则这些命令的平均数将比中数大。即使这些示例仅描述需较长时间完成的单个命令,但是在采样时间段内测量的存储延迟的平均数仍会大不相同,具体取决于在相同时间内完成的其他命令的数量:

4 个命令在 1ms 内完成和 1 个命令在 500ms 内完成,这表明平均延迟时间为 100.8ms。

9 个命令在 1ms 内完成和 1 个命令在 500ms 内完成,这表明平均延迟时间为 50.9ms。

19 个命令在 1ms 内完成和 1 个命令在 500ms 内完成,这表明平均延迟时间为 25.95ms。

注意:考虑在评估任一采样的性能衡量指标时的测量内容,之后基于这些衡量指标下结论。

设备延迟时间增加的某些可能原因如下:

·对目标进行了更改

·磁盘或介质故障

·设备过载

·故障切换

使用ESXTOP命令配置监控:

可以使用交互式esxtop程序提供连接到 VMware ESX主机各种设备的I/O衡量指标。

要监控每个HBA的存储性能,请执行以下操作:

1.在命令行键入esxtop以启动命令。

2.按d切换到磁盘视图(HBA 模式)。

3.要查看完整的设备名称,请按SHIFT + L并在“更改名称字段大小”中输入36。

4.按f修改显示的字段。

5.按b、c、d、e、h和j切换字段,然后按Enter。

6.按s,接着按2将更新时间间隔改为2秒,然后按Enter。

注意:这些选项仅在VMware ESX 3.5及更高版本中可用。

要按每个LUN 监控存储性能,请执行以下操作:

1.从命令行键入esxtop以启动命令。

2.按u切换到磁盘视图(LUN 模式)。

3.按f修改显示的字段。

4.按b、c、f 和h切换字段,然后按Enter。

5.按s,接着按 2 将更新时间间隔改为2秒,然后按Enter。

要增加esxtop中设备字段的宽度以显示完整的naa id,请执行以下操作:

1.在命令行键入esxtop以启动命令。

2.按u切换到磁盘设备显示。

3.按L (大写)更改名称字段大小。

4.输入值36以显示完整的naa标识符。

要按每个虚拟机监控存储性能,请执行以下操作:

1.在命令行键入esxtop以启动命令。

2.键入v切换到磁盘视图(虚拟机模式)。

3.按f修改显示的字段。

4.按b、d、e、h和j切换字段,然后按Enter。

5.按s,接着按2将更新时间间隔改为2秒,然后按Enter。

ESXTOP命令详解:

有关相关列和这些值的描述,请参阅下表:        项目描述

CMDS/s这是指每秒命令总数,包括IOPS(每秒输入/输出操作数)和其他SCSI命令,如SCSI reservations、locks、vendor string requests、unit   attention等要发送到或发送自受监控设备或虚拟机的命令。

在大多数情况下,除非有大量元数据操作(如SCSI预留),否则CMDS/s = IOPS。

DAVG/cmd这是发送给设备的每个命令的平均响应时间(以毫秒为单位)。

KAVG/cmd这是命令在VMkernel中花费的时间。

GAVG/cmd是指客户机操作系统感知的响应时间。该值使用此公式计算:DAVG + KAVG = GAVG

上述列既适用于读取操作,也适用于写入操作,而xAVG/rd只适用于读取操作,xAVG/wr只适用于写入操作。将这些列的结合起来是监控性能的最好方式,但是高读取或写入响应时间可能表示该阵列上的读取或写入缓存处于禁用状态。所有阵列的执行方式都不同,但对于持续的时间段,DAVG/cmd、KAVG/cmd和GAVG/cmd不应超出10 毫秒 (ms)。

注意:VMware ESX 3.0.x 不包含使用 esxtop 监控各个 LUN 或虚拟机的直接功能。不活动 LUN 降低了 DAVG/cmd、KAVG/cmd和 GAVG/cmd 的平均值。这些值也可以从vCenter Server 性能图表中看到。

如果遇到滞后时间值过高的情况,可查看交换机和SAN设备的当前性能衡量指标和运行配置。检查发送、接收和确认操作中可能表示其为延迟的错误或日志记录。这包括阵列从心轴计数方面处理I/O的能力,或者阵列处理提供给它的负载的能力。

如果响应时间增加到超过5000毫秒,则VMware ESX将让命令超时并中止操作。这些事件已记入日志;可以在以下日志中查看中止消息和其他 SCSI 错误:

·ESX 3.5 和 4.x – /var/log/vmkernel

·ESXi 3.5 和 4.x – /var/log/messages

·ESXi 5.x 及更高版本 - /var/log/vmkernel.log

在这些文件中可能看到的存储日志记录的类型取决于服务器配置。可通过主机> 配置 > 高级设置 > SCSI > SCSI.Log* 或 SCSI.Print* 查找这些参数的数值。

VMware vSphere内存管理和监控示意图:

下图综合描绘了VMware vSphere内存管理和监控示意图。其中也包含了esxtop命令中的相关参数:

参考

VMware KB: Information regarding vSphere storage device latency performance metrics

VMware KB: Using esxtop to identify storage performance issues for ESX / ESXi

VMware KB: VMware vSphere 5 Memory Management and Monitoring diagram

应用于

VMware

vmware连接服务器失败响应时间过长,VMware存储性能问题排错指南相关推荐

  1. [ESP8266]刷MQTT固件以及连接服务器失败的问题解决

    摘要:很多小伙伴在初期学习ESP8266 WIFI模块时会遇到很多的问题.其中主要包括:应该给ESP8266模块刷什么固件版本合适.STM32下位机应该怎样编写驱动程序以及大家可能都遇到过的连接服务器 ...

  2. ORA-28547:连接服务器失败,可能是Oracle Net管理错误

    描述:监听和服务都正常启动了,但是远程连接的时候会有这种错误 ORA-28547:连接服务器失败,可能是Oracle Net管理错误 解决办法: listener.ora 文件中 DEFAULT_SE ...

  3. cf网络原因服务器无响应,CF由于网络原因连接服务器失败请重试 1033_10136

    今天好不容易叫上以前朋友上CF玩几把游戏,兴致勃勃打开游戏,两人一起组队打排位,我游戏一进去就掉出来,一直弹出错误:由于网络原因连接服务器失败请重试 1033_10136.试了好多次都这样,就是进不去 ...

  4. 海贼王热血航线正在连接服务器,航海王热血航线连接服务器失败?解决方法一览...

    航海王热血航线进不去怎么办,进不去解决方法一览,航海王与今天早上正式开服了,相信很多玩家都遇到了进不去的问题,下面小编教大家解决办法 航海王热血航线进不去游戏怎么办 原因1:网络问题 如果小伙伴们在登 ...

  5. 永劫无间为啥显示连接服务器失败,永劫无间服务器故障怎么办?永劫无间服务器故障解决办法...

    永劫无间国服已上线了,有不少玩家遇到了连接服务器失败的情况,不知道怎么解决,下面小编就为大家详细的介绍一下,感兴趣的玩家一起来了解下吧! 永劫无间服务器故障怎么办?永劫无间服务器故障解决办法 一.在确 ...

  6. dnf无限重连服务器,dnf无限连接服务器失败解决方法

    dnf无限连接服务器失败怎么解决?相信很多小伙伴们都会遇到类似的问题,下面小编给小伙伴们带来了dnf无限连接服务器失败的临时解决办法,一起来看看把! 除了重启怎么办 几天好几次了 刚刚忍不了了 重启烦 ...

  7. 元神一直显示连接服务器失败,原神连接服务器失败是什么情况-提示连接服务器失败处理办法-去秀手游网...

    原神连接服务器失败是什么情况?想必很多小伙伴都知道游戏近期连接服务器失败,玩游戏的时候有弹窗提示这几个字,接下来去秀小编就给大家带来了原神提示连接服务器失败处理办法,希望能帮助到大家,一起来看看吧. ...

  8. 总是助手服务器失败怎么回事,《遇见逆水寒》连接服务器失败解决方法汇总 服务器连接失败问题原因...

    导 读 遇见逆水寒连接服务器失败怎么回事,近期不少小伙伴都在反映遇见逆水寒助手连接服务器失败,一直登不上去是怎么回事,小编这就为大家分享下遇见逆水寒连接服务器失败解决方法. 遇见逆水寒连接服务器失败解 ...

  9. pgadmin连接服务器失败_增值税发票税控软件:连接服务器失败是否使用离线文件进行更新?...

    增值税发票税控软件:连接服务器失败是否使用离线文件进行更新? 第一步:确认本地电脑是否可以正常打开网页: 打开电脑,网页查看一下是否可以正常上网,打开百度发现,可以正常上网. 第二步:请先确认网络配置 ...

  10. 网页连接的服务器失败是怎么回事啊,网页怎么连接服务器失败

    网页怎么连接服务器失败 内容精选 换一换 华为云提供两种连接方式通过SQL Server客户端连接实例:非SSL连接和SSL连接.其中,SSL连接实现了数据加密功能,具有更高的安全性.准备弹性云服务器 ...

最新文章

  1. 小学计算机教学教师培训,例谈小学信息技术课堂的有效教学
  2. SpringBoot2.0 基础案例(17):自定义启动页,项目打包和指定运行环境
  3. 康力电梯开门不关门 服务器显示开门键动作,康力电梯现场调试后常见问题及排除...
  4. 请举例说明python中**运算符的含义_举例讲解Python中的身份运算符的使用方法
  5. SharePoint:扩展DVWP - 第15部分:通过网站栏实现可维护的下拉框
  6. poj Ancient Cipher 古代密码
  7. blob协议的加密视频地址下载,多个ts文件合并方法,亲测有效
  8. 神经网络BP反向传播算法原理和详细推导流程
  9. 连续型随机变量+分布函数+密度函数+联合分布函数
  10. Splunk CIM
  11. 【刘文彬】【精解】EOS智能合约演练
  12. 主板常见故障维修24例(新手必备)
  13. 利用USB接口转串口芯片,做一个简单的闪光灯
  14. Python画各种爱心
  15. 射频器件的基本参数1
  16. Reactive Programming with RxJava,介绍一本书和Rx
  17. 【毕业设计】远程智能浇花灌溉系统 - stm32 单片机 嵌入式 物联网
  18. 通过原型安装Axure RP Extension for Chrome插件
  19. 根据关键字位置为PDF添加文本和图片
  20. 怎样用计算机的计算器的程序员进行进制,使用系统自带计算器进行二进制运算(示例代码)...

热门文章

  1. 盘点华为系工控企业——中国A股上市公司最多的创业体系
  2. C++ limits头文件的用法(numeric_limits)
  3. element rules不生效
  4. 史上最美大型互联网机房综合布线图鉴
  5. Android广告的Activity收集
  6. 苹果内购后台(java)验证订单
  7. 微信小程序【小程序码传参,自定义埋点】
  8. [转]伽利略卫星导航系统2019年7月14日起的宕机事件
  9. php u8t canonical,php – configure:error:utf8_mime2text()具有新的签名,但U8T_CANONICAL缺少...
  10. Canonical标签的作用及使用方法