linux磁盤IO查看(iostat)

##############

#

#    操作

#

##############

# iostat -x 1 10

Linux 2.6.18-92.el5xen    02/03/2009

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

1.10    0.00    4.82   39.54    0.07   54.46

Device:          rrqm/s   wrqm/s   r/s  w/s     rsec/s   wsec/s  avgrq-sz  avgqu-sz await svctm  %util

sda               0.00     3.50   0.40  2.50     5.60    48.00    18.48     0.00    0.97   0.97   0.28

sdb               0.00     0.00   0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00

sdc               0.00     0.00   0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00

sdd               0.00     0.00   0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00

sde               0.00     0.10   0.30  0.20     2.40     2.40     9.60     0.00    1.60   1.60   0.08

sdf              17.40     0.50 102.00  0.20 12095.20     5.60   118.40     0.70    6.81   2.09  21.36

sdg             232.40     1.90 379.70  0.50 76451.20    19.20   201.13     4.94   13.78   2.45  93.16

##############

#

#    注釋

#

##############

rrqm/s:    每秒進行 merge 的讀操作數目。即 delta(rmerge)/s

wrqm/s:    每秒進行 merge 的寫操作數目。即 delta(wmerge)/s

r/s:       每秒完成的讀 I/O 設備次數。即 delta(rio)/s

w/s:       每秒完成的寫 I/O 設備次數。即 delta(wio)/s

rsec/s:    每秒讀扇區數。即 delta(rsect)/s

wsec/s:    每秒寫扇區數。即 delta(wsect)/s

rkB/s:     每秒讀K字節數。是 rsect/s 的一半,因為每扇區大小為512字節。(需要計算)

wkB/s:     每秒寫K字節數。是 wsect/s 的一半。(需要計算)

avgrq-sz:  平均每次設備I/O操作的數據大小 (扇區)。delta(rsect+wsect)/delta(rio+wio)

avgqu-sz:  平均I/O隊列長度。即 delta(aveq)/s/1000 (因為aveq的單位為毫秒)。

await:     平均每次設備I/O操作的等待時間 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)

svctm:     平均每次設備I/O操作的服務時間 (毫秒)。即 delta(use)/delta(rio+wio)

%util:     一秒中有百分之多少的時間用於 I/O 操作,或者說一秒中有多少時間 I/O 隊列是非空的。即 delta(use)/s/1000 (因為use的單位為毫秒)

##############

#

#    分析

#

##############

1.

如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁盤可能存在瓶頸。

2.

如果 idle 小於 70% IO壓力就較大了,一般讀取速度有較多的wait。

3.同時可以結合

vmstat 查看查看b參數(等待資源的進程數)和wa參數(IO等待所占用的CPU時間的百分比,高過30%時IO壓力高)

4.另外還可以參考

svctm 一般要小於 await (因為同時等待的請求的等待時間被重復計算了),svctm 的大小一般和磁盤性能有關,CPU/內存的負荷也會對其有影響,請求過多也會間接導致 svctm 的增加。await 的大小一般取決於服務時間(svctm) 以及 I/O 隊列的長度和 I/O 請求的發出模式。

如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;如果 await 遠大於 svctm,說明 I/O 隊列太長,應用得到的響應時間變慢,如果響應時間超過了用戶可以容許的范圍,這時可以考慮更換更快的磁盤,調整內核 elevator 算法,優化應用,或者升級 CPU。

隊列長度(avgqu-sz)也可作為衡量系統 I/O 負荷的指標,但由於 avgqu-sz 是按照單位時間的平均值,所以不能反映瞬間的 I/O 洪水。

###############

#

#   例子解釋

#

###############

別人一個不錯的例子.(I/O 系統 vs. 超市排隊)

舉一個例子,我們在超市排隊 checkout 時,怎么決定該去哪個交款台呢? 首當是看排的隊人數,5個人總比20人要快吧? 除了數人頭,我們也常常看看前面人購買的東西多少,如果前面有個采購了一星期食品的大媽,那么可以考慮換個隊排了。還有就是收銀員的速度了,如果碰上了連 錢都點不清楚的新手,那就有的等了。另外,時機也很重要,可能 5 分鍾前還人滿為患的收款台,現在已是人去樓空,這時候交款可是很爽啊,當然,前提是那過去的 5 分鍾里所做的事情比排隊要有意義 (不過我還沒發現什么事情比排隊還無聊的)。

I/O 系統也和超市排隊有很多類似之處:

r/s+w/s 類似於交款人的總數

平均隊列長度(avgqu-sz)類似於單位時間里平均排隊人的個數

平均服務時間(svctm)類似於收銀員的收款速度

平均等待時間(await)類似於平均每人的等待時間

平均I/O數據(avgrq-sz)類似於平均每人所買的東西多少

I/O 操作率 (%util)類似於收款台前有人排隊的時間比例。

我們可以根據這些數據分析出 I/O 請求的模式,以及 I/O 的速度和響應時間。

###############

#

#   案例分析

#

###############

下面是別人寫的這個參數輸出的分析

# iostat -x 1

avg-cpu:     %user     %nice     %sys      %idle

16.2      0.00      4.31      79.44

Device:              rrqm/s  wrqm/s  r/s     w/s     rsec/s  wsec/s  rkB/s  wkB/s   avgrq-sz avgqu-sz await svctm    %util

/dev/cciss/c0d0       0.00   44.90   1.02    27.55    8.16   579.59  4.08   289.80   20.57    22.35   78.21   5.00   14.29

/dev/cciss/c0d0p1     0.00   44.90   1.02    27.55    8.16   579.59  4.08   289.80   20.57    22.35   78.21   5.00   14.29

/dev/cciss/c0d0p2     0.00    0.00   0.00    0.00     0.00     0.00  0.00     0.00    0.00     0.00    0.00   0.00    0.00

上面的 iostat 輸出表明秒有 28.57 次設備 I/O 操作: 總IO(io)/s = r/s(讀) +w/s(寫) = 1.02+27.55 = 28.57 (次/秒) 其中寫操作占了主體 (w:r = 27:1)。

平均每次設備 I/O 操作只需要 5ms 就可以完成,但每個 I/O 請求卻需要等上 78ms,為什么? 因為發出的 I/O 請求太多 (每秒鍾約 29 個),假設這些請求是同時發出的,那么平均等待時間可以這樣計算:

平均等待時間 = 單個 I/O 服務時間 * ( 1 + 2 + ... + 請求總數-1) / 請求總數

應用到上面的例子: 平均等待時間 = 5ms * (1+2+...+28)/29 = 70ms,和 iostat 給出的78ms 的平均等待時間很接近。這反過來表明 I/O 是同時發起的。

每秒發出的 I/O 請求很多 (約 29 個),平均隊列卻不長 (只有 2 個 左右),這表明這 29 個請求的到來並不均勻,大部分時間 I/O 是空閑的。

一秒中有 14.29% 的時間 I/O 隊列中是有請求的,也就是說,85.71% 的時間里 I/O 系統無事可做,所有 29 個 I/O 請求都在142毫秒之內處理掉了。

delta(ruse+wuse)/delta(io) = await = 78.21 => delta(ruse+wuse)/s =78.21 * delta(io)/s = 78.21*28.57 = 2232.8,表明每秒內的I/O請求總共需要等待2232.8ms。所以平均隊列長度應為 2232.8ms/1000ms = 2.23,而 iostat 給出的平均隊列長度 (avgqu-sz) 卻為 22.35,為什么?! 因為 iostat 中有 bug,avgqu-sz 值應為 2.23,而不是 22.35。

vmstat監視內存使用情況

vmstat是Virtual MeomoryStatistics(虛擬內存統計)的縮寫,可對操作系統的虛擬內存、進程、CPU活動進行監視。它是對系統的整體情況進行統計,不足之處是無法對某個進程進行深入分析。

vmstat的語法如下:

vmstat [-V] [-n] [delay [count]]

-V表示打印出版本信息;

-n表示在周期性循環輸出時,輸出的頭部信息僅顯示一次;

delay是兩次輸出之間的延遲時間;

count是指按照這個時間間隔統計的次數。

[root@yufei ~]# vmstat

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 4116 38560 24456 90224 5 11 595 71 96 134 2 2 88 8 0

結果參數說明:

Procs

r:等待執行的任務數

b:處在非中斷睡眠狀態的進程數

展示了正在執行和等待CPU資源的任務個數。當這個值超過了CPU數目,就會出現CPU瓶頸了

Memory

swpd:正在使用的swap大小單位K

free:空閑的內存空間

buff:已使用的buff大小,對塊設備的讀寫進行緩沖

cache:已使用的cache大小,文件系統的cache

inact:

active:

Swap

si:交換內存使用,由磁盤調入內存

so:交換內存使用,由內存調入磁盤

IO

bi:從塊設備讀入的數據總量(讀磁盤) (KB/s)

bo:寫入到塊設備的數據總理(寫磁盤) (KB/s)

System

in:每秒產生的中斷次數

cs:每秒產生的上下文切換次數

上面這2個值越大,會看到由內核消耗的CPU時間會越多

CPU

us:用戶進程消耗的CPU時間百分比

us 的值比較高時,說明用戶進程消耗的CPU時間多,但是如果長期超過50% 的使用,那么我們就該考慮優化程序算法或者進行加速了

sy:內核進程消耗的CPU時間百分比

sy 的值高時,說明系統內核消耗的CPU資源多,這並不是良性的表現,我們應該檢查原因。

id:空閑

wa:IO等待消耗的CPU時間百分比

wa 的值高時,說明IO等待比較嚴重,這可能是由於磁盤大量作隨機訪問造成,也有可能是磁盤的帶寬出現瓶頸(塊操作)

linux vmstat io,linux磁盤IO查看iostat,vmstat相关推荐

  1. oracle的ocr是什么意思,Oracle11gR2——RAC中的表決磁盤、OCR與OLR

    1.表決磁盤 Oracle集群件使用表決磁盤來解決分區集群中的集群成員資格問題. 例如一個8節點集群,其節點之間發生通信中斷,4個節點不能與另外4個節點通信.此時表決磁盤幫助確定哪一組節點應當繼續正常 ...

  2. 查看linux进程的设备io,Linux下查看进程IO工具iopp

    Linux下的IO检测工具最常用的是iostat,不过iostat只能查看到总的IO情况.如果要细看具体那一个程序点用的IO较高,可以使用iotop .不过iotop对内核版本和Python版本有要求 ...

  3. 关于Linux性能调优中磁盘IO调优的一些笔记

    写在前面 和小伙伴分享一些Linux 磁盘 IO优化的笔记,内容很浅,可以用作入门 博文内容结合<Linux性能优化>读书笔记整理 涉及内容包括 使用vmstat 统计系统内磁盘分区I/O ...

  4. linux下测试磁盘的读写IO速度

    有时候我们在做维护的时候,总会遇到类似于IO特别高,但不能判定是IO瓶颈还是软件参数设置不当导致热盘的问题.这时候通常希望能知道磁盘的读写速度,来进行下一步的决策. 下面是两种测试方法: (1)使用h ...

  5. 【Linux系统编程学习】C库IO函数与系统IO函数的关系

    此为黑马Linux课程笔记. 1. C标准IO函数工作流程 如图,以C库函数的fopen为例,其返回类型是FILE类型的指针,FILE类型包含很多内容,主要包含三个内容:文件描述符.文件读写指针的位置 ...

  6. Linux之阻塞与非阻塞IO

    目录 一.阻塞与非阻塞IO简介 1.阻塞IO 2.非阻塞IO 二.应用程序阻塞与非阻塞 1.阻塞 2.查询(非阻塞) ①select ②poll ③epoll 三.驱动程序阻塞与非阻塞 1.等待队列( ...

  7. 漫谈linux文件io,Linux文件IO与通用块层的请求合并

    本文参考https://mp.weixin.qq.com/s/Imt4BW-zoHPpcOpcKZs_AQ, 公众号"Linux阅码场" 请求合并就是将进程内或者进程间产生的在物理 ...

  8. linux nmon 进程io,linux服务器性能监控-nmon(二)

    读过我之前文章的同学会发现,如果在做服务器性能监控的过程中要一个命令一个命令的敲,那显然非常的麻烦,而且不实际.监控命令只更适用于某些场景下的分析和定位,无法直接形成一些图形化的界面以便我们更直观的分 ...

  9. Linux stat命令Blocks字段与IO Block字段的理解

    Linux stat命令Blocks字段与IO Block字段的理解 原因 在之前了解文件系统的时候,为理解块与扇区的概念,用到了stat命令. 关于这个命令输出的信息的文章有很多,其他字段是没有争议 ...

最新文章

  1. java socket抓取资源_Java 通过 Socket 的形式抓取网页内容
  2. 面试题: 数据库 真实面试题已看1 操作语句 存储过程 挺好 sql语句练习 有用
  3. 10、jeecg 默认为空的字段值是如何被填充的?
  4. python widnows mysql_Windows下python安装MySQLdb
  5. 机器学习--弹性网络(Elastic-Net Regression)
  6. springboot 监听所有异常_SpringBoot——目前Java开发最流行的框架(一)
  7. Spring之自动装配注入
  8. Spark源码分析之一:Job提交运行总流程概述
  9. Layer下拉框监听
  10. java异常处借接错书_利用Java异常机制实现模拟借书系统
  11. 孝感高考成绩2021分数查询,孝感教育局官网2021年大悟中考分数查询成绩查分
  12. OperationQueue与属性maxConcurrentOperationCount的那些事
  13. 饥荒联机版把服务器删掉了怎么找回,饥荒联机服务器角色存档删除 | 手游网游页游攻略大全...
  14. Is your Tecplot 360 EX liense valid?
  15. MycoLightTM 比率细菌膜电位试剂盒程序
  16. Python多线程操作
  17. 一个好玩的小游戏——麻神之战
  18. WebStrom中一些有趣的工具与常用快捷键
  19. 武汉大学计算机电气,武汉大学电气与自动化学院
  20. 【Pytorch】data.norm(几种范数(norm)的详细介绍)

热门文章

  1. 脚本提取大华DAV文件
  2. 博山计算机培训,博山服务态度好的财务软件使用培训招生简章
  3. 青蛙跳台阶(python)
  4. 基于摄像直读原理的 OCR智能采集仪表拍照采集终端
  5. 给大家分享我的两个网站
  6. 苹果手机复制电话号码提示格式不正确
  7. MySQL拼音首字母查询(支持三个中文以内的查询)
  8. Mendeley 安装、配置、使用
  9. 树莓派自动对时---树莓派时间不对怎么办
  10. 关于产品经理、研发人员和测试人员角色职责的思考