转:

http://www.cnblogs.com/wjoyxt/p/4808024.html

针对系统中磁盘IO负载过高的指导性操作

主要命令:

echo deadline > /sys/block/sda/queue/scheduler

注:以下的内容仅是提供参考,

如果磁盘IO确实比较大的话,是数据库,可以进行读写分离或者分库操作,减小磁盘压力,文件的话,可以利用raid来减轻压力

一)I/O调度程序的总结:

1)当向设备写入数据块或是从设备读出数据块时,请求都被安置在一个队列中等待完成.

2)每个块设备都有它自己的队列.

3)I/O调度程序负责维护这些队列的顺序,以更有效地利用介质.I/O调度程序将无序的I/O操作变为有序的I/O操作.

4)内核必须首先确定队列中一共有多少个请求,然后才开始进行调度.

二)I/O调度的4种算法

1)CFQ(完全公平排队I/O调度程序)

特点:

在最新的内核版本和发行版中,都选择CFQ做为默认的I/O调度器,对于通用的服务器也是最好的选择.

CFQ试图均匀地分布对I/O带宽的访问,避免进程被饿死并实现较低的延迟,是deadline和as调度器的折中.

CFQ对于多媒体应用(video,audio)和桌面系统是最好的选择.

CFQ赋予I/O请求一个优先级,而I/O优先级请求独立于进程优先级,高优先级的进程的读写不能自动地继承高的I/O优先级.

工作原理:

CFQ为每个进程/线程,单独创建一个队列来管理该进程所产生的请求,也就是说每个进程一个队列,各队列之间的调度使用时间片来调度,

以此来保证每个进程都能被很好的分配到I/O带宽.I/O调度器每次执行一个进程的4次请求.

2)NOOP(电梯式调度程序)----

适用于SSD固态硬盘。

在新兴的固态硬盘比如SSD、Fusion IO上,最简单的NOOP反而可能是最好的算法,因为其他三个算法的优化是基于缩短寻道时间的,而固态硬盘没有所谓的寻道时间且IO响应时间非常短。

特点:

在Linux2.4或更早的版本的调度程序,那时只有这一种I/O调度算法.

NOOP实现了一个简单的FIFO队列,它像电梯的工作主法一样对I/O请求进行组织,当有一个新的请求到来时,它将请求合并到最近的请求之后,以此来保证请求同一介质.

NOOP倾向饿死读而利于写.

NOOP对于闪存设备,RAM,嵌入式系统是最好的选择.

电梯算法饿死读请求的解释:

因为写请求比读请求更容易.

写请求通过文件系统cache,不需要等一次写完成,就可以开始下一次写操作,写请求通过合并,堆积到I/O队列中.

读请求需要等到它前面所有的读操作完成,才能进行下一次读操作.在读操作之间有几毫秒时间,而写请求在这之间就到来,饿死了后面的读请求.

3)Deadline(截止时间调度程序)

特点:

通过时间以及硬盘区域进行分类,这个分类和合并要求类似于noop的调度程序.

Deadline确保了在一个截止时间内服务请求,这个截止时间是可调整的,而默认读期限短于写期限.这样就防止了写操作因为不能被读取而饿死的现象.

Deadline对数据库环境(ORACLE RAC,MYSQL等)是最好的选择.

4)AS(预料I/O调度程序)

特点:

本质上与Deadline一样,但在最后一次读操作后,要等待6ms,才能继续进行对其它I/O请求进行调度.

可以从应用程序中预订一个新的读请求,改进读操作的执行,但以一些写操作为代价.

它会在每个6ms中插入新的I/O操作,而会将一些小写入流合并成一个大写入流,用写入延时换取最大的写入吞吐量.

AS适合于写入较多的环境,比如文件服务器

AS对数据库环境表现很差.

三)I/O调度方法的查看与设置

1)查看当前系统的I/O调度方法:

[root@test1 tmp]#

cat /sys/block/

sda

/queue/scheduler

noop anticipatory deadline

[cfq]

2)临地更改I/O调度方法:

例如:想更改到noop电梯调度算法:

echo deadline > /sys/block/

sda

/queue/scheduler

3)想永久的更改I/O调度方法: 如下

修改内核引导参数,加入elevator=调度程序名

[root@test1 tmp]#

vi /boot/grub/menu.lst

更改到如下内容:

kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/

elevator=deadline

rhgb quiet

重启之后,查看调度方法:

[root@test1 ~]# cat /sys/block/sda/queue/scheduler

noop anticipatory

[deadline]

cfq

已经是deadline了

四)I/O调度程序的测试

本次测试分为只读,只写,读写同时进行.

分别对单个文件600MB,每次读写2M,共读写300次.

1)测试磁盘读:

[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler

[root@test1 tmp]#

time dd if=/dev/sda1 f=/dev/null bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 6.81189 seconds, 92.4 MB/s

real    0m6.833s

user    0m0.001s

sys     0m4.556s

[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/sda1 f=/dev/null bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 6.61902 seconds, 95.1 MB/s

real    0m6.645s

user    0m0.002s

sys     0m4.540s

[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/sda1 f=/dev/null bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 8.00389 seconds, 78.6 MB/s

real    0m8.021s

user    0m0.002s

sys     0m4.586s

[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/sda1 f=/dev/null bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 29.8 seconds, 21.1 MB/s

real    0m29.826s

user    0m0.002s

sys     0m28.606s

结果:

第一 noop:用了6.61902秒,速度为95.1MB/s

第二 deadline:用了6.81189秒,速度为92.4MB/s

第三 anticipatory:用了8.00389秒,速度为78.6MB/s

第四 cfq:用了29.8秒,速度为21.1MB/s

2)测试写磁盘:

[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler

[root@test1 tmp]#

time dd if=/dev/zero f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 6.93058 seconds, 90.8 MB/s

real    0m7.002s

user    0m0.001s

sys     0m3.525s

[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/zero f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 6.79441 seconds, 92.6 MB/s

real    0m6.964s

user    0m0.003s

sys     0m3.489s

[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/zero f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 9.49418 seconds, 66.3 MB/s

real    0m9.855s

user    0m0.002s

sys     0m4.075s

[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler

[root@test1 tmp]# time dd if=/dev/zero f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 6.84128 seconds, 92.0 MB/s

real    0m6.937s

user    0m0.002s

sys     0m3.447s

测试结果:

第一 anticipatory,用了6.79441秒,速度为92.6MB/s

第二 deadline,用了6.84128秒,速度为92.0MB/s

第三 cfq,用了6.93058秒,速度为90.8MB/s

第四 noop,用了9.49418秒,速度为66.3MB/s

3)测试同时读/写

[root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler

[root@test1 tmp]# dd if=/dev/sda1 f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 15.1331 seconds, 41.6 MB/s

[root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler

[root@test1 tmp]# dd if=/dev/sda1 f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 36.9544 seconds, 17.0 MB/s

[root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler

[root@test1 tmp]# dd if=/dev/sda1 f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 23.3617 seconds, 26.9 MB/s

[root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler

[root@test1 tmp]# dd if=/dev/sda1 f=/tmp/test bs=2M count=300

300+0 records in

300+0 records out

629145600 bytes (629 MB) copied, 17.508 seconds, 35.9 MB/s

测试结果:

第一 deadline,用了15.1331秒,速度为41.6MB/s

第二 noop,用了17.508秒,速度为35.9MB/s

第三 anticipatory,用了23.3617秒,速度为26.9MS/s

第四 cfq,用了36.9544秒,速度为17.0MB/s

五)ionice

ionice可以更改任务的类型和优先级,不过只有cfq调度程序可以用ionice.

有三个例子说明ionice的功能:

采用cfq的实时调度,优先级为7

ionice -c1 -n7  -ptime dd if=/dev/sda1 f=/tmp/test bs=2M count=300&

采用缺省的磁盘I/O调度,优先级为3

ionice -c2 -n3  -ptime dd if=/dev/sda1 f=/tmp/test bs=2M count=300&

采用空闲的磁盘调度,优先级为0

ionice -c3 -n0  -ptime dd if=/dev/sda1 f=/tmp/test bs=2M count=300&

ionice的三种调度方法,实时调度最高,其次是缺省的I/O调度,最后是空闲的磁盘调度.

ionice的磁盘调度优先级有8种,最高是0,最低是7.

注意,磁盘调度的优先级与进程nice的优先级没有关系。

一个是针对进程I/O的优先级,一个是针对进程CPU的优先级。

总结:

1、CFQ和DEADLINE考虑的焦点在于满足零散IO请求上。对于连续的IO请求,比如顺序读,并没有做优化。为了满足随机IO和顺序IO混合的场景,Linux还支持ANTICIPATORY调度算法。ANTICIPATORY的在DEADLINE的基础上,为每个读IO都设置了6ms的等待时间窗口。如果在这6ms内OS收到了相邻位置的读IO请求,就可以立即满足。

IO调度器算法的选择,既取决于硬件特征,也取决于应用场景。

在传统的SAS盘上,CFQ、DEADLINE、ANTICIPATORY都是不错的选择;

对于专属的数据库服务器,DEADLINE的吞吐量和响应时间都表现良好

然而

在新兴的固态硬盘比如SSD、Fusion IO上,最简单的NOOP反而可能是最好的算法,因为其他三个算法的优化是基于缩短寻道时间的,而固态硬盘没有所谓的寻道时间且IO响应时间非常短。

2、对于数据库应用, Anticipatory Scheduler 的表现是最差的。Deadline 在 DSS 环境表现比 cfq 更好一点,而

cfq 综合来看表现更好一些

。这也难怪 RHEL默认的 IO 调度器设置为 cfq

linux系统硬盘使用过高,磁盘IO过高时的处理办法相关推荐

  1. linux cpu 内存爆满 mysql停止_如何用脚本统计linux系统CPU、内存、磁盘IO等信息?...

    概述 今天主要分享一个shell脚本,用来获取linux系统CPU.内存.磁盘IO等信息. 脚本 #!/bin/bash# 获取要监控的本地服务器IP地址IP=`ifconfig | grep ine ...

  2. linux 磁盘并发io,Linux系统 磁盘IO过高排查总结

    最近做的一个电商网站因为磁盘 I/O 过高导致访问速度奇慢,问题存在两个月有余未得到解决办法.此次排查原因的经验可以作下次问题的参考. 1.会看懂 top 系统命令出来的各项参数.此次是无意中发现 u ...

  3. linux查看磁盘对应槽位,一种linux系统硬盘槽位识别方法与流程

    技术领域 本发明涉及计算机技术领域,尤具体地说是一种实用性强.linux系统硬盘槽位识别方法. 背景技术: 近年来,随着技术的迅速发展,linux系统的应用也越来越广泛,特别对于国产处理器,linux ...

  4. [学习收藏]Linux系统硬盘优化

    [声明]转自:http://doc.linuxpk.com/129.html 优化linux系统硬盘 本文对linux系统下,硬盘的维护.整理.优化工作进行了一个分析与描述.(2002-12-17 0 ...

  5. linux怎么看系统盘,Linux系统怎么查看电脑的磁盘空间?

    Linux系统怎么查看电脑的磁盘空间?Linux作为一款开源的操作系统,许多用户都在使用这款系统,而这款系统的使用教程和Windows完全不一样,下面作者就带着大家一起来看看怎么操作吧! 使用教程: ...

  6. linux服务器引导分区,Linux系统的引导过程和磁盘分区信息

    Linux系统的引导过程和磁盘分区信息 作者:chinaitlab 佚名 2005-12-07 00:00 评论 分享 [IT168 服务器学院] 系统的引导过程和磁盘分区信息 在PC机上,最初的启动 ...

  7. linux ssd iops测试,Linux系统硬盘的IOPS测试

    Linux系统硬盘的IOPS测试 什么是IOPS? IOPS (英文:Input/Output Operations Per Second),即每秒进行读写(I/O)操作的次数,多用于数据库等场合,衡 ...

  8. Linux系统硬盘挂载

    Linux系统硬盘挂载 1.显示当前分区情况 指令:fdisk -l 2.创建硬盘分区 输入fdisk /dev/vdb,依次输入n,p,1,回车,w,其中n分别表示创建一个新分区,p表示分区类型为主 ...

  9. linux系统硬盘表识

    一:linux系统硬盘命名是基于文件的,一般是:/dev/hda2 和 /dev/sdb3 # /dev:是所有设备文件的存放目录. #hd和sd :它们是分区的前两字母,代表分区所在的设备类型.hd ...

最新文章

  1. 调用startActivityForResult后直接调用onActivityResult
  2. 安装 | Windows 10下基于Anaconda平台的TensorFlow详细安装步骤
  3. 如何在Kubernetes里给PostgreSQL创建secret
  4. Java 中Timer和TimerTask 定时器和定时任务使用的例子
  5. Windows平台下使用Dokan实现文件系统的开发
  6. tensorflow LSTM:张量变形,5维变4维,4维变5维
  7. 将Excel(.xlsx)中的数据导入到数据库中
  8. 苹果电脑表格取消自动计算机,苹果电脑excel序列被隐藏怎么办
  9. 回测系统backtrader(1)参考模板
  10. Window10 WSL2 Linux子系统文件目录路径
  11. 我的世界服务器怎么弄无限矿物,我的世界暮色森林矿石树资源无限刷攻略
  12. 基于DDD的微服务设计和开发实战
  13. 日常踩坑记录-汇总版
  14. “逃犯克星”张学友演唱会完成八杀,幕后功臣竟然是它
  15. 响应对象转json时属性名大小写问题完美解决
  16. 已达到人类水准语音识别模型的whisper,真的有这么厉害吗?
  17. 关于三角形的心及费马点
  18. VSS2005使用技巧
  19. 华为路由交换学习篇-STP生成树协议
  20. 实现敌人(怪物)的简单AI(自动巡逻、看到玩家攻击玩家、玩家离开恢复自动巡逻)

热门文章

  1. 以太坊和Metamask开发web应用时不再需要密码
  2. 下面代码打印的结果?
  3. 怎样在Web开发中完美控制IE标题栏
  4. Yii2中如何将Jquery放在head中的方法
  5. 【HeadFirst 设计模式总结】1.策略模式
  6. iphone:关于沙盒 存储路径
  7. JS关于提交的RSA加密算法
  8. 在桌面应用程序与Web应用程序之间该如何选择
  9. 在UWP的按钮中使用Segoe MDL2 Assets图标
  10. 《浪潮之巅》 读后感