Hadoop为什么没有采用RAID?_Just Do it!_百度空间

Hadoop为什么没有采用RAID?

HDFS集群没有采用RAID(冗余磁盘阵列)作为datanodes的存储设备(尽管namenode使用RAID来保护元数据不会丢失)。由于HDFS是采用在节点之间块复制的方法,所以RAID提供的冗余机制对HDFS来说是多余的。

此外,RAID条带(RAID 0)常用于增加性能,但却比HDFS中用到的JBOD(Just a Bunch Of Disks)要慢,而且JBOD在所有的磁盘之间对HDFS块进行时间片的轮转。具体说,RAID 0读写操作受限于冗余磁盘阵列中最慢的那个磁盘的速度。在JBOD中,磁盘的操作是独立的,所以读写操作的平均速度要大于最慢磁盘的速度。实际应用中,磁盘性能多是可以改变的,即使是同一型号的磁盘。在Yahoo Hadoop Cluster的Benchmark中,测试Gridmix显示JBOD要比RAID 0快10%,另一个测试显示快30%(这里的测试指的是HDFS的写能力。

最后,当一个JBOD配置中的一个磁盘失效,HDFS可以继续操作;但是在RAID中,一个磁盘的失效将会导致整个阵列(节点也一样)变得不再可用。

翻译自:OReilly Hadoop 《The Definitive Guide》June 2009

Hadoop为什么没有采用RAID?相关推荐

  1. Hadoop大数据之RAID

    ------------摘自<百度百科--RAID词条> 磁盘阵列(Redundant Arrays of Independent Disks,RAID),有"独立磁盘构成的具有 ...

  2. Hadoop 为什么不建议使用 RAID?

    参考: Hadoop之为何不使用RAID? 场景:Hadoop做能否用RAID做优化? 答案:否,原因如下: 性能会有所降低,主要受限于最慢的disk(哪怕一个品牌的disk,性能也会不一样) 磁盘整 ...

  3. 大数据处理——Hadoop解析(一)

    概述 这个时代被称之为大数据时代,各行各业生产的数据量呈现爆发性增长,并且基于这些爆发性增长的数据做深层次的数据挖掘.分析.因此,我们可以很容易的感觉到,在这样一个大数据的时代,我们很多做事情的方法正 ...

  4. [Hadoop性能调优]

    一. Hadoop概述 随着企业要处理的数据量越来越大,MapReduce思想越来越受到重视.Hadoop是MapReduce的一个开源实现,由于其良好的扩展性和容错性,已得到越来越广泛的应用. Ha ...

  5. Hadoop性能调优全面总结

    一. Hadoop概述 随着企业要处理的数据量越来越大,MapReduce思想越来越受到重视.Hadoop是MapReduce的一个开源实现,由于其良好的扩展性和容错性,已得到越来越广泛的应用. Ha ...

  6. 10分钟认识RAID磁盘阵列技术!!!

    首先声明这是转贴,因为我认为写的很不错,所以拿来和大家一起分享!!!! RAID磁盘阵列技术简述- - 在计算机发展的初期,"大容量"硬盘的价格还相当高,解决数据存储安全性问题的主 ...

  7. 如何选择正确的RAID级别

    存储世界5月23日报道:目前,根据应用程序.磁盘驱动器种类.预算标准选择正确的RAID级别和10年前一样重要. 例如,如果你想实现高效能的读操作和写操作,你可能就要使用小型磁盘驱动器,避免使用RAID ...

  8. 软RAID创建手册-win2003

    一.概述     大家知道,硬件RAID解决方案速度快.稳定性好,可以有效地提供高水平的硬盘可用性和冗余度,但是居高不下的价格实在令人可畏.不过可庆幸的是,Windows 2003提供了内嵌的软件RA ...

  9. 【转】Hadoop集群添加磁盘步骤

    转自:http://blog.csdn.net/huyuxiang999/article/details/17691405 一.实验环境 : 1.硬件:3台DELL服务器,CPU:2.27GHz*16 ...

最新文章

  1. 比赛-模拟赛 (17 Aug, 2018) (待施工)
  2. 为什么一个星期是7天
  3. 使用 Navicat Premium 将 sql server 的数据库迁移到 mysql 的数据库中
  4. 斐波那契问题的递归和动态规划
  5. 如何删除一个员工编号及其全部主数据和事务数据?
  6. ThreadLocal的原理与使用
  7. BNUOJ 4064 条形码设计 (动态规划 + 递推)
  8. 理解ORACLE数据库字符集
  9. java克鲁斯卡尔算法_Java语言基于无向有权图实现克鲁斯卡尔算法代码示例
  10. android custom toast,Android自定义Toast
  11. Python | 程序以字符串长度打印单词
  12. python从tushare获取数据_python调用tushare获取股票月线数据
  13. Go语言之父详述切片与数组的不同
  14. vSAN其实很简单-vSAN 原厂支持的包含范围
  15. Selenuim 三种等待方式解读
  16. 阿里云发布“码上公益”平台 打造更高效透明的“科技公益”
  17. ServletContext的应用
  18. 百度OCR图像识别(包含自定义模板)
  19. MATLAB 脚本 编写 泰勒展开
  20. 计算机重启后打印机无法连接不上,共享打印机电脑重启就无法连接怎么办

热门文章

  1. 3说明书_怎么才能做好产品说明书翻译?知行翻译公司总结了3点
  2. [设计模式-行为型]备忘录模式(Memento)
  3. php设计模式 命令行模式,[设计模式]PHP设计模式之命令行模式
  4. layui可以动态添加div吗_乳化剂是什么?可以添加到护肤品里吗?
  5. JS获取当前时间,例如2019-10-01格式
  6. Linux服务器中的wget、curl和scp
  7. mysql的dockerfile_dockerfile构建mysql镜像
  8. apache+mysql+wordpress的安装建站
  9. Eclipse和debug的一些快捷键:F8一直执行到下一个断点。
  10. vue ---- webpack中loader