分布式文件系统HADOOP HDFS与传统文件系统LINUX FS的比较与分析

第3 0卷第 4期 2 1 8月 0 0年

报(工

版)

Vo_ O No 4 13 .

Au . 2 0 g 01

J OURNAL OF S HOU UNI UZ VERSTY( NGI I E NEERI NG CI S ENCE EDI I TON)

文章编号:6 3— 4 X(0 0 0 00 1 7 0 7 2 1 )~ 4— 0 5—0 5

分布式文件系统 Ha o p HDF d o S与传统文件系统 Ln xF iu S的比较与分析

许春玲张广泉,

(. 1苏州大学计算机科学与技术学院,江苏苏州 2 5 0;. 10 6 2中国科学院软件研究所计算机科学国家重点实验室,北京 10 8 ) 00 0

要:对现有 HD S的设计架构进行分析,借与 Ln xF F并 iu S架构的对比凸显 H F D S的分布式特性。

通过分析得出:有的 HD S架构使用 Jv现 F aa的 M p界面, a不利于任务的分解和并行处理,因此 HD S F仅在数据的存储上实现分布式,数据处理依然是集中式的,就形成了对 N me oe的依赖,着集这 a Nd随

群的扩大, a N d N me o e的性能成为系统瓶颈,并提出了解决方向。 关键词: a op H F; F ot n c;布式文件系统 H d o; D S HD Sb te ek分 l

中图分类号: P 1 . T 36 4文献标识码: A

0引言

“云计算”全球范围内日益推广的新一代商业计算模式, do是 Haop正是“云计算”境中广泛应用的重要环基础软件。分布式并行框架,用于普通配置计算机组成的集群。从这个定义不难看出 H do适 aop的商业魅力所在。H do方面借鉴了 M p eue计算模型,一模型在 G ol署自己的分布式框架过程中被不断 aop一 aR dc这 og e部

提炼;一方面,作为整个框架基础设施的文件系统,另是正如 G ol MaR d c运行在 G ol Fl Ss m上, og p eue e og i yt e e e

H do有自己的文件系统 H F—— H d0 ir ueFl Ss m的缩写。H F aop也 Ds a0pDsi t i yt tb e e D S作为文件系统之于 H— a do op的意义,如 Lnx文件系统对于 Lnx正 iu iu。作为开源项目代表作的

Lnx透明化的开发模式方便我们透 iu,

过软件的具体实现方法研究分析其背后的设计思想,甚至于隐藏在开发者不自觉沿用的实现方法之后的某些

规律。

因为 Haop和 Lnx是在不断更新中的项目,文分析引用如未特别说明,以 Haop0 1.,iu do iu都本均 do .7 1Lnx kre 240为基础。下文用有序偶表示“ a到 b的一对多映射” e l .. n ,从。

1 HDF S架构

H F D S的架构建立在大量普通配置的计算机组成的集群上。集群中的节点通常都运行 G U Lnx操作 N/ iu系统同时必须支持 Jv, aa因为 HD S是用 Jv实现的。H F F aa D S采用了主从 ( s rSae架构,个集群有一 Mat/ l ) e v一

个 Matr多个 Sae前者称为名字节点 ( a N d )后者称为数据节点 ( a N d ) s和 e l, v N me o e, D t oe。理论上一台计算机 a可以运行多个 D tN d a oe进程、个 N me o e程 (个进程在整个集群中是唯一的 )但是在实际情况中往 a一 a Nd进这,

往是一台计算机只运行一个 D tN d a oe或 N m N d。一个文件被分割成若干 Bok存储在一组 D tN d。 a a e oe l c a oe上 a

N m N d负责打开、 a e oe关闭和重命名文件及目录,同时建立 Bok与 D t oe间的映射。D t oe l c a Nd之 a a N d负责响 a

应客户的读/需求,写同时在 N m N d a e oe的指挥下实现 Bok的建立、 lc删除以及复制。图 1 H F构图。为 D S架

收稿日期: 00— 3— 8 2 1 0 0

作者简介:许春玲 (9 0一)女, 18,硕士研究生,主要研究方向为云计算与分布式架构。 基金项目:中国科学院计算机科学国家重点实验室开放课题 (编号 S S F9 8; Y K 00 )江苏省高校自然科学基金项目(编号

0 K B 20 0。 8 J 50 1 )

hdfs文件系统和linux文件系统,分布式文件系统HADOOP HDFS与传统文件系统LINUX FS的比较与分析...相关推荐

  1. Linux和DOS文件系统的区别,对比Linux文件系统和DOS文件系统

    对比Linux文件系统和DOS文件系统 二 盖 氢拿 对比 文件系统和 娄 秦皇岛职业技术学院 文件系统 雨 河北 秦皇岛 [摘 ,. 共]件系统是操作系统用以表明磁盘或分区上的文件的一种方法以及数据 ...

  2. 一幅长文细学华为MRS大数据开发(二)——HDFS分布式文件系统和ZooKeeper

    文章目录 2 HDFS分布式文件系统和ZooKeeper 2.1 HDFS概述以及应用场景 HDFS概述 HDFS应用场景 HDFS不适合的场景 2.2 HDFS相关概念 计算机集群结构 基本系统架构 ...

  3. 谷歌技术“三宝”之一的Google文件系统和Kosmos 文件系统

    转:http://www.cppblog.com/jack-wang/archive/2010/02/26/108503.aspx 谷歌技术"三宝"之一的Google文件系统和Ko ...

  4. Linux基础知识--2.Linux的文件系统和bash的基础特性(1)

    Linux基础知识--linux的文件系统和bash的基础特性 一.Linux文件系统: Linux文件系统中的文件是数据的集合,文件系统不仅包含着文件中的数据而且还有文件系统的结构,所有Linux ...

  5. Mysql复习计划(一)- 字符集、文件系统和SQL执行流程

    Mysql复习计划(一)- 字符集.文件系统和SQL执行流程 前言 一. Mysql字符集 1.1 Mysql5.7和8.0的默认字符集 1.1.1 修改默认的字符集 1.1.2 修改已有库表的字符集 ...

  6. Linux伪分布式安装Hadoop

    Linux伪分布式安装Hadoop 1. 更新软件列表 hadoop@jeff:~$ sudo apt update 2. 安装vim编辑器 hadoop@jeff:/home/jeff$ sudo ...

  7. shell 删除了hdfs 文件_知识干货 | 大数据全解 HDFS分布式文件系统

                                                                                      HDFS概述 Hadoop分布式文件 ...

  8. HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)

    异常信息: 13/09/11 12:12:06 INFO hdfs.DFSClient: SMALL_BUFFER_SIZE is 512 org.apache.hadoop.ipc.RemoteEx ...

  9. ext4 文件系统和XFS文件系统的对比

    ext4和XFS是Linux操作系统中常见的两种文件系统.它们都是现代的高性能文件系统,各自具有优缺点.以下是它们之间的比较: 性能:XFS在处理大文件和大目录时比ext4表现更好.而ext4在处理小 ...

最新文章

  1. 汇编 整数变量 浮点数变量 符号常量
  2. Ubuntu下 Hadoop 1.2.1 配置安装
  3. 《黑客大曝光:移动应用安全揭秘及防护措施》一2.2 攻击与对策
  4. Linux学习十七、正规表达式练习题
  5. 95-130-340-源码-source-kafka相关-FlinkKafkaConsumer分析
  6. java正则 链接_Java使用正则表达式匹配获取链接地址的方法示例
  7. kafak 命令使用
  8. 虚幻引擎5 C++游戏开发教程
  9. IOS校园网破解更新了
  10. 阿里云如何选择带宽计费模式和带宽值
  11. 机器学习——武林盟主分享机器学习之武功秘籍
  12. 联想Y460 XP下独显叹号
  13. oracle让电脑变卡以及解决方法
  14. 将指定的计数添加到该信号量中会导致其超过最大计数
  15. Web前端第三阶段--DOM
  16. 同向放大器、反向放大器的区别
  17. 手机与单片机NFC通讯方案,手机NFC通讯方案,单片机NFC通信方案
  18. Activiti工作流查询待办和已办
  19. ultraedit查看方式没有html,UltraEdit查看文本编码类型
  20. SHIF算法原理分析

热门文章

  1. 对称加密和非对称加密是什么?
  2. 重读GPDB 和 TiDB 论文引发的 HTAP 数据库再思考
  3. Server 2016/Windows 10使用域管理员账户操作提示权限不足的问题
  4. 【linux】监控和管理linux进程
  5. 解决vs2019 16.5版本中 编译虚幻4c++ bool值报错问题
  6. batch_prob_classify
  7. Visual studio 词汇
  8. 19 个接私活平台,有技术就有钱
  9. Python读取EXCEL省份数据绘制地图
  10. SC系列 (SC-16S) 低频率小型SMD石英晶振 SC-16S 32.768KHZ 12.5PF/20PPM