HDFS(Hadoop Distributed File System) 是 Hadoop 的一个重要的模块,它像磁盘阵列一样能够在分布式环境中构建一个文件系统。由于数据块从多个节上存取,也就能突破单点的网络带宽和硬件资源的限制而获得更好的性能; 能处理更大的数据,和克服单点故障的问题。许多公司正在使用 HDFS 构建自己的分布式文件系统,还比支持它的应用有 Spark, Presto, Hive, HBase, Zeppelin 等。

本文将实战自己搭建一个 HDFS 分布式文件系统,体验最基本的 HDFS 文件操作,看看它是如何分布文件块,以及如何进行冗余容错的。

本次实战环境:

  1. macOS Big Sur 11.7, VirtualBox 6.1.32 r149290, Vagrant 2.2.19
  2. Vagrant Ubuntu 22.04 LTS 虚拟机
  3. Open JDK 8
  4. Hadoop 3.3.4

我们将使用 4 个 Vagrant 虚拟机,其中一个为 NameNode, 其余为 DataNode。HDFS 沿袭了传统的 Master/Slave 系统架构,但因目前像传统的计算机名词 PC, CRT 被恶意使用的当下,Master/Slave 相应的更名为 NameNode 和 DataNode。在通常的系统中, Master 兼具协调与数据存储的功能,而 Slave 只存储数据,而 HDFS 的 NameNode 仅保管文件的元信息,数据块存储在 DataNode 中。

阅读全文 >>

HDFS 分布式文件系统的搭建与使用相关推荐

  1. HDFS分布式文件系统架构

    文章目录 HDFS分布式文件系统架构 1.HDFS概论与基础框架结构 HDFS基础介绍 HDFS设计架构 HDFS设计结构-NameNode HDFS设计结构-DataNode HDFS设计结构-Cl ...

  2. 大数据开发基础入门与项目实战(三)Hadoop核心及生态圈技术栈之2.HDFS分布式文件系统

    文章目录 前言 1.HDFS特点 2.命令行和API操作HDFS (1)Shell命令行客户端 (2)API客户端连接HDFS的两种方式 (3)API客户端上传下载文件 (4)API客户端文件详情及文 ...

  3. hadoop历史背景hdfs分布式文件系统hadoop的集群模式单机模式伪分布

    hadoop历史背景&hdfs分布式文件系统&hadoop的集群模式&单机模式&伪分布 1.hadoop的历史背景 lucense ---->nutch----& ...

  4. 2021年大数据Hadoop(七):HDFS分布式文件系统简介

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 HDFS分布式文件系统 ...

  5. Hadoop HDFS分布式文件系统 常用命令汇总

    引言:我们维护hadoop系统的时候,必不可少需要对HDFS分布式文件系统做操作,例如拷贝一个文件/目录,查看HDFS文件系统目录下的内容,删除HDFS文件系统中的内容(文件/目录),还有HDFS管理 ...

  6. MFS分布式文件系统的搭建

    MFS分布式文件系统的搭建 一:介绍MFS ​ MFS(MooseFS)是一个具有容错性的网络分布式文件系统.它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源. MFS也像其他类的 ...

  7. HDFS:分布式文件系统(1)

    HDFS:分布式文件系统 目录 HDFS:分布式文件系统 1.计算机集群结构 2.HDFS优缺点 3.块Block 4.名称节点和数据结点(nameNode[NN]&DateNode[DN]) ...

  8. 0.HDFS分布式文件系统

    HDFS分布式文件系统 1. Hadoop是什么(20分钟) 1.1 Hadoop架构 HDFS (Hadoop Distributed File System)文件系统:存文件读文件的一个系统 Ha ...

  9. HDFS分布式文件系统具有哪些优点?

    随着互联网数据规模的不断增大,对文件存储系统提出了更高的要求,需要更大的容量.更好的性能以及更高安全性的文件存储系统,与传统分布式文件系统一样,HDFS分布式文件系统也是通过计算机网络与节点相连,但也 ...

最新文章

  1. 传统网站性能优化的三种手段
  2. 【CV】关注度越来越高的行人重识别,有哪些热点?
  3. MySQL中获取天、周、月等数据
  4. 破解sina新浪邮箱密码
  5. postgreSQL除法保留小数
  6. JS键盘KEYCODE值参考
  7. MapServer使用笔记(二)
  8. Atitit 2017年第68界机器视觉图像处理学术大会会议记要attilax总结自建学院自颁学位理论
  9. android异步任务框架,详解Android App中的AsyncTask异步任务执行方式
  10. 百度前员工因内网发布“女优一览表”被辞退,自诉:想转鉴黄师
  11. html5编写软件哪个好?八款html5编写软件推荐
  12. onselect 与 onselectstart
  13. LCD驱动(FrameBuffer)实例开发讲解
  14. 对Si446x驱动库的一些修改
  15. 1.1哈恩巴纳赫定理
  16. 同济大学计算机科学系下设几个专业,同济大学计算机科学与技术工程系简介
  17. android5.0模拟器pc版,逍遥安卓独家发布支持5.0安卓系统电脑模拟器
  18. mysql 时区设定_mysql的时区设置
  19. 用 pc 抓取 vlan tag 的数据包
  20. 【PHP】进一法取整、四舍五入取整、忽略小数等的取整数方法大全

热门文章

  1. 同城废品垃圾废纸家电塑料金属废品回收+家政保洁+回收员骑手+商家入驻+回收站入住【uniapp+thinkphp】开源独立
  2. validated 验证数组_Spring Boot 快速入门系列(VIII)—— 数据校验篇之 @Valid @Validated...
  3. 【物联网】10.物联网数据库 - SQL
  4. 一个快速制作表格的方法,和熬夜做表say拜拜
  5. 旋流除砂器的应用原理以及在水除砂分离中的应用优势
  6. React Native调用Android接口
  7. 跨境电商模式 Cross-Border Electronic Commerce (跨境网络零售)
  8. OpenCV-Python学习笔记(一):图像读入、显示、保存,BGR模式转RGB模式
  9. xftp安装包_Vos3000 6.0、vos3000 7.0安装教程和安装包
  10. 演示:设置密码长度限制、密码加强