交朋友增体面,不如交朋友益身心
教子弟求显荣,不如教子弟立品行

推荐书目电子版下载

Hadoop必读书目(精选)
本文参考文献包含于上述书籍

HDFS快速入门

Hadoop分布式文件系统(HDFS)快速入门

HDFS知识梳理详细版

Hadoop分布式文件系统(HDFS)知识梳理(超详细)

HDFS文件系统详细介绍

Hadoop有一个抽象的文件系统概念,HDFS只是其中的一个实现
Java抽象类org.apache.hadoop.fs.FileSystem定义了Hadoop中一个文件系统的客户端接口,并且该抽象类有几个具体实现,其中和Hadoop紧密相关的见下表

文件系统 URI方案 Java实现(都在org.apache.hadoop包中) 描述
Local file fs.LocalFileSystem 使用客户端校验和的本地磁盘文件系统
使用RawLocalFileSystem表示无校验和的本地磁盘文件系统
HDFS hdfs hdfs.DistributedFileSystem Hadoop的分布式文件系统
将HDFS设计成与MapReduce结合使用,可以实现高性能
WebHDFS Webhdfs Hdfs.web.WebHdfsFileSystem 基于HTTP的文件系统,提供对HDFS的认证读/写访问
Secure WebHDFS swebhdfs hdfs.web.SWebHdfsFileSystem WebHDFS的HTTPS版本
HAR har fs.HarFileSystem 一个构件在其他文件系统之上用于文件存档的文件系统
Hadoop存档文件系统通常用于将HDFS中的多个文件打包成一个存档文件,以减少NameNode内存的使用
使用Hadoop的achive命令来创建HAR文件
View viewfs viewfs.ViewFileSystem 针对其他Hadoop文件系统的客户端挂载表
通常用于为联邦NameNode创建挂载点
FTP ftp fs.ftp.FTPFileSystem 由FTP服务器支持的文件系统
S3 S3a fs.s3a.S3AFileSystem 由Amazon S3支持的文件系统,代替老版本的s3n(S3 原生)实现
Azure wasb fs.azure.NativeAzureFileSystem 由Microsoft Azure支持的文件系统
Swift swift fs.swift.snative.SwiftNativeFileSystem 由OpenStack Swift支持的文件系统

Hadoop对文件系统提供了许多接口,它一般使用URI方案来选取合适的文件系统实例进行交互
命令hadoop fs -ls file:可以列出本地文件系统根目录下的文件

接口

Hadoop是用Java写的,通过Java API可以调用大部分Hadoop文件系统的交互操作,比如文件系统的命令解释器就是一个Java命令,它是用Java的FileSystem类来提供文件系统操作
下面是一些文件系统接口介绍,这些接口通常与HDFS一同使用,因为Hadoop中的其它文件系统一般有访问基本文件系统的工具,但它们大多数都能用于任何Hadoop文件系统

  1. HTTP
  • 由WebHDFS协议提供的HTTPP REST API使得其他语言开发的应用能够很方便地与HDFS交互
  • HTTP接口比原生的Java客户端要慢,尽量不要使用它来传输特大数据
  • 通过HTTP访问HDFS有两种方法,两者都使用了WebHDFS协议
    • 直接访问
      HDFS守护进程直接服务于来自客户端的HTTP请求
    • 通过代理(一个或多个)访问
      客户端通常使用DistributedFileSystem API访问HDFS
  1. C语言
  • Hadoop提供一个名为libhdfs的C语言库,该语言库是Java FileSystem接口类的一个镜像(它被写成访问HDFS的C语言库,但其实它可以访问任何一个Hadoop文件系统)
  • 使用Java原生接口(JNI)调用Java文件系统客户端
  • 还有一个libwebhdfs库,该库使用了WebHDFS接口
  • 其开发滞后于Java API,一些新特性不支持
  1. NFS
  • 使用Hadoop的NFSv3网关将HDFS挂载为本地客户端的文件系统是可行的
  • 可以使用Unix实用程序(如ls和cat)与该文件系统交互,上传文件,通过任意一种编程语言调用POSIX库来访问文件系统
  • 关于如何配置和运行NFS网关,以及如何从客户端连接网关,可以参考Hadoop官网相关文档资料
  1. FUSE
  • 用户空间文件系统(Filesystem in Userspace)允许将用户空间实现的文件系统作为Unix文件系统进行集成
  • 通过使用Hadoop的Fuse-DFS功能模块,HDFS(或任何一个Hadoop)文件系统均可以作为一个标准的本地文件系统进行挂载
  • Fuse-DFSS是用C语言实现的,使用libhdfs作为访问HDFS的接口
  • 在写操作时,Hadoop NFS网关对于挂载HDFS来说是更健壮的解决方案,相比Fuse-DFS而言应优先选择

Hadoop分布式文件系统(HDFS)之文件系统(详细版)相关推荐

  1. Hadoop分布式文件系统命令行接口(HDFS Shell)详细版

    处事有何定凭?但求此心过得去 立业无论大小,总要此身做得来 HDFS快速入门 Hadoop分布式文件系统(HDFS)快速入门 HDFS知识梳理详细版 Hadoop分布式文件系统(HDFS)知识梳理(超 ...

  2. Hadoop分布式集群搭建完全详细教程

    Hadoop分布式集群环境搭建步骤如下 实验环境: 系统:win7 内存:8G(因要开虚拟机,内存建议不低于8G) 硬盘:建议固态 虚拟机:VMware 12 Linux:Centos 7 jdk1. ...

  3. hadoop集群搭建(超详细版)

    1.准备好需要安装的软件 虚拟机VMware12.pro 操作系统CentOS 6.5 远程控制虚拟机的终端SecureCRT8.1 2.在虚拟机中安装CentOS操作系统 安装好虚拟机,图形界面如下 ...

  4. 【hadoop期末复习】第三章 分布式文件系统HDFS 超详细讲解(更新完毕)

    ** 本专栏的Hadoop复习计划文章内容主要包含以下几个部分: [简单]学习通习题 [进阶]课本课后练习 [操作]相关章节实验回顾 ** 使用教材:大数据技术原理与应用(第3版)林子雨 编著 ** ...

  5. JAVA大数据(二) Hadoop 分布式文件系统HDFS 架构,MapReduce介绍,Yarn资源调度

    文章目录 1.分布式文件系统HDFS 1.HDFS的来源 2.HDFS的架构图之基础架构 2.1 master/slave 架构 2.2 名字空间(NameSpace) 2.3 文件操作 2.4副本机 ...

  6. Hadoop技术(一)分布式文件系统HDFS

    分布式文件系统HDFS 第一章 统一思维 单机大数据处理实现以及问题 问题引入 现在收集到的想法 问题升级 第二章 Hadoop 一 Hadoop简介 HDFS优点 HDFS缺点 二 Hadoop分布 ...

  7. Hadoop之HDFS:Hadoop分布式文件系统--具体知识点

    HDFS:Hadoop分布式文件系统 下面是HDFS的具体知识点,个人学习笔记戳这 文章目录 HDFS:Hadoop分布式文件系统 一.学习准备 二.课堂主题 三.课堂目标 四.知识要点 1. had ...

  8. Hadoop分布式文件系统--HDFS结构分析

    前言 在Hadoop内部,详细实现了很多类的文件系统,当然最最被我们用到的就是他的分布式文件系统HDFS了. 可是本篇文章不会讲HDFS的主从架构等东西,由于这些东西网上和资料书中都讲得非常多了. 所 ...

  9. 深入理解HDFS:Hadoop分布式文件系统

    深入理解HDFS:Hadoop分布式文件系统 文本详细介绍了HDFS中的许多概念,对于理解Hadoop分布式文件系统很有帮助. 1. 介绍 在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器 ...

最新文章

  1. Ajax应用需要注意的事项
  2. mysql 分区 性能更差_用案例分析MySQL 5.7分区表性能下降的根本原因
  3. request对象作为:作用域
  4. UVALive - 6442
  5. jquery基础使用!
  6. 【svn】Centos搭建svn服务器环境
  7. 『nForce主板』巧妙去掉“安全删除硬盘”图标!
  8. SOEM报文数据结构介绍
  9. tplink 服务器未响应,详解win10安装tplink网卡免驱版无法用关键操作方法
  10. 接口测试面试题及参考答案(汇总),真香
  11. cdr 表格自动填充文字_372集最新CDR全套教程:视频+素材+案例,从新手到大师只要一个月...
  12. 【Elementory OS 6】安装 tweak
  13. 关于DoG角点检测matlab实现
  14. JZ38 字符串的排列
  15. webpack Uncaught ReferenceError: Swiper is not defined
  16. Rk3326 Android8.0HAL服务添加
  17. 青龙面板-- 咸鱼吃鱼(废-已不能使用)
  18. Testbench编写指南(2)文件的读写操作
  19. 最全自动驾驶数据集分享系列八 | 仿真数据集
  20. PS打不开php,ps卡住了没保存怎么办?

热门文章

  1. 复杂系统学习(七):基于代理的模型I
  2. 常用的百度和谷歌搜索语法
  3. 【翻译】★VERTEBRA-FOCUSED LANDMARK DETECTION FOR SCOLIOSIS ASSESSMENT
  4. 程序出错,找不到问题在哪?——我给你方法
  5. 史上最简单直接截图识别的latex公式编辑器
  6. 树莓派3b写PHP代码可以吗,如何让LabVIEW程序运行在树莓派3B(此处有坑)
  7. 手绘地图制作的关键点之“实时导航”
  8. 程序员如何护眼和避免头痛
  9. Android源码下载网址
  10. 嵌入式五种重要概念串口、COM口、TTL、RS232、RS485的区别详解