• Dfs:hdfs文件系统,data:datanode目录,name:namenode目录
  • Mapred:MapReduce目录

Name目录:

1.Current:里面包含edits、fsimage、seen_txid、VERSION

  • edits 日志:客户端执行写操作会先写入edits日志,并且在内存中保留
  • Fsimage :namenode的镜像文件,每次checkpoing(合并所有edits到一个fsimage的过程)产生的最终的fsimage,同时会生成一个.md5的文件用来对文件做完整性校验
  • Seen_txid :非常重要,他代表namenode的edits*文件尾数,namenode重启时会循序从头跑 edits_0000001~到 seen_txid 的数字。如果format之后会是0
  • Version :记录了集群的信息
    1. namespaceID/clusterID/blockpoolID:在联邦机制中很重要,联邦模式下,会有多个 NameNode 独立工作。每个的 NameNode 提供唯一的命名空(namespaceID),并管理一组唯一的文件块池(blockpoolID)
    2. cTime NameNode: 存储系统创建时间,首次格式化文件系统这个属性是 0,当文件系统升级之后,该值会更新到升级之后的时间戳
  1. In_use.lock:防止一台机器同时启动多个Namenode进程导致目录数据不一致

data目录:

current:包含version和bp目录:

BP-random integer-NameNode-IP address-creation time:BP代表BlockPool的,就是Namenode的VERSION中的集群唯一blockpoolID,IP部分和时间戳代表创建该BP的NameNode的IP地址和创建时间戳。bp目录下包括:dfsused,finalized,rbw

  1. dfsused目录:记录了dfs使用的容量的使用大小
  2. finalized文件夹:这两个目录都是用于实际存储HDFS BLOCK的数据,里面包含许多block_xx文件以及相应的.meta文件,.meta文件包含了checksum信息。
  3. rbw 文件夹:表示文件副本正在写入
  4. tmp文件夹 :表示该副本正在被创建。

说明

  • blk文件:HDFS中的文件块本身,存储的是原始文件内容
  • 使用.meta后缀标识:元数据文件由一个包含版本和类型信息的头文件和一系列块的区域校验和组成
  • 当数据目录中的块文件达到64个之后,DataNode会在该目录下建立一个子目录(subdirn),将这些块文件移动到该目录下,以避免一个目录存储过多的文件,影响了系统的性能。
  • rbw文件:表示该副本正在写入或追加数据。
  • rwr:如果DataNode宕机或重启,处于RBW状态的副本将转换为RWR状态,不会在接受新数据的写入。
  • RUR :当租约到期,NameNode将为客户端关闭其所占用的副本,这将使该副本进入RUR状态。

Version

版本的信息

hadoop文件目录详解相关推荐

  1. 《Hadoop技术详解》一导读

    前 言 Hadoop技术详解 本书采用的约定 本书采用以下排版约定. 斜体 用于表明新的术语.URL.电子邮件地址.文件名和文件扩展名. 等宽字体 用于程序清单,正文段落中有关的程序元素,如变量及函数 ...

  2. Apache Hadoop版本详解

    由doop版本混乱多变,因此,Hadoop的版本选择问题一直令很多初级用户苦恼.本文总结了ApacheHadoop和Cloudera Hadoop的版本衍化过程,并给出了选择Hadoop版本的一些建议 ...

  3. Hadoop Streaming详解

    一: Hadoop Streaming详解 1.Streaming的作用 Hadoop Streaming框架,最大的好处是,让任何语言编写的map, reduce程序能够在hadoop集群上运行:m ...

  4. Hadoop日志详解

    文章目录 1 Hadoop日志详解 2 Hadoop 系统服务输出的日志 2.1 修改Hadoop系统服务日志目录(包括NameNode.secondarynamenode.datanode.reso ...

  5. Hi3516A开发--常用指令和根文件目录详解

    一.常用命令 #arch                                              #显示机器的处理器架构 # uname -a                     ...

  6. hadoop生态圈详解

    1.hadoop架构及作用 (1)Common hadoop核心组件,基本jar包依赖,公共工具程序 (2)HDFS(Hadoop Distributed File System) 分布式文件系统,解 ...

  7. hadoop配置文件详解系列(二)-hdfs-site.xml篇

    上一篇介绍了core-site.xml的配置,本篇继续介绍hdfs-site.xml的配置. 属性名称 属性值 描述 hadoop.hdfs.configuration.version 1 配置文件的 ...

  8. Hadoop核心组件详解—HDFS、YARN、MapReduce

    Hadoop 是一个开源的分布式计算和存储框架,它的作用非常简单,就是在多计算机集群环境中营造一个统一而稳定的存储和计算环境,并能为其他分布式应用服务提供平台支持,相当于在某种程度上将多台计算机组织成 ...

  9. Hadoop NameNode详解

    NameNode在内存中保存着整个文件系统的名字空间和文件数据块的地址映射(Blockmap).如果NameNode宕机,那么整个集群就瘫痪了 整个HDFS可存储的文件数受限于NameNode的内存大 ...

最新文章

  1. 使用sourceInsight 提高代码编写效率
  2. zqgame《每日一言》
  3. NPOI 导出 excel 性能测试
  4. CF1419E-Decryption【数论,dfs】
  5. 小白来学C语言之宏定义(#define)
  6. LQR轨迹跟踪算法Python/Matlab算法实现_代码(2)
  7. 测试开发必备技能-Jmeter二次开发
  8. 项目开发:网上书店(详细的开发流程记录)----注册登录功能,通过邮件验证
  9. 2019年美赛获奖分享经验
  10. tcpdf 使用总结
  11. java migration_EF Add-Migration总结
  12. POI导出excel,按照父子节点进行分级显示
  13. java timeunit_java并发之TimeUnit
  14. 微信小程序图片在不同设备显示保持图片比例并且居中
  15. iar 预编译会把非条件的去掉_IAR使用最全方法.docx
  16. python 数据分析入门教程(三)_Python数据分析入门教程(三):数据选择——AIU人工智能学院-经管之家官网!...
  17. Docker/Podman使用提高---docker-compose基础(python3)
  18. mysql-8.0.13-winx64安装卸载配置使用教程
  19. 中国人为什么精于计算而输于思维?
  20. Telerik UI 2022 R2 SP1 Retail-Not Crack

热门文章

  1. 感动世界的50首歌和他们背后的故事2
  2. 计算机中级证书是几级
  3. docker集群部署
  4. IdUtils工具类
  5. QT图片叠加CompositionMode效果一览
  6. python解析html基础操作
  7. Java事件模型与Android事件模型的比较
  8. Snipaste 使用方法
  9. 服务器无盘启动慢什么情况,网吧无盘系统电脑启动慢是怎么回事?
  10. DETR-二分图匹配 匈牙利算法