目录

  • DataNode工作机制
  • 数据完整性
  • DataNode掉线时限参数设置

DataNode工作机制


DataNode工作机制:

1.一个数据块再DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是原数据包括数据块的长度,块数据的校验和,以及时间戳;

2.DataNode启动后向NameNode注册,通过后,周期性(6hr)的向NameNode上报所有的块信息。

3.心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令,如复制块数据到另一台机器/或删除某个数据块。 如果超过10分钟没有收到某个DataNode的心跳,

4.集群运行中可以安全加入和推出一些机器。

tips: DataNode先自查再汇报:
DN扫描自己节点块信息列表的时间,默认6小时;

DN向NN汇报当前解读信息的时间间隔,默认6小时;

数据完整性

问:如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号(1)和绿灯信号(0),但是存储该数据的磁盘坏了,一直显示是绿灯,就会造成危险。
同理若DataNode节点上的数据损坏了,却一直没有发现,那该如何解决 呢?

DataNode节点保证数据完整性的方法:

1.当DataNode读取block的时候,它会计算校验和CheckSum;

2.如何计算后的CheckSum与block创建时的值不一样,说明block已经损坏;

3.Client读取其他DataNode上的Block;

4.常见的校验算法crc(32), md5(128), sga1(160);

5.DataNode在其文件创建后周期验证CheckSum。

DataNode掉线时限参数设置


TimeOut = 2 * 5 + 10 * 3;

tips: hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒,dfs.heartbeat.interval 的单位为

hadoop--HDFS_DataNode工作机制相关推荐

  1. Hadoop大数据分布式文件系统hdfs的工作机制

    HDFS集群分为两大角色:NameNode.DataNode NameNode负责管理整个文件系统的元数据 DataNode 负责管理用户的文件数据块 namenode工作机制 namenode职责: ...

  2. 王家林 云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程:通过HDFS的心跳来测试replication具体的工作机制和流程...

    这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群,主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程. 通过HDFS的心跳来测试repl ...

  3. Hadoop之Yarn工作机制详解

    Hadoop之Yarn工作机制详解 目录 Yarn概述 Yarn基本架构 Yarn工作机制 作业提交全过程详解 1. Yarn概述 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于 ...

  4. Hadoop之ReduceTask工作机制

    Hadoop之ReduceTask工作机制 目录 设置ReduceTask并行度(个数) 注意 实验:测试reducetask多少合适 ReduceTask工作机制 1. 设置ReduceTask并行 ...

  5. Hadoop之MapTask工作机制

    Hadoop之MapTask工作机制 目录 并行度决定机制 MapTask工作机制 1. 并行度决定机制 问题引出 maptask的并行度决定map阶段的任务处理并发度,进而影响到整个job的处理速度 ...

  6. Hadoop之DataNode工作机制

    Hadoop之DataNode工作机制 目录 DataNode工作机制 数据完整性 掉线时限参数设置 1. DataNode工作机制 DataNode工作机制如下图 一个数据块在DataNode上以文 ...

  7. Hadoop之NameNode和SecondaryNameNode工作机制详解

    Hadoop之NameNode和SecondaryNameNode工作机制详解 NN和2NN工作机制 NN和2NN工作机制详解 Fsimage和Edits解析 checkpoint时间设置 1. NN ...

  8. Hadoop框架:DataNode工作机制详解

    本文源码:GitHub·点这里 || GitEE·点这里 一.工作机制 1.基础描述 DataNode上数据块以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是数据块元数据包括长度.校验.时 ...

  9. 大数据之-Hadoop3.x_Hadoop之HDFS_DataNode的工作机制_原理---大数据之hadoop3.x工作笔记0077

    然后我们再来看一下hadoop中,datanode的工作机制. 1.datanode1,比如启动的时候,它会向namenode进行注册,把自己的信息,比如我存了哪些block块信息, 块中存了块数据, ...

  10. Hadoop生态圈(十三)- Namenode元数据管理及各组件工作机制

    目录 前言 1. Namenode元数据管理 1.1 元数据是什么 1.2 元数据管理概述 1.2.1 内存元数据 1.2.2 磁盘元数据 1.2.2.1 fsimage内存镜像文件 1.2.2.2 ...

最新文章

  1. 数组专题——找重复数字 利用下标
  2. Java学习日志(一)
  3. USB、TTL电平、232电平之间的相互转换
  4. java静态内部类了解一下
  5. 第一节《Git初始化》
  6. 微信小程序 - 高级 - 深度实践 - wx:for 与 wx:for-items 与 wx:for-item 与 wx:key - 2 嵌套菜单的中文展示的方法 - 和官网不同
  7. 手动挡五个档位示意图_★手动挡汽车档位图解
  8. caffe data层_Caffe Softmax层的实现原理?
  9. java 参数注入_Java通过反射,注入参数
  10. 凸优化有关的数值线性代数知识一:矩阵结构与算法复杂性
  11. java随机数Reandom(简单介绍)
  12. OpenGL 概念整理
  13. 简析Windows Linux的内核映射
  14. delphi2007 注册码
  15. mysql图书管理系统设计答辩_基于微信的图书管理系统毕业论文+任务书+开题报告+答辩PPT+前后台(Java+Mysql)源码及数据库文件...
  16. win11家庭版使用远程桌面-RDPWrapper常见问题
  17. 多元有序logistic回归分析_多元logistics回归分析
  18. 空间解析几何 | 空间曲线的切向量与曲面的法向量
  19. 开源了一个私人云盘——蓝眼云盘
  20. 汉诺塔_-Chaz-_新浪博客

热门文章

  1. (数据库系统概论|王珊)第七章数据库设计:习题
  2. linux ulimit
  3. C++设计模式-Factory工厂模式
  4. c++ winpcap开发(8)
  5. c++ winpcap开发(6)
  6. vs2013 编译libevent32和64bit
  7. poj2385 基础的动态规划算法 挑战程序设计竞赛
  8. linux下的缓存机制及清理buffer/cache/swap的方法梳理
  9. Python问题记录:如何处理中文网页中的多余空格
  10. 详解 6 大主流深度学习框架