hadoop--HDFS_DataNode工作机制
目录
- DataNode工作机制
- 数据完整性
- DataNode掉线时限参数设置
DataNode工作机制
DataNode工作机制:
1.一个数据块再DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是原数据包括数据块的长度,块数据的校验和,以及时间戳;
2.DataNode启动后向NameNode注册,通过后,周期性(6hr)的向NameNode上报所有的块信息。
3.心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令,如复制块数据到另一台机器/或删除某个数据块。 如果超过10分钟没有收到某个DataNode的心跳,
4.集群运行中可以安全加入和推出一些机器。
tips: DataNode先自查再汇报:
DN扫描自己节点块信息列表的时间,默认6小时;
DN向NN汇报当前解读信息的时间间隔,默认6小时;
数据完整性
问:如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号(1)和绿灯信号(0),但是存储该数据的磁盘坏了,一直显示是绿灯,就会造成危险。
同理若DataNode节点上的数据损坏了,却一直没有发现,那该如何解决 呢?
DataNode节点保证数据完整性的方法:
1.当DataNode读取block的时候,它会计算校验和CheckSum;
2.如何计算后的CheckSum与block创建时的值不一样,说明block已经损坏;
3.Client读取其他DataNode上的Block;
4.常见的校验算法crc(32), md5(128), sga1(160);
5.DataNode在其文件创建后周期验证CheckSum。
DataNode掉线时限参数设置
TimeOut = 2 * 5 + 10 * 3;
tips: hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒
,dfs.heartbeat.interval 的单位为秒
;
hadoop--HDFS_DataNode工作机制相关推荐
- Hadoop大数据分布式文件系统hdfs的工作机制
HDFS集群分为两大角色:NameNode.DataNode NameNode负责管理整个文件系统的元数据 DataNode 负责管理用户的文件数据块 namenode工作机制 namenode职责: ...
- 王家林 云计算分布式大数据Hadoop实战高手之路第七讲Hadoop图文训练课程:通过HDFS的心跳来测试replication具体的工作机制和流程...
这一讲主要深入使用HDFS命令行工具操作Hadoop分布式集群,主要是通过实验的配置hdfs-site.xml文件的心跳来测试replication具体的工作和流程. 通过HDFS的心跳来测试repl ...
- Hadoop之Yarn工作机制详解
Hadoop之Yarn工作机制详解 目录 Yarn概述 Yarn基本架构 Yarn工作机制 作业提交全过程详解 1. Yarn概述 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于 ...
- Hadoop之ReduceTask工作机制
Hadoop之ReduceTask工作机制 目录 设置ReduceTask并行度(个数) 注意 实验:测试reducetask多少合适 ReduceTask工作机制 1. 设置ReduceTask并行 ...
- Hadoop之MapTask工作机制
Hadoop之MapTask工作机制 目录 并行度决定机制 MapTask工作机制 1. 并行度决定机制 问题引出 maptask的并行度决定map阶段的任务处理并发度,进而影响到整个job的处理速度 ...
- Hadoop之DataNode工作机制
Hadoop之DataNode工作机制 目录 DataNode工作机制 数据完整性 掉线时限参数设置 1. DataNode工作机制 DataNode工作机制如下图 一个数据块在DataNode上以文 ...
- Hadoop之NameNode和SecondaryNameNode工作机制详解
Hadoop之NameNode和SecondaryNameNode工作机制详解 NN和2NN工作机制 NN和2NN工作机制详解 Fsimage和Edits解析 checkpoint时间设置 1. NN ...
- Hadoop框架:DataNode工作机制详解
本文源码:GitHub·点这里 || GitEE·点这里 一.工作机制 1.基础描述 DataNode上数据块以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是数据块元数据包括长度.校验.时 ...
- 大数据之-Hadoop3.x_Hadoop之HDFS_DataNode的工作机制_原理---大数据之hadoop3.x工作笔记0077
然后我们再来看一下hadoop中,datanode的工作机制. 1.datanode1,比如启动的时候,它会向namenode进行注册,把自己的信息,比如我存了哪些block块信息, 块中存了块数据, ...
- Hadoop生态圈(十三)- Namenode元数据管理及各组件工作机制
目录 前言 1. Namenode元数据管理 1.1 元数据是什么 1.2 元数据管理概述 1.2.1 内存元数据 1.2.2 磁盘元数据 1.2.2.1 fsimage内存镜像文件 1.2.2.2 ...
最新文章
- 数组专题——找重复数字 利用下标
- Java学习日志(一)
- USB、TTL电平、232电平之间的相互转换
- java静态内部类了解一下
- 第一节《Git初始化》
- 微信小程序 - 高级 - 深度实践 - wx:for 与 wx:for-items 与 wx:for-item 与 wx:key - 2 嵌套菜单的中文展示的方法 - 和官网不同
- 手动挡五个档位示意图_★手动挡汽车档位图解
- caffe data层_Caffe Softmax层的实现原理?
- java 参数注入_Java通过反射,注入参数
- 凸优化有关的数值线性代数知识一:矩阵结构与算法复杂性
- java随机数Reandom(简单介绍)
- OpenGL 概念整理
- 简析Windows Linux的内核映射
- delphi2007 注册码
- mysql图书管理系统设计答辩_基于微信的图书管理系统毕业论文+任务书+开题报告+答辩PPT+前后台(Java+Mysql)源码及数据库文件...
- win11家庭版使用远程桌面-RDPWrapper常见问题
- 多元有序logistic回归分析_多元logistics回归分析
- 空间解析几何 | 空间曲线的切向量与曲面的法向量
- 开源了一个私人云盘——蓝眼云盘
- 汉诺塔_-Chaz-_新浪博客