Hadoop 03_核心:读写流程
Hadoop1.0核心
HDFS读写流程:
写流程:
读流程:
------------------------------------------------------------------------------
安全模式
namenode启动的时候,首先将映像文件(fsimage)载入内存,并执行编辑日志(edits)中的各项操作。
一旦在内存中成功建立文件系统元数据的映射,则创建一个新的fsimage文件(这个操作不需要SecondaryNameNode)和一个空的编辑日志。
此刻namenode运行在安全模式。即namenode的文件系统对于客服端来说是只读的。(显示目录,显示文件内容等。写、删除、重命名都会失败,尚未获取动态信息)。
在此阶段Namenode收集各个datanode的报告,当数据块达到最小副本数以上时,会被认为是“安全”的, 在一定比例(可设置)的数据块被确定为“安全”后,再过若干时间,安全模式结束
当检测到副本数不足的数据块时,该块会被复制直到达到最小副本数,系统中数据块的位置并不是由namenode维护的,而是以块列表形式存储在datanode中。
------------------------------------------------------------------------------
集群
角色==进程
namenode
数据元数据
内存存储,不会有磁盘交换
持久化(fsimage,edits log)
不会持久化block的位置信息
block:偏移量,因为block不可以调整大小,hdfs,不支持修改文件
偏移量不会改变
datanode
block块
磁盘
面向文件,大小一样,不能调整
副本数,调整,(备份,高可用,容错/可以调整很多个,为了计算向数据移动)
SN
NN&DN
心跳机制
DN向NN汇报block信息
安全模式
client
Hadoop 03_核心:读写流程相关推荐
- 大数据系列文章-Hadoop的HDFS读写流程(二)
在介绍HDFS读写流程时,先介绍下Block副本放置策略. Block副本放置策略 第一个副本:放置在上传文件的DataNode:如果是集群外提交,则随机挑选一台磁盘不太满,CPU不太忙的节点. 第二 ...
- Hadoop:HDFS读写流程
文章目录 一.HDFS写数据流程 1.1 剖析文件写入 1.2 副本存储节点选择 二.HDFS读数据流程 一.HDFS写数据流程 1.1 剖析文件写入 HDFS写数据流程,如图所示: 客户端通过DIs ...
- hdfs读写流程_深度探索Hadoop分布式文件系统(HDFS)数据读取流程
一.开篇 Hadoop分布式文件系统(HDFS)是Hadoop大数据生态最底层的数据存储设施.因其具备了海量数据分布式存储能力,针对不同批处理业务的大吞吐数据计算承载力,使其综合复杂度要远远高于其他数 ...
- java基础巩固-宇宙第一AiYWM:为了维持生计,大数据Hadoop之HDFS分布式文件系统(HDFS读写流程、主从集群两种问题“单点故障”及“压力过大内存受限”、HDFS的架构设计)~整起
Hadoop之HDFS 目录 一.大数据 二.HADOOP 三.HDFS 1.HDFS基本概念 2.HDFS的架构设计 3.HDFS自己对于上面两种数据持久化技术的实现: 4.HDFS读写流程 5.H ...
- Hadoop之HDFS读写数据流程
Hadoop之HDFS读写数据流程 目录 HDFS写数据流程 HDFS读数据流程 网络拓扑概念 机架感知 1. HDFS写数据流程 HDFS写数据流程,如下图 客户端通过Distributed Fil ...
- hadoop读写流程、副本机制、安全模式、平衡节点
一.副本放置策略 如图: 解释: 第一个副本: 假如上传节点为DN节点,优先放置本节点: 否则就随机挑选一台磁盘不太慢 CPU不太繁忙的节点: 第二个副本: 放置在于第一个副本的不同的机架的节点上 第 ...
- 2021年大数据Hadoop(十):HDFS的数据读写流程
2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 HDFS的数据读写流程 ...
- hdfs读写流程_一篇文章搞清楚 HDFS 基本原理
随着互联网的发展,数据日益增多,增长超过了单机能够处理的上线,数据如何存储和处理成为了科技公司的难题,随着google的三篇论文的发布,大家终于找到了一个方案-分布式文件系统+MapReduce.Ha ...
- (转载)深入分析HDFS原理及读写流程
一.架构体系 1.1.什么是HDFS? HDFS即Hadoop Distributed File System的简称,采用Master/Slave主从结构模型来管理数据.在设计上采用了分而治之的思想, ...
最新文章
- 测试tcp连接数工具_后端开发程序员不知道压力测试怎么能行
- Matlab优化函数中options选项的修改
- Fabric--简单的资产Chaincode
- 深入浅出Node.js (2) - 模块机制
- .NET Core开发实战(第22课:异常处理中间件:区分真异常与逻辑异常)--学习笔记(上)...
- 《代码大全》程序员们怎样花费自己的时间
- How to get the xpath by clicking an html element
- mysql getname_mysql别名取不出值(getColumnLabel和getColumnName的区别)
- Login控件:用户登录失败的消息提示。
- idea导入eclipse快捷键
- 基础练习 特殊回文数 C语言
- Face-recognition实现人脸识别
- 10个典型的大数据案例
- 手把手教学 玩转苹果HomeKit
- 【世界杯赛程表】v1.3 100614 我做的M8软件!
- 深圳药厂洁净车间装修SICOLAB深圳药厂GMP洁净车间装修
- MySQL学习笔记:过滤数据+数据过滤
- Apache Camel学习笔记
- 如何有效的学习开源代码
- Open3D ROR滤波
热门文章
- POJ - 2774 Long Long Message(后缀数组)
- 中石油训练赛 - 姓氏(思维+水题)
- POJ - 3258 River Hopscotch(二分水题)
- 中石油训练赛 - 小A盗墓(线段树+异或结论)
- 模拟赛-20190228-随机数(random)
- 20.IDA-修改二进制文件、显示修改点
- BOOST内存管理(二) --- boost::pool
- 用Python实现选择排序
- MyBatis(一)MyBatis介绍和配置详解
- 腾讯为什么也做操作系统?