Hadoop1.0核心

HDFS读写流程:

写流程:

读流程:

------------------------------------------------------------------------------

安全模式

namenode启动的时候,首先将映像文件(fsimage)载入内存,并执行编辑日志(edits)中的各项操作。

一旦在内存中成功建立文件系统元数据的映射,则创建一个新的fsimage文件(这个操作不需要SecondaryNameNode)和一个空的编辑日志。

此刻namenode运行在安全模式。即namenode的文件系统对于客服端来说是只读的。(显示目录,显示文件内容等。写、删除、重命名都会失败,尚未获取动态信息)。

在此阶段Namenode收集各个datanode的报告,当数据块达到最小副本数以上时,会被认为是“安全”的, 在一定比例(可设置)的数据块被确定为“安全”后,再过若干时间,安全模式结束

当检测到副本数不足的数据块时,该块会被复制直到达到最小副本数,系统中数据块的位置并不是由namenode维护的,而是以块列表形式存储在datanode中。

------------------------------------------------------------------------------

集群

角色==进程

namenode

数据元数据

内存存储,不会有磁盘交换

持久化(fsimage,edits log)

不会持久化block的位置信息

block:偏移量,因为block不可以调整大小,hdfs,不支持修改文件

偏移量不会改变

datanode

block块

磁盘

面向文件,大小一样,不能调整

副本数,调整,(备份,高可用,容错/可以调整很多个,为了计算向数据移动)

SN

NN&DN

心跳机制

DN向NN汇报block信息

安全模式

client

Hadoop 03_核心:读写流程相关推荐

  1. 大数据系列文章-Hadoop的HDFS读写流程(二)

    在介绍HDFS读写流程时,先介绍下Block副本放置策略. Block副本放置策略 第一个副本:放置在上传文件的DataNode:如果是集群外提交,则随机挑选一台磁盘不太满,CPU不太忙的节点. 第二 ...

  2. Hadoop:HDFS读写流程

    文章目录 一.HDFS写数据流程 1.1 剖析文件写入 1.2 副本存储节点选择 二.HDFS读数据流程 一.HDFS写数据流程 1.1 剖析文件写入 HDFS写数据流程,如图所示: 客户端通过DIs ...

  3. hdfs读写流程_深度探索Hadoop分布式文件系统(HDFS)数据读取流程

    一.开篇 Hadoop分布式文件系统(HDFS)是Hadoop大数据生态最底层的数据存储设施.因其具备了海量数据分布式存储能力,针对不同批处理业务的大吞吐数据计算承载力,使其综合复杂度要远远高于其他数 ...

  4. java基础巩固-宇宙第一AiYWM:为了维持生计,大数据Hadoop之HDFS分布式文件系统(HDFS读写流程、主从集群两种问题“单点故障”及“压力过大内存受限”、HDFS的架构设计)~整起

    Hadoop之HDFS 目录 一.大数据 二.HADOOP 三.HDFS 1.HDFS基本概念 2.HDFS的架构设计 3.HDFS自己对于上面两种数据持久化技术的实现: 4.HDFS读写流程 5.H ...

  5. Hadoop之HDFS读写数据流程

    Hadoop之HDFS读写数据流程 目录 HDFS写数据流程 HDFS读数据流程 网络拓扑概念 机架感知 1. HDFS写数据流程 HDFS写数据流程,如下图 客户端通过Distributed Fil ...

  6. hadoop读写流程、副本机制、安全模式、平衡节点

    一.副本放置策略 如图: 解释: 第一个副本: 假如上传节点为DN节点,优先放置本节点: 否则就随机挑选一台磁盘不太慢 CPU不太繁忙的节点: 第二个副本: 放置在于第一个副本的不同的机架的节点上 第 ...

  7. 2021年大数据Hadoop(十):HDFS的数据读写流程

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 HDFS的数据读写流程 ...

  8. hdfs读写流程_一篇文章搞清楚 HDFS 基本原理

    随着互联网的发展,数据日益增多,增长超过了单机能够处理的上线,数据如何存储和处理成为了科技公司的难题,随着google的三篇论文的发布,大家终于找到了一个方案-分布式文件系统+MapReduce.Ha ...

  9. (转载)深入分析HDFS原理及读写流程

    一.架构体系 1.1.什么是HDFS? HDFS即Hadoop Distributed File System的简称,采用Master/Slave主从结构模型来管理数据.在设计上采用了分而治之的思想, ...

最新文章

  1. 测试tcp连接数工具_后端开发程序员不知道压力测试怎么能行
  2. Matlab优化函数中options选项的修改
  3. Fabric--简单的资产Chaincode
  4. 深入浅出Node.js (2) - 模块机制
  5. .NET Core开发实战(第22课:异常处理中间件:区分真异常与逻辑异常)--学习笔记(上)...
  6. 《代码大全》程序员们怎样花费自己的时间
  7. How to get the xpath by clicking an html element
  8. mysql getname_mysql别名取不出值(getColumnLabel和getColumnName的区别)
  9. Login控件:用户登录失败的消息提示。
  10. idea导入eclipse快捷键
  11. 基础练习 特殊回文数 C语言
  12. Face-recognition实现人脸识别
  13. 10个典型的大数据案例
  14. 手把手教学 玩转苹果HomeKit
  15. 【世界杯赛程表】v1.3 100614 我做的M8软件!
  16. 深圳药厂洁净车间装修SICOLAB深圳药厂GMP洁净车间装修
  17. MySQL学习笔记:过滤数据+数据过滤
  18. Apache Camel学习笔记
  19. 如何有效的学习开源代码
  20. Open3D ROR滤波

热门文章

  1. POJ - 2774 Long Long Message(后缀数组)
  2. 中石油训练赛 - 姓氏(思维+水题)
  3. POJ - 3258 River Hopscotch(二分水题)
  4. 中石油训练赛 - 小A盗墓(线段树+异或结论)
  5. 模拟赛-20190228-随机数(random)
  6. 20.IDA-修改二进制文件、显示修改点
  7. BOOST内存管理(二) --- boost::pool
  8. 用Python实现选择排序
  9. MyBatis(一)MyBatis介绍和配置详解
  10. 腾讯为什么也做操作系统?