以下即是checkpoint过程:

  1. 辅助Namenode请求主Namenode停止使用edits文件,暂时将新的写操作记录到一个新文件中,如edits.new。
  2. 辅助Namenode节点从主Namenode节点获取fsimage和edits文件(采用HTTP GET)
  3. 辅助Namenode将fsimage文件载入到内存,逐一执行edits文件中的操作,创建新的fsimage文件
  4. 辅助Namenode将新的fsimage文件发送回主Namenode(使用HTTP POST)
  5. 主Namenode节点将从辅助Namenode节点接收的fsimage文件替换旧的fsimage文件,用步骤1产生的edits.new文件替换旧的edits文件(即改名)。同时更新fstime文件来记录检查点执行的时间

转载于:https://www.cnblogs.com/bobsoft/archive/2012/10/07/2714487.html

HADOOP-Checkpoint原理相关推荐

  1. HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介

    本系列是本人对Hive的学习进行一个整理,主要包括以下内容: 1.HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介 2.HiveQL学习笔记(二):Hive基础语法与常用函数 ...

  2. Hadoop运行原理之Spill, Shuffle

    Shuffle阶段又可以分为Map端的shuffle和Reduce端的Shuffle. 一.Map端的shuffle Map端会处理输入数据并产生中间结果,这个中间结果会写到本地磁盘(转者注: 这个中 ...

  3. Flink大数据实时计算系列-Flink的CheckPoint原理 Flink分布式环境下的CheckPoint原理

    Flink大数据实时计算系列-Flink的CheckPoint原理 Flink分布式环境下的CheckPoint原理 Flink的CheckPoint

  4. 兄弟,用大白话告诉你小白都能看懂的Hadoop架构原理

    本文来自:石杉的架构笔记 目录 一.前奏 二.HDFS的NameNode架构原理 一.前奏 Hadoop是目前大数据领域最主流的一套技术体系,包含了多种技术. 包括HDFS(分布式文件系统),YARN ...

  5. Hadoop HA原理

    Hadoop HA(High Available)经过同时配置两个处于Active/Passive模式的Namenode来解决上述问题,分别叫Active Namenode和Standby Namen ...

  6. 深入浅出:hadoop架构原理

    一.前奏 Hadoop是目前大数据领域最主流的一套技术体系,包含了多种技术. 包括HDFS(分布式文件系统),YARN(分布式资源调度系统),MapReduce(分布式计算系统),等等. 有些朋友可能 ...

  7. Hadoop 底层原理介绍

    1 概述 Apache Hadoop是一个软件框架,可在具有数千个节点和PB级数据的大型集群上进行分布式处理. Hadoop主要包含四个项目:Hadoop Common.Hadoop分布式文件系统(H ...

  8. 【大数据入门】Hadoop技术原理与应用之基于Hadoop的数据仓库Hive

    基于Hadoop的数据仓库Hive 文章目录 基于Hadoop的数据仓库Hive @[toc] 6.1 概述 6.1.1 数据仓库概念 6.1.2 传统数据仓库面临的挑战 6.1.3 Hive简介 6 ...

  9. Flink checkpoint操作流程详解与报错调试方法汇总,增量checkpoint原理及版本更新变化,作业恢复和扩缩容原理与优化

    这里写目录标题 flink checkpint出错类型 flink 重启策略 Checkpint 流程简介 增量Checkpoint实现原理 MemoryStateBackend 原理 FsState ...

  10. Hadoop工作原理浅析

    Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统.最核心的模块包括Hadoop Common.HDFS与MapReduce. HDFS HDFS是Hadoop分布式文件系统(H ...

最新文章

  1. python学习------tab补全
  2. SpringBoot 连接mysql踩到的坑
  3. 吃惊!江苏抽查发现,144篇硕士学位论文不合格,部分单位将被约谈
  4. 2020年春季学习信号与系统课程作业参考答案-第十一次作业
  5. solr搭建分布式搜索引擎
  6. Go内存管理之代码的逃逸分析
  7. 填表法解“银行家算法”问题
  8. 方向导数、梯度与梯度下降
  9. mqtt压力测试工具emqtt
  10. Mac技巧1: 精确倍速QuickTime Player 播放器
  11. 曲面局部理论介绍——从曲面的概念、基本形式到高斯曲率及其 Pthyon 计算
  12. 奇葩事情,某些网页打不开
  13. Windows XP 注册表修改大全
  14. 使用ldapmodify修改条目
  15. 学习笔记——Kaggle_Digit Recognizer (朴素贝叶斯 Python实现)
  16. linux在根目录下创建目录一test,Linux练习题
  17. php框架 s,开源免费的PHP框架|轻量级PHP框架(DecSoft's Humm PHP)下载 V2019.4 官方版 - 比克尔下载...
  18. 四足机器人——步态规划
  19. 【BootStrap】如何删除HTML的span标签
  20. Vue3轮播图插件 vue-splide

热门文章

  1. bean的属性类型----ibatis类型-------oracle数据库类型
  2. Nginx负载均衡策略之ip_hash
  3. C 基本语法 | 菜鸟教程
  4. Eureka、Zookeeper和Consul 的区别
  5. MyBatis关键配置-创建会话工厂
  6. Redis中的哨兵机制的不足
  7. 字节流写数据加异常处理
  8. aop简介-aop开发明确的事
  9. 规格参数查询后台代码实现
  10. springboot的自动配置原理