第127讲:Hadoop集群管理之安全模式解析及动手实战学习笔记

hadoop在启动时namenode会把fsimage加载进内存,同时和edits内容合并,以此建立整个文件系统的元数据的镜像(内存级别),所以客户端可以通过namenode访问文件系统的信息。完成后变成一个新的fsimage,这个过程是namenode自已完成的,同时会建立一个新的edits。这时namenode需要开始监听rpc和http的请求,此时的状态就叫安全模式。安全模式时整个文件系统对客户端来说是可读的。实质上安全模式下可读的要求更严,它只是对文件系统的

元数据的操作会成功,例如查看文件系统上有哪些目录,目录下有哪些文件。但对读取文件只有在集群上的datanode上的块可用时才能实现。

系统中的block的位置不是由namenode维护的,而是以block list的形式存储在datanode中,系统正常工作时namenode会在内存中保存所有block的location的映射信息,在安全模式下,每个datanode会向namenode发送最新的block location list的最新信息,namenode知道块的信息后客户端就可以通过 namenode对文件系统进行操作。

namenode如果认为block具体位置的信息不够多的话,即datanode上的节点复本不够多时可能会启动对block的复制过程。实质上一般不会发生,因为在hadoop中一般配置3个复本,启动安全模式时(dfs.namenode.replication.min)默认最小复本满足1个就没有问题了。

要退出安全模式也需要配置:dfs.namenode.safemode.threshold-pct:  0.999f,即整个文件系统中最小的复本的个数为1满足99.9%时就可以退出安全模式。

hadoop刚刚format时因为文件系统中没有文件,这时不会进入安全模式。

hadoop dfsadmin -safemode get

可以获得是否是安全模式。

hadoop dfsadmin -safemode enter/leave  进入退出安全模式

在系统维护升级时需要进入安全模式。禁止对系统操作。

dfs.namenode.safemode.min.datanodes=0

最小datanode个数,即退出安全模式时活着的datanode的具体数量。

=0即退出安全模式时不考虑datanode个数。

如果这个值大于集群datanode个数,则集群一直处于安全模式。

dfs.namenode.safemode.extension=3000

满足了replication后再等待多长时间才退出安全模式。

以上内容是王家林老师DT大数据梦工厂《Hadoop深入浅出实战经典》第127讲的学习笔记。
王家林:Spark、Flink、Docker、Android技术中国区布道师。Spark亚太研究院院长和首席专家,DT大数据梦工厂创始人,Android软硬整合源码级专家,英语发音魔术师,健身狂热爱好者。

微信公众账号:DT_Spark

联系邮箱18610086859@126.com

电话:18610086859

QQ:1740415547

微信号:18610086859

新浪微博:ilovepains

王家林的第一个中国梦:免费为全社会培养100万名优秀的大数据从业人员!

可以通过王家林老师的微信号18610086859发红包捐助,目前已经发布的王家林免费视频全集如下:

1,《大数据不眠夜:Spark内核天机解密(共100讲)》:http://pan.baidu.com/s/1eQsHZAq

2,《Hadoop深入浅出实战经典》 http://pan.baidu.com/s/1mgpfRPu

3,《Spark纯实战公益大讲坛》 http://pan.baidu.com/s/1jGpNGwu 
4,《Scala深入浅出实战经典》 http://pan.baidu.com/s/1sjDWG25 
5,《Docker公益大讲坛》 http://pan.baidu.com/s/1kTpL8UF 
6,《Spark亚太研究院Spark公益大讲堂》 http://pan.baidu.com/s/1i30Ewsd

7,Spark实战高手之路全部六阶段视频:http://edu.51cto.com/pack/view/id-144.html

8,《大数据Spark企业级实战》购买http://item.jd.com/11622851.html

第127讲视频网站地址:

51CTO

http://edu.51cto.com/lesson/id-77868.html

第127讲:Hadoop集群管理之安全模式解析及动手实战学习笔记相关推荐

  1. Hadoop集群管理与NFS网关

    目录 一.Hadoop集群管理 1.访问集群文件系统 2.重新初始化集群 3.增加新的节点 4.修复节点 5.删除节点 二.NFS网关 1.NFS网关概述 2.NFS网关架构图 3.HDFS用户授权 ...

  2. 从主机名谈Hadoop集群管理

    本文出处:http://blog.csdn.net/chaijunkun/article/details/23283431,转载请注明.由于本人不定期会整理相关博文,会对相应内容作出完善.因此强烈建议 ...

  3. Hadoop集群大数据解决方案之MapReduce 程序实战进阶(自定义partitionsortgroup)(六)

    准 备   在上一篇博客举了个简单的word count,重在说明mapreduce的流程,但是针对mapreduce的编程,程序员能控制的,远远不止map和reduce,还有诸如partition, ...

  4. 大数据讲课笔记3.3 Hadoop集群配置

    文章目录 零.学习目标 一.导入新课 二.新课讲解 (一)配置Hadoop集群 1.在master虚拟机上配置hadoop (1)编辑Hadoop环境配置文件 - hadoop-env.sh (2)编 ...

  5. Hadoop详解(五)——ZooKeeper详解,ZooKeeper伪分布搭建和集群搭建,Hadoop集群搭建,sqoop工具的使用

    ZooKeeper简介 什么是ZooKeeper? ZooKeeper是Google的Chubby一个开源的实现,是Hadoop分布式协调服务. 它包含了一个简单的原语集,分布式应用程序可以基于它实现 ...

  6. 虚拟化Hadoop集群的部署和管理 - 基本操作

    在Big Data Extensions(BDE)上不仅可以在分钟级别非常快速地部署Hadoop集群,这点可以通过前文<大数据虚拟化零起点-6基础运维第五步-使用CLI创建Apache Hado ...

  7. 使用HUE来管理hadoop集群

    HUE Hue是cdh专门的一套web管理器,它包括3个部分hue ui,hue server,hue db.hue提供所有的cdh组件的shell界面的接口.你可以在hue编写mr,查看修改hdfs ...

  8. Hadoop集群启动后利用Web界面管理HDFS

    Hadoop集群启动后,可以通过自带的浏览器Web界面查看HDFS集群的状态信息,访问IP为NameNode所在服务器的IP地址,hadoop版本为3.0以前访问端口默认为9870,hadoop版本为 ...

  9. HADOOP集群大数据词频统计及设计比较(完整教程)

    ###如若发现错误,或代码敲错,望能评论指正!!! 通过百度网盘分享的文件:Hadoop相关需要的软件 链接:https://pan.baidu.com/s/1XzDvyhP4_LQzAM1auQCS ...

最新文章

  1. Dirichlet分布与多项分布的共轭性
  2. 农村电商谋定双创工程-李玉庭:互联网+农产品重整流通
  3. Csharp: Winform 顏色選擇器 Color convert RGB and RGB convert Color
  4. 机器学习实战-KNN算法-20
  5. Mysql 优化的一些要点
  6. java fx choicebox_JavaFX:具有图像和文本的ChoiceBox
  7. C++ 四种类型转换运算符
  8. python 模糊匹配ftp文件_使用python实现正则匹配检索远端FTP目录下的文件
  9. notepadqq_Notepadqq Linux文本编辑器入门
  10. 深入理解Scala 标识符,命名和域
  11. sql语句优化的一些办法
  12. 2021数模美赛LaTeX+Word论文模板更新!
  13. uboot移植——启动第一阶段
  14. 7.26 1004度度熊的午饭时光 百度之星题解
  15. 加固工程验收规范50550_GB 50550-2010建筑结构加固工程施工质量验收规范
  16. 我的2019归零,2020走你
  17. 七天引爆社交新零售(助你提高十倍业绩)——前言
  18. 论文阅读_Reducing Test Cases with Attention Mechanism of Neural Networks
  19. 瑞萨 boot相关指令 理解
  20. p5.js之“列阵绘图画板”实现大面积规律性绘制

热门文章

  1. 细数Mac上那些好用且免费的软件(二)
  2. 企业财务管理信息化现状思考与探索
  3. 互联网医疗的定义及架构
  4. Exception caught: mqAdminExt get broker stats data TOPIC_PUT_NUMS failed
  5. 苹果机型中最具经典的三款机型
  6. Altium Designer挖空开槽填坑之board cutout
  7. SpringBoot项目中自动加载datasourceConfig配置导致启动失败
  8. favicon.ico无法访问
  9. 策略模式——多种发票上传实现案例
  10. 计算机逻辑运算实验总结,算术逻辑运算实验报告(共10篇).doc