根据HA架构图,规划HA的分布式集群服务器

HA集群规划

配置参考图

根据官方文档配置HA

部分说明

Architecture

在典型的ha集群中,两台独立的机器被配置为namenode。在任何时间点,一个namenodes处于活动状态,另一个处于备用状态。活动NameNode负责集群中的所有客户端操作,而备用服务器只是充当从服务器,保持足够的状态,以便在必要时提供快速故障转移。备用节点与活动节点保持状态同步,两个节点都与一组称为“日志节点”(Jns)的独立守护进程通信。当任何名称空间修改由活动节点执行时,它会将修改的记录持久地记录到这些jn中的大多数。备用节点能够从JNS读取编辑,并不断监视它们对e的更改。

Hardware resources

要部署HA集群,您应该准备以下内容:NameNode计算机—运行主动和备用Namenodes的计算机应具有彼此等效的硬件,以及与非HA群集使用的硬件相当的硬件。日志节点计算机-运行日志节点的计算机。日志节点守护程序相对较轻,因此这些守护程序可以合理地配置在具有其他Hadoop后台进程的计算机上,例如NameNODES、JobTracker或纱线资源Manager。注意:必须至少有3个日志节点守护程序,因为编辑日志修改必须写入到大多数JNS。这将允许系统容忍单个机器的故障。您还可以运行3个以上的日志节点,但为了实际增加系统可以承受的故障数,您应该运行奇数的JNS,(即,3、5、7等)。请注意,在使用N个日志节点运行时,系统可以容忍最多(n-1)/2故障,并继续正常运行。请注意,在HA集群中,备用NameNode还执行命名空间状态的检查点,因此不必在HA集群中运行辅助NameNode、检查点节点或BackupNode。事实上,这样做将是错误。这也允许一个正在重新配置非HA启用HDFS集群的人启用高可用性,以便重新使用以前专用于辅助NameNode的硬件。

配置概述

与联邦配置类似,HA配置是向后兼容的,允许现有的单个NameNode配置不受更改地工作。新配置的设计使得集群中的所有节点都可以具有相同的配置,而无需根据节点的类型将不同的配置文件部署到不同的计算机上。

与HDFFederation一样,HA集群重用名称服务ID来标识单个HDFS实例,该实例实际上可能由多个HARNameNodes组成。此外,HA还添加了一个名为NameNodeID的新抽象。集群中的每个不同的NameNode都有一个不同的NameNode ID来区分它。为了支持所有NameNode的单个配置文件,相关的配置参数都以名称服务ID和NameNode ID作为后缀。

备份hadoop中的配置文件和数据(131,132,133)

HA配置

hdsf-site.xml

dfs.nameservices - the logical name for this new nameservice

Note: If you are also using HDFS Federation, this configuration setting should also include the list of other nameservices, HA or otherwise, as a comma-separated list.

配置nameservices

dfs.nameservices

ns1

配置namenodes

dfs.ha.namenodes.ns1

nn1,nn2

配置namenode

dfs.namenode.rpc-address.ns1.nn1

hadoop-senior.beifeng.com:8020

dfs.namenode.rpc-address.ns1.nn2

hadoop-senior02.beifeng.com:8020

配置访问地址namenode.http-address

dfs.namenode.http-address.ns1.nn1

hadoop-senior.beifeng.com:50070

dfs.namenode.http-address.ns1.nn2

hadoop-senior02.beifeng.com:50070

配置代理

dfs.client.failover.proxy.provider.mycluster

org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

nodeName ssh fencing 可以实现131和132上的nameNode可以无密码登入。131->132登入。也可以132->131登入

dfs.ha.fencing.methods

sshfence

dfs.ha.fencing.ssh.private-key-files

/root/.ssh/id_rsa

配置 journalnode 的edits日志存放的目录

dfs.journalnode.edits.dir

/opt/app/hadoop-2.5.0/data/dfs/jn

core-site.xml配置

配置默认的HDFS

fs.defaultFS

hdfs://ns1

hadoop数据存储目录

hadoop.tmp.dir

/opt/app/hadoop-2.5.0/data/tmp

垃圾回收时间

fs.trash.interval

420

主节点(131)向其他子节点(132,133)同步修改的配置文件

命令:scp -r /opt/app/hadoop-2.5.0/etc/hadoop/core-site.xml /opt/app/hadoop-2.5.0/etc/hadoop/hdfs-site.xml /opt/app/hadoop-2.5.0/etc/hadoop/slaves root@hadoop-senior02.beifeng.com:/opt/app/hadoop-2.5.0/etc/hadoop/

hdfs 备份数配置_大数据||HDFS HA配置详解相关推荐

  1. python海量数据分析师职业技能_大数据分析师技能图谱详解与零基础自学内容大全...

    全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化,大数据堪比石油,如何掘金大数据是所有个人.企业和国家的机遇和挑战.中国是人才大国,能理解和应用大数据的创新人才更是稀缺资源.大数据 ...

  2. <Zhuuu_ZZ>大数据技术之Flume详解

    大数据技术之Flume详解 一 Flume配置 Flume安装地址 环境配置 验证 二 Flume基础架构 1.定义 2.Flume组成架构 3.Flume组件 Agent Source Channe ...

  3. 大数据发展规划及技术详解

    大数据发展规划及技术详解 1.BI的流程:主要是阐述一下BI的流程:第一,需求分析阶段,要搞清楚用户需求,就本例用户想要的是volte业务使用情况的月报表,必须要搞清楚月报表中包括哪些指标(包括维度指 ...

  4. 大数据平台作业调度系统详解-理论篇

    大数据开发平台的核心组件之一:作业调度系统. 作业调度系统是一个相对复杂的系统,涉及的内容繁杂,针对的场景多种多样,实现的方案千差万别,是一个需要理论和实践并重的系统. 本文先从大的场景划分的角度对市 ...

  5. 跑动大数据的笔记本配置_大数据专业用什么样的笔记本合适?

    大数据专业需要CPU 性能强.内存大的笔记本电脑. 虽然说现在有云服务器,但是应该还是有蛮多人在自己电脑上安装虚拟机来学习大数据知识的,跑跑 Demo ,所以对CPU 的性能和内存有一定的要求,其他的 ...

  6. 看完了这篇,还能不知道什么是hadoop,大数据吗?❤️‍万字详解告诉你

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物. 文章目录 一.大数据概论 1.1 大数据概念 1.2 大数据特点 1. ...

  7. 大数据平台Lambda架构详解

    Lambda架构由Storm的作者Nathan Marz提出.旨在设计出一个能满足.实时大数据系统关键特性的架构,具有高容错.低延时和可扩展等特. Lambda架构整合离线计算和实时计算,融合不可变( ...

  8. 大数据课程培训大纲详解,大数据培训学习内容

    大数据助力成就非凡.大数据正在改变着商业游戏规则,为企业解决传统业务问题带来变革的机遇.毫无疑问,当未来企业尝试分析现有海量信息以推动业务价值增值时,必定会采用大数据技术.那么大数据培训哪家好呢?今天 ...

  9. 【若泽大数据】MySQL参数详解

    系统变量提供的是各种与服务器配置和功能有关的信息.大部分的系统变量都可以在服务器启动时进行设置.在运行时,每一个系统变量都拥有一个全局值或会话值,或者同时拥有这两个值.许多系统变量都是动态的,也就是说 ...

最新文章

  1. python查看文件有多少行_python如何判断文件有多少行
  2. MobileNetV2-YoloV3
  3. 蓝桥杯-11-1实现strcmp函数(java)
  4. Memcached 群集高可用性(HA)架构
  5. sql数据库实例(c#查询登录界面)
  6. Svn正确的使用方法
  7. mac系统在云服务器地址,mac如何登陆云服务器地址
  8. 部分编程错误小集-15.04
  9. 95-290-055-源码-内存管理-HybridMemorySegment
  10. 计算机固态硬盘安装,电脑安装了固态硬盘,需要如何重装系统?详细的方法教程在这里!...
  11. vs2019中git提交代码的步骤
  12. 操作系统概念之定义和功能
  13. 安装Kylin Linux Advanced Server V10操作系统
  14. DBT-50000及相关问题处理
  15. 广东计算机二级考试大纲,全国计算机等级考试大纲(二级)
  16. 【Unity3D 问题总结】Failed to import package with error: Couldn‘t decompress package
  17. 100以内的数分解问题
  18. 线程的启动暂停和终止
  19. Scipy库(win下安装)
  20. v-if 和 v-show的区别 vue面试题

热门文章

  1. 修改安装路径 pip 以及修改运行路径
  2. 基于中文主观性知识库的句子主观性计算项目
  3. day36-表关系(外键)
  4. Liunx之nginx代理
  5. Java基础11-封装(思想、访问权限、this、构造方法)
  6. 一个HelloWorld网站
  7. 单例在多线程中的使用
  8. JDBC链接SQLServer2005 Express
  9. javax.servlet.http.HttpServletRequest接口(HTTP版本)
  10. 数据结构与算法——贪心算法