问题:停掉active namenode后无法自动切换到standby namenode,但是手动重启停掉的active namenode后,standby namenode就变成active了。

如题,设置了两个NameNode,启动时一个active,一个standby。
当在active namenode上运行如下命令停掉active namenode:

hadoop-daemon.sh stop namenode

active namenode是停掉了,但是standby namenode没有自动切换成active,
但是当使用如下命令重新启动刚刚停掉的namenode,这时standby namenode就变成active了。

hadoop-daemon.sh start namenode

通过查看日志发现报错:
## Caused by: java.net.ConnectException: Connection refused
## Caused by: java.io.FileNotFoundException: /root/.ssh/id_dsa (No such file or directory)
报错的文件路径为dfs.ha.fencing.ssh.private-key-files的值。

通过网上查阅得知,hdfs-site.xml通过参数dfs.ha.fencing.methods来实现,出现故障时通过哪种方式登录到另一个namenode上进行接管工作,这意味着dfs.ha.fencing.ssh.private-key-files参数用来指定存放ssh免密登录到另一个节点的私钥的路径。
而/root/.ssh/id_dsa路径是从别人的配置拷过来的,修改成本机存放私钥的文件就行

修改完后,重启集群,停掉active namenode后standby namenode自动切换成active了。
.
.
.
.
.
知识
Hadoop公共库中对外提供了两种fenching实现,分别是sshfence和shellfence(缺省实现),其中sshfence是指通过ssh登陆目标Master节点上,使用命令fuser将进程杀死(通过tcp端口号定位进程pid,该方法比jps命令更准确),shellfence是指执行一个用户事先定义的shell命令(脚本)完成隔离。
hdfs-site.xml通过参数dfs.ha.fencing.methods来实现出现故障时通过哪种方式登录到另一个namenode上进行接管工作,这意味着dfs.ha.fencing.ssh.private-key-files参数用来指定存放ssh免密登录到另一个节点的私钥的路径。

本文为个人记录所用,如有侵权/错误,恳请指出 (╹▽╹)…

Hadoop HA在停掉active namenode后无法自动切换到standby namenode相关推荐

  1. 西门子触摸屏上电显示初始画面几秒后,自动切换到下一个画面的具体方法

    西门子触摸屏上电显示初始画面几秒后,自动切换到下一个画面的具体方法 例如:在启动画面停留10秒后,切换到其他画面. 具体实现方法可参考以下内容: 如下图所示,新建一个项目,在画面中添加2个画面, 如下 ...

  2. HADOOP HA之NameNode HA集群配置与应用

    目录 前言 一.HADOOP HA之NameNode HA集群配置 1.修改hadoop-env.sh 2.修改core-site.xml 3.修改hdfs-site.xml 4.修改workers ...

  3. Hadoop HA namenode宕机环境恢复

    描述 Ambari管理的Hadoop生产集群开启了HA,在运行期间,namenode1(nn1)为活跃(active)namenode,namenode2(nn2)为备用(standby)nameno ...

  4. Hadoop HA 双namenode搭建

    机器分布 hadoop1 192.168.56121 hadoop2 192.168.56122 hadoop3 192.168.56123 准备安装包 jdk-7u71-linux-x64.tar. ...

  5. hadoop HA 之 QJM

    前言 本文主要通过对hadoop2.2.0集群配置的过程加以梳理,所有的步骤都是通过自己实际测试.文档的结构也是根据自己的实际情况而定,同时也会加入自己在实际过程遇到的问题.搭建环境过程不重要,重要点 ...

  6. Hadoop Ha集群配置

    为什么要配置HDFS HA?   首先:HDFS集群中NameNode 如果存在单点故障.对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用. 而影响HD ...

  7. Hadoop Ha (High avilable)配置

    为什么要配置HDFS HA? 首先:HDFS集群中NameNode 如果存在单点故障.对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用. 而影响HDFS ...

  8. Hadoop  HA

    Hadoop  HA 是什么? hadoop2.x版本中可以有多个namenode结点,一个是活跃(active)状态,一个是准备(standby)状态. HDFS HA背景 HDFS集群中NameN ...

  9. (超详细)基于Zookeeper的Hadoop HA集群的搭建

    基于Zookeeper的Hadoop HA集群的搭建 JunLeon--go big or go home 前言: 高可用(high availability,HA)指的是若当前工作中的机器宕机了,系 ...

最新文章

  1. 所谓完整的linux系统包括哪些部分呢?【转】
  2. RemoveError: 'setuptools' is a dependency of conda and cannot be removed from
  3. h3c服务器 raid 型号,H3C服务器创建Raid
  4. 新功能:阿里云负载均衡SLB支持HTTP访问强制跳转HTTPS
  5. 定位导航方案在特殊环境下的适用说明
  6. OAuth 2 开发人员指南(Spring security oauth2)
  7. 一种基于复制粘贴的cam350邮票孔拼版教程(三) 导出钻孔文件
  8. 小程序tabBar图标显示太大
  9. 测试额外任务而撒旦法 速度速度发撒旦法
  10. 微软输入法繁体简体切换
  11. android 获取短信中心号码,无法发短信,短信中心号码设置 解决办法!!!
  12. linux环境下pytesseract的安装和央行征信中心的登录验证码识别
  13. 跳跳棋【LCA】【二分】
  14. 圈内著名ts_央视为电竞发声:AG和estar当选著名战队,梦泪,猫神被官方肯定
  15. 香帅的北大金融学课笔记13 -- 投资决策
  16. NiosII 学习过程
  17. HBase的Nonce实现分析
  18. 高一被清华姚班录取,高三委拒谷歌 offer,一个重度网瘾少年到理论计算机科学家的蜕变!...
  19. 传统业务上云:跨AZ容灾架构解析
  20. 面试时,我说谎了——Leo网上答疑44

热门文章

  1. 某知名支付系统的架构演进权威分析
  2. 2020年计算机中职赛,我校在2020年广西职业院校技能大赛(中职组)中再获佳绩...
  3. SVG中以任意直线为对称轴的镜像变换及其矩阵
  4. 漫漫人生录 | 程序员年终总结,情绪负债不可取
  5. RedisDesktopManager死活连接不上,网上的各种方法都失败了,可能于网络策略配置有关!!!
  6. 字符编码转换类(支持多国语言)
  7. SAP ABAP MIGO 262
  8. 驾校网站模板 php_汽车驾照培训的网站模板
  9. 【渝粤教育】 广东开放大学21秋期末考试民事诉讼法学10680k2
  10. Linux中__setup()实现原理以及源码分析