启动namenode报错:Journal Storage Directory /var/bigdata/hadoop/full/dfs/jn/dmgeo not formatted

在测试flink的HA时,把某个节点(部署了jobmanager和namenode)的节点reboot了,然后启动时发现namenode没有起来,报错大概如下:

org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /tmp/hadoop/dfs/journalnode/xxxx not formattedat org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:457)

原因:大概为journalnode保存的元数据和namenode的不一致,导致,3台机器中有2台报了这个错误。

解决:在nn1上启动journalnode,再执行hdfs namenode -initializeSharedEdits,使得journalnode与namenode保持一致。再重新启动namenode就没有问题了。

但又遇到flink的jobmanager启动不了,报错如下:

ERROR org.apache.flink.runtime.entrypint.XlusterEntrypoint   -Fatal error occurred in the cluster entrypoint.org.apache.flink.runtime.dispatcher.DispatcherException: Failed to take leadership with session id xxxxxxxxxxxxxxxxxxxxxxxxxx....
caused by: java.lang.RuntimeException: org.apache.flink.util.FlinkException: Could not retrieve submitted JobGraph from state handle under /xxxxx. This indicates that the retrieved state handle is broken. Try cleaning the state handle store.
..
caused by: java.io.FileNotFoundException: File does not exitst: /xxxx/submittedJobGraphe439cfc979db

节点reboot时,是有任务在执行的,而刚才journalnode的initializeSharedEdits导致某些文件丢失了,而jobmanager在读取这个提交的job时发生了报错,故在zookeeper删除flink任务的引用即可

./zkCli.sh -server zookeeper的hostset /flink/default/running_job_registry/xxxxx DONE
delete /flink/default/jobgraphs/xxxx

解决后,重新启动jobmanager、taskmanager没有问题了,再提交任务就可以了。

启动namenode报错:Journal Storage Directory /var/bigdata/hadoop/full/dfs/jn/dmgeo not formatted相关推荐

  1. 配置Hadoop格式化namenode时报错cannot create directory /usr/local/hadoop/tmp/dfs/name/current

    格式化namenode时,通过以下字句验证是否成功 status 0 为操作成功,status 1为操作失败,往上翻查找错误原因 该错误是由于权限问题导致的 我们通过 sudo su 进入root操作 ...

  2. Hadoop启动NameNode报错ERROR Cannot set priority of namenode process 2639

    项目场景: Hadoop启动NameNode报错::ERROR: Cannot set priority of namenode process 问题描述: Hadoop启动NameNode报错ERR ...

  3. 启动virt-manager报错:Failed to open /var/lib/dbus/machine-id

    [root@hyperStor ~]# virt-manager //启动KVM虚拟机管理工具报错 process 4619: D-Bus library appears to be incorrec ...

  4. DataNode 启动失败报错 Incompatible clusterIDs

    文章目录 DataNode 启动失败报错 Incompatible clusterIDs 信息 报错摘要 问题描述 问题原因 分析步骤 解决办法 参考 DataNode 启动失败报错 Incompat ...

  5. 【X11vnc】Ubuntu18.04 x11vnc启动失败,报错error opening logfile: /var/log/x11vnc.log

    Ubuntu18.04 x11vnc启动失败,报错error opening logfile: /var/log/x11vnc.log 前提概要 报错 解决方案 前提概要 之前在Ubuntu18.04 ...

  6. Linux 常规安装MySQL 执行启动命令报错(附安装方法)

    采用解压官网的targ ,配置mysql group权限组,并且初始化数据库后,执行service mysql start 报错: /etc/init.d/mysql: line 244: my_pr ...

  7. MySQL 启动失败报错无法更新pid文件

    一.问题描述 某次因MySQL故障,一线人员反馈MySQL启动,一直无法启动,报错:启动mysql失败 ERROR! The server quit without updating PID file ...

  8. Eclipse中启动tomcat报错:A child container failed during start

    我真的很崩溃,先是workspace崩了,费了好久重建的workspace,然后建立了一个小demo项目,tomcat中启动却报错,挑选其中比较重要的2条信息如下: A child container ...

  9. starting mysql. success!_启动mysql报错解决问题过程

    启动mysqld 报错 [root@localhost ~]# service mysqld start Starting MySQL.Logging to '/etc/mysql/localhost ...

最新文章

  1. ipv6下单播。组播 泛播
  2. 北京周末去哪儿 —— 玉渊潭
  3. Java黑皮书课后题第4章:*4.15(电话键盘)电话上的国际标准字母/数字映射如下所示。编写程序,提示用户输入一个小写或大写字母,然后显示对应数字。对于非字母输入,提示非法输入
  4. 在c语言中卖水果的程序,非常难的C语言问题!!!(悬赏80)
  5. 如何实现:判断数据库中某表是否有记录,若为空,则插入一条记录。若不为空则查询某记录...
  6. java学到哪里最容易蒙,蒙哥比vs蒙克(目前最好的哪个)
  7. 苏州大学计算机组成题库11,苏州大学计算机组成题库(范文).doc
  8. C# 对称算法,加密解密类
  9. 进程和cpu的相关知识和简单调优方案
  10. 数据-第14课-栈的定义及实现
  11. Python解释器(Interpreter)介绍
  12. 网络安全等级保护三级产品清单整理
  13. 关于用友华表Cell插件代码
  14. 【我的OpenGL学习进阶之旅】如何抽取着色器代码到assets目录下的GLSL文件,以及如何通过Java或者C++代码来加载着GLSL文件?
  15. 蒟蒻的控制台贪吃蛇(新手实验)
  16. python web实战视频教程_2018Python Flask打造一个视频网站实战视频教程
  17. 思科模拟器实验5:交换机端口聚合配置实验
  18. asterisk(星号)中Dialplan基础:Answer, Playback, and Hangup Applications
  19. python 默认参数后接可变参数_Python可变参数会自动填充前面的默认同名参数实例...
  20. 相量式用计算机怎么算,计算器关于相量计算的操作方法

热门文章

  1. 机器学习实践:本地远程查看服务器训练TensorBoard
  2. Java基础day24
  3. 工业用微型计算机(7)-指令系统(4)
  4. 799页!吴恩达深度学习笔记.PDF
  5. AI基础:简易数学入门
  6. ICDM 2020 TOP3方案
  7. 7x24小时实时互动,网易云信金融行业虚拟客服解决方案来啦!
  8. 网易云信直播sdk的整体传输优化
  9. hbase实践之写流程拾遗
  10. git 拉取分支代码 合分支