启动namenode报错:Journal Storage Directory /var/bigdata/hadoop/full/dfs/jn/dmgeo not formatted
启动namenode报错:Journal Storage Directory /var/bigdata/hadoop/full/dfs/jn/dmgeo not formatted
在测试flink的HA时,把某个节点(部署了jobmanager和namenode)的节点reboot了,然后启动时发现namenode没有起来,报错大概如下:
org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /tmp/hadoop/dfs/journalnode/xxxx not formattedat org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:457)
原因:大概为journalnode保存的元数据和namenode的不一致,导致,3台机器中有2台报了这个错误。
解决:在nn1上启动journalnode,再执行hdfs namenode -initializeSharedEdits
,使得journalnode与namenode保持一致。再重新启动namenode就没有问题了。
但又遇到flink的jobmanager启动不了,报错如下:
ERROR org.apache.flink.runtime.entrypint.XlusterEntrypoint -Fatal error occurred in the cluster entrypoint.org.apache.flink.runtime.dispatcher.DispatcherException: Failed to take leadership with session id xxxxxxxxxxxxxxxxxxxxxxxxxx....
caused by: java.lang.RuntimeException: org.apache.flink.util.FlinkException: Could not retrieve submitted JobGraph from state handle under /xxxxx. This indicates that the retrieved state handle is broken. Try cleaning the state handle store.
..
caused by: java.io.FileNotFoundException: File does not exitst: /xxxx/submittedJobGraphe439cfc979db
节点reboot时,是有任务在执行的,而刚才journalnode的initializeSharedEdits导致某些文件丢失了,而jobmanager在读取这个提交的job时发生了报错,故在zookeeper删除flink任务的引用即可
./zkCli.sh -server zookeeper的hostset /flink/default/running_job_registry/xxxxx DONE
delete /flink/default/jobgraphs/xxxx
解决后,重新启动jobmanager、taskmanager没有问题了,再提交任务就可以了。
启动namenode报错:Journal Storage Directory /var/bigdata/hadoop/full/dfs/jn/dmgeo not formatted相关推荐
- 配置Hadoop格式化namenode时报错cannot create directory /usr/local/hadoop/tmp/dfs/name/current
格式化namenode时,通过以下字句验证是否成功 status 0 为操作成功,status 1为操作失败,往上翻查找错误原因 该错误是由于权限问题导致的 我们通过 sudo su 进入root操作 ...
- Hadoop启动NameNode报错ERROR Cannot set priority of namenode process 2639
项目场景: Hadoop启动NameNode报错::ERROR: Cannot set priority of namenode process 问题描述: Hadoop启动NameNode报错ERR ...
- 启动virt-manager报错:Failed to open /var/lib/dbus/machine-id
[root@hyperStor ~]# virt-manager //启动KVM虚拟机管理工具报错 process 4619: D-Bus library appears to be incorrec ...
- DataNode 启动失败报错 Incompatible clusterIDs
文章目录 DataNode 启动失败报错 Incompatible clusterIDs 信息 报错摘要 问题描述 问题原因 分析步骤 解决办法 参考 DataNode 启动失败报错 Incompat ...
- 【X11vnc】Ubuntu18.04 x11vnc启动失败,报错error opening logfile: /var/log/x11vnc.log
Ubuntu18.04 x11vnc启动失败,报错error opening logfile: /var/log/x11vnc.log 前提概要 报错 解决方案 前提概要 之前在Ubuntu18.04 ...
- Linux 常规安装MySQL 执行启动命令报错(附安装方法)
采用解压官网的targ ,配置mysql group权限组,并且初始化数据库后,执行service mysql start 报错: /etc/init.d/mysql: line 244: my_pr ...
- MySQL 启动失败报错无法更新pid文件
一.问题描述 某次因MySQL故障,一线人员反馈MySQL启动,一直无法启动,报错:启动mysql失败 ERROR! The server quit without updating PID file ...
- Eclipse中启动tomcat报错:A child container failed during start
我真的很崩溃,先是workspace崩了,费了好久重建的workspace,然后建立了一个小demo项目,tomcat中启动却报错,挑选其中比较重要的2条信息如下: A child container ...
- starting mysql. success!_启动mysql报错解决问题过程
启动mysqld 报错 [root@localhost ~]# service mysqld start Starting MySQL.Logging to '/etc/mysql/localhost ...
最新文章
- ipv6下单播。组播 泛播
- 北京周末去哪儿 —— 玉渊潭
- Java黑皮书课后题第4章:*4.15(电话键盘)电话上的国际标准字母/数字映射如下所示。编写程序,提示用户输入一个小写或大写字母,然后显示对应数字。对于非字母输入,提示非法输入
- 在c语言中卖水果的程序,非常难的C语言问题!!!(悬赏80)
- 如何实现:判断数据库中某表是否有记录,若为空,则插入一条记录。若不为空则查询某记录...
- java学到哪里最容易蒙,蒙哥比vs蒙克(目前最好的哪个)
- 苏州大学计算机组成题库11,苏州大学计算机组成题库(范文).doc
- C# 对称算法,加密解密类
- 进程和cpu的相关知识和简单调优方案
- 数据-第14课-栈的定义及实现
- Python解释器(Interpreter)介绍
- 网络安全等级保护三级产品清单整理
- 关于用友华表Cell插件代码
- 【我的OpenGL学习进阶之旅】如何抽取着色器代码到assets目录下的GLSL文件,以及如何通过Java或者C++代码来加载着GLSL文件?
- 蒟蒻的控制台贪吃蛇(新手实验)
- python web实战视频教程_2018Python Flask打造一个视频网站实战视频教程
- 思科模拟器实验5:交换机端口聚合配置实验
- asterisk(星号)中Dialplan基础:Answer, Playback, and Hangup Applications
- python 默认参数后接可变参数_Python可变参数会自动填充前面的默认同名参数实例...
- 相量式用计算机怎么算,计算器关于相量计算的操作方法