cloudera-scm-service报错server已死,但pid文件仍存问题解决

在CDH集群运维过程中,会遇到CM数据库被锁住了、断电了,数据库没启起来,导致CDH没起起来,首先我们来梳理下遇到这些问题之后的CDH集群恢复步骤,用以以后的运维工作。

下面记录恢复步骤:
一:数据库重启(选做):
1、首先查看数据库oracle的监听状态:lsnrctl status
当使用该命令后看到最后:命令执行成功,即监听启着;
例程 “PLSExtProc”, 状态 UNKNOWN, 包含此服务的 1 个处理程序…
服务 “orcl” 包含 1 个例程。
例程 “orcl”, 状态 READY, 包含此服务的 1 个处理程序…
服务 “orclXDB” 包含 1 个例程。
例程 “orcl”, 状态 READY, 包含此服务的 1 个处理程序…
服务 “orcl_XPT” 包含 1 个例程。
例程 “orcl”, 状态 READY, 包含此服务的 1 个处理程序…
命令执行成功;
否则用lsnrctl stop停监听;
2、sqlplus / as sysdba进入sql> 命令框
shutdown immediate;关闭数据库
3、sql>quit 退出后执行lsnrctl start启监听;
4、sqlplus / as sysdba进入sql> 命令框 :startup启数据库;

二、启cloudera-scm-service
service cloudera-scm-service status 查看状态
service cloudera-scm-service start 启动service
可能遇到的问题
1、cloudera-scm-server dead but pid file exists
遇到该问题,首先删除cloudera-scm-server.pid
rm /var/run/cloudera-scm-server.pid,再重启
service cloudera-scm-service服务;
2、有可能重启后还是会失败,
则查看cloudera-scm-service.log日志,一般日志目录为:/var/log/cloudera-scm-service下,查看ERROR日志,再看cloudera-scm-service.out日志文件,如果出现:地址已被使用,则结合.log日志查看7182端口是否已经被占用;

查看端口进程命令lsof -i:7182,kill -9 pid,即可;
如果遇到org.hibernate.exception.GenericJDBCException:Cloud not open connection非一定是JDBC驱动问题,有可能是端口被占用情况,仔细排查错误,查看日志报错原因;

三、启cloudera-scm-agent
service cloudera-scm-agent status 查看状态
service cloudera-scm-agent start 启动agent

也可能遇到的问题
cloudera-scm-agent dead but pid file exists,同样删除cloudera-scm-agent.pid
rm /var/run/cloudera-scm-agent.pid,再重启,如果遇到IOError:port 9000 not free on 'dsj1’则说明9000端口被占用,kill该端口即可;

四:启完agent、service后,打开cdh网页,
进入界面,对各个组件进行处理;

CDH有可能会遇到其他的坑,还是需要仔细排查日志错误,方是上策;

cloudera-scm-service报错server已死,但pid文件仍存问题解决相关推荐

  1. asp.net使用post方式action到另一个页面,在另一个页面接受form表单的值!(报错,已解决!)...

    asp.net使用post方式action到另一个页面,在另一个页面接受form表单的值!(报错,已解决!) 原文:asp.net使用post方式action到另一个页面,在另一个页面接受form表单 ...

  2. java连接 mdx,olap4j连接sap hana的xmla服务mdx查询报错【已解决】

    olap4j连接sap hana的xmla服务mdx查询报错[已解决] 各位大神,求指教~~我在java中通过olap4j连接上了sap hana的xmla xs 服务,通过mdx查询hana中的数据 ...

  3. 关于eclipse中web项目tomcat报错Server Tomcat v9.0 Server at localhost failed to start问题解决

    第一次写博客,写个简单的好了 关于eclipse中web项目tomcat报错Server Tomcat v9.0 Server at localhost failed to start 问题 我的解决 ...

  4. Neo4j 启动报错 Server shutdown initiated by request

    Neo4j 启动报错 Server shutdown initiated by request 检查Neo4j conf文件 尝试restart 删除database下所有数据 检查Neo4j con ...

  5. 在Controller注入Service报错的解决方法

    在Controller注入Service报错的解决方法 参考文章: (1)在Controller注入Service报错的解决方法 (2)https://www.cnblogs.com/zhangxj/ ...

  6. 下载文件到本地解压压缩包出现文件损坏,报错问题已解决

    下载文件到本地解压压缩包出现文件损坏,报错问题已解决 参考文章: (1)下载文件到本地解压压缩包出现文件损坏,报错问题已解决 (2)https://www.cnblogs.com/zly-1209/p ...

  7. IDEA 配置连接数据库报错 Server returns invalid timezone. Need to set ‘serverTimezone‘ property.

    项目场景: 提示:使用IDEA连接数据库: 问题描述 提示:IDEA 配置连接数据库报错 Server returns invalid timezone. Need to set 'serverTim ...

  8. 打开UG10 C语言错误,UG打开prt文件UTF8归档报错:部件已以UTF8模式归档,但NX运行

    UG打开prt文件UTF8归档报错:部件已以UTF8模式归档,但NX运行 图1 点击确定后又会回到NX打开prt的界面中,导致我们无法查看和修改这个prt文件,不但如此即使我们选择通过导入部件的方式去 ...

  9. 报错:已处理证书链,但是在不受信任提供程序信任的根证书中终止

    报错:已处理证书链,但是在不受信任提供程序信任的根证书中终止 1.下载证书 2.开始→运行框→MMC 3.文件→添加删除管理单元 4.证书→计算机账户(其他的都保持默认,无限下一步) 5.返回窗体,点 ...

  10. pycuda安装报错(已解决)

    在安装pycuda的过程中,出现找不到cuda.h文件,出现这种问题有俩种原因: 1.确实没有找到cuda.h文件,原因是环境变量没有包含cuda路径,打开~/.bashrc添加环境路径: expor ...

最新文章

  1. 字节跳动 ClickHouse 在 A/B 实验和模型训练的使用
  2. kafka入门:简介、使用场景、设计原理、主要配置及集群搭建(转)
  3. ubuntu修改pip的官方源为豆瓣源
  4. aliyun折腾记录
  5. 节点树xmu 1466.祖先极值
  6. android代码使用adb,如何使用adb在Android 11上触发BroadcastReceiver?
  7. undo log mysql_MySQL的redo log与undo log
  8. 三维重构 c++_桐柏3d打印模型生产厂家【博通三维】-博通三维
  9. railscasts #1 Caching with Instance Variables
  10. MINIEYE完成B轮融资,四维图新基金战略领投
  11. android视频添加特效,抖音蝴蝶翅膀特效怎么弄的 安卓手机上给视频加蝴蝶特效的方法...
  12. js采集图片批量下载
  13. 集成mybatis-generator-maven-plugin报错A required class was missing while ..org/mybatis/generator/api/dom
  14. WPS 从今以后我再也不会用了 记录一下!
  15. iis mysql密码_mysql忘记root密码与root帐号被删除处理方法
  16. 用iPhone前摄3D人像建模,Meta:我看行
  17. Java 添加和删除Word文档水印
  18. oracle关于索引
  19. 编写C语言程序 输出一个菱形
  20. python官网选择哪个_python官网安装挑选哪个?

热门文章

  1. Eclipse安装教程
  2. 教之初考试系统登录选择服务器,教之初考试系统
  3. 短信接口怎么对接?看完这篇文章你就知道了!
  4. Java程序设计(基础)- 概述
  5. 计算机组成原理第五版第四章课后答案,计算机组成原理第4章习题参考答案
  6. Linux:20个linux常用命令
  7. 浅聊信创投资研究框架| 信创
  8. 20200409_W_Fluid-Structure Interaction and OpenSeesPy
  9. c语言编写打字母游戏代码,求一个用C语言编写的小游戏代码
  10. 怎样把ue4官方文档下载下来_使用Doxygen生成UE4的chm格式API文档