早上看CDH发现有一个nodemanager挂掉

然后查看对应的日志。 发现在日志里面并没有错误。,然然后发现服务器的磁盘满了,赶紧清理磁盘空间

清理磁盘的时候发现主要是/tmp目录下面生成了很多 

类似这种的日志。

清理完空间之后 重启nodemanager。发现还是启不来

到这里之后发现就停住了。。。。然后CDH页面就挂了nodemanager还是起不来。

继续查看

发现8042端口注册不上。 然后继续追述上个日志 只要nodemanager启动就会recovering  application

所以 find 一下

find /*  -name *application application_1560341746674_1515*

发现 /data/yarn/nm/usercache/root/appcache/* 目录下面很多 类似的文件,时间为头一天晚上7点过,继续看zabbix监控 发现

内存不足,

然后晚上九点过显示磁盘空间不足,解决办法

rm  -fr /data/yarn/nm/usercache/*

删除cache之后 重启nodemanager正常

并且删除

/var/lib/hadoop-yarn/yarn-nm-recovery/*

问题分析:由于这台机器上跑大任务,导致内存不足,内存不足 yarnnodemanager会一直报警写到  /tmp目录下,产生很多大文件,进而导致磁盘不足,

删除/tmp 下面的日志之后 启动node 但是一直起不来,yarn会去cache里面 recovering任务,但是这些任务已经过时导致一直起不来,解决办法就是删除这些cache

详细信息可以参考

https://community.cloudera.com/t5/Batch-Processing-and-Workflow/Yarn-NodeManager-fails-to-start-and-crashing-with-SIGBUS/m-p/67382#M3640

https://mapr.com/docs/61/AdministratorGuide/c-config-nodemanager-restart.html

转载于:https://www.cnblogs.com/ZFBG/p/11135425.html

记一次nodemanager无法启动的情况相关推荐

  1. 在未启动程序情况 点击视图设计器 弹出未将对象引用窗体的解决方案

    请问下 在未运行程序情况 点击视图设计器 弹出未将对象引用窗体   解决方案: 1.看后台进程是不是相关的进程在启动,如果有关闭进程:重启vs,即可 2.重启电脑 转载于:https://www.cn ...

  2. 记一次hadoop namenode 启动失败问题及解决过程(启动几秒钟后又挂了)

    这是个小问题,但如果新手接触的话可能会花费一番时间才能解决,甚至会不知所措.在此重点记录的还是解决问题的方式. 问题描述 在自己虚拟机上新安装了hadoop.在做单节点启动测试时发现namenode启 ...

  3. 记一次openshift origin-node启动报错

    记一次openshift证书问题(origin-node因证书未自动更新,启动失败,导致集群服务不正常) 1.事件简述:某天访问公司openshift3.10集群上部署应用时访问报错app unava ...

  4. Vmware 8导致apache2无法启动的情况

    为了调Web前端的方便,在Windows下保留了一个xampp,今天突然出现apache启动后自动关闭的情况,比较郁闷..记得之前有过Skype占用80端口的情况,这次又是哪家抢占端口? XAMPP无 ...

  5. S3C2440的内存情况在NAND FLASH或者NOR FLASH启动的情况下

    1,从NANDFLASH启动时,在ARM上电时,ARM会自动把NANDFLASH前4K的内容拷贝到S3C2440内部SRAM中,同时把SRAM的地址映射到0X00000000.ARM上电后会从SRAM ...

  6. oracle服务器不识别tc服务,记一次ORACLE无法启动登陆事故

    打开XSHELL 登陆ORACLE用户 1.sqlplus scott/scott 提示登陆失败 2.sqplus / as sysdba 启动数据库提示 3.查找日志 操作日志:$ORACLE_HO ...

  7. mysql无法启动修复_记一次MySQL无法启动及修复经历

    记得有次本地的MySQL无法启动,网上说,去删掉InnoDB日志就行,我就傻乎乎的去删掉了InnoDB相关的文件,果然,没有任何问题,正常启动了. 可是谁曾想,过了几天,故障复现了,我就按部就班的又去 ...

  8. 解决MyEclipse里Tomcat端口被占用而无法启动的情况

    今天在MyEclipse里启动Tomcat时,控制台报错(myeclipse2013,tomcat 7.0.52) 错误显示java.lang.Exception: Socket bind faile ...

  9. mysql docker oom_记一次 K3s MySQL 启动 OOM 排查

    以前用Docker Compose做开发环境,MySQL也在Docker里运行,一切使用正常.后来开发环境迁移到K3s(轻量级的K8s),但是MySQL一启动就被OOM Killer干掉,所以一直没迁 ...

  10. 记一次windows 10启动报错 An operat ing system wasn‘t found. Try disconnecting any drives that don‘t con问题

    电脑启动时报错: 戴尔台式机启动时报错 An operat ing system wasn't found. Try disconnecting any drives that don't conta ...

最新文章

  1. openoj的一个小比赛(F题解题报告)poj3978(dp+素数筛选)
  2. 线性代数 第一章 行列式
  3. 6.4 JAVA 方法重载
  4. Linux(Redhat5.5)配置时间服务器(Ntp)法
  5. PHP 中错误控制符@
  6. Shell——输入/输出重定向
  7. 开发接口文档_产品经理必懂的接口文档撰写方式
  8. web客户端安全之跨站点请求伪造攻击
  9. C++ 构造函数与析构函数
  10. 零经验程序员如何抢占面试机会?
  11. jQuery碎语(2) 事件
  12. 大数据分析的四大趋势有哪些
  13. 看了扎心:39岁单身程序员入住养老院!养老院:院内平均年龄瞬间年轻了
  14. 三菱PLC水处理程序加触摸屏程序 三菱PLC水处理程序加触摸屏程序
  15. Android模拟器使用SD卡(2)
  16. 杭州地铁2号线西北段顺利通车 三思LED照明彰显“暖心”服务
  17. 百度云 不限速 | 2019 最好用下载工具
  18. 利用Python软件完成通讯录功能
  19. 世界杯吉祥物玩偶难产?俄罗斯人紧急求助这个杭州男人
  20. NLP学习(二)—中文分词技术

热门文章

  1. mysql utf8转gbk cmd_修改xampp的mysql数据库utf8mb4为gbk以解决cmd内中文显示为问号
  2. IntelliJ IDEA上创建Maven Spring MVC项目
  3. Nginx 解决 Tomcat 集群下的 Session共享
  4. Spring Boot_打造企业级微信点餐系统_汇总贴
  5. 第490篇--Accessing the Domain info is denied in IIS.
  6. 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_06 Properties集合_2_Properties集合中的方法store...
  7. 阶段1 语言基础+高级_1-3-Java语言高级_05-异常与多线程_第6节 Lambda表达式_6_Lambda表达式有参数有返回值的...
  8. Java8新特性:接口
  9. Codeforces 1169A Circle Metro
  10. 输入1-53周,输出1-53周的开始时间和结束时间