前言

最近,是在做集群搬移工作,大家肯定会遇到如下的场景。

(1) 比如,你新购买的电脑,初步者学习使用Ambari集群。从旧电脑复制到新电脑这边来

(2) 比如,你公司Ambari集群的ip,因业务或其他情况需要,暂时需要更改ip

(3) 比如,你更改了主机名

    (4)也许其他的原因

  扩展

linux虚拟机系统的复制或克隆后续问题解决!

问题详情

  黄色问号表示: Heartbeat Lost

  即所有的服务都心跳丢失了。。重启ambari-server和ambari-agent都不能解决。

解决途径

  1、  查看个节点之间是否可以相互通信,若ssh连接不上,有可能是该节点关机了,没有打开,手动开启该节点,再次验证是否可互通。

  2、  在主节点启动ambari-server restart和ambari-agent restart,为了保证其它节点也成功启动,在其它从节点也要进行:ambari-agent restart操作。

  3、  遇到问题

    3.1  mysql server start失败

    在启动过程中,经常出现mysql服务启动失败。查看失败信息,找到是在哪个节点的mysql服务不能正常启动,一般报错是mysql.sock这个问题,解决方法:在对应节点上进行处理:mv /var/lib/mysql/mysql.sock  /var/lib/mysql/mysql.sock_bk. 然后再次启动ambari服务。一般即可。

    3.2 datanode start 失败

       1)关闭集群全部的服务 #ambari-service stop

        2)修改目录所有者 #cd /data1/hadoop/

    #chown –R hdfs:hadoop  hdfs/

        3)重启集群服务 #ambari-service start 并且在ambari的界面start All所有组件。

      

4、

下次可以试着通过手动启动来看看,出现的问题
  如果过你通过手动启动的话,你就应该能看到报错的信息。

  如果你的ip改变了,怎么来解决?

  如果你的主机名改变了,怎么来解决?

    

最后,重新启动所有节点上的ambari-server 和 ambari-agent

[bigdata@ambigdata1 ~]$ sudo service ambari-server stop
Using python  /usr/bin/python2
Stopping ambari-server
Ambari Server stopped
[bigdata@ambigdata1 ~]$ sudo service ambari-agent stop
Verifying Python version compatibility...
Using python  /usr/bin/python2
Found ambari-agent PID: 7495
Stopping ambari-agent
Removing PID file at /var/run/ambari-agent/ambari-agent.pid
ambari-agent successfully stopped
[bigdata@ambigdata1 ~]$ sudo service ambari-server start
Using python  /usr/bin/python2
Starting ambari-server
Ambari Server running with administrator privileges.
Organizing resource files at /var/lib/ambari-server/resources...
Server PID at: /var/run/ambari-server/ambari-server.pid
Server out at: /var/log/ambari-server/ambari-server.out
Server log at: /var/log/ambari-server/ambari-server.log
Waiting for server start....................
Ambari Server 'start' completed successfully.
[bigdata@ambigdata1 ~]$ sudo service ambari-agent start
Verifying Python version compatibility...
Using python  /usr/bin/python2
Checking for previously running Ambari Agent...
Starting ambari-agent
Verifying ambari-agent process status...
Ambari Agent successfully started
Agent PID at: /var/run/ambari-agent/ambari-agent.pid
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
[bigdata@ambigdata1 ~]$ 

  其他节点,不多赘述。

  

  解决

欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑
 

同时,大家可以关注我的个人博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/

   详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

  人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
  目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

转载于:https://www.cnblogs.com/zlslch/p/7922897.html

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...相关推荐

  1. ambari集群安装hdp

    接上篇<ambari集群搭建详细步骤> 说明:ambari2.6.5和ambari2.7.5的页面不一样 集成安装向导 Get Started 开始 Select Version 选择版本 ...

  2. 如何实现 集群化/Session 复制-doc(cluster-howto.html)

    源文档链接: http://tomcat.apache.org/tomcat-6.0-doc/cluster-howto.html 翻译日期: 2014年3月19日 翻译人员: 铁锚 感受: Tomc ...

  3. ODPS主备集群双向数据复制导致主备中心网络打爆问题

    简介:ODPS主备集群双向数据复制导致主备中心网络打爆问题 1. 故障问题描述 客户现场发生了ODPS主备机房相互数据全量复制导致的主备中心网络被打爆的问题,严重影响了日常运行的ODPS任务.在ODP ...

  4. Ambari集群搭建

    [集群规划] 虚拟机1 虚拟机2 虚拟机3 内 存 5GB 5GB 5GB 磁 盘 115GB 115GB 115GB host名 vm01 vm02 vm03 ip地址 192.168.1.100 ...

  5. 给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)...

    不多说,直接上干货! 这个很简单,在集群机器里,选择就是了,本来自带就有Impala的. 扩展博客 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 欢迎大 ...

  6. HUE配置文件hue.ini 的hbase模块详解(图文详解)(分HA集群和非HA集群)

    不多说,直接上干货! 我的集群机器情况是 bigdatamaster(192.168.80.10).bigdataslave1(192.168.80.11)和bigdataslave2(192.168 ...

  7. 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

    引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

  8. 企业级负载均衡集群——通过fence设备解决集群节点之间争抢资源的现象(FENCE搭建、高可用服务配置详解)

    1.FENCE工具的原理及作用 FENCE设备是RHCS集群中必不可少的一个组成部分,通过FENCE设备可以避免因出现不可预知的情况而造成的"脑裂"现象 FENCE设备的出现,就是 ...

  9. 全网最全的Windows下Anaconda2 / Anaconda3里Python语言实现定时发送微信消息给好友或群里(图文详解)...

    不多说,直接上干货! 缘由: (1)最近看到情侣零点送祝福,感觉还是很浪漫的事情,相信有很多人熬夜为了给爱的人送上零点祝福,但是有时等着等着就睡着了或者时间并不是卡的那么准就有点强迫症了,这是也许程序 ...

最新文章

  1. “意念打字”速度接近常人手机聊天,专家:这比马斯克的“猴子玩游戏”难多了 | Nature封面...
  2. 1、计算机系统硬件(面试小知识)
  3. 《软件工艺师:专业、务实、自豪》一第3章
  4. scp 一次拷贝多个文件
  5. OpenShift 4 - 通过DaemonSet在指定Node上运行守护程序
  6. strchr,wcschr 及strrchr, wcsrchr,_tcschr,_tcsrchr函数
  7. matlab 不确定度计算器,不确定度计算器
  8. 小米笔记本 镜像_2020年小米笔记本Air 13.3原装WIN10出厂系统ISO镜像1607原版下载...
  9. java 泛型 参数传递子类_超类的Java泛型,但并非所有子类都想定义类型参数
  10. 怎么获取论文所在期刊的电子版封面及目录
  11. 【前端工程化】使用tippy.js代替自定义的popover/tooltip
  12. Python 小练习_battleship
  13. 教你六步拆解 DDD领域驱动设计落地实践
  14. IT外包项目质量把控
  15. Android侧滑返回分析和实现(不高仿微信),flutter项目实战
  16. IGBT晶圆在新能源汽车充电桩领域的应用
  17. tkinter 设置不可编辑_jquery 设置页面元素不可点击、不可编辑、只读(备忘)
  18. 应用程序无法正常启动0xc000007b的解决方法(PhotoScan为例)
  19. 测绘专业计算机二级,测绘本科毕业,几年具有考二级注册结构师资格?
  20. HDU 6555 The Fool

热门文章

  1. 多地发钱鼓励生育,能刺激年轻人生娃吗
  2. 人生第一份Offer,国企、私企、外企该选择哪一个?
  3. 国家发改委:春运期间推动“健康码”全国一码通行
  4. 人工智能时代将至,教育或将发生大改变,未来教育会人工智能化?
  5. 2019年衡水中学高考喜报
  6. linux 6.4定时启动,Centos6.4 设置开机自动以某个非root用户启动脚本
  7. oracle的存储过程 替换,为什么在存储过程中,变量替换无法使用索引?
  8. 023_Promise
  9. java中的表达式是指_Java 表达式,语句和代码块
  10. android培训内容明细,记录Android开发学习