公司给分配了3台新的虚拟机,打算从头配置一下zookeeper,kafka,storm,hadoop,hbase的环境。

(以后配置mongodb,spark的时候,在陆续更新,目前(2016/4/21)只接触这么多)

配置的过程中发生了一些问题。这里共享一下笔记。当然,我做配置的时候的原则是:

只配置知道的,不知道的就不去配置。虽然会发生问题,但是在解决问题的过程中,能达到学习的目的。

所以,我在配置的过程中,才发生了下面这么多的弱智的问题。略有愧疚。所以,往往前期要比别人花上更多的时间和精力。

-----------------------

软件版本:(不同版本的问题有可能不一样,这里的解决方法仅供参考,出现问题概不负责)

【zookeeper】:zookeeper-3.4.6.tar.gz

【kafka】:kafka_2.9.2-0.8.1.1.tgz

【storm】:apache-storm-0.9.5.tar.gz

【hadoop】:hadoop-2.7.1.tar.gz

【hbase】:hbase-1.2.1-bin.tar.gz

-----------------------

(1)查看zookeeper.out的日志发现了如下错误。

后来发现是我的配置文件中,将dataDir的路径写错了,修改之后就不再出现这个错误。

这里其实只是我的一个最单纯的错误,留下这个错误的目的是:养成查看日志的习惯。大多数问题通过查看日志是可以找到原因的。

(2)查看zookeeper.out的日志发现了如下错误。

日志中提示是端口发生了冲突,尝试更换了一下端口。问题解决。

大多数情况下,我们都会使用zookeeper自带的端口号,当集群中启动的服务很多的时候,是会发生端口号冲突的。

(3)hadoop的配置文件不知道该如何配置。(无图)

hadoop的集群构建的时候,基本上都需要配置下面几个文件:

hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml

但是,根据Hadoop的版本不同,有可能配置的内容会有些许区别,网上的配置方法也众说纷纭。

当然,还是要感谢网上的人能将配置项加上中文翻译的。

我最初配置的时候,是打算参考正确答案(官网),结果官网上罗列了很多的配置项,

后来咨询了一些大牛得到如下结论:(当然,这个结论还是需要验证的)

①、官网上的配置项是一个“合集”,每一项都介绍的很详细。但是,其实大部分都用不上,最低配其实大部分指定点路径就行了。

②、除开JAVA_HOME等必须配置的项目之外,即使什么都不配,按理说也可以启动起来。

总结来说:配置文件需要按需配置

(4)停止hadoop的时候出现"“no datanode to stop"的错误

网上大概有三个方法来解决这个问题,我这里偷懒罗列一下。我这次是用第③种方法解决的。

【第一种解决方法】

①、删除“/usr/hadoop/tmp”里面的内容:rm -rf /usr/hadoop/tmp

②、重新创建“/usr/hadoop/tmp”文件夹。

③、删除“/tmp”下以“hadoop”开头文件。

④、重新格式化hadoop:hadoop namenode -format

⑤、重新启动hadoop

【第二种解决方法】

修改每个Slave的namespaceID,使其与Master的namespaceID一致。

或者

修改Master的namespaceID使其与Slave的namespaceID一致。

Master的“namespaceID”位于“/usr/hadoop/tmp/dfs/name/current/VERSION”文件里面,

Slave的“namespaceID”位于“/usr/hadoop/tmp/dfs/data/current/VERSION”文件里面。

【第三种解决方法】

在重新格式化分布式目录及对应文件时,需要将NameNode及DataNode上所配置的dfs.name.dir对应的路径删掉或移除,否则hadoop无法正常工作。

根据某资料所说的,这是为了避免由于格式化而删掉已有且有用的的hdfs数据,所以格式化前dfs.name.dir对应的路径应当是不存在的。

(5)停止hadoop的时候出现"no nodemanager to stop"的错误

网上找到了一篇很牛的博客(不知道是不是原创)

http://www.codeweblog.com/%E8%A7%A3%E5%86%B3%E5%85%B3%E9%97%ADhadoop%E6%97%B6no-namenode-to-stop%E5%BC%82%E5%B8%B8/

看了这篇博客之后,总算知道了PID的意义和配置的必要性。配置一下之后,果真解决了。

我修改了两个文件的PID的保存位置:

①、hadoop-env.sh

②、yarn-env.sh

需要注意以下两点:

1、hadoop-env.sh中已经邮PID_DIR的属性了,修改它的值就可以,yarn-env.sh需要自己追加属性

2、记住要先关闭Hadoop再修改,不然你修改完又无法关闭了。

(6)nodemanager启动后一段时间自动关闭

略有感慨,总是有大牛能够写出非常透彻的分析。这次也找到了一篇很好的博客:

http://my.oschina.net/u/1451042/blog/223235

按照博客上的说法,如果不在yarn-site.xml中追加yarn.resourcemanager.hostname,

nodemanager启动后要通过心跳机制定期与RM通信,否则RM会认为NM死掉,会停止NM的服务。

如下如所示,修改yarn-site.xml后,问题解决。

(7)HBase的regionServer无法通过Master节点启动

现象如下图所示,Master节点到时可以启动了,Slave节点未能与Master一同启动。

下图中左面是Master节点的进行状态,右面是Slave节点的进程状态。

原因是hbase-site.xml中【hbase.cluster.distributed】属性没有配置。

如果不设置这个属性,就不能构成完全集群模式。像下图所示追加属性之后,ReginServer正常启动。

(8)HBase的RegionServer过会就自动关闭

按照上述问题6中配置完成之后,过了一会我又去看了一下进程状态,发现Slave节点的RegionServer进行突然消失了。

(通过问题1养成了查看Log的好习惯)将原来的Log日志全部删除掉,重新启动Hbase,尝试实时监控Slave端的Log日志,

发现Log中出现大量的下面的日志:

从Log中能看出来,貌似一直在尝试与ZK集群建建立连接,可是连接不上。于是乎,想到了配置文件中的需要追加zookeeper的配置。

向下面这样修改之后,再次监控上面的Log,发现不在出现这个问题了。

注意:在配置zookeeper的地址的时候,如果不写明后面的端口号,默认为2181,由于我修改过默认端口号,所以必须写明。

如果没有修改过端口号,value中写[master,slave1,slave2]或者[192.168.1.179,192.168.1.180,192.168.1.181]都可以。

另外有一点也需要注意,如果需要zookeeper和hbase分别单独启动,不需要Hbase启动的时候自动去启动zookeeper时,

需要在hbase-env.sh的属性【HBASE_MANAGES_ZK】设置为false。默认是true的。修改后如下:

(9)启动hadoop的时候,总是提示下面的警告

在公司的时候,使用的版本是2.7.1没有出现这个问题,周末在家搞的时候,使用的是自己机器上的虚拟机,

hadoop的版本为2.5.1,就会出现这个问题。

在网上查看了一下相关信息,说是由于本地库没有加载成功的原因,使用hadoop checknative查看了一下,确实是有问题。

比较蛋疼的是,在网上找到的文章中,都是说在hadoop-env.sh中加入以下下面配置就可以解决。

export HADOOP_OPTS="-Djava.library.path=${HADOOP_HOME}/lib/"

结果尝试了几次之后没有效果。开启hadoop的debug模式之后,检测了一下启动Log。有如下提示:

说明系统中的glibc的版本和libhadoop.so需要的版本不一致导致。查看一下系统的libc版本。显示版本为2.12

*后来在网上找到一个与我一样的问题的博客:http://blog.sina.com.cn/s/blog_4eca88390102vn86.html

到网站【http://ftp.gnu.org/gnu/glibc/】上下载【glibc-2.14.tar.bz2】和【glibc-linuxthreads-2.5.tar.bz2】上传到Linux上。

(待更新)

--END--

转载于:https://www.cnblogs.com/quchunhui/p/5413807.html

集群环境配置遇到的问题(随时更新)相关推荐

  1. php连接kafka集群,Kafka集群环境配置

    Kafka集群环境配置 1 环境准备 1.1 集群规划 Node02 Node03 Node04 zk zk zk kafka kafka kafka 1.2 jar包下载 安装包:kafka_2.1 ...

  2. Hadoop集群环境配置搭建

    一.简单介绍 Hadoop最早诞生于Cutting于1998年左右开发的一个全文文本搜索引擎 Lucene,这个搜索引擎在2001年成为Apache基金会的一个子项目,也是 ElasticSearch ...

  3. MySQL数据库的MNA集群环境配置

    1 案例1:准备MHA集群环境 1.1 问题 • 准备6台虚拟机,并按照本节规划配置好IP参数 • 在这些虚拟机之间实现SSH免密登录 • 在相应节点上安装好MHA相关的软件包 1.2 方案 使用6台 ...

  4. 大数据开发系列(一)----Hadoop集群环境配置

    配置成功,jps显示如下:                                      HDFS                                             ...

  5. 三十六.MHA集群概述 、 部署MHA集群 测试配置

    1.准备MHA集群环境 准备6台虚拟机,并按照本节规划配置好IP参数 在这些虚拟机之间实现SSH免密登录 在相应节点上安装好MHA相关的软件包 使用6台RHEL 7虚拟机,如图-1所示.准备集群环境, ...

  6. zookeeper 在 windows 下配置伪集群环境

    安装启动zookeeper 在 Apache zookeeper 官网下载 https://www.apache.org/dyn/closer.cgi/zookeeper/ 下载后解压,我使用的是3. ...

  7. 大数据之-Hadoop完全分布式_集群中分发脚本xsync_集群环境中同时配置大量主机---大数据之hadoop工作笔记0033

    然后我们来说一下,如果在集群环境中动不动,10000以上台主机,那么这个时候 我们怎么去配置,不能一台一台的去配置,我们可以这样. 使用xsync来进行文件同步. 这个时候我们需要一个基于xsync编 ...

  8. 适合入门hadoop 2.7.7的集群环境搭建高可用版本配置(保姆版)

    需要的安装包: 1.jdk压缩包 2.hadoop压缩包 百度云盘链接 开始搭建hadoop集群 1 集群规划 安装VMware,使用三台虚拟机进行集群搭建,下面是每台虚拟机的规划: 2 网络配置 2 ...

  9. kafka 基础知识梳理及集群环境部署记录

    一.kafka基础介绍 Kafka是最初由Linkedin公司开发,是一个分布式.支持分区的(partition).多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特 ...

最新文章

  1. 算法之递归(3)- 链表操作
  2. JQ+ajax 提交表单不跳转页面
  3. 自然语言处理领域重要研究及资源全索引!
  4. putty完全使用手册--多窗口---git提交---连接数据库--自动日志显示
  5. MODE —— 计算10个分数的平均值(知识点: 数组 变长数组)
  6. OpenCV 透视变换
  7. Asp.net正则获取html内容
  8. VTK:几何对象演示用法实战
  9. 大工17秋《计算机文化基础》在线测试1,奥鹏大工15秋《计算机文化基础》在线测试1答案...
  10. 多分类问题的另一种处理策略——softmax回归
  11. python工作目录_python获取当前工作目录
  12. Clark变换与Park(派克)变换
  13. r语言如何计算t分布临界值_「SPSS数据分析」SPSS差异分析(3)独立样本T检验操作步骤及解读...
  14. Win10声卡驱动正常但没声音怎么办?驱动人生解决办法
  15. Fluent中级工程进阶,从5种气体燃烧模型出发
  16. flask实现浏览器实时视频播放
  17. python下载arcgis地图_使用下载器下载适用于arcgis的离线地图切片
  18. 对企业信息化建设的研究
  19. 有哪些平台是和连连支付合作的?连连支付可以跨境支付?不用去银行?
  20. c语言程序翻译软件,C语言基础 (15) 翻译软件

热门文章

  1. 指令集及流水线基本概念
  2. 机器如何区分和判定指令和数据
  3. 计算机辅助工艺设计张胜文,计算机辅助工装设计.ppt
  4. 华为最新开源框架mindspore学习
  5. HTML <div> 标签介绍
  6. 3-插入排序C实现(递增递减的简单转换)
  7. C++-Loki Allocator
  8. android 强制全屏,[Android]设置Activity为全屏显示的两种方法
  9. Netty 简单样例分析(io传输的框架)
  10. 74 计算机图形学开源处理库