戳蓝字“CSDN云计算”关注我们哦!

前面我们介绍了在Ubuntu上安装Hadoop单机版。但是我们知道,Hadoop在实际工作中都是以集群的形式存在的,毕竟需要处理大量的数据,单机的处理速度显然不能满足。所以这篇文章我们就来介绍一下如何在Ubuntu上搭建Hadoop集群。

准备阶段

三台在同一局域网内的Linux机器或者虚拟机。

配置好Host文件,让三台机器可以通过主机名进行访问。

三台机器上都安装了JDK。

在其中一台上安装好Hadoop,安装方法可以参考前面的文章。

配置SSH免密登录

你可能很奇怪我要搭建的是Hadoop集群,为啥需要配置SSH免密登录呢。有两点原因:

在启动集群上所有的节点的时候无需重复输入密码。

我们在搭建集群的时候需要将Hadoop的文件夹复制到其他机器上,如果是一两台的话copy起来很快,

但是如果是几百台呢,所以这个时候如果机器之间可以免密登录的话我们可以很方便的使用脚本完成整个工作。

具体的配置方式可以看下我之前的文章,SSH免密登录(内含批量配置脚本)

修改单机版的配置文件

1、修改core-site.xml,只需要修改fs.defaultFS配置项即可,hadoop.tmp.dir不需要修改。

2、修改``hdfs-site.xml`,主要是修改HDFS存储文件副本的数量,之前单机版的时候设置为1,现在改为2(这个配置项默认的配置为2)。

安装包复制,并设置环境变量

其实在我们搭建好一台机器的Hadoop环境后只需要下面几步就可以完成集群环境的搭建了:

将Hadoop的安装目录拷贝到其他机器上。

在其他机器上配置Hadoop环境变量。

执行source /etc/profile命令,使得环境变量生效。

修改namenode的slave文件,指定datanode是哪几台机器

前面两步我写好了脚本,直接执行一下就可以了。第3步中说的slave文件在hadoop的安装目录下的etc/hadoop/slave,我这里用的test01和test02两台机器做datanode。

脚本地址

附上脚本使用说明

需要保证脚本文件夹中的两个脚本文件在同一目录下。

如果Hadoop的安装目录不为/root/apps/hadoop/hadoop-2.8.5,则需要修改脚本中hadoop的安装位置(两个脚本中都需要修改)。

修改脚本中机器名称,SERVERS变量。

环境启动

1、在namenode机器上执行下面的命令

2、在浏览器中访问`http://{机器IP}:50070,查看到如下结果即代表成功。

---------------------

作者:名字想好没。

来源:CSDN

原文:

https://blog.csdn.net/sinat_27629035/article/details/85561666

版权声明:本文为博主原创文章,转载请附上博文链接!

推荐阅读

  • 罗永浩“咬定”微信不放松

  • 一篇文章带你快速理解微服务架构,由浅入深带你走进微服务架构的核心

  • 对不起,我就是喜欢问你Spring构造器注入原理

  • 程序员有话说 | 程序猿在乘地铁的时候都在想什么?

  • 清华北大“世界排名断崖式下跌”?

  • Spark+Alluxio性能调优十大技巧

  • 从云计算到AI:NetApp的数据网络转型之道

1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

2.征稿:

投稿邮箱:liudan@csdn.net;微信号:color_ld。请备注投稿+姓名+公司职位。

喜欢就点击“好看”吧!

Ubuntu上安装Hadoop集群相关推荐

  1. ubuntu中安装hadoop集群

    hadoop是由java 语言编写的主从结构分布式计算存储架构 准备工作: 操作系统: Ubuntu16.04 软件安装包:jdk-8u171-linux-x64.tar.gz : hadoop-2. ...

  2. Linux上安装Hadoop集群(CentOS7+hadoop-2.8.3)

    https://blog.csdn.net/pucao_cug/article/details/71698903 1下载hadoop 2安装3个虚拟机并实现ssh免密码登录 2.1安装3个机器 2.2 ...

  3. Ambari在离线环境中安装Hadoop集群

    2019独角兽企业重金招聘Python工程师标准>>> http://www.hackbase.com/article-973-1.html (WJW)Ambari在离线环境中安装H ...

  4. CentOS7 搭建Ambari-Server,安装Hadoop集群(一)

    2017-07-05:修正几处拼写错误,之前没发现,抱歉! 第一次在cnblogs上发表文章,效果肯定不会好,希望各位多包涵. 编写这个文档的背景是月中的时候,部门老大希望我们能够抽时间学习一下Had ...

  5. 使用ambari安装hadoop集群

    之前一篇介绍了ambari的安装,这一篇介绍一下通过ambari安装Hadoop集群 登陆后,给自己的hadoop集群起个名字 选择HDP版本,并且选中use local repository 我们操 ...

  6. 在CentOS上安装ZooKeeper集群

    一共准备3个CentOS虚拟机 172.16.9.194 172.16.9.195 172.16.9.196 上传zookeeper-3.3.6.tar.gz到服务器并解压,3台服务器的目录结构如下 ...

  7. 三台Ubuntu虚拟机搭建 Hadoop集群 (第一次搭)

    最近因为要搭Hadoop集群,确实花了好大的心血在里面,因为我的Linux也是前两天速成的,好多东西都还是边查资料边搭.但我最终确实成功了,留了一点点小问题在里面.(当Hadoop集群start-al ...

  8. CentOS7上搭建Hadoop集群(入门级)

    场景 Hadoop Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软 件框架,支持在商品硬件构建的大型集群上运行应用程序.Hadoop是根据Goog ...

  9. 在mac上进行hadoop集群搭建

    一.环境说明 软件版本 环境&软件 版本 操作系统&macOs 11.2.1 虚拟机&VMware Fusion 12.1 服务器&CentOS 7.8 jdk 1.8 ...

最新文章

  1. redis有序集合类型sort set
  2. 一个可视化的retrospective网站
  3. 数据结构实验之链表五:单链表的拆分_JAVA
  4. Heinz College of Information Systems and Public Policy Carnegie Mellon University
  5. Unknown media type in type ‘all/all’ 的解决办法
  6. 金融行业怎么用AI?蚂蚁金服是这么做的
  7. FIle类和递归方法的使用
  8. [家里蹲大学数学杂志]第410期定积分难题
  9. 【Retinex】【Frankle-McCann Retinex】matlab代码注释
  10. Apache Flink 在翼支付的实践应用
  11. [原创]C#之探索发现:在WinForm上写的一个模拟分页小程序
  12. 人物抠图(Photoshop技巧系列)
  13. 正则表达式同时匹配中英文及常用正则表达式
  14. 设计-前端设计尺寸与规范
  15. 机器人操作空间轨迹规划 -- 姿态规划
  16. IPv6测试(一)认识IPv6
  17. 设计模式只是一把锤子,不要拿着到处去敲!
  18. 购物商城html源码asp,购物商城 html
  19. 关于关联规则的一些资料
  20. 给定两点确定一条直线

热门文章

  1. android jni java调用c,Android与JNI(一) ---- Java调用C 静态调用
  2. 多所高校通知:暂缓返校
  3. 2021年“最美科技工作者”李德仁院士:科学要为祖国服务
  4. 不可思议的素数(上)(文末送书)
  5. 招聘、招聘,我就这样被算法选中
  6. (pytorch-深度学习系列)简单实现kaggle房价预测-学习笔记
  7. java接口经常变动前端怎么办_Java进程故障排查(CPU资源占用高,接口响应超时,功能接口停滞等)...
  8. 23种设计模式之装饰模式
  9. redis主从搭建和分片集群搭建
  10. 利用正则匹配url是否合法对于有的url会浪费过长时间使程序卡死,切记!