Hadoop介绍

Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。

狭义上说,Hadoop指Apache这款开源框架,它的核心组件有:

HDFS(分布式文件系统):解决海量数据存储

YARN(作业调度和集群资源管理的框架):解决资源任务调度

MAPREDUCE(分布式运算编程框架):解决海量数据计算

hadoop集群的搭建即为在集群中安装以上的3个组件。

Hadoop优点

1、扩容能力(Scalable)Hadoop是在可用的计算机集群间分配数据并完成计算任务的,这些集群可用方便的扩展到数以千计的节点中。

2、成本低(Economical):Hadoop通过普通廉价的机器组成服务器集群来分发以及处理数据,以至于成本很低。

3、高效率(Efficient):通过并发数据,Hadoop可以在节点之间动态并行的移动数据,使得速度非常快。

4、可靠性(Rellable):能自动维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。所以Hadoop的按位存储和处理数据的能力值得人们信赖。

服务器集群环境基本配置

1、在VMware上创建3个虚拟机,用以模拟集群环境

  1. 1 登录并在命令行中输入ifconfig查看IP地址

这个ip地址是自动分配的,后边我们需要将ip设置为静态的。

  1. 2 虚拟机网络配置

编辑虚拟机的网络编辑器

1.3  修改IP地址为静态

编辑修改网卡IP地址的配置文件

vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改以下的红色部分

TYPE="Ethernet"

PROXY_METHOD="none"

BROWSER_ONLY="no"

BOOTPROTO="static"

DEFROUTE="yes"

IPV4_FAILURE_FATAL="no"

IPV6INIT="yes"

IPV6_AUTOCONF="yes"

IPV6_DEFROUTE="yes"

IPV6_FAILURE_FATAL="no"

IPV6_ADDR_GEN_MODE="stable-privacy"

NAME="ens33"

UUID="dfd8991d-799e-46b2-aaf0-ed2c95098d58"

DEVICE="ens33"

ONBOOT="yes"

IPADDR="192.168.88.161"

GATEWAY="192.168.88.2"

NETMASK="255.255.255.0"

DNS1="8.8.8.8"

DNS2="114.114.114.114"

IPV6_PRIVACY="no"

最后使用systemctl restart network重启网络并使用ifconfig查看ip地址是否改变。

  1. 4 设置主机名和域名映射

配置每台虚拟机主机名,分别编辑每台虚拟机的hostname文件,直接填写主机名,保存退出即可。

vim /etc/hostname

第一台主机主机名为:node1

第二台主机主机名为:node2

第三台主机主机名为:node3

配置每台虚拟机域名映射,分别编辑每台虚拟机的hosts文件,在原有内容的基础上,增加以下内容:

注意:不要修改文件原来的内容,三台虚拟机的配置内容都一样。

vim /etc/hosts

192.168.88.161 node1

192.168.88.162 node2

192.168.88.163 node3

  1. 关闭三台虚拟机的防火墙和Selinux

关闭每台虚拟机的防火墙,在每台虚拟机上分别执行以下指令:

systemctl stop firewalld.service          #停止firewall

systemctl disable firewalld.service       #禁止firewall开机启动

关闭之后,查看防火墙状态:

systemctl status firewalld.service

关闭每台虚拟机的Selinux,编辑每台虚拟机的Selinux的配置文件

vim /etc/selinux/config

将Selinux工作模式关闭:

  1. 三台机器机器免密码登录

 第一步:三台机器生成公钥与私钥,在三台机器执行以下命令,生成公钥与私钥。

ssh-keygen -t rsa

执行该命令之后,按下三个回车即可,然后敲(三个回车),就会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥),默认保存在/root/.ssh目录。

第二步:将三台机器的公钥拷贝到第一台机器,三台机器执行命令:

ssh-copy-id node1

在执行该命令之后,需要输入yes和node1的密码:

第三步:复制第一台机器的认证到其他机器,在第一台机器上指行以下命令

scp /root/.ssh/authorized_keys node2:/root/.ssh

scp /root/.ssh/authorized_keys node3:/root/.ssh

执行命令时,需要输入yes和对方的密码

第四步:测试SSH免密登录

可以在任何一台主机上通过ssh 主机名命令去远程登录到该主机,输入exit退出登录

例如:在node1机器上,免密登录到node2机器上

ssh node1

exit

执行效果如下:

  1. 7三台机器时钟同步

通过网络连接外网进行时钟同步,必须保证虚拟机连上外网,启动定时任务。

crontab -e

随后在输入界面键入以下内容,每隔一分钟就去连接阿里云时间同步服务器,进行时钟同步

*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com;

hadoop集群搭建学习总结(一)相关推荐

  1. 好程序员大数据笔记之:Hadoop集群搭建

    好程序员大数据笔记之:Hadoop集群搭建在学习大数据的过程中,我们接触了很多关于Hadoop的理论和操作性的知识点,尤其在近期学习的Hadoop集群的搭建问题上,小细节,小难点拼频频出现,所以,今天 ...

  2. 不看就亏系列!这里有完整的 Hadoop 集群搭建教程,和最易懂的 Hadoop 概念!| 附代码...

    作者 | chen_01_c 责编 | Carol 来源 | CSDN 博客 封图 | CSDN付费下载于视觉中国 hadoop介绍 Hadoop 是 Lucene 创始人 Doug Cutting, ...

  3. 环境搭建-Hadoop集群搭建

    环境搭建-Hadoop集群搭建 写在前面,前面我们快速搭建好了centos的集群环境,接下来,我们就来开始hadoop的集群的搭建工作 实验环境 Hadoop版本:CDH 5.7.0 这里,我想说一下 ...

  4. linux hadoop集群搭建,hadoop集群搭建

    hadoop集群搭建步骤 实验介绍 下面将要在三台linux虚拟机上搭建hadoop集群. 知识点 linux基本命令 集群安装 完成实验需要以下相关知识 解压命令 tar -zxvf XX.tar. ...

  5. Hadoop集群搭建(27)

    2019独角兽企业重金招聘Python工程师标准>>> Hadoop集群搭建方式: 1.1    确定部署三个节点,分别是hadoop0,hadoop1,hadoop2. 其中had ...

  6. Hadoop 集群搭建

    Hadoop 集群搭建 2016-09-24 杜亦舒 目标 在3台服务器上搭建 Hadoop2.7.3 集群,然后测试验证,要能够向 HDFS 上传文件,并成功运行 mapreduce 示例程序 搭建 ...

  7. 大数据 -- Hadoop集群搭建

    Hadoop集群搭建 1.修改/etc/hosts文件 在每台linux机器上,sudo vim /etc/hosts 编写hosts文件.将主机名和ip地址的映射填写进去.编辑完后,结果如下: 2. ...

  8. hadoop集群搭建 修改配置文件(三台主机都要配置)

    hadoop集群搭建      修改配置文件(三台主机都要配置) master 主机配置 1)hadoop-env.sh vim hadoop-env.sh 2)core-site.xml vim c ...

  9. Hadoop集群搭建之问题锦集

    **Hadoop集群搭建之问题锦集** 1.Centos7 ifconfig这个命令没找到的解决方法 yum -y install net-tools 2.修改文件的读写权限 chmod 777 /e ...

最新文章

  1. goland 关闭 自动移除未使用的包  自动添加需要的包
  2. c++ clang_complete
  3. mysql 子查询添加索引_mysql – 你能索引子查询吗?
  4. C++实现N选R的实现算法(附完整源码)
  5. 漫画TCP——一个悲伤的故事
  6. 架构日趋复杂的今天,如何重构数据库和应用边界?
  7. cadence自动生成铺铜_干货 | 国内铜湿法冶金工艺现状分析
  8. Linux日常运维管理技巧(二)Linux防火墙:你可以ping别人,别人ping不了你、转发、代理
  9. shell if语句特殊用法(高级用法),工具安装判断
  10. 想要换壁纸,看这个网站就够了!
  11. 54 计算机与信息科学类,计算机与信息科学类专业包括哪些
  12. 模型参数太多怎么办?用谷歌高效训练库GPipe啊
  13. OLE 操作Excel 祥解
  14. 【Flutter】微信项目实战【03】我的界面搭建(下)
  15. 深度学习图片卷积输出大小计算公式
  16. 重装系统都杀不掉的十大病毒
  17. Window应急响应(五):ARP病毒
  18. php批量打印页面,SETE批量打印
  19. mac软件卸载不干净?你没用对工具!!试试这款mac卸载神器!
  20. SAP_控制TECO生产订单不能发料及收货

热门文章

  1. 转载:高德地图加载不出来,有高德的logo,但地图一片空白
  2. ARX程序的升级及多版本编译须知
  3. [1171]windows10局域网设置固定IP地址
  4. 接入网的方式和PON网络技术
  5. python里clear和copy_python (集合和深浅拷贝)
  6. 龙族幻想无法获取服务器端文件,龙族幻想无法进入怎么办?无法进入解决办法一览...
  7. 浮栅场效应管 符号_学修手机要了解维修的基础知识场效应管:指南舟手机维修培训学校...
  8. Android Studio 入门(转)
  9. C++实现位图的旋转
  10. scrollTop()方法