完全分布式搭建

前边已经修改完ip了,那么现在就开始搭建完全分布式了

1、修改主机名

hostname(查看主机名)

sudo nano /etc/hostname(修改主机名)

2、修改hosts文件

sudo nano /etc/hosts

添加格式为 IP  + 主机名

之后重启所有虚拟机,然后hostname查看主机名,发现主机名已经改变。

3、克隆虚拟机

克隆3台client(centos7)

步骤:右键centos-7-->管理->克隆-> ... -> 完整克隆

4、启动客户端并且修改hostname和ip地址

编辑sudo nano /etc/sysconfig/network-scripts/ifcfg-eno33文件(只修改ip就行)

编辑sudo nano /etc/hostname

编辑sudo nano /etc/resolv.conf

nameserver 192.168.17.2(网关地址)

重启网络服务

$>sudo service network restart

这里简要介绍一下namonode和DataNode的作用:

 NameNode只负责元数据信息,没有数据流,他只负责维护名字空间,任何对文件系统名字空间的改动都记录在NameNode。系统的文件组织结构和linux非常类似。你可以创建,删除,移动,重命名文件或者目录。

DataNode负责为文件系统的客户提供读/写操作服务。DataNode同时还为NameNode提供block创建,删除,备份机制。

5、ssh免密登录(在你所在用户的根目录下)

执行:ssh-keygen -t rsa(一直按回车)
[wang@wang201 ~]$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/wang/.ssh/id_rsa):
Created directory '/home/wang/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /home/wang/.ssh/id_rsa.
Your public key has been saved in /home/wang/.ssh/id_rsa.pub.
The key fingerprint is:
39:f2:fc:70:ef:e9:bd:05:40:6e:64:b0:99:56:6e:01 usera@serverA
The key's randomart image is:
+--[ RSA 2048]----+
|          Eo*    |
|           @ .   |
|          = *    |
|         o o .   |
|      . S     .  |
|       + .     . |
|        + .     .|
|         + . o . |
|          .o= o. |
+-----------------+

此时会在/home/wang/.ssh目录下生成密钥对

[wang@wang201~]$ ls -la .ssh
总用量 16
drwx------  2 wang wang 4096  8月 24 09:22 .
drwxrwx--- 12 wang wang 4096  8月 24 09:22 ..
-rw-------  1 wang wang 1675  8月 24 09:22 id_rsa
-rw-r--r--  1 wang wang 399  8月 24 09:22 id_rsa.pub

然后将公钥id_rsa.pub上传到wang202服务器的,并以wang用户登录

[wang@wang201~]$ ssh-copy-id wang@wang202
The authenticity of host '10.124.84.20 (10.124.84.20)' can't be established.
RSA key fingerprint is f0:1c:05:40:d3:71:31:61:b6:ad:7c:c2:f0:85:3c:cf.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added '10.124.84.20' (RSA) to the list of known hosts.
wang@wang202's password:
Now try logging into the machine, with "ssh 'userb@10.124.84.20'", and check in:.ssh/authorized_keysto make sure we haven't added extra keys that you weren't expecting.

这个时候wang的公钥文件内容会追加写入到wang的 .ssh/authorized_keys 文件中,这样做完之后我们就可以免密码登录了

6、验证一下ssh操作其他机器

使用ssh wang202 就能登录成功了

如果登录不成功或者还需要密码验证,那就把/home/wang/.ssh 下的文件删除,重新做一次ssh的免密。

一般权限修改成700(只要没有w权限就可以了)  里面文件建议644或者600。

7、安装hadoop

a.在根目录新建文件夹 :sudo mkdir /soft

b.修改soft权限:chown -R wang:wang /soft/

c.上传hadoop安装包到给目录下(我用的是hadoop-2.7.3版本的,版本可自选)

d.解压:tar -zxvf hadoop-2.7.3.tar.gz

e.解压后名字太长可以改个名字: mv   hadoop-2.7.3   hadoop

f.解压后在hadoop里创建:mkdir -p /data/tmp(用来保存fsimage和edits文件,非常重要)

g.配置 hadoop/etc/hadoop/下的文件:

core-site.xml:

     <property><name>fs.defaultFS</name><value>hdfs://wang201/</value></property><property><name>hadoop.tmp.dir</name><value>/soft/hadoop-2.7.3/data/tmp</value></property><property><name>hadoop.http.staticuser.user</name><value>wang</value></property>        

hdfs-site.xml:

    <property><name>dfs.replication</name><value>3</value></property><property><name>dfs.permissions.enabled</name><value>false</value></property><property><name>dfs.namenode.secondary.http-address</name><value>wang203:50090</value></property>

yarn-site.xml:

    <property><name>yarn.resourcemanager.hostname</name><value>wang201</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.log-aggregation-enable</name><value>true</value></property><property><name>yarn.log-aggregation.retain-seconds</name><value>106800</value></property>

mapred-site.xml:

   <property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobhistory.address</name><value>wang201:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>wang201:19888</value></property>

slaves:

wang202
wang203
wang204

hadoop-env.sh:

export JAVA_HOME=/soft/jdk

h.分发配置

$>cd /soft/hadoop/etc/

$>scp -r hadoop-2.7.3  wang@wang202:/soft/

$>scp -r hadoop-2.7.3  wang@wang203:/soft/

$>scp -r hadoop-2.7.3  wang@wang204:/soft/

格式化文件系统

hadoop namenode -format

显示这样即表示成功了

启动hadoop进程

$>start-all.sh

然后用jps就能看到有哪些进程了

转载于:https://www.cnblogs.com/wakerwang/p/9471391.html

大数据小项目之电视收视率企业项目04--完全分布式搭建相关推荐

  1. 大数据小项目之电视收视率企业项目09--hive环境搭建

    Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据.它架构在Hadoop之上,总归为大数据,并使得查询和分析方便.并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务 ...

  2. 大数据小项目之电视收视率企业项目07

    maven搭建(前提是在你的Windows电脑上有Java,并且能用) 下图为maven官网(http://maven.apache.org/) 安装 Maven 之前要求先确定你的 JDK 已经安装 ...

  3. 大数据小项目之电视收视率企业项目12

    因为环境不足,所以没有用flume收集日志,而是用的已经从别的渠道的日志 日志截图: 编写以下脚本,将收集的日志文件上传至HDFS #!/bin/bash#set java env export JA ...

  4. 大数据小项目之电视收视率企业项目10

    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供对数据进行简单处理,并 ...

  5. 大数据小项目之电视收视率企业项目11

    sqoop数据迁移 概述 sqoop是apache旗下一款"Hadoop和关系数据库服务器之间传送数据"的工具. 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS ...

  6. 大数据小项目之电视收视率企业项目05

    通过hadoop自带的demo运行单词统计(测试) 在家目录下操作: 1)mkdir input 2)cd intput 3)echo "hello word" > file ...

  7. 大数据小项目之电视收视率企业项目06

    hadoop常用的命令 hdfs dfs -mkdir -p /user/wang/hadoop  递归创建目录 hdfs dfs -ls /user 查看/user下内容 hdfs dfs -ls ...

  8. 大数据小项目之电视收视率企业项目01

    一.VM安装(这个大家去百度吧....) 二.centos安装 版本:centos7 'https://jingyan.baidu.com/article/a3aad71aa180e7b1fa0096 ...

  9. 大数据小项目之电视收视率企业项目03

    Yum的介绍 Yum 全称为 Yellow dog Updater, Modified,它是一个在线的软件安装命令. 他能够从指定的服务器自动下载RPM包并且安装,可以自动处理依赖性关系,并且一次安装 ...

最新文章

  1. 有兴趣的执行一下这段代码
  2. 团体——L1-003 个位数统计 (c)
  3. mongodb中分页显示数据集的学习
  4. 详解HTTP与HTTPS
  5. TCP/IP学习笔记-Qt中的ReuseAddressHint以及SO_REUSEADDR,以为组播常用场景分析
  6. torch.mul() 和 torch.mm() 区别【矩阵a和b对应位相乘/矩阵相乘】
  7. 【论文阅读】Abdominal multi-organ segmentation with organ-attention networks and statistical fusion
  8. Unity2020系列通用中文语言包
  9. PDF转CAD格式步骤再简单
  10. Spring框架学习记录二:装配Bean
  11. 6-3 jmu-python-函数-找钱 (10分)
  12. oracle12c性能测试,Oracle12c IMO 测试
  13. 基于STM32F429动态信号测试分析系统
  14. 全方位教你怎么看懂英国的车牌
  15. Python输出 计算器 !
  16. 以梦为马,扬帆起航,双非人的2021,万字逐梦旅
  17. 权威披露2014微信十大最火谣言 | 调查称女性最爱传谣,你服不服?
  18. 2008-2020年各省地方债务余额数据(wind)
  19. Breeze's MapHack 1.0 正式版发布【修正版发布】
  20. Connectify中文版一人上网多人受益

热门文章

  1. 1. golang 语言环境安装
  2. Eclipse常用设置
  3. Android中使用running services查看service进程内存
  4. 抽象类在ASP.NET的学习与应用
  5. CentOS4 可用镜像及更新方式
  6. C语言中static全局变量与普通的全局变量区别
  7. 电脑解锁后黑屏有鼠标_笔记本电脑开机黑屏只显示鼠标怎么办?
  8. 单片机涡轮流量传感器_暖通慧教你一文读懂流量传感器
  9. Python--day41--事件和信号量之模拟连接数据库并在连接三次后抛出连接超时异常...
  10. Ts + React + Mobx 实现移动端浏览器控制台