2019独角兽企业重金招聘Python工程师标准>>>

1.  虚机的环境准备不详细列出,保证个虚机之间可以ping通,以及无密码登录。

环境准备阶段。

192.168.137.117 master,slave1 zookeeper hadoop
192.168.137.118 slave2 zookeeper hadoop
192.168.137.119 slave3 zookeeper hadoop

下载hadoop,http://apache.fayea.com/hadoop/common/stable/hadoop-2.6.0.tar.gz

安装jdk,jdk 1.7.0_71

2.  切换到hadoop用户,解压hadoop-2.6.0.tar.gz。

cd /data0/
tar zxvf hadoop-2.6.0.tar.gz

配置环境变量

vi ~/.bashrc
export JAVA_HOME=/usr/java/jdk1.7.0_71
export HADOOP_HOME=/data0/hadoop-2.6.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarsource ~/.bashrc

3.  配置分布式环境,hadoop的配置文件主要有core-site.xml,mapred-site.xml, hdfs-site.xml 、 yarn-site.xml文件。

core-site.xml

<configuration><property><name>hadoop.tmp.dir</name><value>/data0/hadoop/tmp</value><description>Abase for other temporary directories.</description></property><property><name>fs.defaultFS</name><value>hdfs://master:9000</value></property><property><name>io.file.buffer.size</name><value>4096</value></property><property><name>ha.zookeeper.quorum</name><value>master:2181,slave2:2181,slave3:2181</value></property>
</configuration>

mapred-site.xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobtracker.http.address</name><value>master:50030</value></property><property><name>mapreduce.jobhistory.address</name><value>master:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>master:19888</value></property><property><name>mapreduce.job.queuename</name><value>hadoop</value></property></configuration>

hdfs-site.xml

<configuration><property><name>dfs.nameservices</name><value>ns1</value></property><property><name>dfs.namenode.secondary.http-address</name><value>master:50090</value></property><property><name>dfs.namenode.name.dir</name><value>/data0/hadoop/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>/data0/hadoop/dfs/data</value></property><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.webhdfs.enabled</name><value>true</value></property><property><name>dfs.permissions</name><value>false</value></property>
</configuration>

yarn-site.xml

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.address</name><value>master:8032</value></property><property><name>yarn.resourcemanager.scheduler.address</name><value>master:8030</value></property><property><name>yarn.resourcemanager.resource-tracker.address</name><value>master:8031</value></property><property><name>yarn.resourcemanager.admin.address</name><value>master:8033</value></property><property><name>yarn.resourcemanager.webapp.address</name><value>master:8088</value></property><property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value></property><property><name>yarn.scheduler.fair.allocation.file</name><value>/data0/hadoop-2.6.0/etc/hadoop/fair-scheduler.xml</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>4</value></property>
</configuration>

配置公平调度器

fair-scheduler.xml

<allocations><queue name="default"><minResources>0 mb,0vcores</minResources><maxResources>16384 mb,16vcores</maxResources><maxRunningApps>5</maxRunningApps><weight>1.0</weight></queue><user name="default"><maxRunningApps>5</maxRunningApps></user><queue name="hadoop"><minResources>1024 mb, 4 vcores</minResources><maxResources>4096 mb, 8 vcores</maxResources><maxRunningApps>200</maxRunningApps><minSharePreemptionTimeout>300</minSharePreemptionTimeout><weight>1.0</weight><!--<schedulingPolicy>fifo</schedulingPolicy>--></queue><user name="hadoop"><maxRunningApps>400</maxRunningApps></user><queue name="hive"><minResources>1024 mb, 1 vcores</minResources><maxResources>8092 mb, 8 vcores</maxResources><maxRunningApps>200</maxRunningApps><minSharePreemptionTimeout>300</minSharePreemptionTimeout><weight>1.0</weight><!--<schedulingPolicy>fifo</schedulingPolicy>--></queue><user name="hadoop"><maxRunningApps>400</maxRunningApps></user><userMaxAppsDefault>40</userMaxAppsDefault><fairSharePreemptionTimeout>6000</fairSharePreemptionTimeout>
</allocations>

hadoop-env.sh ,yarn-env.sh 导入JAVA_HOME

export JAVA_HOME=/usr/java/jdk1.7.0_71
vi masersmastervi slavesslave1
slave2
slave3

将配置好的环境打包

tar zcvf hadoop-2.6.0.tar.gz hadoop-2.6.0
scp  hadoop-2.6.0.tar.gz hadoop@slave2:/data0
scp  hadoop-2.6.0.tar.gz hadoop@slave3:/data0

分别登录到另外两台机器,解压hadoop包,并配置环境变量。

最后,格式化hdfs,启动hadoop集群,在master节点上执行如下命令,

hadoop namenode -format
cd $HADOOP_HOME/sbin
./start-all.shjps查看后台进程
25337 QuorumPeerMain
1075 HMaster
1694 Jps
25619 DataNode
25494 NameNode
25973 NodeManager
25839 ResourceManager
1470 Main

web查看hdfs,http://192.168.137.117:50070/

查看集群,http://192.168.137.117:8088

至此,hadoop的集群就搭建完成了。

转载于:https://my.oschina.net/u/2311010/blog/508139

hadoop2.6分布式环境搭建相关推荐

  1. Hadoop2.2.0伪分布式环境搭建(附:64位下编译Hadoop-2.2.0过程)

    Hadoop2.2.0伪分布式环境搭建: 写在前面:Hadoop2.2.0默认是支持32位的OS,如果想要在64位OS下运行的话,可以通过在64位OS下面编译Hadoop2.2.0来实现,编译的操作步 ...

  2. 2021年大数据环境搭建(二):分布式环境搭建

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 分布式环境搭建 集群规 ...

  3. Hadoop单机和伪分布式环境搭建

    hadoop环境搭建 1.三个环境        单机.伪分布式.分布式 2.三个分支       apache版本(Apache基金会)       cdh版本(cloudera公司)       ...

  4. 最详细的Hadoop+Hbase+Hive完全分布式环境搭建教程(二)

    继续上次的教程,这次安装hbase与hive.之前有同学反应百度网盘中没有hbase安装包,这次补上了,在上篇博客的网盘链接中已经有了,最详细的Hadoop+Hbase+Hive完全分布式环境搭建教程 ...

  5. 1 Hadoop 3.2.4分布式环境搭建

    1 Hadoop 3.2.4分布式环境搭建 1 系统配置 3台centOS虚拟机 # 配置hosts解析 vim /etc/hosts192.168.88.129 hadoop1 192.168.88 ...

  6. HDFS伪分布式环境搭建-很不错

    HDFS伪分布式环境搭建 原创 ZeroOne01 2018-03-24 19:51:20 评论(0) 655人阅读 HDFS概述及设计目标 什么是HDFS: 是Hadoop实现的一个分布式文件系统( ...

  7. Hadoop入门基础教程 Hadoop之完全分布式环境搭建

    上一篇我们完成了Hadoop伪分布式环境的搭建,伪分布式模式也叫单节点集群模式, NameNode.SecondaryNameNode.DataNode.JobTracker.TaskTracker所 ...

  8. Zookeeper分布式环境搭建

    Zookeeper分布式环境搭建 一.分布式安装部署 1.前置条件 2.集群规划 3.解压安装 4.配置zoo.cfg文件 5.集群操作 二.配置参数解读 1.tickTime 2.initLimit ...

  9. ZooKeeper之分布式环境搭建

    第1关:仲裁模式与伪分布式环境搭建 本关任务:了解ZooKeeper的仲裁模式,掌握伪分布式安装. vi /opt/zookeeper-3.4.12/conf/zoo.cfg 增加以下内容并保存:se ...

最新文章

  1. 【swjtu】数字电路实验6_旋转编码器人机交互电路设计
  2. 当机器学习性能遭遇瓶颈时,如何优化?如何去尝试解决问题?
  3. 判断分辨网站是否伪静态的方法
  4. mysql创建表对经常要查询的列添加索引或者组合索引
  5. android 获取url中的参数
  6. 不能在此路径中使用此配置节。如果在父级别上锁定了该节,便会出现这种情况...
  7. CSS3知识点整理(三)----变形与动画
  8. matlab是那个国家,这是一个老外写的利用曲率来识别硬币的MATLAB程序。作者所在国家的硬币偏黄色,拍摄的时候反光比较少...
  9. 理论基础 —— 二叉树 —— 顺序存储结构
  10. 【译】变分自编码器教程 一、简介
  11. 1.react生命周期详解(2020.12.05)
  12. ReflectionUtils.invokeMethod的作用
  13. 偷取php网站源码,最新PHP新闻小偷采集站开源版本源码分享,集成六个广告位,不限制域名...
  14. 长春技师学院计算机专业,中专院校 / 中专技校 / 长春市技师学院
  15. LTE-PCC SCC
  16. 超大背包(挑战编程之01背包)
  17. java.lang.AbstractMethodError: Method com/mchange/v2/c3p0/impl/NewProxyPreparedStatement.isClosed()Z
  18. 文件不见还占用空间咋修复
  19. 基于金字塔模型的自动化测试设计
  20. Java数据结构与算法 一

热门文章

  1. Mondrian and OLAP
  2. SCCM2012系列之四,SCCM2012部署前的SQL Server准备
  3. 在App中获得MainFrame指针
  4. async_memcache for tornado
  5. Android 向右滑动销毁(finish)Activity, 随着手势的滑动而滑动的效果
  6. Hibernate JPA中insert插入数据后自动执行select last_insert_id()解决方法
  7. 实体属性变更历史记录框架(一)-变更历史记录从此无忧
  8. 里约奥运会的五项技术创新
  9. 《趣学JavaScript——教孩子学编程》——1.5 本章小结
  10. Android Studio设置,鼠标放上去有提示