yarn基本概念
yarn是负责调度mapreduce程序,hdfs是负责存储数据
1、Resource Manager
接受用户提交的分布式计算程序,并为其划分资源
管理、监控各个Node Manager上的资源情况,以便于均衡负载

2、Node Manager
管理它所在机器的运算资源(cpu + 内存)
负责接受Resource Manager分配的任务,创建容器、回收资源

yarn的配置

node manager在物理上应该跟data node部署在一起
resource manager在物理上应该独立部署在一台专门的机器上,这里和namenode配置在同一台物理机上.

1、修改配置文件:
vi yarn-site.xml

<configuration><property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property><property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property><property>
<name>yarn.nodemanager.resource.memory-mb</name> <!-- 配置nodemanager的内存大小 -->
<value>1024</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name> <!-- 配置nodemanager的cpu核数,如果多于物理核心则平均分配-->
<value>2</value>
</property>
</configuration>

2、scp这个yarn-site.xml到其他节点
scp yarn-site.xml root@slave1:$PWD
scp yarn-site.xml root@slave2:$PWD
scp yarn-site.xml root@slave3:$PWD

3、启动yarn集群:start-yarn.sh (注:该命令应该在resourcemanager所在的机器上执行)

4、用jps检查yarn的进程,用web浏览器查看yarn的web控制台
http://hdp20-01:8088

hadoop yarn 集群配置相关推荐

  1. hadoop yarn集群HA安装及配置

    单机部署 官网文档 https://hadoop.apache.org/docs/r2.9.2/hadoop-project-dist/hadoop-common/SingleCluster.html ...

  2. Hadoop HA on Yarn——集群配置

    集群搭建 因为服务器数量有限,这里服务器开启的进程有点多: 机器名 安装软件 运行进程 hadoop001 Hadoop,Zookeeper NameNode, DFSZKFailoverContro ...

  3. Hadoop分布式集群配置

    1.三台虚拟机(Centos7.6),配置JDK,HADOOP环境,在搭建虚拟机时,可以先将一台的环境配置,再克隆两台改IP就好.三台虚拟机最小化安装,必须拥有必要的插件 <!--解释--> ...

  4. Hadoop Ha集群配置

    为什么要配置HDFS HA?   首先:HDFS集群中NameNode 如果存在单点故障.对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用. 而影响HD ...

  5. hadoop hdfs 集群配置

    配置过程 修改配置文件 hadoop的配置文件在:/root/apps/hadoop安装目录/etc/hadoop/ 修改hadoop-env.sh,配置java环境变量 export JAVA_HO ...

  6. pythonspark集群模式运行_有关python numpy pandas scipy 等 能在YARN集群上 运行PySpark

    有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上 运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...

  7. 基于YARN集群构建运行PySpark Application

    文章转载:https://www.tuicool.com/articles/eaYVN3v Spark Application可以直接运行在YARN集群上,这种运行模式,会将资源的管理与协调统一交给Y ...

  8. Hadoop 2.0集群配置详细教程

    Hadoop 2.0集群配置详细教程 前言 Hadoop2.0介绍 Hadoop是 apache 的开源 项目,开发的主要目的是为了构建可靠,可拓展 scalable ,分布式的系 统, hadoop ...

  9. Hadoop分布式集群安装配置

    1.1 安装环境 操作系统deepin 15.11, VMware Workstation,hadoop 3.1.3 版本.在deepin 操作系统中安装 VMware Workstation,在 V ...

最新文章

  1. ITK:创建Image
  2. yum安装出现No package vim available解决办法
  3. 推荐一个好用的Chrome扩展,专门处理xml的,名叫XML Tree
  4. JavaScript 学习随记——==和===及常见元素的真假值
  5. php中数组生成下拉选项,php数组生成html下拉列表的方法
  6. HDU-1045 Fire NetFire Net 最大团
  7. asp.net 配置 X-Frame-Options
  8. table函数--Matplotlib
  9. React Native Button使用
  10. 酒店管理系统源码,前台+后台
  11. office韩文版本
  12. PHP - XHProf简明教程
  13. html中button标签reset用法
  14. Quest、Mission、Task——游戏中的“任务”
  15. 神仙道人物属性基础知识普及
  16. python实现守护进程_Python如何实现守护进程的方法示例
  17. 【Qt】Use multi-arg instead
  18. Debug: Minkowski undefined symbol; Tensorboard has no attribute ‘version‘
  19. ESP32学习笔记(一) 芯片型号介绍
  20. 商业级手术麻醉系统源码,术前分析、用药、评级,术后访视、麻醉科室管理、数据统计分析

热门文章

  1. 我这么认真地问问题,你为啥不回答???
  2. Python“制作”midi音乐“两只老虎”
  3. 视频服务器读取hdfs文件,基于HDFS的流媒体服务器Red5视频文件分发的研究与应用...
  4. 计算机网络技术人员介绍,计算机网络技术专业介绍2021 计算机网络技术专业就业方向及前景...
  5. with在python中啥意思,“with”语句在Python中做什么?
  6. C++之继承探究(十二):子类的构造、析构和赋值运算符重载
  7. php orm教程,Laravel ORM 数据model操作教程
  8. java foreach多线程_java关键字(一)
  9. java 下载文件大小_如何在浏览器中显示使用角度5下载的文件的文件大小?
  10. ISE中UCF约束文件的编写