hadoop yarn 集群配置
yarn基本概念
yarn是负责调度mapreduce程序,hdfs是负责存储数据
1、Resource Manager
接受用户提交的分布式计算程序,并为其划分资源
管理、监控各个Node Manager上的资源情况,以便于均衡负载
2、Node Manager
管理它所在机器的运算资源(cpu + 内存)
负责接受Resource Manager分配的任务,创建容器、回收资源
yarn的配置
node manager在物理上应该跟data node部署在一起
resource manager在物理上应该独立部署在一台专门的机器上,这里和namenode配置在同一台物理机上.
1、修改配置文件:
vi yarn-site.xml
<configuration><property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property><property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property><property>
<name>yarn.nodemanager.resource.memory-mb</name> <!-- 配置nodemanager的内存大小 -->
<value>1024</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name> <!-- 配置nodemanager的cpu核数,如果多于物理核心则平均分配-->
<value>2</value>
</property>
</configuration>
2、scp这个yarn-site.xml到其他节点
scp yarn-site.xml root@slave1:$PWD
scp yarn-site.xml root@slave2:$PWD
scp yarn-site.xml root@slave3:$PWD
3、启动yarn集群:start-yarn.sh
(注:该命令应该在resourcemanager所在的机器上执行)
4、用jps检查yarn的进程,用web浏览器查看yarn的web控制台
http://hdp20-01:8088
hadoop yarn 集群配置相关推荐
- hadoop yarn集群HA安装及配置
单机部署 官网文档 https://hadoop.apache.org/docs/r2.9.2/hadoop-project-dist/hadoop-common/SingleCluster.html ...
- Hadoop HA on Yarn——集群配置
集群搭建 因为服务器数量有限,这里服务器开启的进程有点多: 机器名 安装软件 运行进程 hadoop001 Hadoop,Zookeeper NameNode, DFSZKFailoverContro ...
- Hadoop分布式集群配置
1.三台虚拟机(Centos7.6),配置JDK,HADOOP环境,在搭建虚拟机时,可以先将一台的环境配置,再克隆两台改IP就好.三台虚拟机最小化安装,必须拥有必要的插件 <!--解释--> ...
- Hadoop Ha集群配置
为什么要配置HDFS HA? 首先:HDFS集群中NameNode 如果存在单点故障.对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用. 而影响HD ...
- hadoop hdfs 集群配置
配置过程 修改配置文件 hadoop的配置文件在:/root/apps/hadoop安装目录/etc/hadoop/ 修改hadoop-env.sh,配置java环境变量 export JAVA_HO ...
- pythonspark集群模式运行_有关python numpy pandas scipy 等 能在YARN集群上 运行PySpark
有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上 运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...
- 基于YARN集群构建运行PySpark Application
文章转载:https://www.tuicool.com/articles/eaYVN3v Spark Application可以直接运行在YARN集群上,这种运行模式,会将资源的管理与协调统一交给Y ...
- Hadoop 2.0集群配置详细教程
Hadoop 2.0集群配置详细教程 前言 Hadoop2.0介绍 Hadoop是 apache 的开源 项目,开发的主要目的是为了构建可靠,可拓展 scalable ,分布式的系 统, hadoop ...
- Hadoop分布式集群安装配置
1.1 安装环境 操作系统deepin 15.11, VMware Workstation,hadoop 3.1.3 版本.在deepin 操作系统中安装 VMware Workstation,在 V ...
最新文章
- ITK:创建Image
- yum安装出现No package vim available解决办法
- 推荐一个好用的Chrome扩展,专门处理xml的,名叫XML Tree
- JavaScript 学习随记——==和===及常见元素的真假值
- php中数组生成下拉选项,php数组生成html下拉列表的方法
- HDU-1045 Fire NetFire Net 最大团
- asp.net 配置 X-Frame-Options
- table函数--Matplotlib
- React Native Button使用
- 酒店管理系统源码,前台+后台
- office韩文版本
- PHP - XHProf简明教程
- html中button标签reset用法
- Quest、Mission、Task——游戏中的“任务”
- 神仙道人物属性基础知识普及
- python实现守护进程_Python如何实现守护进程的方法示例
- 【Qt】Use multi-arg instead
- Debug: Minkowski undefined symbol; Tensorboard has no attribute ‘version‘
- ESP32学习笔记(一) 芯片型号介绍
- 商业级手术麻醉系统源码,术前分析、用药、评级,术后访视、麻醉科室管理、数据统计分析
热门文章
- 我这么认真地问问题,你为啥不回答???
- Python“制作”midi音乐“两只老虎”
- 视频服务器读取hdfs文件,基于HDFS的流媒体服务器Red5视频文件分发的研究与应用...
- 计算机网络技术人员介绍,计算机网络技术专业介绍2021 计算机网络技术专业就业方向及前景...
- with在python中啥意思,“with”语句在Python中做什么?
- C++之继承探究(十二):子类的构造、析构和赋值运算符重载
- php orm教程,Laravel ORM 数据model操作教程
- java foreach多线程_java关键字(一)
- java 下载文件大小_如何在浏览器中显示使用角度5下载的文件的文件大小?
- ISE中UCF约束文件的编写