注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

  1.    ResourceManager相关配置参数

  (1) yarn.resourcemanager.address

  参数解释:ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序,杀死应用程序等。

  默认值:${yarn.resourcemanager.hostname}:8032

  (2) yarn.resourcemanager.scheduler.address

  参数解释:ResourceManager 对ApplicationMaster暴露的访问地址。ApplicationMaster通过该地址向RM申请资源、释放资源等。

  默认值:${yarn.resourcemanager.hostname}:8030

  (3) yarn.resourcemanager.resource-tracker.address

  参数解释:ResourceManager 对NodeManager暴露的地址.。NodeManager通过该地址向RM汇报心跳,领取任务等。

  默认值:${yarn.resourcemanager.hostname}:8031

  (4) yarn.resourcemanager.admin.address

  参数解释:ResourceManager 对管理员暴露的访问地址。管理员通过该地址向RM发送管理命令等。

  默认值:${yarn.resourcemanager.hostname}:8033

  (5) yarn.resourcemanager.webapp.address

  参数解释:ResourceManager对外web ui地址。用户可通过该地址在浏览器中查看集群各类信息。

  默认值:${yarn.resourcemanager.hostname}:8088

  (6) yarn.resourcemanager.scheduler.class

  参数解释:启用的资源调度器主类。目前可用的有FIFO、Capacity Scheduler和Fair Scheduler。

  默认值:

  org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

  (7) yarn.resourcemanager.resource-tracker.client.thread-count

  参数解释:处理来自NodeManager的RPC请求的Handler数目。

  默认值:50

  (8) yarn.resourcemanager.scheduler.client.thread-count

  参数解释:处理来自ApplicationMaster的RPC请求的Handler数目。

  默认值:50

  (9) yarn.scheduler.minimum-allocation-mb/ yarn.scheduler.maximum-allocation-mb

  参数解释:单个可申请的最小/最大内存资源量。比如设置为1024和3072,则运行MapRedce作业时,每个Task最少可申请1024MB内存,最多可申请3072MB内存。

  默认值:1024/8192

  (10) yarn.scheduler.minimum-allocation-vcores / yarn.scheduler.maximum-allocation-vcores

  参数解释:单个可申请的最小/最大虚拟CPU个数。比如设置为1和4,则运行MapRedce作业时,每个Task最少可申请1个虚拟CPU,最多可申请4个虚拟CPU。什么是虚拟CPU,可阅读我的这篇文章:“YARN 资源调度器剖析”。

  默认值:1/32

  (11) yarn.resourcemanager.nodes.include-path /yarn.resourcemanager.nodes.exclude-path

  参数解释:NodeManager黑白名单。如果发现若干个NodeManager存在问题,比如故障率很高,任务运行失败率高,则可以将之加入黑名单中。注意,这两个配置参数可以动态生效。(调用一个refresh命令即可)

  默认值:“”

  (12) yarn.resourcemanager.nodemanagers.heartbeat-interval-ms

  参数解释:NodeManager心跳间隔

  默认值:1000(毫秒)

  2. NodeManager相关配置参数

  (1) yarn.nodemanager.resource.memory-mb

  参数解释:NodeManager总的可用物理内存。注意,该参数是不可修改的,一旦设置,整个运行过程中不 可动态修改。另外,该参数的默认值是8192MB,即使你的机器内存不够8192MB,YARN也会按照这些内存来使用(傻不傻?),因此,这个值通过一 定要配置。不过,Apache已经正在尝试将该参数做成可动态修改的。

  默认值:8192

  (2) yarn.nodemanager.vmem-pmem-ratio

  参数解释:每使用1MB物理内存,最多可用的虚拟内存数。

  默认值:2.1

  (3) yarn.nodemanager.resource.cpu-vcores

  参数解释:NodeManager总的可用虚拟CPU个数。

  默认值:8

  (4) yarn.nodemanager.local-dirs

  参数解释:中间结果存放位置,类似于1.0中的mapred.local.dir。注意,这个参数通常会配置多个目录,已分摊磁盘IO负载。

  默认值:${hadoop.tmp.dir}/nm-local-dir

  (5) yarn.nodemanager.log-dirs

  参数解释:日志存放地址(可配置多个目录)。

  默认值:${yarn.log.dir}/userlogs

  (6) yarn.nodemanager.log.retain-seconds

  参数解释:NodeManager上日志最多存放时间(不启用日志聚集功能时有效)。

  默认值:10800(3小时)

  (7) yarn.nodemanager.aux-services

  参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序

  默认值:“”

  原文链接:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-resourcemanager-nodemanager/

Hadoop YARN配置参数剖析—RM与NM相关参数相关推荐

  1. hadoop之 YARN配置参数剖析—RM与NM相关参数

    参数均需要在yarn-site.xml中配置: 1. ResourceManager相关配置参数 (1) yarn.resourcemanager.address 参数解释:ResourceManag ...

  2. Hadoop YARN配置参数剖析(4)—Fair Scheduler相关参数

    首先在yarn-site.xml中,将配置参数yarn.resourcemanager.scheduler.class设置为org.apache.hadoop.yarn.server.resource ...

  3. Hadoop Yarn配置参数整理(非常全面)

    RM与NM相关参数 ResourceManager 参数名称 作用 默认值 yarn.resourcemanager.address ResourceManager 对客户端暴露的地址.客户端通过该地 ...

  4. Hadoop YARN配置(RM与NM)相关参数

    配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 参数 默认值 描述 yarn.resourcemanager.host ...

  5. CDH 版本Hadoop Yarn配置容量调度器(默认是公平调度器)

    配置中进行如下调整: 其实就是在在yarn-site.xm中添加yarn.resourcemanager.scheduler.class,修改成容量调度器: <property><n ...

  6. Hadoop Yarn配置多队列的容量调度器案例

    1)在 capacity-scheduler.xml 中配置如下: (1)修改如下配置 <!-- 指定多队列,增加 hive 队列 --> <property><name ...

  7. hadoop yarn配置任务优先级

    vim yarn-site.xml

  8. mysql+io+参数_MySQL IO线程及相关参数调优

    一.关于一个SQL的简单的工作过程 1.工作前提描述 1.启动MySQL,在内存中分配一个大空间innodb_buffer_pool(其中log_buffer) 2.多用户线程连接MySQL,从内存分 ...

  9. 电阻参数_关于电阻的相关参数

    实际应用时,通常采用平均电阻温度系数,定义式:TCR(平均)=(R2-R1)/R1(T2-T1) 有负温度系数.正温度系数及在某一特定温度下电阻只会发生突变的临界温度系数.紫铜的电阻温度系数为1/23 ...

最新文章

  1. RIA Service + dataformc操作例子
  2. [zz] 几种类间关系:继承、实现、依赖、关联、聚合、组合及UML实现图
  3. 使用markdown编辑evernote(印象笔记)的常用方法汇总
  4. Spring的datasource配置详解
  5. c语言double字母,C语言double和float 实例分析
  6. 车辆姿态相关的传感器概述
  7. [转]c# 中间件 的扩展模型(.net webapi/.net Core 的 MiddleWare 处理模型)
  8. 云计算体系结构中soa构建层_云计算的服务模式及技术结构
  9. Python数模笔记-Sklearn(4)线性回归
  10. Vue + Spring Boot 学习笔记02:引入数据库实现用户登录功能
  11. getconf 取系统配制 --CPU
  12. Mycat 分布式事务的实现
  13. C++学习008-delete与delete[]的差别
  14. 谁说漂亮女程序猿就不能拿大厂Offer了?
  15. android fragment 设置透明,DialogFragment背景透明设置
  16. 求当前时间的三种方法(Java)
  17. 自从用了企业微信,彻底摆脱表格写工作周报
  18. 计算机系微电子专业就业前景,2019微电子技术专业就业前景和就业方向分析
  19. CPU是计算机的大脑英语,走进PC的大脑:CPU知识全面剖析
  20. Rock5 KubeSphere常规部署

热门文章

  1. #1406 data too long for column '' at row 1
  2. PHP函数-判断字符是否在于指定的字符串中
  3. 未来教育计算机二级预测c,二级C语言(附光盘)(全国计算机等级考试预测试卷与真考题库)...
  4. 复杂电路简化经典例题_一天搞定考试系列之电路原理(3)
  5. MyBatis接口代理
  6. 与计算机病毒相关的小故事,我和计算机病毒的故事2000字论文
  7. python如何画出多个独立的图片_python实现在一个画布上画多个子图
  8. matlab画无量纲速度分布,麦克斯韦分布与概率论中典型分布的比较教学
  9. ios13苹方字体ttf_字体 | iOS1013 SF Compact Rounded 英文 By alex
  10. 电路 晶振频率_都说晶振是电路的心脏,你真的了解它吗?