文章目录

  • 组件模块说明
  • 容量调度器(Capacity Scheduler)
    • 容量调度器特点
  • 公平调度器(Fair Scheduler)
  • 配置容量调度器案例
    • 例子1
    • 例子2
    • 例子3
    • 例子4
  • 配置公平调度器案例
    • 例子1

组件模块说明

Hadoop:以下内容为V3.3版本

资源管理器(ResourceManager):整个集群所有资源的管理者。作用:处理客户端请求、监控NodeManager、启动或监控ApplicationMaster、资源的分配与调度。

容器(Container):对任务运行环境的抽象,虚拟化技术容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、cpu、磁盘、网络等。好处:任务运行完直接释放。

Application Master:单个任务运行的老大,任务在Container内运行客户端提交一个job,就会产生一个ApplicationMaster。作用:为应用程序申请资源并分配给内部的任务、任务的监控与容错。

容量调度器(Capacity Scheduler)

hadoop3默认的调度器

容量调度器特点


图中queueA分配最多20%资源,queueB分配50%,queueC分配30%。其中queueC,配置租户ss、cls。

  1. 多队列:每个队列可配置一定的资源量,每个队列采用FIFO调度策略。
  2. 容量保证:管理员可为每个队列设置资源最低保证和资源使用上限(如图中queueA分配20%资源上限)
  3. 灵活性:如果一个队列中的资源有剩余,可以暂时共享给那些需要资源的队列,而一旦该队列有新的应用
    程序提交,则其他队列借调的资源会归还给该队列。
  4. 多租户:支持多用户共享集群(如图中queueC,配置租户ss、cls)和多应用程序同时运行;为了防止同一个用户的作业独占队列中的资源,该调度器会对同一用户提交的作业所占资源量进行限定。

公平调度器(Fair Scheduler)

hadoop3默认的容量调度器可以改为公平调度器

同队列所有任务共享资源,在时间尺度上获得公平的资源。如queueA,20%资源,4个任务,每个5%。

配置容量调度器案例

以下执行yarn rmadmin -refreshQueues可刷新队列配置

例子1

default 队列占总内存的 40%,最大资源容量占总资源 60%(容量调度器允许借用其他队列剩余的资源,这里限制不超过60%), hive 队列占总内存的 60%, 最大资源容量占总资源 80%。

在 capacity-scheduler.xml 中配置如下:

<!-- 指定多队列,增加hive队列 -->
<property><name>yarn.scheduler.capacity.root.queues</name><value>default,hive</value>
</property><!-- 降低default队列资源额定容量为40%,默认100% -->
<property><name>yarn.scheduler.capacity.root.default.capacity</name><value>40</value>
</property><!-- 降低default队列资源最大容量为60%,默认100% -->
<property><name>yarn.scheduler.capacity.root.default.maximum-capacity</name><value>60</value>
</property><!-- 指定hive队列的资源额定容量 -->
<property><name>yarn.scheduler.capacity.root.hive.capacity</name><value>60</value>
</property><!-- 指定hive队列的资源最大容量 -->
<property><name>yarn.scheduler.capacity.root.hive.maximum-capacity</name><value>80</value>
</property>

例子2

vcore和内存固定值配置,参考官网

yarn.scheduler.capacity.<queue-path>.maximum-allocation-mb:每个队列在资源管理器上分配给每个容器请求的最大内存限制。此设置覆盖集群配置 yarn.scheduler.maximum-allocation-mb。该值必须小于等于集群最大值。

yarn.scheduler.capacity.<queue-path>.maximum-allocation-vcores:每个队列在资源管理器中分配给每个容器请求的虚拟内核的最大限制。此设置会覆盖集群配置 yarn.scheduler.maximum-allocation-vcores。该值必须小于或等于集群最大值。

例子3

限制用户提交、操作权限

在capacity-scheduler.xml中配置如下:

<!-- 哪些用户有权向队列提交作业,如果要配置默认队列就是yarn.scheduler.capacity.root.default.acl_submit_applications-->
<property><name>yarn.scheduler.capacity.root.hive.acl_submit_applications</name><value>hive</value>
</property><!-- 哪些用户有权操作队列,管理员权限(查看/杀死) -->
<property><name>yarn.scheduler.capacity.root.hive.acl_administer_queue</name><value>hive</value>
</property><!-- 哪些用户有权配置提交任务优先级 -->
<property><name>yarn.scheduler.capacity.root.hive.acl_application_max_priority</name><value>hive</value>
</property>

例子4

任务优先级,在资源紧张时,优先级高的任务将优先获取资源。默认情况,Yarn将所有任务的优先级限制为0,若想使用任务的优先级功能,须开放该限制。

修改yarn-site.xml文件,增加以下参数,为给任务优先级配置5个等级:

<property><name>yarn.cluster.max-application-priority</name><value>5</value>
</property>

通过以下命令修改正在执行的任务的优先级。

yarn application -appID <ApplicationID> -updatePriority 优先级

例如:

yarn application -appID application_1611133087930_0009 -updatePriority 5

配置公平调度器案例

例子1

创建两个队列,分别是test和test2(以用户所属组命名)。若用户提交任务时指定队列,则任务提交到指定队列运行;若未指定队列,test用户提交的任务到root.group.test队列运行,test2提交的任务到root.group.test2队列运行(注:group为用户所属组)。

公平调度器的配置涉及到两个文件,一个是yarn-site.xml,另一个是公平调度器队列分配文件fair-scheduler.xml(文件名可自定义)。

修改yarn-site.xml文件,加入以下参数:

<property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value><description>配置使用公平调度器</description>
</property><property><name>yarn.scheduler.fair.allocation.file</name><value>/opt/module/hadoop-3.1.3/etc/hadoop/fair-scheduler.xml</value><description>指明公平调度器队列分配配置文件</description>
</property>

配置fair-scheduler.xml:

<?xml version="1.0"?>
<allocations><!-- 单个队列中Application Master占用资源的最大比例,取值0-1 ,企业一般配置0.1,比如服务器10G内存,0.1为1G --><queueMaxAMShareDefault>0.1</queueMaxAMShareDefault><!-- 单个队列最大资源的默认值 test test2 default --><queueMaxResourcesDefault>4096mb,4vcores</queueMaxResourcesDefault><!-- 增加一个队列test --><queue name="test"><!-- 队列最小资源 --><minResources>2048mb,2vcores</minResources><!-- 队列最大资源 --><maxResources>4096mb,4vcores</maxResources><!-- 队列中最多同时运行的应用数,默认50,根据线程数配置 --><maxRunningApps>4</maxRunningApps><!-- 队列中Application Master占用资源的最大比例 --><maxAMShare>0.1</maxAMShare><!-- 该队列资源权重,默认值为1.0 --><weight>1.0</weight><!-- 队列内部的资源分配策略 --><schedulingPolicy>fair</schedulingPolicy></queue><!-- 增加一个队列test2 --><queue name="test2" type="parent"><!-- 和队列test的配置相似 -->...</queue><!-- 任务队列分配策略,可配置多层规则,从第一个规则开始匹配,直到匹配成功 --><queuePlacementPolicy><!-- 提交任务时指定队列,如未指定提交队列,则继续匹配下一个规则; false表示:如果指定队列不存在,不允许自动创建--><rule name="specified" create="false"/><!-- 提交到root.group.username队列,若root.group不存在,不允许自动创建;若root.group.user不存在,允许自动创建;即test用户提交到test队列 --><rule name="nestedUserQueue" create="true"><rule name="primaryGroup" create="false"/></rule><!-- 最后一个规则必须为reject或者default。Reject表示拒绝创建提交失败,default表示把任务提交到default队列 --><rule name="reject" /></queuePlacementPolicy>
</allocations>

hadoop3 Yarn容量(Capacity Scheduler)调度器和公平(Fair Scheduler)调度器配置相关推荐

  1. Yarn调度器和调度算法(FIFO、容量调度器 与 公平调度器)

    目录 Yarn调度器和调度算法 一.先进先出调度器(FIFO) 二.容量调度器(Capacity Scheduler) 1. 容量调度器特点 2. 容量调度器资源分配算法 三.公平调度器(Fair S ...

  2. 详解Yarn中三种资源调度器(FIFO Scheduler、Capacity Scheduler、Fair Scheduler)和配置自定义队列实现任务提交不同队列

    前言 在前面 Yarn的基本架构和作业提交全流程 一文中提到,当ResourceManager收到客户端Client的请求之后会将该作业job添加到(默认的)容量调度器中,然后再由某一个空闲的Node ...

  3. 大数据之-Hadoop3.x_Yarn_容量调度器---大数据之hadoop3.x工作笔记0145

    然后我们再来看一下capacity scheduler,这个是Apache hadoop的默认调度器. 可以看到这个容量调度器,是yahoo雅虎开发的一个多用户调度器,多个用户都可以 把任务发过来对吧 ...

  4. YARN中的任务队列调度器-公平调度器(Fair Scheduler)

    一.概述 公平调度器可以为所有的应用"平均公平"分配资源,当然,这种"公平"是可以配置的,称为权重,可以在分配文件中为每一个队列设置分配资源的权重,如果没有设置 ...

  5. Hadoop3.2.0 YARN 容量调度程序

    Hadoop:容量调度程序 目的 概观 特征 配置 设置ResourceManager以使用CapacityScheduler 设置队列 队列属性 设置应用程序优先级. Capacity Schedu ...

  6. Linux进程调度:完全公平调度器 Completely Fair Scheduler 内幕| linux-2.6

    https://www.ibm.com/developerworks/cn/linux/l-completely-fair-scheduler/index.html? 目录 Linux 调度器简史 C ...

  7. 配置hadoop 使用fair scheduler调度器

    hadoop版本为cloudera hadoop cdh3u3 配置步骤为 1. 将$HADOOP_HOME/contrib/fairscheduler/hadoop-fairscheduler-0. ...

  8. 实时Linux内核调度器 | Real-Time Linux Kernel Scheduler

    <Real-Time Linux Kernel Scheduler> HOWTOs by Ankita Garg on August 1, 2009 目录 Design Goal 设计目标 ...

  9. cpu调度的最小单位_Linux CFS调度器

    一直没有写过关于Linux内核调度器的内容,这几天被问起,简单的讲了讲,收到一堆challenge,这次决定做一个通篇总结方便自己整理思路. 要说Linux2.4和2.6最大的差异就在于CFS调度器的 ...

最新文章

  1. 第一次 C语言课程设计
  2. 什么是第三方物流管理?如何套用模板进行绘制
  3. 伍迷创意随想集 之 网游与旅游结合新玩法
  4. 通过FM CO_VB_ORDER_POST更新生产订单的Components数据
  5. 网易云信+妙克:从零到标杆的在线音视频音乐教学之路
  6. 前端学习(654):优化插件
  7. 七、Python第七课——有关列表的二三事(切片、切片的遍历和复制)
  8. Three.js 学习笔记(1)--坐标体系和旋转
  9. android 动态获取权限
  10. UINO优锘:竞速“元宇宙”,中国能凭借数字孪生技术突围吗?
  11. 向 3D 城市模型添加外观
  12. NetDevOps的理解与学习路线
  13. Dubbo—— 一个服务既是消费者又是提供者
  14. pcie台式网卡无法开热点
  15. node.js 不能识别?.问号点运算符
  16. VR企业宣传满足宣传需求给客户强烈的真实感
  17. java时间字符串转时间戳
  18. 幸运转盘中的芯片——CD4017和NE555
  19. Android App兼容android10.0系统需要修改那些东西,看这个就够了
  20. 如何在mac下查看JDK文档(附jdk1.8中文文档下载地址)

热门文章

  1. python小游戏毕设 坦克大战小游戏设计与实现 (源码)
  2. 用力和应变片计算弹性模量_应变片测量原理.ppt
  3. 嵌入式开发——brctl命令实现桥接上网
  4. 启动hdfs报错:hadoop100 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)
  5. 如何给数据添加高斯白噪声?
  6. Python qrcode制作二维码
  7. html和js画圣诞树图片,基于JS2Image实现圣诞树代码,
  8. 进程间通信——消息队列(Message queue)
  9. Win10如何自定义右键菜单-修改注册表(图文)
  10. 学习固不可少 回顾也别有风味