一、Oozie 简介
Oozie 英文翻译为:驯象人。一个基于工作流引擎的开源框架,由 Cloudera 公司贡献给Apache,提供对 Hadoop Mapreduce、Pig Jobs 的任务调度与协调。Oozie 需要部署到 Java Servlet 容器中运行。主要用于定时调度任务,多任务可以按照执行的逻辑顺序调度。

二、Oozie 的功能模块介绍
2.1、模块

  1. Workflow
    顺序执行流程节点,支持 fork(分支多个节点),join(合并多个节点为一个)
  2. Coordinator
    定时触发 workflow
  3. Bundle Job
    绑定多个 Coordinator
    2.2、常用节点
  4. 控制流节点(Control Flow Nodes)
    控制流节点一般都是定义在工作流开始或者结束的位置,比如 start,end,kill 等。以及提供工作流的执行路径机制,如 decision,fork,join 等。
  5. 动作节点(Action Nodes)
    负责执行具体动作的节点,比如:拷贝文件,执行某个 Shell 脚本等等。

三、Oozie 的部署
3.1 下载安装包并解压到指定目录
3.2 在原来学习的基础上修改 Hadoop 配置信息如下:
core-site.xml

<!-- Oozie Server 的 Hostname -->
<property>
<name>hadoop.proxyuser.admin.hosts</name>
<value>*</value>
</property>
<!-- 允许被 Oozie 代理的用户组 -->
<property>
<name>hadoop.proxyuser.admin.groups</name>
<value>*</value>
</property>

mapred-site.xml

<!-- 配置 MapReduce JobHistory Server 地址 ,默认端口 10020 -->
<property>
<name>mapreduce.jobhistory.address</name>
<value>linux01:10020</value>
</property>
<!-- 配置 MapReduce JobHistory Server web ui 地址, 默认端口 19888 -->
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>linux01:19888</value>
</property>

yarn-site.xml

<!-- 任务历史服务 -->
<property>
<name>yarn.log.server.url</name>
<value>http://linux01:19888/jobhistory/logs/</value>
</property>

3.3 将配置文件同步到集群的其它节点
3.4 重启Hadoop集群
3.5 在 oozie 根目录下解压 hadooplibs
3.6 在 Oozie 根目录下创建 libext 目录
3.7 拷贝一些依赖的 jar 包
1.将 hadooplibs 里面的 jar 包,拷贝到 libext 目录下
2.拷贝 Mysql 驱动包到 libext 目录下
3.8 将 ext-2.2.zip 拷贝到 libext/目录下
3.9 修改Oozie配置文件
oozie-site.xml

属性:oozie.service.JPAService.jdbc.driver
属性值:com.mysql.jdbc.Driver
解释:JDBC 的驱动属性:oozie.service.JPAService.jdbc.url
属性值:jdbc:mysql://linux01:3306/oozie
解释:oozie 所需的数据库地址属性:oozie.service.JPAService.jdbc.username
属性值:root
解释:数据库用户名属性:oozie.service.JPAService.jdbc.password
属性值:123456
解释:数据库密码属性:oozie.service.HadoopAccessorService.hadoop.configurations
属性值:*=/home/admin/modules/cdh/hadoop-2.5.0-cdh5.3.6/etc/hadoop
解释:让Oozie 引用 Hadoop 的配置文件

3.10 在 Mysql 中创建 Oozie 的数据库
1.上传 Oozie 目录下的 yarn.tar.gz 文件到 HDFS
2. 创建 oozie.sql 文件
3. 打包项目,生成 war 包
3.11 启动、关闭 Oozie 服务

$ bin/oozied.sh start
$ bin/oozied.sh stop

3.12 访问 Oozie 的 Web 页面

http://主机IP:11000/oozie

完!

任务调度之Oozie简介相关推荐

  1. hadoop离线阶段(第二十三节)oozie简介、安装和使用及oozie与hue的整合

    目录 oozie简介 oozie的介绍 oozie的架构 oozie的执行流程 oozie的组件介绍 oozie安装 第一步:修改core-site.xml 第二步:上传oozie的安装包并解压 第三 ...

  2. linux任务调度框架,任务调度框架Hangfire 简介

    任务调度是我们项目中常见的功能,虽然任务调度的功能实现本身并不难,但一个好用的轮子还是可以给我们的开发的效率提升不少的. 在.net环境中,较为有名的任务调度框架是HangFire与Quartz.NE ...

  3. #数据技术选型#即席查询Shib+Presto,集群任务调度HUE+Oozie

    郑昀 创建于2014/10/30 最后更新于2014/10/31 一)选型:Shib+Presto 应用场景:即席查询(Ad-hoc Query) 1.1.即席查询的目标 使用者是产品/运营/销售运营 ...

  4. Apache Oozie(1):Apache Oozie简介

    1 Oozie 概述 Oozie 是一个用来管理 Hadoop 生态圈 job 的工作流调度系统.由Cloudera 公司贡献给 Apache.Oozie 是运行于 Java servlet 容器上的 ...

  5. 什么是Oozie——大数据任务调度框架

    Oozie简介 Oozie是大数据四大协作框架之一--任务调度框架,另外三个分别为数据转换工具Sqoop,文件收集库框架Flume,大数据WEB工具Hue. 它能够提供对Hadoop MapReduc ...

  6. Oozie工作流调度工具的部署

    一.Oozie简介 Oozie英文翻译为:驯象人.一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache,提供对Hadoop Mapreduce.Pig Jobs的任务调度与协调.Oo ...

  7. Hadoop之Oozie

    Oozie简介 对于我们的工作,可能需要好几个Hadoop作业来协作完成,往往一个job的输出会被当做另一个job的输入来使用,这个时候就涉及到了数据流的处理.我们不可能就盯着程序,等它运行完再去运行 ...

  8. 工作流引擎Oozie(一):workflow

    1. Oozie简介 Yahoo开发工作流引擎Oozie(驭象者),用于管理Hadoop任务(支持MapReduce.Spark.Pig.Hive),把这些任务以DAG(有向无环图)方式串接起来.Oo ...

  9. 高可用Hadoop平台-Oozie工作流之Hadoop调度

    1.概述 在<高可用Hadoop平台-Oozie工作流>一篇中,给大家分享了如何去单一的集成Oozie这样一个插件.今天为大家介绍如何去使用Oozie创建相关工作流运行与Hadoop上,已 ...

最新文章

  1. Silverlight 5的时间表及大量问题
  2. li:hover背景色
  3. python使用界面-用python制作用户图形界面
  4. 《深入理解计算机系统》读书笔记八:程序结构和执行
  5. mongo 唯一约束索引_快速掌握mongoDB(三)——mongoDB的索引详解
  6. (10)Vivado 异步时钟约束
  7. Tomcat配置可以访问外部资源路径
  8. “Emgu.CV.CvInvoke”的类型初始值设定项引发异常 解决办法
  9. WIFI 802.11协议传输速率
  10. ScrollView如何判断滑动到底部以及getHeight()方法与getMeasuredHeight()方法的一些理解
  11. html div 球形,CSS3球形
  12. 企业机房升温-谁之过?
  13. numpy 矩阵 秩_Python(NumPy):集合只能映射秩1数组
  14. log4j配置文件,日志文件的模板
  15. c语言写法方法加_void,c语言加法程序怎么写
  16. python爬取豆瓣电影排行榜前250名
  17. 方舟服务器维护为什么要藏好,方舟生存进化芯片藏哪儿好
  18. bzoj1208 [HNOI2004]宠物收养所
  19. NNDL 作业3:分别使用numpy和pytorch实现FNN例题
  20. 初步认识地图布局和指北针 - SuperMap iDesktop 8C

热门文章

  1. Ubuntu 16.04通过命令行连接Wi-Fi
  2. 字符串格式化:Formatter类
  3. FreeType解析矢量字体存在的问题以及优化技巧
  4. 使用Visual Studio IDE编写程序时不显示窗口或窗口一闪而逝的解决方法
  5. 运动规划,路径规划和轨迹规划的关系(补充路径跟踪和轨迹跟踪)
  6. (FJWC2020)DTOJ 4688. 迫害 DJ
  7. 更改Excel单元格中批注的显示位置
  8. ASR技术和TTS技术含义及区别
  9. android防拆机方案,拆机狂人必备 iFixit Android客户端试用
  10. USRP系列(四):USRP RIO 和 Stand-alone USRP