大数据单机学习环境搭建(12)Azkaban的简单使用
专题:大数据单机学习环境搭建和使用
- 1.登录和密码修改
- 2.新建工程
- 2.1新建工程
- 2.2创建zip文件
- 2.3添加文件到项目
- 3.任务执行
- 3.1立即执行
- 3.2.设置定时任务
- 4.依赖任务建立
大数据单机学习环境搭建(12)Azkaban的简单使用
写在前面:
Azkaban单机部署教程地址
百度网盘个人分享资源
1.登录和密码修改
Azkaban安装后登录 http://node1:8081/index(node1改为),原始账号:azkaban,密码:azkaban
用户名和密码修改,进入conf文件夹编辑xml文件即可
cd /opt/azkaban-solo-server/conf
vim azkaban.properties
2.新建工程
2.1新建工程
2.2创建zip文件
1.job文件 type=command
指明执行方式是command
,command=sh date_save.sh
指明要执行的内容,执行内容不一定是文件,也可以是单独的命令,例如:hive -e 'select current_date();'
。
# command.jobtype=command
command=sh date_save.sh
2.date_save.sh文件简单写个例子,内容无所谓只有正确就行
date >> /home/azkaban测试.txt
3.文件打包压缩为zip
2.3添加文件到项目
3.任务执行
添加完文件后点击Execute Flow
进入任务执行设置界面
3.1立即执行
1.点击Execute
再点击弹出的Continue
即可立即执行
2.如下提示即执行成功,进入History可以查看更过执行信息
3.查看sh的重定向文件即可看的执行结果
3.2.设置定时任务
1.重新点击Execute Flow
进入任务执行设置界面,点击Schedule
进入定时任务设置
2.Azkaban提供的任务设置非常简单易用,具体见下图。再点击弹出的Continue
即可
3.设置完成既有任务执行计划
4.执行结果查看同立即执行一样不再赘述。
4.依赖任务建立
依赖关系如图所示,task2依赖task1执行,task3依赖task1和task2执行。任务执行与第3部分设置完全一致,不再赘述。具体文件设置见下方,懒人链接下载task.zip(本人会陆续更新更多免费资源,请点赞 关注 收藏)
dependencies
后接依赖的任务,不加job后缀,多依赖逗号间隔即可
task1.job
# command.jobtype=command
command=sh date_save.sh
task2.job
# command.jobtype=command
dependencies=task1
command=hive -e 'select current_date()'
task3.job
# command.jobtype=command
dependencies=task1,task2
command = python df_save.py
date_save.sh
date >> /home/azkaban测试.txt
df_save.py
import numpy as np
import pandas as pddf = pd.DataFrame(np.array(range(1, 100, 2)).reshape((5, 10)))df.to_csv('/home/df.csv')
懒人链接下载task.zip(本人会陆续更新更多免费资源,请点赞 关注 收藏)
声明:本文所载信息不保证准确性和完整性。文中所述内容和意见仅供参考,不构成实际商业建议,如有雷同纯属巧合。
大数据单机学习环境搭建(12)Azkaban的简单使用相关推荐
- 大数据单机学习环境搭建(5)Hive建表DDL详解
专题:大数据单机学习环境搭建和使用 1. Hive建表简单示例 1.1.Hive建表语句 1.2.表详细信息 1.3.数据展示 2. Hive建表语法详解 3.拓展1:复杂数据分割 4.拓展2:事务表 ...
- 大数据单机学习环境搭建(9)Spark单节点安装与pyspark使用
包含sparksql的完整使用案例,请务必耐心看完 专题:大数据单机学习环境搭建和使用 1.Spark安装 2.Spark配置 2.1配置环境变量 2.2spark客户端 3.Spark使用 3.1环 ...
- 大数据----2.基础环境搭建
大数据hadoop环境搭建 一.linux环境搭建 1.linux环境 1.hadoop是运行在linux系统之上: 但是也有windows版本的hadoop: 学习的时候使用linux来进行学习: ...
- (非常详细)大数据平台学习·环境安装配置(一)(RockyLinux9版)
一.文章简介 着手搭建大数据平台时,配置虚拟机环境是成为新手的第一道门槛.虽然各种视频和网站上也有很多虚拟机安装配置教程,但由于对 Linux 环境不熟悉,同时加上网上不少教程都是五花八门的cento ...
- 大数据实战之环境搭建(七)
本节我给大家测试一下Linux环境的Solr,通过增删改查的实例demo看看Solr环境是否已经OK.记得有哥们留言,问到只看见Solr和Cassandra的单独环境搭建,却不见它们的协同.我想说这两 ...
- 大数据实战之环境搭建(十)
Html5, 云计算,移动互联网,大数据你知道多少,如果不知道多少,请抓紧时间学习. 今天要说的是消息队列ActiveMQ,这个和cassandra一样也是apache的产品,开源的,支持很多客户端, ...
- 大数据实战之环境搭建(三)
今天不小心下载了一个VMPLayer和CenterOS-5.所以我决定后面的demo全部使用linux作为大数据的载体来进行讲解.今天主要就是讲一下CenterOS的安装准备 我们安装好VMPlaye ...
- 大数据之-Hadoop环境搭建_hadoop官网手册---大数据之hadoop工作笔记0020
本地运行模式,和伪分布式模式是,在测试学习的时候用,然后 完全分布式模式是真正开发中要用的, 要配置hadoop的集群,至少要3个虚拟机,加上自己的电脑,4台,每个虚拟机要分配2G内存,至少,所以内存 ...
- 大数据-Hadoop(环境搭建)
1 虚拟机环境准备 1.1准备三台虚拟机,虚拟机配置要求如下: (1)单台虚拟机:内存4G,硬盘50G,安装必要环境 sudo yum install -y epel-release sudo yum ...
最新文章
- 数学老师必备工具,你的最爱!
- 禁用TwebBrowser右键
- Spring MVC工作原理 及注解说明
- Windows漏洞:MS08-067远程代码执行漏洞复现及深度防御
- F-Stack:ff_run函数详解
- Hessian 3.2.0的两个bug(转)
- 7-2 修理牧场 (25 分)
- FreeType需要libpng的说明(编译时可以用参数去掉,2.12已支持svg)
- matlab矩阵论文,回归函数论文,关于基于Matlab矩阵运算的多元回归函数编程相关参考文献资料-免费论文范文...
- sqlserver执行生成rpt文件怎么回事_使用生成脚本功能和数据导出工具实现SQL Server2014数据降级2008R2版本...
- 【编程语言】Swift完全自学手册
- 智能无感验证实战案例:神州优车
- 卸载win10 自带应用
- Linux C 函数参考(日期时间)
- 指针实现入栈、出栈、取栈顶元素
- 前端面试谈:简历通用注意事项
- 刻录光盘软件测试工资,Windows XP刻录数据光碟
- 【每日知识】res是什么意思?
- 嘀嘀打车起家的辛苦历程
- Jetson Nano B01 无界面初始化安装系统+飞桨(Paddle)v2.0
热门文章
- java计算机毕业设计科大学生党员之家设计源程序+mysql+系统+lw文档+远程调试
- mybatis choose when ==的应用。
- 3D打印机在医学方面有哪些用途?3D打印可以定制矫形器吗?
- 机器学习-随机森林-分类
- 基于部件关注DenseNet的细粒度车型识别
- html中table是块元素吗,列表及表格(块元素,内联元素)
- 探索大寰夹爪| 大寰PGE-5平行夹爪亮点与指示灯判断
- 人类(行为)动力学(3)——分布规律
- 第九十九节,JavaScript数据类型
- 常见.Net 英文专业词汇收集 [转]