开源大数据:Apache DolphinScheduler
Apache DolphinScheduler 分布式易扩展的可视化DAG工作流任务调度系统
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用
Apache DolphinScheduler 架构
Apache DolphinScheduler 特性
- 以DAG图的方式将Task按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态
- 支持丰富的任务类型:Shell、MR、Spark、SQL(mysql、postgresql、hive、sparksql),Python,Sub_Process、Procedure等
- 支持工作流定时调度、依赖调度、手动调度、手动暂停/停止/恢复,同时支持失败重试/告警、从指定节点恢复失败、Kill任务等操作
- 支持工作流优先级、任务优先级及任务的故障转移及任务超时告警/失败
- 支持工作流全局参数及节点自定义参数设置
- 支持资源文件的在线上传/下载,管理等,支持在线文件创建、编辑
- 支持任务日志在线查看及滚动、在线下载日志等
- 实现集群HA,通过Zookeeper实现Master集群和Worker集群去中心化
- 支持对
Master/Worker
cpu load,memory,cpu在线查看 - 支持工作流运行历史树形/甘特图展示、支持任务状态统计、流程状态统计
- 支持补数
- 支持多租户
- 支持国际化
- 还有更多等待伙伴们探索
Apache DolphinScheduler 启动流程活动
DolphinScheduler 界面图
开源大数据:Apache DolphinScheduler相关推荐
- 阿里云EMR 2.0:重新定义新一代开源大数据平台
摘要:本文整理自阿里云高级产品专家何源(荆杭)在 阿里云EMR2.0线上发布会 的分享.本篇内容主要分为三个部分: 开源大数据的痛点及EMR产品历程 EMR2.0 新特征 总结 一.开源大数据的痛点及 ...
- 开源大数据周刊-第30期
阿里云E-MapReduce实践 泰为在E-MapReduce上的考量与实践 阿里云EMR是基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务OSS等云服务进行无缝数据交换,方便用户 ...
- 开源大数据周刊-第49期
摘要: 开源大数据周刊-第49期 资讯 实时流数据分析--2017 年的 27 个预测 概述:根据Markets & Markets的预测,流数据分析市场将从 2016 年的 30 8 亿美元 ...
- 开源大数据周刊-第76期
摘要: 本期周刊包括开源大数据核心组件Hadoop和Impala的最新消息,以及HBase.Kafka.TensorFlow等主流开源组件的实践分享和技术实现,还有来自京东推荐部门的推荐系统演进史,纯 ...
- 开源大数据周刊-第34期
阿里云E-MapReduce实践 使用E-MapReduce服务处理阿里云文件存储(NAS)的数据 文件存储是阿里云今年新推出的存储服务,因为它提供标准的文件访问协议,用户无需对现有应用做任何修改,即 ...
- 开源大数据查询分析引擎
引言 大数据查询分析是云计算中核心问题之一,自从Google在2006年之前的几篇论文奠定云计算领域基础,尤其是GFS.Map-Reduce.Bigtable被称为云计算底层技术三大基石.GFS.Ma ...
- 时下最热开源大数据技术TOP10
文章讲的是时下最热开源大数据技术TOP10,眼下大数据成为最热技术,并且呈现爆炸式增长.全世界的新项目雨后春笋般的出现.对于这些新的公司.项目来说,利好就是所有可用的技术是开放源代码的,直接采用. 海 ...
- 大数据平台常用组件_这款大数据智能服务平台火了!全自动化配置30+款开源大数据组件...
在互联网市场的头部效应下,企业所面临的竞争压力越来越大,如何有效解决获客成本高.用户黏性低.变现能力弱等问题,正是越来越多的企业开始构建大数据平台的初衷.但由于大数据解决方案所涉及的组件错综复杂.技术 ...
- 开源大数据平台的安全实践
开源大数据平台的安全实践 刘杰 百度(中国)有限公司,北京 100085 摘要:开源大数据平台的安全机制目前并不特别完善,特别是用户认证.日志审计等方案还存在不少问题.分析了开源大数据平台存在的安全隐 ...
- 开源大数据平台HBase对接OBS操作指南
1 背景介绍 华为云对象存储服务可以与HBase大数据生态进行对接,为用户提供计算存储分离的大数据解决方案.该方案具备高性能.低成本的优势,且无扩容问题. 本操作指导书旨在帮助华为云用户在开 ...
最新文章
- 你的能力代表你能走多远
- 前端一HTML:十六: 权重有关的练习
- php设置东京时区,php设置时区方法介绍
- C#多线程开发-任务并行库
- 2012年5月份第2周51Aspx源码发布详情
- 一个简洁实用的后台管理系统AWESOME
- Java工作笔记-IntelliJ IDEA中的精确搜索
- jdbc原子事务的实现
- 连接oracle数据库代码,oracle数据库的连接代码
- 某项目的双代号网络图如下所示_系统集成项目管理工程师5天备考第3天第1-2学时...
- 发现一个非常好用的扒站工具IDM
- 微软开放必应搜索引擎核心算法
- 超简单的自定义个性化网页鼠标光标样式 html+css+js
- 软件开发版本管理规范
- os 存储器的结构层次
- 讲给后台程序员看的前端系列教程(17)——文本样式
- BFU数据结构头歌实验:基于BF算法的病毒感染检测
- 经营性ICP与非经营性ICP有什么区别?
- 机器人导航技术的研究现状和发展趋势
- 限流与代理网关集成调研及应用
热门文章
- Android开发之异步消息处理机制AsyncTask
- hdu 1232 经典并查集应用
- HLG 数字去重和排序II【二叉排序树】
- 深入理解JavaScript系列(21):S.O.L.I.D五大原则之接口隔离原则ISP
- 《Ray Tracing in One Weekend》——Chapter 10: Positionable camera
- Echarts定制一个地图
- 安徽省学考计算机操作,安徽省教育考试院全国计算机等级考试网上报名流程与操作步骤...
- python 实例化过程_python实例化对象的具体方法
- 设计一个python程序来计算显示通过如图_Python程序设计 17计算机、物联网 合班-中国大学mooc-试题题目及答案...
- stone (组合数学 + Lucas定理)