Apache Hop(Hop Orchestration Platform 的首字母缩写)是一种数据编排(data orchestration )和数据工程平台(data engineering platform),旨在促进数据和元数据编制。Hop 可以让我们专注于问题的解决,而不受技术的阻碍。该项目起源于 Kettle,经过数年的重构,并于2020年9月进入 Apache 孵化器;2022年1月18日正式成为 Apache 顶级项目。

Hop 允许数据专业人员以可视化的方式工作,使用元数据来描述应如何处理数据。可视化设计使数据开发人员能够专注于他们想要做的事情,而不是需要如何完成该任务。这种对手头任务的关注让 Hop 开发人员比编写代码时更有效率。Hop 的目标是成为数据集成的未来,我们只需要对手头上的任务进行一次设计,然后通过 Apache Hop 在任何地方运行,比如 Hop 本地引擎、Spark、Flink、Google Dataflow 或 AWS EMR等。

Hop 被设计的尽可能灵活:其核心是小巧但功能强大的 Hop 引擎。所有的功能都是通过插件添加的:默认的 Hop 安装带有大约 400 个插件。我们可以根据需要删除或添加第三方插件,以定制 Hop,使其完全符合我们的需要。Hop 设计用于任何场景,从物联网到海量数据、本地、云端、裸操作系统或容器和 kubernetes。

Hop 的使用场景主要有以下几个方面:

  • 利用云、集群和大规模并行处理环境,将大型数据集加载到数据库中;
  • 数据仓库构建并支持渐变维度 (SCD, Slowly Changing Dimensions)、变更数据捕获 (CDC,Change Data Capture) 和代理键创建;
  • 不同数据架构之

架构:数据系统Apache Hop简介以及与Kettle的异同相关推荐

  1. 起源于 Kettle 的新一代数据集成平台 Apache Hop 成为 Apache 顶级项目

    Apache Hop(Hop Orchestration Platform 的首字母缩写)是一种数据编排(data orchestration )和数据工程平台(data engineering pl ...

  2. Apache CXF 简介

    Apache CXF 简介 开放源代码的服务框架 本教程介绍了 Apache CXF 服务框架的基本知识,并通过讲解自带的例子来初步体验通过 CXF 进行服务的发布与消费:然后搭建基于 Eclipse ...

  3. Apache hop web构建及部署

    前言 正在使用kettle webspoon,虽然解决了一些问题,但是问题还是层出不穷,在群中了解到apache hop是基于kettle最新的扩展,所以研究一下.新的确实是不一样,构建过程比webs ...

  4. apache hop 搭建_server端

    第一:下载hop,并按照在docker中 执行docker脚本 docker run -d \  --name=hop-server \  -p 8181:8181 \  -v /e/soft/rar ...

  5. 大数据权限管理组件Apache Ranger简介和原理

    大数据权限管理组件Apache Ranger简介和原理 一.什么是Ranger 二.Ranger的管理页面和Ranger支持的框架 三.Ranger的目标 四.Ranger架构 五.Ranger的工作 ...

  6. Apache Camel简介以及使用场景

    Apache Camel简介以及使用场景 我们要解决的问题以及解决方案 我们要解决的问题 EAI的常用解决方案 SOA架构模型 ESB企业服务总线 如何实现ESB 为什么使用Camel Camel可以 ...

  7. 用户案例|告别传统金融消息架构:Apache Pulsar 在平安证券的实践

    本文首发自 InfoQ <告别传统金融消息架构:Apache Pulsar 在平安证券的实践>. 在金融场景中,伴随着业务的扩展,应用系统也相应地增加更多的场景,这些新场景对消息系统提出更 ...

  8. Apache Mahout 简介

    Apache Mahout 简介 通过可伸缩.商业友好的机器学习来构建智能应用程序 当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见.人们对机器学习技巧 ...

  9. 3-docker 架构和底层技术简介

    3-docker 架构和底层技术简介 Docker Platform Docker 是一个平台. 提供了一个开发.打包.运行app的平台 把app和底层 infrastructure 隔离开来 根据上 ...

最新文章

  1. Swift 中使用 SQLite——修改和删除数据
  2. CentOS 7 SSH 免密登录的方法
  3. python网络爬虫的基本步骤-详解Python网络爬虫功能的基本写法
  4. python简单连接数据库
  5. JAX-RS 2.0:自定义内容处理
  6. 计算机在盲童音乐教学中的具体应用,计算机在高校中的具体应用
  7. Django搭建简易博客
  8. 上海事职业培训软件测试高级,《软件测试人员(Java)(4级)》人力资源和社会保障部教材办公室、中国就业培训技术指导中心上海分中心、上海市职业培训研究发展中心 编_孔网...
  9. svn回退到上一个版本_Git实用教程(一) | 为什么需要版本控制?(以嵌入式项目开发为例)...
  10. 百面机器学习 #2 模型评估:07 过拟合和欠拟合及其常用解决方法
  11. linux修改jdk版本无效,关于windows和linux系统更换JDK版本后,修改环境变量也无法生效的原因和解决办法...
  12. DB2数据库SQL0670N错误(行长度超限)案例解析
  13. Laravel学习笔记之Demo1——URL生成和存储
  14. openjudge-1664 放苹果
  15. Chrome 大版本更新来了,这是一次「史诗级」增强
  16. 远程桌面服务器连接失败,Windows服务器远程桌面连接失败是什么原因
  17. 开博了,微博太短,不适合,还是稀饭大的博客
  18. 数据结构:最大子列和问题
  19. 计算机美术基础课程标准,《计算机美术基础》教学大纲 课程标准 最全最新.doc...
  20. 可以放游戏网站云服务器,游戏网站选择哪个云服务器好?游戏服务器配置方案?...

热门文章

  1. 【硬件设计】AC-DC整流桥电路
  2. 20145339顿珠达杰 《信息安全系统设计基础》第0周学习总结
  3. win10磁盘分区解决方案
  4. 两个互联网公司的创业故事
  5. chrome常用启动参数
  6. 边缘计算架构、分层及典型组网拓扑
  7. Google可能不会显示挑逗性的网络故事
  8. 关于 Linux中逻辑卷/物理分区等知识的一些总结
  9. 人脸识别之人脸检测(二)--人脸识别样本制作及训练测试
  10. 运行github中python程序_从phon上的github直接运行python代码