Apache Gobblin 是一个分布式大数据集成框架,用于流式和批处理数据生态系统。该项目 2014 年起源于 LinkedIn,2015 年开源,并于 2017 年 2 月进入 Apache 孵化器

通过简化跨多个执行环境、数据速度、规模、连接器等的接收、复制、组织和生命周期管理流程,Apache Gobblin 每天可用于集成数百 TB 和数千个数据集

  • 在支持简单转换的同时,从各种来源提取和导出数据,并汇入和汇出数据湖。
  • 湖中的数据组织(例如压缩、分区、重复数据删除)。
  • 元数据驱动的湖泊内数据的生命周期和合规性管理(例如,数据保留、细粒度数据删除)

Apache Gobblin 的详细介绍可查看:https://gobblin.apache.org/

Apache Gobblin 分布式大数据集成框架相关推荐

  1. 开源直播课丨大数据集成框架ChunJun类加载器隔离方案探索及实践

    本期我们带大家回顾一下无倦同学的直播分享<ChunJun类加载器隔离>,ChunJun类加载器隔离的方案是我们近期探索的一个新方案,这个方案目前还不是非常成熟,希望能借由此次分享与大家一起 ...

  2. 盘点2021年晋升为Apache TLP的大数据相关项目

    时间过得真快,2021年就过去了,又到了一年总结的时候了.本文将延续之前的惯例来总结一下过去一年大数据相关的项目顺利毕业成 Apache 顶级项目.在2021年一共有四个大数据相关项目顺利毕业成顶级项 ...

  3. 新代大数据计算框架Apache Flink

    大数据计算框架的发展 最近几年,出现了很多热门的开源社区,其中注明的Hadoop Storm,以及很热门的Spark, 它们有着各自专注的应用场景.Spar掀开了内存计算的先河,也以内为基础,赢得了内 ...

  4. 分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例【转】

    Kylin 麒麟官网:http://kylin.apache.org/cn/download/ 关键字:olap.Kylin Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的 ...

  5. 在线车辆推荐网 Python语言+Django框架+Mysql数据库 基于用户、物品的协同过滤推荐算法 开发在线汽车推荐系统 二手车网站推荐系统 分布式大数据、机器学习、人工智能开发

    在线车辆推荐网 Python语言+Django框架+Mysql数据库 基于用户.物品的协同过滤推荐算法 开发在线汽车推荐系统 二手车网站推荐系统 分布式大数据.机器学习.人工智能开发 CarRecom ...

  6. 大数据计算框架与平台--深入浅出分析

    http://mp.weixin.qq.com/s/s2DnbgieeQockaLKdZDCzA?utm_source=tuicool&utm_medium=referral 1. 前言 计算 ...

  7. 全面认识当前市面99%的大数据技术框架(附:各大厂大数据技术应用文章)

    目录 大数据领域分析 系统平台 集群管理与监控 文件系统 资源调度 协调框架 数据存储 数据处理 数据查询和分析 数据收集 消息系统 任务调度 数据治理 数据可视化 云平台 大数据必知点 大厂应用实践 ...

  8. 大数据计算框架及引擎介绍

    一.大数据处理框架 主流的大数据处理框架包括以下三类五种: 1.仅批处理框架:Apache Hadoop 2.仅流处理框架:Apache Storm.Apache Samza 3.混合框架:Apach ...

  9. 大数据开源框架技术汇总

    主要基于对现阶段一些常用的大数据开源框架技术的整理,只是一些简单的介绍,并不是详细技术梳理.可能会有疏漏,发现再整理.参考得太多,就不一一列出来了.这只是作为一个梳理,对以后选型或者扩展的做个参考. ...

最新文章

  1. linux文件权限详解
  2. Python 09--多线程、进程
  3. 用python tkinter显示Mandelbrot图
  4. c++命名空间---namespace
  5. 7 QM配置-质量计划配置-定义检验方法的编号范围
  6. 学完java后学python_大火的python开发学好后能找到工作吗
  7. mysql ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executing t
  8. pybind11用python调用C++代码
  9. 伽玛校正(Gamma Correction)
  10. OSPF路由聚合(学习笔记+实验验证)
  11. Python selenium练习:华为保修查询
  12. 【考研】22上海大学计算机上岸记录
  13. GitCode上手使用体验
  14. 6s芯片测试软件,如何简单检测你的苹果使用什么处理器办法
  15. C语言实现文件的加密解密
  16. 几种贴图压缩方式详解
  17. 美国ZIPnbsp;Codenbsp;一览表
  18. VR行业发展的前景和现状?
  19. 国内外视频编解码标准体系-我们在音视频标准化组织的工作,唯有坚持、主动、投入
  20. 最全的DevOps工具集合,再也不怕选型了!

热门文章

  1. TCP/IP Protocol Fundamentals Explained with a Diagram
  2. linux 建立ftp用户
  3. cuda中的二分查找
  4. C#_delegate - 值参数和引用参数
  5. 禁用vsftpd欢迎语
  6. 常用的WebService
  7. Q76:仿射变换(Affine Transformation)
  8. 问题六十八:着色模型(shading model)(1)——反射模型(reflection model)(3.1)——辐射学(Radiometry)
  9. 问题四十四:怎么用ray tracing画空间任意位置的圆环的任意片段
  10. DayDayUp:2021年的自我总结