从消息到数据湖:看 Apache RocketMQ、Hudi、Kyuubi 最新进展
上海的开发者小伙伴们,12 月 18 号,Apache RocketMQ & Apache Hudi & Apache Kyuubi (Incubating)三社区 Meetup 来了,打造最强消息传输、实时计算、数据入湖一体化解决方案专场。
本场活动聚焦 Apache RocketMQ 及 Hudi,Kyuubi 数据湖结合,帮助开发者能更好地应对业务挑战。活动将邀请喜马拉雅、平安证券、网易、阿里云的众多技术专家,共同为大家分享 Apache RocketMQ with hudi & Kyuubi 实践与应用。
相关项目介绍
Apache RocketMQ
Apache RocketMQ 是由阿里巴巴开源的消息产品,历经多年双十一流量洪峰严苛考验,具有低延迟、高性能、高可靠性、万亿级容量和灵活的可扩展性。目前,全球超过上万家企业都在使用 Apache RocketMQ,不仅包括字节、快手、小米、滴滴、同城艺龙等来自互联网的头部企业,也包括来自于头部银行、券商、保险,基金等一系列要求极为严苛的金融公司。
Apache RocketMQ 经过过去几年的发展,已经成为微服务领域业务消息的首选,伴随着云原生时代的到来以及实时计算的兴起, 生于云、长于云的 Apache RocketMQ 5.0 应运而生,全新升级为云原生消息、事件、流融合处理平台,帮助用户更容易地构建下一代事件驱动和流处理应用。
Github 地址:
https://github.com/apache/rocketmq
Apache Hudi
Apache Hudi 是 Apache 软件基金会顶级项目,是新一代的流式数据湖平台,支持数据插入、更新、删除和增量数据处理;可助力构建高效的企业级数据湖。
GitHub 地址:
http://github.com/apache/hudi
Apache Kyuubi(Incubating)
Apache Kyuubi (Incubating)是一个 Thrift JDBC/ODBC 服务,目前对接了 Apache Spark 计算框架,支持多租户和分布式等特性,可以满足企业内诸如 ETL、BI 报表等多种大数据场景的应用。Kyuubi 可以为企业级数据湖探索提供标准化的接口,赋予用户调动整个数据湖生态的数据的能力,使得用户能够像处理普通数据一样处理大数据。项目已于 2021 年 6 月 21 号正式进入 Apache 孵化器。从社区当前阶段的发展目标来看,它的主要方向是依托本身的架构设计,围绕各类主流计算框架,打造一个面向 Serverless SQL on Lakehouse 的服务。Apache Kyuubi (Incubating)是一个 Thrift JDBC/ODBC 服务,目前对接了 Apache Spark 计算框架,支持多租户和分布式等特性,可以满足企业内诸如 ETL、BI 报表等多种大数据场景的应用。Kyuubi 可以为企业级数据湖探索提供标准化的接口,赋予用户调动整个数据湖生态的数据的能力,使得用户能够像处理普通数据一样处理大数据。项目已于 2021 年 6 月 21 号正式进入 Apache 孵化器。从社区当前阶段的发展目标来看,它的主要方向是依托本身的架构设计,围绕各类主流计算框架,打造一个面向 Serverless SQL on Lakehouse 的服务。
Github 地址:
https://github.com/apache/incubator-kyuubi
立即点击此处参与活动吧!
了解更多相关信息,请扫描下方二维码或搜索微信号(AlibabaCloud888)添加云原生小助手!获取更多相关资讯!
从消息到数据湖:看 Apache RocketMQ、Hudi、Kyuubi 最新进展相关推荐
- 大数据Hadoop之——新一代流式数据湖平台 Apache Hudi
文章目录 一.概述 二.Hudi 架构 三.Hudi的表格式 1)Copy on Write(写时复制) 2)Merge On Read(读时合并) 3)COW vs MOR 四.元数据表(Metad ...
- 开源数据湖方案选型:Hudi、Delta、Iceberg深度对比
文章目录 前言: 共同点 一.Databricks 和 Delta 1.1.Delta的意图,解决的疼点 1.没有 Delta 数据湖之前存在的问题 : 二.Uber和Apache Hudi 三.Ne ...
- 从200多篇顶会论文看推荐系统前沿方向与最新进展
作者|牟善磊 学校|中国人民大学硕士生 研究方向 | 推荐系统 来源 | RUC AI Box 推荐系统作为深度学习御三家(CV, NLP, RS)之一,一直都是学术界和工业界的热门研究 topic. ...
- 21 个问题看 NLP 迁移学习的最新进展
2020-06-23 03:20:11 作者 | Mr Bear 编辑 | 丛末 2018 年 10月,Bert 问世.从此,一波 NLP 迁移学习的研究热潮向我们袭来. 当下,全球研究人员已经在此领 ...
- 多篇顶会论文看DRO (Distributionally Robust Optimization) 最新进展
©PaperWeekly 原创 · 作者 | 张一帆 学校 | 中科院自动化所博士生 研究方向 | 计算机视觉 常见的算法使用经验风险最小化(ERM)的范式,有一个模型参数为 ,一个损失函数 和数据分 ...
- 查询性能较 Trino/Presto 3-10 倍提升!Apache Doris 极速数据湖分析深度解读
从上世纪 90 年代初 Bill Inmon 在<building the Data Warehouse>一书中正式提出数据仓库这一概念,至今已有超过三十年的时间.在最初的概念里,数据仓库 ...
- Apache Hudi 在袋鼠云数据湖平台的设计与实践
在大数据处理中,实时数据分析是一个重要的需求.随着数据量的不断增长,对于实时分析的挑战也在不断加大,传统的批处理方式已经不能满足实时数据处理的需求,需要一种更加高效的技术来解决这个问题.Apache ...
- 数据湖存储格式Hudi原理与实践
今天给大家分享阿里云DLA团队技术专家李伟所做的分享<数据湖存储格式Hudi原理yu .pdf>,对数据湖及Apache Hudigan兴趣的伙伴别错过啦!(到省时查报告小程序中搜索&qu ...
- 知乎热议:数据仓库、数据湖、湖仓一体,究竟有什么区别?
来源:知乎 作者:十叶心 全文共 14108个字,建议阅读 20分钟 一.基本概念 1.1数仓发展历史 数据湖是以集中方式存储各种类型数据,提供弹性的 容量和吞吐能力,能够覆盖广泛的数据源,支持 ...
最新文章
- 清华系“AI帮”崛起,要驱动1500亿元产业规模
- 设计模式——原型模式(Prototype Pattern)
- 原创:通过jQuery进行跨域操作
- struts2找不到action_第一次用上Struts2框架做Web开发的体验……
- weui-react项目实战新心得
- 你知道,java项目中是如何获取文件地址的吗?
- C#计算程序的运行时间
- java找出所有缺席人员,GitHub - uxzhen/Java: 假娃会迟到,但不会缺席!http://xuzhen.work:8080/getAll...
- VS2013开发Windows服务项目
- 梳子刻字刻什么好_石阶上被刻了1700多个汉字,网友狂赞!
- mysql 找表重复数据_mysql 数据表中查找重复记录
- tensorflow 中MNIST数据集下载
- 【DB2报错】执行存储过程报SQLSTATE:-811 SQLCODE:21000,怎么办?
- MCS-51单片机的内部结构
- 凑微分公式_高等数学–求积分的一些方法(IV 凑微分法)
- 1124 Raffle for Weibo Followers(map)
- python 数组去重复
- redis统计用户日活量_使用redis统计用户日活、月活(实践版)
- SQL语句查询重复语句并进行标记和更新
- 修复iPhone手机白苹果