Flink使用HiveCatalog可以通过或者的方式来处理Hive中的表。这就意味着Flink既可以作为Hive的一个批处理引擎,也可以通过流处理的方式来读写Hive中的表,从而为实时数仓的应用和流批一体的落地实践奠定了坚实的基础。本文将以Flink1.12为例,介绍Flink集成Hive的另外一个非常重要的方面——Hive维表JOIN(Temporal Table Join)与Flink读写Hive表的方式。以下是全文,希望本文对你有所帮助。

Flink写入Hive表

Flink支持以批处理(Batch)流处理(Streaming)的方式写入Hive表。当以批处理的方式写入Hive表时,只有当写入作业结束时,才可以看到写入的数据。批处理的方式写入支持append模式和overwrite模式

批处理模式写入

  • 向非分区表写入数据

Flink SQL> use catalog myhive; -- 使用catalog
Flink SQL> INSERT INTO users SELECT 2,'tom';
Flink SQL> set execution.type=batch; -- 使用批处理模式
Flink SQL> INSERT OVERWRITE users SELECT 2,'tom';
  • 向分区表写入数据

-- 向静态分区表写入数据
Flink SQL> INSERT OVERWRITE myparttable PARTITION (my_type='type_1', my_date

Flink on Hive构建流批一体数仓相关推荐

  1. hive增量表和全量表_基于 Flink + Hive 构建流批一体准实时数仓

    基于 Hive 的离线数仓往往是企业大数据生产系统中不可缺少的一环.Hive 数仓有很高的成熟度和稳定性,但由于它是离线的,延时很大.在一些对延时要求比较高的场景,需要另外搭建基于 Flink 的实时 ...

  2. 基于 Flink + Hive 构建流批一体准实时数仓

    简介: 想要搭建流式链路就必须得抛弃现有的 Hive 数仓吗?并不是,借助 Flink 可以实现已有的 Hive 离线数仓准实时化.本文整理自 Apache Flink Committer.阿里巴巴技 ...

  3. 尘锋信息基于 Apache Paimon 的流批一体湖仓实践

    尘锋信息基于 Apache Paimon 构建流批一体湖仓,主要分享: 整库入湖,TB 级数据近实时入湖 基于 Flink + Paimon 的数仓 批 ETL 建设 基于 Flink + Paimo ...

  4. Hive 老当益庄 | 深度解读 Flink 1.11:流批一体 Hive 数仓

    精选30+云产品,助力企业轻松上云!>>> 首先恭喜 Table/SQL 的 blink planner 成为默认 Planner,撒花.撒花. Flink 1.11 中流计算结合 ...

  5. 基于Flink SQL构建流批一体实时数仓

    基于Flink构建流批一体的实时数仓是目前数据仓库领域比较火的实践方案.随着Flink的不断迭代,其提供的一系列技术特性使得用户构建流批一体的应用变得越来越方便.本文主要分享基于FinkSQL构建实时 ...

  6. 基于 FlinkSQL 构建流批一体准实时数仓

    百度安全验证https://baijiahao.baidu.com/s?id=1693281284582715430&wfr=spider&for=pc 一.背景 基于 Hive 的离 ...

  7. 基于 Apache Hudi 构建流批一体系统实践

    1. 前言 当前公司的大数据实时链路如下图,数据源是MySQL数据库,然后通过Binlog Query的方式消费或者直接客户端采集到Kafka,最终通过基于Spark/Flink实现的批流一体计算引擎 ...

  8. Hologres+Flink流批一体首次落地4982亿背后的营销分析大屏

    简介: 本篇将重点介绍Hologres在阿里巴巴淘宝营销活动分析场景的最佳实践,揭秘Flink+Hologres流批一体首次落地阿里双11营销分析大屏背后的技术考验. 概要:刚刚结束的2020天猫双1 ...

  9. 流批一体技术框架探索及在袋鼠云数栈中的实践

    一.关于流批一体数据仓库 流批一体是一种架构思想,这种思想说的是同一个业务,使用同一个sql逻辑,在既可以满足流处理计算同时也可以满足批处理任务的计算. 从效率层面来说,批处理只能以t+1的形式呈现业 ...

最新文章

  1. 使用Atomikos Transactions Essentials实现多数据源JTA分布式事务--转载
  2. 前端技术以及工程化工具
  3. chat.php能定期刷新,php+ajax实现在线刷新,即时通讯,无需mysql数据库!
  4. 二叉树 BinaryTree (先序、中序、后序遍历 节点查找、插入、删除 完整类) Java数据结构与算法
  5. Goland 学习笔记之--govendor
  6. vs窗体程序常用工具_Visual Studio 2010(VS)--消消乐定制版①
  7. 7-79 约分最简分式
  8. 深度学习的显卡对比评测:2080ti vs 3090 vs A100
  9. 【随笔】写在2020除夕之夜
  10. 第12章 Stata非线性回归分析
  11. spring报MySQLSyntaxErrorException: Unknown error 1146
  12. 供应商主数据屏幕增强XK02,XK03
  13. 北京大学计算机博士金钊,北京大学2019年信息科学技术学院拟录取推荐免试博士研究生.PDF...
  14. 电商APP源码功能解说
  15. 音视频开发系列(32)OpenGL ES 基本概念
  16. 矩阵论笔记(四)——酉空间与酉变换
  17. Tkinter教程之Scrollbar篇
  18. Java基础高频面试题
  19. 类型多样的鸡尾酒免抠摄影素材,速来收藏
  20. Error creating bean with name ‘XXX‘: Injection of autowired dependencies failed解决办法

热门文章

  1. linux设置mysql字符集_linux修改mysql字符集编码
  2. 半导体物理与器件pdf施敏_SiC半导体材料的基本性质和应用
  3. append是什么意思java_关于append()问题
  4. python算法有多少个_Python算法比较两个排序的列表并计算多少个...
  5. linux系统上安装toma,Linux-tar - osc_btnnkvs0的个人空间 - OSCHINA - 中文开源技术交流社区...
  6. SQLi LABS Less-20
  7. 卷积神经网络(CNN)结尾篇:可视化跟踪(Visualize)
  8. 1129 Recommendation System
  9. Kali Linux渗透测试实战 1.3 渗透测试的一般化流程
  10. Segment Advisor