hudi mor表数据ro和rt表问题 rt更新数据表无法使用count
本人使用canal + kafka + sparkstructedstreaming 将mysql数据同步至hudi,并将hudi与hive集成。
想利用hive查询hudi数据。
hudi 在hive中有两张表:
xxx_ro:历史(compact策略触发后能查询到的数据)
xxx_rt:实时
查询ro表发现更新数据未与历史数据合并
查询rt表为实时数据,但是无法使用count()
hudi在 hdfs以 log+parquet格式保存,更新数据存储至log
查看了官网的配置
.option(DataSourceWriteOptions.ASYNC_COMPACT_ENABLE.key(),"true").option(HoodieCompactionConfig.INLINE_COMPACT_TRIGGER_STRATEGY.key(),"NUM_OR_TIME").option(HoodieCompactionConfig.INLINE_COMPACT_NUM_DELTA_COMMITS.key(), "3").option(HoodieCompactionConfig.INLINE_COMPACT_TIME_DELTA_SECONDS.key(),"60")
尝试一下看看
2022-03-03
昨天试了spark-sql查 rt表 报错
2022-03-03 09:33:45
直接更新时compact
上面配置就都不要了
测试ro表数据 是“实时”更新数据
hudi mor表数据ro和rt表问题 rt更新数据表无法使用count相关推荐
- cdatatable大数据操作_C# DataRow和DataColumn:更新数据表
在前面<C# Command>一节中已经介绍了使用 SqlCommand 对象中的 ExecuteNonQuery 方法执行非查询 SQL 语句来实现对数据表的更新操作,使用 DataSe ...
- mysql怎么用游标修改数据_MySql使用游标Cursor循环(While)更新数据
#要修改的变量 DECLARE var_ID VARCHAR(50) DEFAULT ''; #需要修改的数据的数量 DECLARE var_UpdateCount INT; #当前循环次数 DECL ...
- FreeSql (十四)批量更新数据
FreeSql支持丰富的更新数据方法,支持单条或批量更新,在特定的数据库执行还可以返回更新后的记录值. var connstr = "Data Source=127.0.0.1;Port=3 ...
- FreeSql (十)更新数据
FreeSql支持丰富的更新数据方法,支持单条或批量更新,在特定的数据库执行还可以返回更新后的记录值. var connstr = "Data Source=127.0.0.1;Port=3 ...
- Django讲课笔记09:使用QuerySet新增和更新数据
文章目录 零.本讲学习目标 一.课程导入 二.新课讲授 (一)Shell模式新增数据 1.使用实例化 - 赋值 - save新增数据 2.使用create新增数据 3.使用字典与create新增数据 ...
- 数据集成到可视化分析,轻松驾驭数据洞察力:ETLCloud与帆软BI完美结合
在当今数据驱动的业务环境中,企业需要快速而准确地获取.处理和分析大量的数据.为了满足这一需求,ETLCloud通过和帆软BI的集成提供了一种强大的数据采集和数据分析解决方案,通过可视化的ETL工具和灵 ...
- SqlServer 利用游标批量更新数据
SqlServer 利用游标批量更新数据 Intro 游标在有时候会很有用,在更新一部分不多的数据时,可以很方便的更新数据,不需要再写一个小工具来做了,直接写 SQL 就可以了 Sample 下面来看 ...
- asscess 一条记录更新数据_一条MySQL更新语句是怎么执行的?
流程图 这是在网上找到的一张流程图,写的比较好,大家可以先看图,然后看详细阅读下面的各个步骤. 执行流程: 1.连接验证及解析 客户端与MySQL Server建立连接,发送语句给MySQL Serv ...
- 使用Flink对hudi MOR表进行离线压缩
默认情况下,MERGE_ON_READ表的压缩是启用的. 触发器策略是在完成五次提交后执行压缩. 因为压缩会消耗大量内存,并且与写操作处于相同的管道中,所以当数据量很大(> 100000 /秒) ...
最新文章
- 常用windows命令
- 【Android 启动过程】Activity 启动源码分析 ( Activity -> AMS、主线程阶段 )
- 网页中显示flash的时候部分显示红色叉好,而有的能够正常显示
- 2009年出现的计算机术语,2009年计算机一级考试真题及答案
- 弱电工程数据中心计算机房内布线
- 无线网络渗透测试-使用Wifite破解无线网络
- textedit怎么插入数据_还在手动插入Excel交叉空白行?这个小技巧10秒搞定
- 帝国cms模板仿礼品销售网站
- CCF2018-3-2 碰撞的小球
- ubuntu16.04使用umake安装pycharm-professional
- CSS基础:浅用字体图标(以阿里字体图标库演示)
- 手机计算机国二支付,“刷手机”时代悄然来临 手机支付呼唤国家标准(二)...
- k8s之无状态服务Deployment1
- Bzoj4698: [Sdoi2008]Sandy的卡片
- 做成事情的3个要素:意愿、能力、资源
- element-ui自适应问题
- ubuntu16.04 opencv3.3 python2.7 caffe GPU环境搭建
- 导出期刊对应格式的参考_中文参考文献怎么一键导出正确格式?写作必看!
- 低配本用win10服务器系统,低配电脑用win7还是win10比较好_低配置电脑装win7还是win10系统合适...
- ★《唐琅探案》后记【2】
热门文章
- 为王菲写的第二首歌《山河》
- 刨根问底-AQS源码解析
- Python 数据可视化神器分享:pyecharts
- BIOS密码清除方法--unlock6的使用.
- Unity3D学习笔记——RigidBody(刚体)
- 博南石上海公司的那个hr,貌似叫什么harvey hou,太恶心了。。。
- 修复VMware网络连接失败及设置固定IP
- 一、简单的http抓包(微信公众网页登录模拟)
- 论文数据分析-1(论文数据统计)
- 正在配置计算机好久了,准备配置windows请勿关闭计算机要多久_准备配置请勿关机很久...