doris routine load
https://doris.apache.org/zh-CN/docs/data-operate/import/import-way/routine-load-manual/
json (无嵌套)
CREATE ROUTINE LOAD v2x_olap_database.government_car_route_load ON government_car_route_load
COLUMNS(temId, tehNo, speed, dayMileage, gpsTime, status, direction, k1, longitude, latitude, eventTime, dt)
PROPERTIES
(
"desired_concurrent_number"="3",
"max_batch_interval" = "20",
"max_batch_rows" = "300000",
"max_batch_size" = "209715200",
"strict_mode" = "false",
"format" = "json"
)
FROM KAFKA
(
"kafka_broker_list" = "10.0.2.37:31090,10.0.2.38:31091,10.0.2.38:31092",
"kafka_topic" = "government_car_topic",
"property.group.id" = "government_car_route_load_group",
"property.kafka_default_offsets" = "OFFSET_BEGINNING",
"property.enable.auto.commit" = "false",
"kafka_partitions" = "0"
);
json (嵌套)
参考:https://www.cnblogs.com/ywjfx/p/14722302.html
CREATE ROUTINE LOAD test.test_json_label_4 ON user_json
COLUMNS(id, name, counts, ts)
PROPERTIES
(
"desired_concurrent_number"="3",
"max_batch_interval" = "20",
"max_batch_rows" = "300000",
"max_batch_size" = "209715200",
"strict_mode" = "false",
"format" = "json",
"jsonpaths" = "[\"$.test.id\",\"$.test.name\",\"$.test.counts\",\"$.test.ts\"]"
)
FROM KAFKA
(
"kafka_broker_list" = "localhost:9092",
"kafka_topic" = "Demo2",
"kafka_partitions" = "0",
"kafka_offsets" = "0"
);
查看导入
mysql> show routine load\G;
Empty set (0.00 sec)
删除导入任务
mysql> STOP ROUTINE LOAD FOR government_car_route_load;
Query OK, 0 rows affected (0.00 sec)
暂停任务
mysql> PAUSE ROUTINE LOAD FOR government_car_route_load;
从 pause 状态中恢复
mysql> RESUME ROUTINE LOAD FOR government_car_route_load
问题记录
failed to get kafka partition info: [no partition in this topic]
"kafka_partitions" = "0"
no partition for this tuple.
分区表历史分区未创建报如上错误
参考:https://blog.csdn.net/qq_37865420/article/details/122456181
创建历史分区
alter table v2x_olap_database.government_car_recovery set ("dynamic_partition.create_history_partition"="true","dynamic_partition.start" = "-75");
routine load 容错 current error rows is more than max error num
https://doris.apache.org/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/ALTER-ROUTINE-LOAD/
where 过滤条件
频繁因数据质量问题导致数据导入失败,加入 where 进行过滤
CREATE ROUTINE LOAD xxx ON xxx
COLUMNS(...),
where timestamp < servertimestamp and timestamp > UNIX_TIMESTAMP(DATE(now())) * 1000
PROPERTIES
(
...
)
FROM KAFKA
(
...
);
routine load 状态异常
failed to find 3 backends
其中某个 backend 状态异常
恢复重启该backend ./start-be.sh --daemon
分区自动创建,恢复routine load RESUME ROUTINE LOAD FOR government_car_route_load
doris routine load相关推荐
- Doris Routine Load正则表达实战
Doris Routine Load正则表达实战 1. Kafka安装 #1.下载安装包 wget https://dlcdn.apache.org/kafka/3.2.0/kafka_2.13-3. ...
- Doris Routine Load数据导入实战【每秒导入16w】
Doris Routine Load实战[每秒导入16w] 1. Kafka安装 #1.下载安装包 wget https://dlcdn.apache.org/kafka/3.2.0/kafka_2. ...
- 数据导入 - Kafka 结合Doris Routine load 任务导入
背景 参与项目有关数据采集,采集数据同步到数据库之前是使用sql的形式去进行同步,考虑到全表同步数据时数据量过大导致mybatis批量插入数据内存异常,原始解决方案采取分批次进行导入,但是同步数据速度 ...
- Doris Routine Load接入Kafka0.8.0实战
Doris Routine Load接入Kafka0.8.0实战 想要更全面了解Spark内核和应用实战,可以购买我的新书. <图解Spark 大数据快速分析实战>(王磊) 1. 问题产生 ...
- Apache Doris Routine Load数据导入使用方法
Apache Doris 代码仓库地址:apache/incubator-doris 欢迎大家关注加星 1.概要 Routine load 功能为用户提供了一种自动从指定数据源进行数据导入的功能. R ...
- Apache Doris 系列: 基础篇-Routine Load
简介 Routine Load 支持用户提交一个常驻的导入任务,通过不断的从指定的数据源读取数据,将数据导入到 Doris 中. 目前仅支持通过无认证或者 SSL 认证方式,从 Kakfa 导入 CS ...
- Doris之Routine Load
Routine Load 例行导入(Routine Load)功能为用户提供了一种自动从指定数据源进行数据导入的功能. 本文档主要介绍该功能的实现原理.使用方式以及最佳实践. FE:Frontend, ...
- Doris系列13-数据导入之Routine Load
文章目录 一. Routine Load 概述 二. Kafka 例行导入 2.1 创建例行导入任务 2.1.1 columns_mapping 2.1.2 where_predicates 2.1. ...
- 第3.3章:StarRocks数据导入--Routine Load
Routine Load(例行导入)是StarRocks自带的一种可以从Kafka中持续不断的导入数据的方式,我们可以方便的在StarRocks中通过SQL来控制导入任务的暂停.继续及停止. 关于Ro ...
最新文章
- vc picture控件载入背景图,随控件大小改变
- im和音视频开发哪个更好_如何阅读成为更好的开发者的方式
- 技术的顶点,是普惠人类还是超越人类
- Subversion存储库中“分支”,“标记”和“主干”的含义是什么?
- python自学步骤-小白刚入门Python,学完基础后,接下来的学习步骤!
- java 滚动条 滚动_广告条随滚动条的移动而移动
- 双向@OneToMany / @ManyToOne关联
- 前端学习(1608):react-router-dom基础
- PostgreSQL 的一个简单连接和查询操作——示例
- 高并发编程_高并发编程系列:全面剖析Java并发编程之AQS的核心实现
- php 筛选搜索,筛选——搜索
- Navicat连接oracle03135,ORA-03135: connection lost contact的解决方法
- 给所有准备考网络工程师的考生的一点点建议
- 中职计算机办公自动化教学,中职学校计算机办公自动化教学现状分析.pdf
- python获取期货数据_【python量化】期货ML策略(一)数据获取
- 安卓神器-kiwi browser
- GTC '19 经典回顾 | 如何编排和创造二次元中的舞蹈?
- 如何在WindowsXP中发短信
- Web安全漏洞及安全防护
- 计算机均价的公式,【转】二手笔记本电脑的价格计算方法和举例