https://doris.apache.org/zh-CN/docs/data-operate/import/import-way/routine-load-manual/

json (无嵌套)

CREATE ROUTINE LOAD v2x_olap_database.government_car_route_load ON government_car_route_load
COLUMNS(temId, tehNo, speed, dayMileage, gpsTime, status, direction, k1, longitude, latitude, eventTime, dt)
PROPERTIES
(
"desired_concurrent_number"="3",
"max_batch_interval" = "20",
"max_batch_rows" = "300000",
"max_batch_size" = "209715200",
"strict_mode" = "false",
"format" = "json"
)
FROM KAFKA
(
"kafka_broker_list" = "10.0.2.37:31090,10.0.2.38:31091,10.0.2.38:31092",
"kafka_topic" = "government_car_topic",
"property.group.id" = "government_car_route_load_group",
"property.kafka_default_offsets" = "OFFSET_BEGINNING",
"property.enable.auto.commit" = "false",
"kafka_partitions" = "0"
);

json (嵌套)

参考:https://www.cnblogs.com/ywjfx/p/14722302.html

CREATE ROUTINE LOAD test.test_json_label_4 ON user_json
COLUMNS(id, name, counts, ts)
PROPERTIES
(
"desired_concurrent_number"="3",
"max_batch_interval" = "20",
"max_batch_rows" = "300000",
"max_batch_size" = "209715200",
"strict_mode" = "false",
"format" = "json",
"jsonpaths" = "[\"$.test.id\",\"$.test.name\",\"$.test.counts\",\"$.test.ts\"]"
)
FROM KAFKA
(
"kafka_broker_list" = "localhost:9092",
"kafka_topic" = "Demo2",
"kafka_partitions" = "0",
"kafka_offsets" = "0"
);
查看导入
mysql> show routine load\G;
Empty set (0.00 sec)

删除导入任务
mysql> STOP ROUTINE LOAD FOR government_car_route_load;
Query OK, 0 rows affected (0.00 sec)
暂停任务
mysql> PAUSE ROUTINE LOAD FOR government_car_route_load;
从 pause 状态中恢复
mysql> RESUME ROUTINE LOAD FOR government_car_route_load

问题记录

failed to get kafka partition info: [no partition in this topic]

"kafka_partitions" = "0"
no partition for this tuple.

分区表历史分区未创建报如上错误

参考:https://blog.csdn.net/qq_37865420/article/details/122456181

创建历史分区

alter table v2x_olap_database.government_car_recovery set ("dynamic_partition.create_history_partition"="true","dynamic_partition.start" = "-75");

routine load 容错 current error rows is more than max error num

https://doris.apache.org/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/ALTER-ROUTINE-LOAD/


where 过滤条件

频繁因数据质量问题导致数据导入失败,加入 where 进行过滤

CREATE ROUTINE LOAD xxx ON xxx
COLUMNS(...),
where timestamp < servertimestamp and timestamp > UNIX_TIMESTAMP(DATE(now())) * 1000
PROPERTIES
(
...
)
FROM KAFKA
(
...
);

routine load 状态异常



failed to find 3 backends

其中某个 backend 状态异常

恢复重启该backend ./start-be.sh --daemon
分区自动创建,恢复routine load RESUME ROUTINE LOAD FOR government_car_route_load

doris routine load相关推荐

  1. Doris Routine Load正则表达实战

    Doris Routine Load正则表达实战 1. Kafka安装 #1.下载安装包 wget https://dlcdn.apache.org/kafka/3.2.0/kafka_2.13-3. ...

  2. Doris Routine Load数据导入实战【每秒导入16w】

    Doris Routine Load实战[每秒导入16w] 1. Kafka安装 #1.下载安装包 wget https://dlcdn.apache.org/kafka/3.2.0/kafka_2. ...

  3. 数据导入 - Kafka 结合Doris Routine load 任务导入

    背景 参与项目有关数据采集,采集数据同步到数据库之前是使用sql的形式去进行同步,考虑到全表同步数据时数据量过大导致mybatis批量插入数据内存异常,原始解决方案采取分批次进行导入,但是同步数据速度 ...

  4. Doris Routine Load接入Kafka0.8.0实战

    Doris Routine Load接入Kafka0.8.0实战 想要更全面了解Spark内核和应用实战,可以购买我的新书. <图解Spark 大数据快速分析实战>(王磊) 1. 问题产生 ...

  5. Apache Doris Routine Load数据导入使用方法

    Apache Doris 代码仓库地址:apache/incubator-doris 欢迎大家关注加星 1.概要 Routine load 功能为用户提供了一种自动从指定数据源进行数据导入的功能. R ...

  6. Apache Doris 系列: 基础篇-Routine Load

    简介 Routine Load 支持用户提交一个常驻的导入任务,通过不断的从指定的数据源读取数据,将数据导入到 Doris 中. 目前仅支持通过无认证或者 SSL 认证方式,从 Kakfa 导入 CS ...

  7. Doris之Routine Load

    Routine Load 例行导入(Routine Load)功能为用户提供了一种自动从指定数据源进行数据导入的功能. 本文档主要介绍该功能的实现原理.使用方式以及最佳实践. FE:Frontend, ...

  8. Doris系列13-数据导入之Routine Load

    文章目录 一. Routine Load 概述 二. Kafka 例行导入 2.1 创建例行导入任务 2.1.1 columns_mapping 2.1.2 where_predicates 2.1. ...

  9. 第3.3章:StarRocks数据导入--Routine Load

    Routine Load(例行导入)是StarRocks自带的一种可以从Kafka中持续不断的导入数据的方式,我们可以方便的在StarRocks中通过SQL来控制导入任务的暂停.继续及停止. 关于Ro ...

最新文章

  1. vc picture控件载入背景图,随控件大小改变
  2. im和音视频开发哪个更好_如何阅读成为更好的开发者的方式
  3. 技术的顶点,是普惠人类还是超越人类
  4. Subversion存储库中“分支”,“标记”和“主干”的含义是什么?
  5. python自学步骤-小白刚入门Python,学完基础后,接下来的学习步骤!
  6. java 滚动条 滚动_广告条随滚动条的移动而移动
  7. 双向@OneToMany / @ManyToOne关联
  8. 前端学习(1608):react-router-dom基础
  9. PostgreSQL 的一个简单连接和查询操作——示例
  10. 高并发编程_高并发编程系列:全面剖析Java并发编程之AQS的核心实现
  11. php 筛选搜索,筛选——搜索
  12. Navicat连接oracle03135,ORA-03135: connection lost contact的解决方法
  13. 给所有准备考网络工程师的考生的一点点建议
  14. 中职计算机办公自动化教学,中职学校计算机办公自动化教学现状分析.pdf
  15. python获取期货数据_【python量化】期货ML策略(一)数据获取
  16. 安卓神器-kiwi browser
  17. GTC '19 经典回顾 | 如何编排和创造二次元中的舞蹈?
  18. 如何在WindowsXP中发短信
  19. Web安全漏洞及安全防护
  20. 计算机均价的公式,【转】二手笔记本电脑的价格计算方法和举例

热门文章

  1. 如何制作俄罗斯方块(作业第一部分)
  2. 融云IM技术分享:万人群聊消息投递方案的思考和实践
  3. 计算机控制综合应用题,2013计算机考研《操作系统》之综合应用题
  4. IWebBrowser2登陆网站(无验证码的)
  5. cmd命令查看ip的方法以及其他命令
  6. AttributeUsage特性和特性标识符
  7. 【POJ】POJ题目分类
  8. 监督学习方法与无监督学习方法总结
  9. 潭州教育python培训怎样
  10. 计算机创建硬盘分区,Win7系统中怎么创建新的磁盘分区 win7新建磁盘分区过程图文详解...