观众朋友们:

晚上好!

欢迎收看【 Doris 近日要闻】~本次为您带来的是 2021年07月15日 ~ 2021年07月18日 的双周总结。

Doris 社区周报每期会包含 FAQ 环节。我们会在社区论坛、Github ISSUE、Dev邮件组以及微信用户群中挑选一些主要问题并在 FAQ 环节中进行解答。

  • Dev 邮件组:dev@doris.apache.org

  • Github Issue:https://github.com/apache/incubator-doris/issues

  • 社区论坛地址:http://ai.baidu.com/forum/topic/list/209/0/167

1. 统计数据

共位24作者提交了56个 Commit 。感谢以下作者的贡献:

Mingyu Chen, stdpain, Zhengguo Yang, Xinyi Zou, HappenLee, EmmyMiao87, zhoukang, qiye, jiafeng.zhang, Pxl, xy720, wudi, pengxiangyu, huzk, harveyyue, flynn, caiconghui, Stephen-Robin, Lijia Liu, Kuncle, Henry2SS, GeoffreyStark, DinoZhang, Arthur.Zhang

最近2周,共修改新增代码行 18424 ,删除代码行 7124 

2. 主要进展

2.1 新增功能

  • https://github.com/apache/incubator-doris/pull/6117

    show tablet status 增加表创建时间、数据更新时间

  • https://github.com/apache/incubator-doris/pull/6107

    支持 Alibaba DataX doriswriter 插件

  • https://github.com/apache/incubator-doris/pull/6140

    增加 bit_length 函数支持

  • https://github.com/apache/incubator-doris/pull/6161

    支持通过 libhdfs3 直接访问并导入 hdfs 数据,不再需要 broker 进程。

  • https://github.com/apache/incubator-doris/pull/6159

    支持通过限制一个用户的最大查询示例数来限制用户查询量,或避免用户发送不合理的复杂查询。

  • https://github.com/apache/incubator-doris/pull/6023

    支持修复分区表的默认分桶数。

  • https://github.com/apache/incubator-doris/pull/6121

    支持 Runtime Filter 功能。

  • https://github.com/apache/incubator-doris/pull/6226

    支持通过代价模型计算的 Join Reorder 功能。

  • https://github.com/apache/incubator-doris/pull/6209

    新增 bdbje debug 模式,用于查看存储在 bdbje 中的元数据日志。

2.2 WIP

  • https://github.com/apache/incubator-doris/pull/5980

    支持数组类型简单的查询语法。

2.3 Bug修复

  • https://github.com/apache/incubator-doris/pull/6165

    修复 Flink-Doris-Connector 导入 null 值报错的问题。

  • https://github.com/apache/incubator-doris/pull/6172

    修复 bucket shuffle join 某些情况下产生错误查询计划的问题。

  • https://github.com/apache/incubator-doris/pull/6129

    修复通过动态分区功能创建历史分区时可能产生错误的问题,并支持了指定创建历史分区的个数。

  • https://github.com/apache/incubator-doris/pull/6190

    show dynamic partition table 语句直接转发到 master 执行,避免出现信息无法查看的问题。

  • https://github.com/apache/incubator-doris/pull/6109

    修复某些情况下,错误的创建了范围重叠的分区的问题。

  • https://github.com/apache/incubator-doris/pull/6096

    修复创建逻辑视图时,会错误的折叠非确定性常量表达式的问题。

  • https://github.com/apache/incubator-doris/pull/6184

    修复 show view for table 可能出现 Unresovled table reference 错误的问题。

  • https://github.com/apache/incubator-doris/pull/6215

    修复某些情况下,Routine Load 可能会卡住的问题。

  • https://github.com/apache/incubator-doris/pull/6213

    修复 Routine Load中使用 json 函数,无法匹配整个 json 数据的问题。

  • https://github.com/apache/incubator-doris/pull/6051

    修复 decimal 类型除零错误

  • https://github.com/apache/incubator-doris/pull/6250

    升级 okhttp 版本已修复在jdk13下使用 doris on es 功能可能导致 http 请求卡住的问题。

2.4 功能改进

  • https://github.com/apache/incubator-doris/pull/6149

    Spring 内嵌容器修改为 Jetty,修复307转发问题。

  • https://github.com/apache/incubator-doris/pull/6180

    优化 Bloom Filter 的过滤效率。

  • https://github.com/apache/incubator-doris/pull/6170

    优化 csv 格式导入的效率。

  • https://github.com/apache/incubator-doris/pull/5934

    Flink Doris Connector 支持设置数据写入到 Doris 的时间间隔。

  • https://github.com/apache/incubator-doris/pull/6092

    Routine Load 新增 errorRowsAfterResumed 来展示重启后作业处理的错误行数。

3. FAQ

Q:通过 DECOMMISSION 下线BE节点时,为什么总会有部分tablet残留?

A:

在下线过程中,通过 show backends 查看下线节点的 tabletNum ,会观察到 tabletNum 数量在减少,说明数据分片正在从这个节点迁移走。当数量减到0时,系统会自动删除这个节点。但某些情况下,tabletNum 下降到一定数值后就不变化。这通常可能有以下两种原因:

1. 这些 tablet 属于刚被删除的表、分区或物化视图。而刚被删除的对象会保留在回收站中。而下线逻辑不会处理这些分片。可以通过修改 FE 的配置参数 catalog_trash_expire_second 来修改对象在回收站中驻留的时间。当对象从回收站中被删除后,这些 tablet就会被处理了。

2. 这些 tablet 的迁移任务出现了问题。此时需要通过 show proc "/cluster_balance" 来查看具体任务的错误了。

对于处理版本,可以先通过 show proc "/statistic" 查看集群是否还有 unhealthy 的分片,如果为0,则可以直接通过 drop backend 语句删除这个 BE 。否则,还需要具体查看不健康分片的副本情况。

Q:priorty_network应该如何设置?

A:

priorty_network 是 FE、BE 都有的配置参数。这个参数主要用于帮助系统选择正确的网卡 IP 作为自己的 IP 。建议任何情况下,都显式的设置这个参数,以防止后续机器增加新网卡导致IP选择不正确的问题。

priorty_network 的值是 CIDR 格式表示的。分为两部分,第一部分是点分十进制的 IP 地址,第二部分是一个前缀长度。比如 10.168.1.0/8 会匹配所有 10.xx.xx.xx 的IP地址,而 10.168.1.0/16 会匹配所有 10.168.xx.xx 的 IP 地址。

之所以使用 CIDR 格式而不是直接指定一个具体 IP,是为了保证所有节点都可以使用统一的配置值。比如有两个节点:10.168.10.1 和 10.168.10.2,则我们可以使用 10.168.10.0/24 来作为 priorty_network 的值。

Q:FE的Master、Follower、Observer都是什么?

A:

首先明确一点,FE 只有两种角色:Follower 和 Observer。而 Master 只是一组 Follower 节点中选择出来的一个 FE。Master 可以看成是一种特殊的 Follower。所以当我们被问及一个集群有多少 FE,都是什么角色时,正确的回答当时应该是所有 FE 节点的个数,以及 Follower 角色的个数和 Observer 角色的个数。

所有 Follower 角色的 FE 节点会组成一个可选择组,类似 Poxas 一致性协议里的组概念。组内会选举出一个 Follower 作为 Master。当 Master 挂了,会自动选择新的 Follower 作为 Master。而 Observer 不会参与选举,因此 Observer 也不会称为 Master 。

一条元数据日志需要在多数 Follower 节点写入成功,才算成功。比如3个 FE ,2个写入成功才可以。这也是为什么 Follower 角色的个数需要是奇数的原因。

Observer 角色和这个单词的含义一样,仅仅作为观察者来同步已经成功写入的元数据日志,并且提供元数据读服务。他不会参与多数写的逻辑。

-- END --

【往期回顾】

【Doris Weekly & FAQ】2021.06.21~2021.07.04

【Doris Weekly】2021.06.07~2021.06.20

【Doris Weekly】2021.05.25~2021.06.08

【精彩文章】

活动回顾| Apache Doris 的过去、现在与未来 活动回顾| 基于 Iceberg 拓展 Doris 数据湖能力的实践
活动回顾| Apache Doris 在韵达物流领域的应用实践 社区人物志|张家锋:一个人可能走得更快,但一群人会走得更远

欢迎扫码关注:

Apache Doris(incubating)官方公众号

相关链接:

Apache Doris官方网站:

http://doris.incubator.apache.org

Apache Doris Github:

https://github.com/apache/incubator-doris

Apache Doris 开发者邮件组:

dev@doris.apache.org

本文分享自微信公众号 - ApacheDoris(gh_80d448709a68)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

【Doris Weekly FAQ】2021.07.05~2021.07.18相关推荐

  1. Doris Weekly FAQ】2021.07.19~2021.08.01

    观众朋友们: 晚上好! 欢迎收看[ Doris 近日要闻]~本次为您带来的是 2021年07月19日 - 2021年08月01日 的双周总结. Doris 社区周报每期会包含 FAQ 环节.我们会在社 ...

  2. 【Doris Weekly】2020.10.12~2020.10.18

    观众朋友们: 晚上好! 今天是2020年10月20日星期二,农历九月初四,欢迎收看[Doris一周要闻]. 本次为您带来的是2020年10月12日-10月18日的周度总结. 01 统计数据 本周共有  ...

  3. 港科百创|【未磁科技】勇夺百万大奖,2021年度总决赛圆满收官!香港科大-越秀集团百万奖金国际创业大赛年度总决赛成功举办!...

    2021年12月10-11日,"香港科大-越秀集团"百万奖金国际创业大赛·2021年度总决赛顺利举行.本次大赛在经过两日的紧张评选和激烈角逐后,[未磁科技]最终赢得2021年度百万 ...

  4. 【unity 保卫星城】--- 开发笔记05(普通子弹武器)

    [unity 保卫星城]--- 开发笔记 ~~ 战机武器库 ~~ 1.普通的子弹 · 感觉把好多类,都写再 六 这个主题里,感觉主题会撑爆,所有还是再开个小框架吧. · 就叫战机武器库吧~ ~~ 战机 ...

  5. 【致远FAQ】致远OA启动不起来了(中集)

    database disk image is malformed 问题现象: 协同服务启动失败,ApacheJetspeed/logs/localhost.2021-XX-XX.log日志记录关键异常 ...

  6. 543、RabbitMQ详细入门教程系列 -【Confirm与Mandatory】 2022.09.05

    目录 一.前言概述 二.SpringAMQP配置Confirm 2.1 Connection设置 2.2 template设置 2.3 Confirm实现 三.SpringAMQP配置ManDator ...

  7. 544、RabbitMQ详细入门教程系列 -【手动消费确认】 2022.09.05

    目录 一.前言概述 二.配置实现 2.1 XML配置 2.2 MessageListener实现 三.消息预取 四.并发消费 五.参考链接 一.前言概述 RabbitMQ(四) --消费者Consum ...

  8. 【隧道篇 / IPsec】(5.2) ❀ 05. IPsec - 点对多星状拓扑 ❀ FortiGate 防火墙

    [简介]IPSec VPN 即指采用IPSec协议来实现远程接入的一种VPN技术,IPSec全称为Internet Protocol Security,是由Internet Engineering T ...

  9. 【高级篇 / ZTNA】(7.0) ❀ 05. 域用户自动安装 FortiClient (上) ❀ FortiGate 防火墙

    [简介]中大型企业通常会使用Windows Server对电脑进行管理,我们可以利用Windows Server的自动安装功能,将所有电脑安装FortiClient客户端.   创建组织单位和用户 通 ...

最新文章

  1. python3-泊松分布
  2. Windows Server 2008 配置IE使用代理
  3. 华南理工计算机考试题,华南理工考研计算机历年真题
  4. Spring IOC 组件概述
  5. Atlas Of Cardiovascular Emergencies 心血管急症图集
  6. VTK:合并选择用法实战
  7. 【Android】 常用的Intent
  8. 创建一个Windows Service应用程序
  9. manjaro linux 使用Xorg显示服务器
  10. liunx服务程序的安装及配置
  11. Linux系统——sqlist数据库
  12. linux ubuntu安装教程 pdf,Ubuntu下安装PDF阅读器Okular
  13. android微信打不开怎么办,微信打不开怎么回事 微信打不开怎么办
  14. 芝麻信用获世界级安全认证
  15. printf打印二进制数据
  16. 苹果上传闪退 php,怎样解决iPhone程序闪退问题
  17. python分组求和法_python – 如何将groupby值的总和除以另一个值的count
  18. java+上传整个文件夹的所有文件
  19. 快速上手爬虫,有哪些方便实用的工具和服务?
  20. html input禁止驶入,layui form表单 input输入框获取焦点后 阻止Enter回车自动提交 – 执念 – 博客园...

热门文章

  1. 在Unity中获得一个物体的所有子物体包括孙物体。
  2. docker导入MySQL数据库
  3. 在.jupyter文件夹中找不到jupyter_notebook_config.py文件怎么办
  4. 梅科尔工作室—罗森—鸿蒙笔记4
  5. Ubuntu右上角不显示网络的图标解决办法
  6. 矩阵 A乘A的转置是否一定正定? NO!!!
  7. 移植GRBL控制器到ESP32实现写字机器人
  8. 炸裂!AI 都快把《西部世界》搞出来了!
  9. PTA 7-42 《图书目录管理系统》(初级修订版)
  10. 云计算 小企业_小型企业云计算