摘要: 在实际业务生产环境中,业务应用系统在使用 OLTP 数据库将数据进行存储后,均会存在如后台运营类系统进行统计报表分析等场景的复杂 SQL 查询诉求。

背景
在实际业务生产环境中,业务应用系统在使用 OLTP 数据库将数据进行存储后,均会存在如后台运营类系统进行统计报表分析等场景的复杂 SQL 查询诉求。

为满足此类复杂 SQL 查询快速响应的需求,DRDS 团队基于第三代分布式SQL引擎,进一步引入自研 MPP 多机并行计算引擎(Fireworks)及对应的优化策略,极大地补强了 DRDS 的复杂查询处理能力。

千万级数据下的分布式多表Join、聚合、排序、子查询操作秒级返回结果,可极大的提升响应速度。自身利用同一份数据(RDS只读)进行处理,无需数据同步至其他数据源,降低业务架构整体链路复杂度,节省业务运维及预算成本。

主要特性
自研 MPP 多机并行计算引擎 Fireworks

DRDS 只读实例搭载了一个具备完整多机并行处理能力的 SQL 执行引擎(Fireworks)。它与 DRDS 主实例上搭载的 SQL 执行引擎有显著差异。

DRDS 主实例的执行引擎采用单机架构,采取尽可能将计算下推至底层各物理分库执行的策略,依靠物理分库的计算能力实现了逻辑SQL的分布式计算。

而 DRDS 只读实例上搭载的 Fireworks 引擎是一个由多个计算节点组成的集群,将一个 SQL 查询转换为一个分布式计算任务,突破下挂
物理库计算能力的限制,大幅提升针对复杂逻辑SQL的计算速度,对 Join、Aggregate 和 Sort 计算有显著加速效果。

Fireworks 会将 Join、Aggregate 和 Sort 这类计算任务通过 Shuffle 的方式打散并分发到计算集群的多个计算节点上,通过多计算节点并行计算达到计算加速的目的。

针对多机并行执行模式定制打造的优化器

原 DRDS 主实例优化器主要侧重 OLTP 场景,核心理念是尽量将一切计算下推至下挂的物理库执行。其目的是充分利用物理库的计算资源,同时可以避免产生大量的数据流动,从而得到较快的响应速度。

而当面对涉及较大数据量级下的复查查询场景时,整体性能会受到下挂物理库的限制,同时也会对物理库产生较大的压力从而影响稳定性,总体来看其 OLAP 能力有很多局限性。

在引入了 MPP 多机并行计算引擎 Fireworks 之后,DRDS 本身在计算能力上得到了极大地提升,优化器的整体优化策略也有所调整:

  1. 尽量将复杂计算(如 Join 、Aggregation 、Sort )上提至自身执行引擎计算,通过 Fireworks 计算集群实现计算加速与可扩展性;
  2. 将轻量级的计算(如 Project 、Filter )继续下推至至物理库从而减少数据拉取的成本。

DRDS 分布式 SQL 优化器通过对执行计划最细粒度的优化可以产生出对多机并行执行引擎友好的执行计划,获得更好执行效率。

同时提供精细化算子下推策略,将对 RDS 较小压力的算子下推至物理库取得更高的计算性价比,同时保护 RDS 免受代价较大算子的影响,从而保证在线流量的稳定性。

基于在线数据直接分析

以新零售业务为代表的新兴互联网业务不断涌现,这类业务除了有实时的 OLTP 需求,还伴随着一些有一定复杂度的准实时 OLAP 的需求用以支持实时决策等需求。

而目前大多数的数据分析场景的解决方案均需要将 OLTP 数据库的生产数据导出至其他数据源进行再次离线分析,这种传统方案很难满足准实时的需求,同时在数据导出至离线系统时也存在数据丢失的风险。

DRDS 只读实例无需进行冗长繁琐的数据同步任务,基于 RDS 只读实例或 RDS 主实例直接进行复杂数据处理,降低业务架构整体链路复杂度,节省业务运维及预算成本。

DRDS 只读实例在避免数据同步的同时,可保证数据处理时效性,最高可做到 READ COMMITED 的实时性 (基于 RDS 主实例)。

边界清晰的 SQL 兼容性

DRDS 只读实例全面兼容 DRDS 主实例的 SQL 查询语法,与 DRDS 5.3 版本的 SQL 兼容性和 SQL 支持边界高度保持一致。

与同类产品相比具备兼容性高以及支持边界清晰的特点。可以提供与 DRDS 主实例几乎一致的体验。

DRDS 主实例上无法执行或执行较慢的复杂 SQL 可以直接迁移到只读实例来执行,免去SQL改写的额外开销。

产品体验灵活自主

DRDS 只读实例自动同步 DRDS 主实例的账号权限信息,原生VPC支持,内外网可同时开启,根据业务情况灵活变配,数据处理能力线性提升。

技术架构总览

DRDS 只读实例整体架构与 DRDS 主实例基本保持一致,仅在查询层有所变化,增加了 MPP 执行引擎和对应优化器,如下如所示:

DRDS协议层负责处理网络交互与 MySQL 协议的解析,收到查询请求后会将 SQL 转交至查询层处理。查询层负责解析 SQL 并由执行器产生经过优化的执行计划,然后交由执行引擎到存储层进行查询以及计算。
如果需要使用 Fireworks 引擎计算,在得到执行计划之后查询层还会将该执行计划进一步转换为分布式执行计划并将其作为分布式任务提交给 Fireworks Cluster。由远端的 Fireworks 集群完成到存储层进行数据查询以及后续计算的工作。

简单来说,DRDS 只读实例可以认为是在原 DRDS 基础上增加了一条具备多机并行处理能力的执行链路。

适用场景

总体来说 DRDS 只读实例适用于处理低并发高延迟的大数据量级下的复杂查询。如数据分析及报表类场景,该类场景的典型特征为含有大
量的关联、聚合及排序操作且参与计算的数据规模较大。

目前 DRDS 只读实例在阿里集团内部已经落地了多个业务,其中最具代表性的当属盒马、商业大脑等新零售场景。围绕人、货、场、仓多个维度进行关联分析,对分散在不同逻辑库的几张甚至十几张逻辑表进行关联然后再聚合、排序以满足库存对账、决策支持等业务上的需求。

DRDS 只读实例的出现使业务开发同学不再需要配置、维护数量繁多的数据同步链路,不用担心因数据不同步而造成的结果时效性差或不准确等问题,一定程度上减轻了开发同学的工作负担。

对于已经在使用 DRDS 的用户来说,DRDS 只读实例可以解决如下两类已知问题:

  1. 在使用 DRDS 过程中可能会发现某一些涉及Join、聚合、排序的复杂 SQL因为不能完全下推而需要在DRDS执行引擎中进行二次计算,而这种计算因为受到单机执行引擎在内存方面的限制而无法执行。
  2. SQL 的复杂计算部分可以下推但是涉及到的数据规模较大造成物理库压力增高影响 OLTP 业务或者响应时间过慢达不到要求。

小结

长期以来 DRDS 受到单机架构执行引擎的限制一直无法对基于大数据规模的复杂查询提供很好的支持,也无法通过扩展物理资源来实现对自身本地计算能力的线性扩展。

DRDS只读实例的推出彻底地弥补了 DRDS 在 OLAP 场景下的短板,使得 DRDS 在提供强大 OLTP 能力的同时提供可扩展的 OLAP 能力,为同时具有 OLTP 需求与中等规模数据分析需求的用户提供了一站式整体解决方案,为用户带来便利。

后续半年时间内 DRDS 只读实例将发布跨逻辑库的关联查询功能,并通过更多的技术手段,不断增强只读实例核心能力,在并发度、响应时间、数据量、交互式查询等方面将拥有更好的表现,满足企业级应用对数据库的严苛要求。

原文链接

本文为云栖社区原创内容,未经允许不得转载。

复杂 SQL 查询跑不动?DRDS 只读实例来解决!相关推荐

  1. sql查询分析器 只读_DRDS 只读实例来解决复杂 SQL 查询

    转自: 复杂 SQL 查询跑不动?DRDS 只读实例来解决!​segmentfault.com 背景 在实际业务生产环境中,业务应用系统在使用 OLTP 数据库将数据进行存储后,均会存在如后台运营类系 ...

  2. 用SQL查询Oracle数据库名和实例名

    文章目录 1. 查看数据库名 2. 查看实例名 1. 查看数据库名 select name from v$database; 更详细点的话,就执行这个(注意,这个必须在命令行界面执行). desc v ...

  3. 后台多条sql查询,json传前台,前台处理多条sql数据实例

    后台多条sql查询,json传前台,前台处理多条sql数据实例 前台jsp页面: <div class="yppp_2" style="margin-left:10 ...

  4. Sql分页查询以及top函数简单实例

    Sql分页查询以及top函数简单实例 Sql分页查询以及top函数简单实例 我们做项目时查询表格存在几百上千条数据时经常会需要用到分页,下面就给大家介绍一下在sql中查询分页的简单实例吧.首先我们要知 ...

  5. 有关RDS上只读实例延时分析-同适用于自建MySQL主从延时分析判断

    个人不是很喜欢在技术上跟人互喷,尤其是不在同一个岗位上的人.一方面本人的性格如此,另一方面,我自身的口水也确实是不行,人生经历了第一次的双11洗礼,在大促的环境下,总算知道了有些东西是否应该规避,这次 ...

  6. mysql发生只读的原因_关于同步延迟原因与处理的RDS MySQL 只读实例

    关于同步延迟原因与处理的RDS MySQL 只读实例 RDS MySQL只读实例一般来说用于分担主实例的查询(Select)压力,或者用于运行OLAP类型的分析应用,避免复杂统计查询对主实例的性能影响 ...

  7. java查询mysql装载bean_jsp与javabean链接mysql数据库并查询数据表的简单实例源码

    jsp与javabean链接mysql数据库并查询数据表的简单实例源码.这个简单的实例是给新手学习的,或者一些高手临时忘记怎么使用jsp操作mysql数据库时候查找的,包括了建立mysql数据库连接的 ...

  8. 今日 Paper | 模态平衡模型;组合语义分析;高表达性SQL查询;多人姿态估计模型等

    2020-02-07 14:23 导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块.   目录 视觉对话的模态平衡模型 对注意力的通用攻击和对应的数据集DAmageNet 半 ...

  9. bs架构与cs架构的区别_Oracle vs Mysql--架构、sql查询执行流程及SQL解析顺序区别说明...

    概述 之前分享的主要是Oracle上的一些内容,那么mysql又有哪些地方不一样呢?下面从MySQL总体架构.sql查询执行流程和语句执行顺序来看一下.. 01 架构总览 下面看一下mysql的架构图 ...

最新文章

  1. CTFshow sql注入 上篇(web171-220)
  2. 初始python(二)
  3. lvm快照的创建恢复
  4. 四人帮–代理设计模式
  5. 图形处理-几种图像修复方法
  6. web入门,这些必须掌握!!!
  7. Web 前端开发初学者十问集锦(2)
  8. 【手写字母识别】基于matlab GUI模板匹配手写大写字母识别【含Matlab源码 115期】
  9. 计算机考试试题大一上学期,大一第一学期期末考试计算机试题
  10. html 里面的 role 属性是什么意思和用途
  11. 如何在Mozilla Firefox中启用(或禁用)Cookie
  12. android 判断base64编码格式,一文带你读懂base64编码
  13. 动手学数据分析(四)- 数据可视化
  14. 收藏夹整理——程序员笔试面试
  15. linux裸设备文件系统,关于裸设备,文件系统,CIO/DIO
  16. 举个栗子~Tableau 技巧(211):学做指针环形图
  17. 研究生挂职锻炼-面试问答演练
  18. 在使用开源IOT平台Thingsboard时,遇到的编译问题一initial exceeded maximum budget
  19. 记单词05-od,-hod(路)
  20. 计算机组装实验感受,计算机组装实训心得体会

热门文章

  1. image pil 图像保存_使用PIL保存图像
  2. 【学习笔记】第五章——I/O(设备分类、控制方式、软件层次结构、假脱机、缓冲)
  3. decimal是什么类型_SQLMysql数据类型
  4. python实训名片管理程序_python3学生名片管理v2.0版
  5. webservice 实现与his系统对接_[Share] EDI 及其他常见系统对接技术
  6. python里元组和列表的共同点和不同点_Python元组与列表的相同点与区别
  7. 算术溢出使用4字节值上的运算符_c语言程序设计的数据类型、运算符和表达式介绍...
  8. java 判断季节,Java-用switch判断季节
  9. php 缩略图 失真,WORDPRESS缩略图失真变形模糊的解决方法
  10. 拖拽批量上传图片如何保证 顺序_图片压缩神器和图片分割工具,美工设计和运营终于得救了...