美团点评SQL优化工具SQLAdvisor开源
介绍
在数据库运维过程中,优化 SQL 是 DBA 团队的日常任务。例行 SQL 优化,不仅可以提升程序性能,还能够降低线上故障的概率。
目前常用的 SQL 优化方式包括但不限于:业务层优化、SQL逻辑优化、索引优化等。其中索引优化通常通过调整索引或新增索引从而达到 SQL 优化的目的。索引优化往往可以在短时间内产生非常巨大的效果。如果能够将索引优化转化成工具化、标准化的流程,减少人工介入的工作量,无疑会大大提高DBA的工作效率。
SQLAdvisor 是由美团点评公司北京DBA团队开发维护的 SQL 优化工具:输入SQL,输出索引优化建议。 它基于 MySQL 原生词法解析,再结合 SQL 中的 where 条件以及字段选择度、聚合条件、多表 Join 关系等最终输出最优的索引优化建议。目前 SQLAdvisor 在公司内部大量使用,较为成熟、稳定。
现在,我们非常高兴地将 SQLAdvisor 开源,项目 GitHub 地址:https://github.com/Meituan-Dianping/SQLAdvisor 。我们已经把相关开发工作全面转到 GitHub 上,开源版本和内部使用版本保持完全一致。希望与业内有类似需求的团队,一起打造一款优秀的 SQL 优化产品。
SQLAdvisor架构流程图:
SQLAdvisor使用举例
sql: SELECT id FROM crm_loan WHERE id_card = '1234567'
cmd: ./sqladvisor -h xx -P xx -u xx -pxx -d xx -q "SELECT id FROM crm_loan WHERE id_card = '1234567'"
SQLAdvisor输出: alter table crm_loan add index idx_id_card(id_card)
SQLAdvisor快速入门教程
SQLAdvisor的优点
- 基于 MySQL 原生词法解析,充分保证词法解析的性能、准确定以及稳定性;
- 支持常见的 SQL(Insert/Delete/Update/Select);
- 支持多表 Join 并自动逻辑选定驱动表;
- 支持聚合条件 Order by 和 Group by;
- 过滤表中已存在的索引。
SQLAdvisor原理介绍
Join 处理
- Join语法分为两种:Join on 和 Join using,并且 Join on 有时会存在 where 条件中。
- 分析 Join 条件首先会得到一个 nested_join 的 table list,通过判断它的 join_using_fields 字段是否为空来区分 Join on 与 Join using。
- 生成的 table list 以二叉树的形式进行存储,以后序遍历的方式对二叉树进行遍历。
- 生成内部解析树时,right Join 会转换成 left Join。
- Join 条件会存在当层的叶子节点上,如果左右节点都是叶子节点,会存在右叶子节点。
- 每一个非叶子节点代表一次 Join 的结果。
上述实现时,涉及的函数为:mysql_sql_parse_join(TABLE_LIST join_table) mysql_sql_parse_join(Item join_condition) ,主要流程图如下:
where 处理
- 主要是提取 SQL 语句的 where 条件。where 条件中一般由 AND 和 OR 连接符进行连接,因为 OR 比较难以处理,所以忽略,只处理 AND 连接符。
- 由于 where 条件中可以存在 Join 条件,因此需要进行区分。
- 依次获取 where 条件,当条件中的操作符是 like,如果不是前缀匹配则丢弃这个条件。
- 根据条件计算字段的区分度按照高低进行倒序排,如果小于30则丢弃。同时使用最左原则将 where 条件进行有序排列。
计算区分度
- 通过 “show table status like” 获得表的总行数 table_count。
- 通过计算选择表中已存在的区分度最高的索引 best_index,同时Primary key > Unique key > 一般索引。
- 通过计算获取数据采样的起始值offset与采样范围rand_rows:
- offset = (table_count / 2) > 10W ? 10W : (table_count / 2)
- rand_rows =(table_count / 2) > 1W ? 1W : (table_count / 2)
- 使用select count(1) from (select field from table force index(best_index) order by cl.. desc limit rand_rows) where field_print 得到满足条件的rows。
- cardinality = rows == 0 ? rand_rows : rand_rows / rows;
- 计算完成选择度后,会根据选择度大小,将该条件添加到该表中的备选索引中。
主要涉及的函数为:mysql_sql_parse_field_cardinality_new() 计算选择度。
添加备选索引
- mysql_sql_parse_index()将条件按照选择度添加到备选索引链表中。
- 上述两函数的流程图如下所示:
Group 与 Order 处理
- Group 字段与 Order 字段能否用上索引,需要满足如下条件:
- 涉及到的字段必须来自于同一张表,并且这张表必须是确定下来的驱动表。
- Group by 优于 Order by, 两者只能同时存在一个。
- Order by 字段的排序方向必须完全一致,否则丢弃整个 Order by 字段列。
- 当 Order by 条件中包含主键时,如果主键字段为 Order by。 字段列末尾,忽略该主键,否则丢弃整个 Order by 字段列。
- 整个索引列排序优先级:等值>(group by | order by )> 非等值。
- 该过程中设计的函数主要有:
- mysql_sql_parse_group() 判断 Group 后的字段是否均来自于同一张表。
- mysql_sql_parse_order() 判断 Order 后的条件是否可以使用。
- mysql_sql_parse_group_order_add() 将字段依次按照规则添加到备选索引链表中。
驱动表选择
- 经过前期的 where 解析、Join 解析,已经将 SQL 中表关联关系存储起来,并且按照一定逻辑将候选驱动表确定下来。
- 在侯选驱动表中,按照每一张表的侯选索引字段中第一个字段进行计算表中结果集大小。
- 使用 explain select * from table where field 来计算表中结果集。
- 结果集小最小的被确为驱动表。
- 步骤中涉及的函数为:final_table_drived(),在该函数中,调用了函数 get_join_table_result_set() 来获取每张驱动候选表的行数。
添加被驱动表备选索引
- 通过上述过程,已经选择了驱动表,也通过解析保存了语句中的条件。
- 由于选定了驱动表,因此需要对被驱动表的索引,根据 Join 条件进行添加。
- 该过程涉及的函数主要是:mysql_index_add_condition_field(),流程如下:
输出建议
- 通过上述步骤,已经将每张表的备选索引键全部保存。此时,只要判断每张表中的候选索引键是否在实际表中已存在。没有索引,则给出建议增加对应的索引。
- 该步骤涉及的函数是:print_index() ,主要的流程图为:
SQLAdvisor版本更新
- Functionality Added or Changed
- 调整架构将 SQLParser 与 SQLAdvisor 模块隔离,方便调试。
- 重新架构多表 Join 关系的 find_join_elements() 函数,思路更加清晰。
- 修改选定驱动表的策略,确保驱动表为小结果集。
- 添加 where 条件中的 like 处理。
- 优化 Order by 逻辑,忽略 Order by primary key 场景。
- 输出索引建议前,增加判断索引是否已存在。
- Bugs Fixed
- 修复 SQL 无法处理中文问题。
- 修复字段多次出现在 where 条件中从而导致多次出现在索引列中问题。
- 修复在 find_best_index() 函数中,对 MySQL API 中的 result 对象提前 free,导致指针失效问题。
愿景
和各位同行共同打造一款企业级优秀的 SQL 优化产品,希望大家能够积极参与。
欢迎大家将需求或发现的 Bug 在 Github 上提交 issue,帮助 SQLAdvisor 逐渐壮大;也欢迎大家在 SQLAdvisor 用户交流群(QQ: 231434335)相互交流,共同学习。
SQLAdvisor手册
- SQLAdvisor快速入门教程.
- SQLAdvisor原理和架构.
- SQLAdvisor release notes.
- SQLAdvisor开发规范.
- FAQ.
美团点评SQL优化工具SQLAdvisor开源相关推荐
- 美团点评开源 SQL 优化工具 SQLAdvisor 测试报告
0x00 目录 0x00 目录 0x01 SQLAdvisor 介绍 0x02 SQLAdvisor 原理 0x03 SQLAdvisor 测试 3.1 SQLAdvisor 安装 3.2 导入测试数 ...
- 【MySQL】MySQL数据库SQL优化工具 SQL Tuning Expert for MySQL(收费)
1.概述 SQL Tuning Expert for MySQL 是 Tosska 公司推出的针对MySQL的SQL优化工具. 该工具不仅让DBA或者SQL开发人员,轻松阅读和理解执行计划,而且能产生 ...
- SQL优化工具分享-SQL Tuning Expert Pro for Oracle Trial
做开发离不开对于数据库的接触,也离不开对SQL的接触,一个优质的SQL,可以让系统性能提升到质的飞跃,一个糟糕的SQL,可以让系统奔溃.所以对于我们开发人员来说,很需要一个SQL性能优化工具,在这种情 ...
- 人工智能自动sql优化工具--SQLTuning for SQL Server
SQL语句是对数据库进行操作的惟一途径,对数据库系统的性能起着决定性的作用.对于同一条件下的SQL语句写法有很多,其中一些写法往往对性能又有很大影响.但是每个人掌握SQL语言的水平不同,如何才能保证写 ...
- SQL 优化工具 Explain
## SQL优化工具Explain MySQL是关系型数据库中的一种,**查询功能强,数据一致性高,数据安全性高,支持二级索引**.但性能方面稍逊与非关系型数据库,特别是百万级别以上的数据,很容易出现 ...
- web项目接到请求之后执行sql特别慢_小米开源!SQL优化工具,人工智能帮你 Rewrite...
本文出自头条号老王谈运维,转载请说明出处. 作为一名优秀的DBA或系统管理员,工作总是充满各种"艰辛"! 你在工作中是否遇到过这样的情况:有一个慢SQL需要优化,但是通过分析执行计 ...
- 10W+集群规模下,美团点评如何优化改造K8s?
国梁,美团点评基础研发平台集群调度中心高级工程师 正文共:7396 字 16 图 预计阅读时间: 19 分钟 背景 作为国内领先的生活服务平台,美团点评很多业务都具有非常显著.规律的"高峰& ...
- GEMM性能提升200倍,AutoKernel算子优化工具正式开源
作者 | OPEN AI LAB 研究员 吕春莹 出品 | AI科技大本营 头图 | CSDN下载自视觉中国 随着AI技术的快速发展,深度学习在各个领域得到了广泛应用.深度学习模型能否成功在终端落地应 ...
- mysql的sql优化工具下载_MySQL SQL查询优化工具EverSQL
概述 一般来说,SQL查询优化器分析给定查询的许多选项,预估每个选项的成本,最后选择成本最低的选项.如果查询优化器选择了错误的计划,则性能差异可能从几毫秒到几分钟.幸运的是,现在有许多第三方SQL查询 ...
最新文章
- word顶部有一道线_为什么顶角线不会过时?文章内容告诉你
- 基于阿里的Node全栈之路(二)阿里负载均衡的HTTPS优化方案
- 网站前端和后台性能优化1
- 学习react心得及总结
- 【Demo 0121】纯资源DLL中提取资源
- django restframework 下载文件_【技术选型】Django还是Flask?这是个问题!
- Excel导出显示服务器意外,C# 调用Excel 出现服务器出现意外状况. (异常来自 HRESULT:0x80010105 (RPC_E_SERVERFAULT)...
- [物理学与PDEs]第1章第6节 电磁场的标势与矢势 6.3 例 --- 电偶极辐射
- php分解质因数,用PHP如何实现将一个整数分解为质因数的积?
- Java 10 var关键字详解和示例教程
- mysql全库备份/增量备份脚本
- nps内网穿透_内网穿透工具:NPS的使用
- 【PM】互联网项目管理的特点总结
- git使用命令行首次提交代码
- Java实现满天星动案例
- php inpo,优化PHP in_array()函数,效率提高50倍
- UE4 第三人称人物 目标偏移(Aim offset)学习笔记
- 活在当下——一条狗的使命
- 标准解读系列:行标发布,道路交通信号控制机从管控到服务
- 搜狗输入法明明输入中文却显示英文怎么办