MySQL关联查询时,我们为什么建议小表驱动大表?
作者:留兰香丶
blog.csdn.net/codejas/article/details/78632883
有的时候我们在操作数据库时会将两个或多个数据表关联起来通过一些条件筛选数据,在关联表时我们要遵循一些原则,这样会使我们编写的SQL 语句在效率上快很多。
一、优化原则
小表驱动大表,即小的数据集驱动大得数据集。在知道什么是小表驱动达大表之前,我们先来了解两个查询关键字,IN 与 EXISTS。我们通过两段查询语句先来了解一下它们的作用。我建立了两张表,一张员工表,一张部门表,员工表中有部门id 这个属性,将这两张表关联起来。
我们先使用IN 来查询数据:
SELECT *
FROM t_emp
WHERE dept_id IN (SELECT dept_id FROM t_dept)
LIMIT 5;
查询结果:由于有很多的员工信息,在这里我就只查询5 条数据。
+-------------+----------+------------+--------------+---------+
| emp_id | emp_name | emp_gender | emp_email | dept_id |
+-------------+----------+------------+--------------+---------+
| 00000000177 | 41d80 | m | 41d80@zc.com | 1 |
| 00000000178 | a74b8 | m | a74b8@zc.com | 1 |
| 00000000179 | 661ca | m | 661ca@zc.com | 1 |
| 00000000180 | 9413d | m | 9413d@zc.com | 1 |
| 00000000181 | 7d577 | m | 7d577@zc.com | 1 |
+-------------+----------+------------+--------------+---------+
接下里使用EXISTS 来查询数据:
SELECT * FROM t_emp WHERE EXISTS (SELECT 1 FROM t_dept WHERE t_dept.dept_id = t_emp.dept_id) LIMIT 5;
查询结果:与上面的结果一样。
+-------------+----------+------------+--------------+---------+
| emp_id | emp_name | emp_gender | emp_email | dept_id |
+-------------+----------+------------+--------------+---------+
| 00000000177 | 41d80 | m | 41d80@zc.com | 1 |
| 00000000178 | a74b8 | m | a74b8@zc.com | 1 |
| 00000000179 | 661ca | m | 661ca@zc.com | 1 |
| 00000000180 | 9413d | m | 9413d@zc.com | 1 |
| 00000000181 | 7d577 | m | 7d577@zc.com | 1 |
+-------------+----------+------------+--------------+---------+
既然IN 和 EXISTS 都可以用来查询数据,那它们两个有什么区别呢?
SELECT *
FROM t_emp
WHERE dept_id IN (SELECT dept_id FROM t_dept);// 这条SQL 语句相当于:
for SELECT dept_id FROM t_deptfor SELECT * FROM t_emp WHERE t_emp.dept_id = t_dept.dept_id
这里虽然我们编写的SQL 语句是主查询员工信息,子查询部门id ,但是MySql 的执行顺序会先执行子查询,再执行主查询,然后获得我们要查询的数据。
SELECT * FROM t_emp WHERE EXISTS (SELECT 1 FROM t_dept WHERE t_dept.dept_id = t_emp.dept_id);// 这条SQL 语句相当于:
for SELECT * FROM t_emp for SELECT * FROM t_dept WHERE t_dept.dept_id = t_emp.dept_id
我们可以将EXISTS 语法理解为:将主查询的数据放在子查询中做条件验证,根据结果TRUE 和 FALSE 来决定主查询中的数据是否需要保留。EXISTS 子查询只返回TRUE 或 FALSE ,因此子查询中的SELECT * 可以是SELECT 1 或者其他,MySql 的官方说在实际执行时会忽略SELECT 清单,因此是没有 什么区别的。EXISTS 子查询其实在执行时,MySql 已经对它做了一些优化并不是对每条数据进行对比。
二、总结
在实际操作过程中我们要对两张表的dept_id 都设置索引。在一开始我们就讲了一个优化原则即:小表驱动大表,在我们使用IN 进行关联查询时,通过上面IN 操作的执行顺序,我们是先查询部门表再根据部门表查出来的id 信息查询员工信息。我们都知道员工表肯定会有很多的员工信息,但是部门表一般只会有很少的数据信息,我们事先通过查询部门表信息查询员工信息,以小表(t_dept)的查询结果,去驱动大表(t_emp),这种查询方式是效率很高的,也是值得提倡的。
但是我们使用EXISTS 查询时,首先查询员工表,然后根据部门表的查询条件返回的TRUE 或者 FALSE ,再决定员工表中的信息是否需要保留。这不就是用大的数据表(t_emp) 去驱动小的数据表小的数据表(t_dept)了吗?虽然这种方式也可以查出我们想要的数据,但是这种查询方式是不值得提倡的。
当t_emp 表中数据多于 t_dept 表中的数据时,这时我们使用IN 优于 EXISTS。当t_dept 表中数据多于 t_emp 表中的数据时(我们这里只是假设),这时我们使用EXISTS 优于 IN。因此是使用IN 还是使用EXISTS 就需要根据我们的需求决定了。但是如果两张表中的数据量差不多时那么是使用IN 还是使用 EXISTS 差别不大。
END
精彩推荐
一百期Java面试题汇总
SpringBoot内容聚合
IntelliJ IDEA内容聚合
Mybatis内容聚合
我知道你 “在看”
MySQL关联查询时,我们为什么建议小表驱动大表?相关推荐
- mysql 小表连大表_MySQL 表之间关联查询时,为什么建议小表驱动大表?
有的时候我们在操作数据库时会将两个或多个数据表关联起来通过一些条件筛选数据,在关联表时我们要遵循一些原则,这样会使我们编写的SQL 语句在效率上快很多. 一.优化原则 小表驱动大表,即小的数据集驱动大 ...
- MySQL IN、Exist关联查询时,我们为什么建议小表驱动大表?
有的时候我们在操作数据库时会将两个或多个数据表关联起来通过一些条件筛选数据,在关联表时我们要遵循一些原则,这样会使我们编写的SQL 语句在效率上快很多. 一.优化原则 小表驱动大表,即小的数据集驱动大 ...
- MySql小表驱动大表
有的时候我们在操作数据库时会将两个或多个数据表关联起来通过一些条件筛选数据,在关联表时我们要遵循一些原则,这样会使我们编写的SQL 语句在效率上快很多. 一.优化原则 小表驱动大表,即小的数据集驱动大 ...
- Mysql优化原则_小表驱动大表IN和EXISTS的合理利用
//假设一个for循环 for($i = 0; $i < 10000; $i++) { for ($j = 0; $i < 50; $j++){} }for($i = 0; $i < ...
- mysql算法优化原则_Mysql优化原则_小表驱动大表IN和EXISTS的合理利用
//假设一个for循环 for($i = 0; $i < 10000; $i++) { for ($j = 0; $i < 50; $j++) { } } for($i = 0; $i & ...
- mysql 大表 驱动_MySql 小表驱动大表
在了解之前要先了解对应语法 in 与 exist. in后的括号的表达式结果要求之输出一列字段.与之前的搜索字段匹配,匹配到相同则返回对应行. mysql的执行顺序是先执行子查询,然后执行主查询,用子 ...
- Mysql之小表驱动大表
Mysql之小表驱动大表 1 什么是小表驱动大表 2 为什么使用小表驱动大表 3 判断驱动表与非驱动表 4 Exists和in的使用场景 1 什么是小表驱动大表 用小的数据集去驱动(可理解为匹配)大的 ...
- MySQL高级知识(十六)——小表驱动大表
前言:本来小表驱动大表的知识应该在前面就讲解的,但是由于之前并没有学习数据批量插入,因此将其放在这里.在查询的优化中永远小表驱动大表. 1.为什么要小表驱动大表呢 类似循环嵌套 for(int i=5 ...
- 【MySQL】小表驱动大表
1.概述 前言:本来小表驱动大表的知识应该在前面就讲解的,但是由于之前并没有学习数据批量插入,因此将其放在这里.在查询的优化中永远小表驱动大表. 1.为什么要小表驱动大表呢 类似循环嵌套 for(in ...
最新文章
- 用鸿蒙跑了个 “hello world”!鸿蒙开发初体验
- 如何提高ORACLE数据库的查询统计速度
- python中的选择结构语句是语句_python3控制语句---选择结构语句
- Smart Paster...great tool to paste large strings into Vs.net
- Kubernetes 容器网络模型和典型实现
- python连接linux服务器读取txt文件_python 读取Linux服务器上的文件方法
- bzoj1699[Usaco2007 Jan]Balanced Lineup排队
- 如何定制Activity的标题栏
- 【Elasticsearch】java 操作 Elasticsearch 7.8 索引 文档 等操作
- 第十六章:SpringCloud Config 配置自动刷新
- 组装台式计算机的部件,组装台式电脑的配置清单
- git push时提示邮箱格式不正确
- Geoffrey Hinton
- Teamview 禁用QuickConnect按钮
- 天气图标下载_50种免费天气图标集可供下载
- 华为手机连电脑当摄像头用_今天才知道,华为手机摄像头还能这样用!还不会用你买什么华为?...
- 利用平台系统运营店铺五大法则
- jmeter参数化之函数助手
- EMC电磁兼容测试服务包括
- 年底程序员好找工作吗_博客和意见-“查看者邮件”,这是年底的一种邪恶方式吗? 还是开始新年的好方法......
热门文章
- 格力干的?顾客京东上买到二手奥克斯空调 京东、奥克斯回应...
- 蔚来将推第三款SUV 续航超500km 明年有望交付
- 苹果iOS13将推出 这些经典手机将会被“淘汰”
- 《权力的游戏》第八季剧情翻水:超40万粉丝请愿重拍
- 造车之心不死?苹果已与至少四家公司进行谈判
- 李彦宏卸任百度投资管理有限公司董事 马东敏上任
- Java成神之路——一文搞懂CAS
- Android 音频开发(一) 基础入门篇
- oracle dba收入水平,oracle教程_oracle dba 收入
- python列表输入数字逗号隔开_第一行Python代码之我的第一个Project(3)